Sei sulla pagina 1di 151

Capı́tulo 1

COMBINATORIA

Previamente al estudio de la probabilidad en sı́, conviene dedicar algún tiempo al repaso de las
técnicas combinatorias.
Recordemos que la Combinatoria es la parte de las Matemáticas que se ocupa de la resolución de
problemas de elección y disposición de los elementos de cierto conjunto, de acuerdo con ciertas reglas.
Es decir, dentro de la Combinatoria es dónde tienen sentido preguntas del tipo:
1. ¿Cuántas quinielas distintas pueden hacerse?.
2. ¿Cuántas posibles combinaciones pueden darse en la loterı́a primitiva?.
3. ¿Qué posibilidades hay de que me toquen los cuatro ases en una mano de tute?.
4. ¿De cuántas formas se pueden sentar 5 personas en 5 asientos de un cine?.
Trataremos de dar respuesta a estas cuestiones y algunas más.

1.1. Conceptos fundamentales


En todo problema combinatorio hay varios conceptos claves que debemos distinguir:

1. Población: Es el conjunto de elementos que estamos estudiando. Llamaremos tamaño de la


población al número de elementos de este conjunto.
2. Muestra: Es un subconjunto de la población. Llamaremos tamaño de la muestra al número de
elementos que la componen.

Los diferentes tipos de muestra vienen determinados por dos aspectos:

a) El orden, es decir, si es importante que los elementos de la muestra aparezcan ordenados o no.

b) La posibilidad de repetición o no de los elementos.

Ejemplo: Veamos con qué tipo de poblaciones y muestras trabajamos en los ejemplos anteriores:

1. La población en este caso es {1,X,2}, que tiene tamaño 3 (no hay otras posibilidades en una
quiniela).
Una quiniela (teniendo en cuenta el ”pleno al 15”) es una muestra de tamaño 15 de la población
anterior (por ejemplo : 1XX121XXX212111).
Es evidente que el orden en esta muestra es importante (no es lo mismo una X en la segunda
casilla que en la quinta) y que se permiten elementos repetidos ( los unos , equis o doses se
pueden repetir).
Es por tanto una muestra ordenada y con repetición.

5
CAPÍTULO 1. COMBINATORIA 6

2. En este caso la población es mayor, pués son todos los números desde el 1 al 49, es decir
{1,2,3. . . .,49}.
Por tanto, y si nos olvidamos del complementario, una apuesta de loterı́a primitiva es una muestra
de tamaño 6 de dicha población (por ejemplo 3, 18, 40, 41, 43, 45 ).
Aquı́ el orden no influye y los elementos no se pueden repetir (no puede salir un número más de
una vez). Son muestras no ordenadas y sin repetición.

3. La población ahora está formada por las 40 cartas que componen una baraja española, es decir
{1 oros, 2 oros,. . . .,Rey bastos} , y para el caso de 4 jugadores, tenemos una muestra de 10
cartas, que evidentemente no se pueden repetir y además el orden no importa.
Muestras no ordenadas y sin repetición.

4. La población son las 5 personas a elegir, y la muestra tiene el mismo tamaño, 5, pues elegimos a
las 5 personas. Eso sı́, ahora el orden sı́ que es importante y además las personas no se pueden
repetir.
Son muestras ordenadas y sin repetición.

5. Un ejemplo de muestra no ordenada y con repetición podrı́a ser una mano de cartas pero teniendo
en cuenta que jugamos con 2 barajas idénticas mezcladas (80 cartas).
Si se reparten 10 a cada uno de 4 jugadores, tenemos una muestra de tamaño 10 en la que
es evidente que el orden no importa y que podemos tener cartas repetidas (por ejemplo, dos
caballos de oros).

El objetivo de la Combinatoria es calcular cuántos tipos de muestras de un determinado tamaño


se pueden extraer de cierta población. El resultado en el que nos basaremos a la hora de calcular el
número de muestras es el siguiente:

Principio de multiplicación:

Si un procedimiento se puede separar en r etapas, de modo que el resultado de una de ellas no influye
en el resultado de las otras, y en cada una de estas etapas se obtienen respectivamente n1 , n2 , n3 , . . ., nr
resultados, entonces el procedimiento global conduce a n1 · n2 · n3 · . . . · nr resultados.

Ejemplo: ¿Cuántos resultados podemos obtener al lanzar una moneda tres veces?.

Aplicando el principio anterior, en el primer lanzamiento obtenemos 2 resultados (Cara o cruz), en el


segundo lanzamiento, otros 2 y en el tercero también 2.
Por tanto, en total hay 2 · 2 · 2 = 8 posibles resultados. Si lo disponemos en forma de diagrama de
árbol, obtenemos los 8 resultados:

Figura 1.1: Diagrama de árbol


CAPÍTULO 1. COMBINATORIA 7

1.2. Muestras ordenadas


1.2.1. Muestras ordenadas sin repetición
Si tenemos una población de tamaño n y queremos extraer una muestra ordenada y sin repetición
de tamaño k (k < n), razonemos de este modo:
El primer elemento lo podemos elegir entre n elementos.
El segundo, al no poder repetir, podemos elegirlo entre n − 1 elementos.
..
.
El elemento k, lo podremos elegir entre n − k + 1 elementos.

Por tanto, y aplicando el principio de multiplicación en total hay :

n · (n − 1) · . . . · (n − k + 1)

muestras de tamaño k ordenadas y sin repetición.

Ejemplos:

1. ¿De cuántas formas se pueden elegir 2 cartas, extraı́das sucesivamente y sin repetir, de una
baraja española?
La primera se puede elegir de 40 formas.
La segunda, al no poder repetir, sólo se puede elegir de 39 maneras.
Por tanto, en total hay 40·39 = 1560 posibilidades.

2. Seis ciclistas llegan al sprint en una prueba de la Olimpiadas, ¿De cuántas maneras se pueden
colocar los tres primeros puestos?.
Para el primer puesto hay 6 posibilidades.
Para el segundo, sólo 5 posibilidades.
Para el tercero, quedan 4 opciones.
Por tanto hay en total 6·5·4 = 120 maneras.

Las muestras ordenadas y sin repetición se denominan Variaciones sin repetición. Por tanto,
si el tamaño de la población es n y el de la muestra k, el número de variaciones sin repetición lo
expresaremos por:
Vnk = n · (n − 1) · . . . · (n − k + 1)
(notemos que k, tamaño de la muestra indica el número de factores que hay que multiplicar, por
ejemplo, en los ejemplos anteriores, en el primero las muestra eran de tamaño 2 y multiplicábamos 2
factores, y en el segundo eran muestras de tamaño tres y multiplicábamos tres factores).

Ejercicio: ¿Cuántos números de cuatro cifras no repetidas se pueden formar con las cifras del 1 al 9
(ambas inclusive)?

1.2.2. Permutaciones
En el caso particular de que se tome una muestra de tamaño igual al tamaño de la población, es
decir, k = n, las variaciones se denominan permutaciones y se obtendrı́a:

Vnn = n · (n − 1) · . . . · (n − n + 1) = n · (n − 1) · . . . · 1
CAPÍTULO 1. COMBINATORIA 8

El producto de todos los números enteros desde el 1 hasta el n se denomina factorial de n y se


representa por n!. Por definición, 0!=1 y 1!=1. Evidentemente no existen los factoriales de los números
negativos (Si intentásemos calcular, por ejemplo (-4)!, por definición deberı́amos escribir:

(−4) · (−3) · (−2) · (−1) · 0 · 1 = 0

, es decir, el 0 siempre aparecerı́a en un factorial de un entero negativo, y dicho factorial serı́a siempre
0. No tiene sentido, por tanto, calcular el factorial en este caso).
Por tanto este caso particular de variaciones sin repetición se denomina permutaciones sin repeti-
ción de n elementos y se expresa:
Pn = n!
Ejemplo: ¿De cuántas maneras se pueden sentar 5 personas en 5 asientos en un cine?.
La primera persona se puede sentar en 5 sitios.
La segunda sólo en 4, la tercera en 3, la cuarta en 2 y la quinta en 1.
De modo que hay 5·4·3·2·1 = 120 posibilidades, es decir, P5 = 5! = 120.
Ejercicio: ¿Cuántas palabras de 8 letras (con o sin sentido) se pueden formar con las letras A B C
D E F G H?.

1.2.3. Permutaciones con elementos repetidos


Si queremos calcular el número de permutaciones de n elementos de los cuáles hay n1 de una
clase,n2 de otra, etc. . . de modo que n1 + n2 + . . . + nr = n , entonces hablamos de permutaciones de
n elementos, algunos de los cuales están repetidos, lo que se expresa como:
n!
Pnn1 ,n2 ,...,nr =
n1 ! · n2 ! · . . . · nr !
Ejemplo: Con las letras A A A B B ,¿cuántas palabras, con o sin sentido, pueden formarse?
La A se repite 3 veces y la letra B se repite 2 veces, y en total hay 5 letras. Ası́ el número total de
palabras son:
5! 5·4·3·2·1 5·4
P53,2 = = = = 10
3! · 2! 3·2·1·2·1 2
Dichas palabras serı́an: AAABB, AABAB, AABBA, ABAAB, ABABA, ABBAA
Escribe los 4 restantes.
Ejercicio: Con 5 signos + y 3 signos - ¿Cuántas cadenas de sı́mbolos se pueden formar?

1.2.4. Muestras ordenadas con repetición


Si la población es de tamaño n y la muestra de tamaño k, pero ahora permitimos repeticiones
,procedemos ası́:
El primer elemento se puede elegir de n maneras.
Como podemos repetir, el segundo también se puede elegir de n maneras.
..
.
El elemento número k se puede elegir de n maneras.
En total tendremos n·n·. . . ·n (k veces ) = nk muestras de este tipo.
Ejemplos:

1. ¿De cuántas maneras se pueden elegir 2 cartas (no necesariamente distintas de una baraja de 40
cartas?.
La primera se puede elegir de 40 maneras.
La segunda, al poder repetir, también se puede elegir de 40 maneras.
En total hay 40·40 = 1600 formas.
CAPÍTULO 1. COMBINATORIA 9

2. ¿De cuántas formas se puede entregar el Premios al primer clasificado, al segundo, al tercero, y
al cuarto entre 5 pelı́culas diferentes en un festival de cine?
El primer Premio se puede dar de 5 maneras, el segundo también, el tercero también y el cuarto
también.
Por tanto hay 54 = 625 posibilidades.

Las muestras ordenadas y con repetición se denominan Variaciones con repetición y lo expresare-
mos:
V Rkn = nk
Ejercicio: ¿Cuántos números de tres cifras (no necesariamente distintas) pueden formarse con los
dı́gitos 1,6,7,8,9?.

1.3. Muestras no ordenadas


1.3.1. Muestras no ordenadas y sin repetición
Para estudiar este caso, es conveniente fijarse en un ejemplo.
Supongamos que tenemos una bolsa con 5 bolas numeradas del 1 al 5. Sacamos dos bolas, sin
importarnos el orden y sin repetir, ¿cuántos posibles resultados hay?.
Examinemos las posibilidades. Si el orden fuese importante ya sabemos que tendrı́amos 5·4 = 20
posibilidades (V52 = 5 · 4) que serı́an:

1, 2 1, 3 1, 4 1, 5
2, 1 2, 3 2, 4 2, 5
3, 1 3, 2 3, 4 3, 5
4, 1 4, 2 4, 3 4, 5
5, 1 5, 2 5, 3 5, 4
Ahora bien, como no nos importa el orden, para nosotros las parejas 2,1 y 1,2 que son 2, en realidad
sólo deberı́an contar como una, y lo mismo ocurre con el resto de parejas.
Estamos contando cada pareja 2 veces. Por tanto, para obtener el número de parejas que buscamos
tenemos que dividir entre 2. Ası́ resulta que el número de muestras no ordenadas y sin repetición que
20
tenemos es de: = 10 , sólo 10 posibilidades que son:
2
{1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5}, {4, 5}
donde las llaves indican que el orden no importa.
Si sacásemos 3 bolas en lugar de 2, tendrı́amos los trı́os: 1,2,3 1,2,4 1,2,5 etc. . . en total 5·4·3 =
60 posibilidades (V53 = 5 · 4 · 3).
Razonando de igual manera al caso anterior, todos aquellos trı́os en los que estuviesen por ejemplo,
el 1, el 2 y el 3 estarı́an repetidos. Ahora bien, ¿cuántas veces se repite cada trı́o?. Veamos, tomando
como ejemplo los trı́os con 1,2 y 3 obtenemos: 1,2,3 1,3,2 2,1,3 2,3,1 3,1,2 3,2,1 6 posibilidades
(P3 = 3!) que en realidad representan lo mismo pues no nos importa el orden. Lo mismo ocurre con
cada trı́o, de modo que cada uno de ellos se repite 6 veces, ası́ pués si no tenemos en cuenta el orden,
60
el número de muestras no son 60 sino: = 10 maneras (no ordenadas y sin repetición).
6
Ejercicio: Escribir los 10 trı́os del ejemplo anterior.
Formalizando lo anterior, si la población es de tamaño n y se extraen muestras de tamaño k, si
fuesen ordenadas serı́an
Vnk = n · (n − 1) · . . . · (n − k + 1)
pero como son no ordenadas tenemos que dividir por el número de maneras de ordenar esas muestras
de tamaño k, es decir hay que dividir por
Pk = k!
CAPÍTULO 1. COMBINATORIA 10

Resumiendo, el número de muestras no ordenadas y sin repetición de tamaño k que se extraen de


una población de tamaño n es:
Vnk
Pk
Las muestras no ordenadas y sin repetición se denominan Combinaciones sin repetición y las
expresaremos:
Vk
Cnk = n
Pk
El número de combinaciones sin repetición Cnk se recuerda de manera más sencilla mediante otra
fórmula:  
n
Cnk =
k
 
n
La expresión se denomina número combinatorio y se lee ”n sobre k”.
k
Una regla sencilla que permite calcular este número combinatorio es:
 
n n!
=
k k! · (n − k)!

Ejemplos:

1. ¿De cuántas maneras se pueden sacar 3 bolas numeradas en cualquier orden, de una bolsa que
contiene 5 bolas?.
Serı́an combinaciones de 5 elementos de los que sacamos 3, es decir, tenemos que calcular:
 
5 5!
C53 = = = 10
3 3! · 2!

son las maneras que habı́amos calculado en el ejemplo de la introducción.

2. ¿De cuántas formas se puede formar un grupo de trabajo de 6 alumnos de entre una clase de
27?.
En este caso son combinaciones (no importa el orden ) de 27 elementos de los que se escogen 6
, es decir:  
6 27 27! 27!
C27 = = = = 296010
6 6! · (27 − 6)! 6! · 21!

(¡Compruébalo!).

Ejercicio: ¿De cuántas maneras se pueden extraer 6 bolas de un bombo que contiene 49 bolas?
(Loterı́a Primitiva)
Hay algunos tipos más de muestras, en concreto las muestras no ordenadas con repetición, pero
no se estudiarán en este momento.

Números combinatorios y factoriales en la calculadora

Las calculadoras cientı́ficas poseen algunas teclas útiles para el cálculo de factoriales y números com-
binatorios.
Para el factorial, se utiliza la tecla !, que suele encontrarse sobre alguna otra tecla, por lo que al
utilizarla habrá que presionar antes la tecla SHIFT (o INV).
Dado que los factoriales crecen a una velocidad enorme, un calculadora normal sólo puede calcular
hasta el factorial de 69, y ya si pretendemos calcular 70!, se produce un mensaje de error.
Observemos que un número tan inofensivo como 13! ya tiene un valor de 6.227.020.800
CAPÍTULO 1. COMBINATORIA 11

Para el caso de los números combinatorios, algunas calculadoras poseen una función para calcu-
larlos. Suele estar situada sobre la tecla de la división (depende mucho del modelo de calculadora).
Dicha función es
nCr
   
n 5
y calcula el número combinatorio , de modo que si queremos calcular , basta con introducir
r 3
el 5, luego SHIFT (o INV) , posteriormente el 3 y luego presionar la tecla de = para obtener 10. (Ya
lo habı́amos calculado antes).
Evidentemente si alguna de estas funciones tiene una tecla propia en la calculadora, es decir, no
está encima de otra, no es necesario presionar la tecla SHIFT (o INV) para operar con ella.
Capı́tulo 10

DIFERENCIABILIDAD DE
FUNCIONES. OPTIMIZACIÓN

10.1. Introducción
Sin duda uno de los pilares básicos de las matemáticas lo constituye el cálculo diferencial (o cálculo
de derivadas). Las aplicaciones de las derivadas son múltiples y se dan en muchos y muy diversos
campos.
El cálculo diferencial tuvo su gérmen en los trabajos del ilustres matemáticos como I.Newton y
G.W. Leibnitz, quienes, independientemente uno del otro, llegaron a resultados similares en el siglo
XVII.
En este tema se añalizarán algunas de las principales aplicaciones de las derivadas de funciones,
que posibilitan el cálculo de extremos relativos, concavidad y puntos de inflexión, facilitan el trazado
de curvas y sirven de herramienta para la resolución de los llamados problemas de optimización, en
los cuales se trata de encontrar la solución óptima (máxima o mı́nima) a cierto problema.

10.2. Introducción al concepto de derivada. Tasas de variación me-


dia e instantánea.
Sabemos que las funciones son crecientes en ocasiones, decrecientes en otras, e incluso constantes
en alguna de sus partes.
Ahora bien, no todas las funciones crecientes crecen de igual modo, e incluso una misma función
creciente puede crecer de distinta forma, dependiendo de que nos encontremos en una parte u otra.
−x
Analicemos un ejemplo. La siguiente figura muestra la gráfica de la función f (x) = :
x−2

Es evidente que la función es creciente a partir del punto de abscisa x = 2. Ahora bien, ¿siempre
crece de igual modo?.

168
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 169

Evidentemente no.
Tomemos un intervalo, por ejemplo el intervalo [3, 4].
¿Cuánto ha crecido la función en ese intervalo?. Como:
−3
f (3) = = −3
1
y
−4
f (4) = = −2
2
la función ha crecido en realidad:
f (4) − f (3) = 1
1 unidad.
Si nos fijamos en otro intervalo donde la función también sea creciente, el [4, 6], veamos como crece
la función.
Como f (4) = −2 y
−6 −3
f (6) = =
4 2
el crecimiento total es de
−3 1
f (6) − f (4) = − (−2) =
2 2
tan sólo media unidad, aunque el intervalo es dos veces mayor que el primero.
Podemos inferir entonces que la función es mucho más creciente, o que crece más rápidamente en
el intervalo [3, 4] que en el [4, 6].
La formalización de estas ideas la da la Tasa de Variación Media de una función.

Definición: Se llama Tasa de Variación Media en un intervalo [a, b] de una función f (x), y se expresa
por T V M [a, b], al cociente:
f (b) − f (a)
T V M [a, b] =
b−a
La T V M no es más que la diferencia entre los valores de la función en los extremos del intervalo
dividida entre la longitud del intervalo.
Por tanto, de esta primera definición podemos deducir algunas propiedades:
* Si la T V M en el intervalo es positiva, significa que la función crece, globalmente en el intervalo.
(Entiéndase globalmente en el sentido de que no es necesariamente creciente en todo el intervalo, pero
en definitiva hay un crecimiento de la función en dicho intervalo).
* Si la T V M en el intervalo es negativa, la función decrecerá.
* La magnitud del crecimiento o el decrecimiento dependerá de la magnitud de la T V M .
Ası́ pues la T V M nos da una idea de cómo crece o decrece la función y con qué rapidez lo hace.
Sin embargo, la T V M no resuelve todos los problemas, puesto que nos podemos plantear si la
función es creciente o no en un punto concreto, no en un intervalo.
La T V M y el concepto de lı́mite solucionan el problema:
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 170

Si queremos saber si la función tiene una tendencia creciente o decreciente en un punto a, utiliza-
remos el concepto de T V M como antes en un intervalo [a, a + h]:

f (a + h) − f (a) f (a + h) − f (a)
T V M [a, a + h] = =
a+h−a h
A medida que nos acercamos al punto a, es decir, a medida que h se acerca a 0, la tasa de variación
media en ese intervalo se acerca al dato buscado, la tasa de variación en ese punto concreto. Más
concretamente:

Definición: Se llama Tasa de Variación Instantánea en un punto a de una función f (x) al valor,
denotado por T V I(a):
f (a + h) − f (a)
T V I(a) = lı́m
h→0 h
x
Ejemplo: Calcular la tasa de variación instantánea de la función f (x) = en el punto 2.
x−1
Aplicando la definición:
2+h 2 2+h
f (2 + h) − f (2) − 2−1
2+h−1 −2
T V I(2) = lı́m = lı́m = lı́m 1+h =
h→0 h h→0 h h→0 h
2+h−2−2h −h
1+h −h −1
= lı́m = lı́m 1+h = lı́m = lı́m =1
h→0 h h→0 h h→0 h(h + 1) h→0 h + 1

Ejercicio: Calcula la Tasa de Variación Instantánea para las siguientes funciones en los puntos indi-
cados:
2x − 1
a) f (x) = en x = 0 y x = −1.
x+1
b) g(x) = √x3 − x + 3 en x = 1 y x = −2.
c) h(x) = x + 3 en x = 6 y x = −2.

10.3. Definición de derivada. Reglas de derivación. Interpretación


geométrica
La tasa de variación instantánea en un punto es precisamente la derivada de la función en un
punto. Formalicemos:

Definición: Dada una función f (x) y un punto a, se llama derivada de la función f (x) en el punto
a, y se representa por f  (a) a:
f (a + h) − f (a)
f  (a) = lı́m
h→0 h
es decir la derivada en un punto es la tasa de variación instantánea en ese punto.

El problema que nos podemos encontrar es el siguiente.


Si tenemos una función, digamos f (x) = 2x2 + 1, y calculamos su derivada en un punto x = −3,
tendremos que hacer:

f (−3 + h) − f (−3) 2(−3 + h)2 + 1 − (2(−3)2 + 1)


f  (−3) = lı́m = lı́m =
h→0 h h→0 h
2(9 + h2 − 6h) + 1 − 19 2h2 − 12h h(2h − 12)
= lı́m = lı́m = lı́m = lı́m 2h − 12 = −12
h→0 h h→0 h h→0 h h→0

Ahora bien, si queremos calcular la derivada en el punto 2 de la misma función, tenemos que volver a
calcular ese lı́mite, lo cuál es un trabajo engorroso.
Conviene, por tanto calcular la función derivada de f (x), es decir f  (x).
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 171

Esta función derivada permite calcular la derivada en cualquier punto sin más que sustituir en el
punto concreto. Por ello es conveniente dominar las llamadas reglas de derivación para las funciones
más habituales.
Por otra parte, es posible calcular las derivadas sucesivas de una función.
La derivada segunda será la derivada de la función derivada, y se representará por f  (x), y ası́ su-
cesivamente las funciones derivadas tercera (f  (x)), cuarta, etc.

10.3.1. Propiedades de las derivadas. Reglas de derivación


1. La derivada de una constante es nula:

f (x) = k =⇒ f  (x) = 0

donde k ∈ R.

2. Derivada de la suma (o diferencia de funciones):

(f ± g)(x) = f  (x) ± g  (x)

3. Derivada del producto de una función por una constante:

(k · f ) (x) = k · f  (x)

donde k ∈ R.

4. Derivada del producto de funciones:

(f · g) (x) = f  (x) · g(x) + f (x) · g  (x)

5. Derivada del cociente de funciones:


 
f f  (x) · g(x) − f (x) · g  (x)
(x) =
g (g(x))2

6. Derivada de la composición de funciones (Regla de la cadena):

(f ◦ g) (x) = f  (g(x)) · g (x)


CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 172

10.3.2. Derivadas elementales


Función elemental Derivada

1.- f (x) = xk , k ∈ R f  (x) = k · xk−1

2.- f (x) = ex f  (x) = ex

3.- f (x) = ax , a ∈ R+ f  (x) = ax · ln a

1 1
4.- f (x) = logax, a ∈ R+ f  (x) = ·
x ln a
1
5.- f (x) = ln x f  (x) =
x

6.- f (x) = sen x f  (x) = cos x

7.- f (x) = cos x f  (x) = −sen x

1
8.- f (x) = tan x f  (x) = 1 + tan2 x = sec2 x =
cos2 x

9.- f (x) = csc x f  (x) = − cot x · csc x

10.- f (x) = sec x f  (x) = tan x · sec x

−1
11.- f (x) = cot x f  (x) = = − csc2 x
sen 2 x
1
12.- f (x) = arc sen x f  (x) = √
1 − x2

−1
13.- f (x) = arc cos x f  (x) = √
1 − x2

1
14.- f (x) = arctan x f  (x) =
1 + x2
√ 1
15.- f (x) = x f  (x) = √
2· x

√ 1
16.- f (x) = n
x f  (x) = √
n
n · xn−1
Con todas estas propiedades es mucho más fácil derivar, por ejemplo, para la función y el punto
anterior, calculamos la función derivada:

f (x) = 2x2 + 1 =⇒ f  (x) = 4x

y ahora, conocida la función derivada podemos calcular la derivada en cualquier punto: En x = 2,

f  (2) = 4 · 2 = 8

En x = −3,
f  (−3) = 4 · (−3) = −12
Es mucho más cómodo y no tenemos que recurrir a la definición.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 173

10.3.3. Interpretación geométrica de la derivada


La derivada tiene una interpretación geométrica muy sencilla.
Observemos la función f (x). Si calculamos las respectivas tasas de variación media en los intervalos
que se acercan al punto a, como la tasa de variación media es:

f (a + h) − f (a)
T V M [a, a + h] =
h
este cociente corresponde a la pendiente (o inclinación) de la recta que une los puntos (a, f (a)) y
(a + h, f (a + h)):

f (a + h) − f (a)
Figura 10.1: La pendiente de la recta secante es .
h

Por tanto cuando nos acercamos al punto a, es decir, cuando calculamos el valor de la tasa de
variación instantánea o derivada en el punto a, dicho valor es precisamente la pendiente de la recta
tangente en el punto a, es decir, aquella recta que sólo corta (en las cercanı́as del punto) a la función
f (x) en el punto a.

Figura 10.2: La pendiente de la recta tangente es f  (a).


CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 174

Recordemos que la pendiente de una recta es, en cierta forma, la inclinación de la recta.
Si α es al ángulo que forma la recta con el eje x y m es la pendiente de la recta, se cumple que:

m = tan α

Figura 10.3: La pendiente de la recta tangente es m = tan α

Ası́, si f (x) es la función y queremos calcular la tangente en el punto (a, f (a)), sabemos que la
pendiente de la recta tangente es m = f  (a), y utilizando la ecuación de la recta en la forma punto-
pendiente, sabemos que la ecuación de dicha recta tangente es:

y − f (a) = f  (a) · (x − a)

Ejemplo: Calcula la ecuación de la recta tangente a la curva f (x) = e2x+2 en el punto −1.

Como a = −1, en primer lugar calculamos:

f (−1) = e−2+2 = e0 = 1

Para calcular f  (−1), derivamos:


f  (x) = 2 · e2x+2
y por tanto la derivada en el punto a = −1 será:

f  (−1) = 2 · e−2+2 = 2 · e0 = 2

Con estos datos, la ecuación de la recta tangente es:

y − f (−1) = f  (−1) · (x − (−1)) =⇒ y − 1 = 2(x + 1) =⇒ y = 2x + 3


CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 175

Graficamente la función y la recta tangente son:

Figura 10.4: Curva f (x) = e2x+2 y tangente en x = −1, y = 2x + 3.

10.4. Aplicaciones de las derivadas a la Fı́sica y la Economı́a


10.4.1. Aplicación a la Fı́sica
La derivada tiene una importante aplicación en el campo de la fı́sica.
Si una partı́cula lleva un movimiento cualquiera en el que el espacio recorrido viene dado por una
función e(t), es decir, el espacio dado en función del tiempo, entonces se cumple que:
a) La derivada del espacio, e (t) representa la velocidad de la partı́cula en el instante t, es decir, la
derivada del espacio es la velocidad:
v(t) = e (t)
b) Además, la derivada de la velocidad, v  (t) representa la aceleración de la partı́cula en cualquier
instante t, es decir, la derivada de la velocidad (o la derivada segunda del espacio) es la aceleración:

a(t) = v  (t) = e (t)

Ejemplo: El espacio recorrido por un móvil viene dado por la función e(t) = 3t2 − t + 1.
a) Calcular la tasa de variación en el intervalo [2, 6].
b) Hallar la velocidad en el instante t = 0.
c) Hallar la velocidad y aceleración en el instante t = 2.

a) Aplicando la fórmula:

e(6) = 108 − 6 + 1 = 103, e(2) = 12 − 2 + 1 = 11

luego:
e(6) − e(2) 103 − 11 92
T V M [2, 6] = = = = 23 m/s
6−2 4 4
b) La velocidad será:
v(t) = e (t) = 6t − 1 =⇒ v(0) = −1 m/s
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 176

c) En el instante 2:
v(2) = 11 m/s
Y la aceleración en ese mismo instante;

a(t) = v  (t) = 6

Por tanto,
a(2) = 6 m/s2
la aceleración es constante, es un movimiento uniformemente acelerado.

10.4.2. Aplicación a la Economı́a


La aplicación a la Economı́a se refiere al concepto de marginalidad.
Ası́, el coste marginal de fabricación de un producto es el incremento de coste que se produce
cuando se aumenta la producción en una unidad más.
Del mismo modo se habları́a del incremento de los ingresos por la última unidad vendida, ingreso
marginal.
En cualquier caso, siempre que se utilice el término marginal , se trata de la derivada de la función
de que se esté tratando, respecto de la variable de producción, que se mide en unidades fabricadas.
Supongamos, por ejemplo, que la función de costes de cierto producto viene dada por la expresión
c(x) = 30 + 50x − x2 , donde c(x) se expresa en euros y x en unidades.
El coste marginal para producir la unidad x + 1 serı́a c (x) = 50 − 2x.
En realidad, la derivada no proporciona exactamente el coste marginal, sino una aproximación
que facilita el cálculo. Dicho coste marignal, rigurosamente, viene dado por c(x + 1) − c(x), pero esta
diferencia se puede aproximar bien por la derivada c (x).
Si queremos calcular el coste marginal producido al producir la 3ª unidad, fijémonos en que es-
tarı́amos calculando el coste marginal de la unidad nº 2, c (2) = 46, es decir, 46 euros.
Si no utilizásemos la derivada, el coste marginal serı́a:

c(3) = 30 + 150 − 9 = 171, c(2) = 30 + 100 − 4 = 126 =⇒ c(3) − c(2) = 171 − 126 = 45

no es el valor que obtenı́amos con la derivada, pero es una buena aproximación.


Las funciones de la Economı́a tienen un campo de validez que, por lo general, es restringido respecto
al dominio de definición de la función.
En este caso, por ejemplo, la función es válida desde x = 0 hasta x = 25; a partir de ahı́, si obser-
vamos el coste marginal, disminuyen los costes de fabricación, lo que es absurdo si se está fabricando
más.
Notemos, además que si queremos calcular el coste marginal si se quiere producir la unidad número
n, hemos de calcular la función de coste marginal evaluada en la unidad anterior, que es la última
unidad producida, es decir, en la unidad n − 1.
Lo mismo se puede decir si la función es de ingresos o de beneficios.

Ejercicios:
1. El desplazamiento de un móvil que se mueve a lo largo de una linea recta viene dado por la
2
función e(t) = et − 1.
Halla la velocidad y la aceleración del movimiento. En el instante inicial, ¿cuáles son éstas?.

2. Las funciones de ingresos y gastos correspondientes a cierto producto de consumo son, respecti-
vamente:
I(x) = 80x − 0 1x2 , C(x) = 500 + 20x
. Halla la función beneficio y el beneficio marginal. ¿Para qué valores de x están definidas estas
funciones?.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 177

10.5. Derivabilidad y continuidad


Se estudió en el tema anterior el concepto de continuidad de una función en un punto.
Vimos, por ejemplo, que intuitivamente se puede decir que una función es continua cuando se
puede dibujar sin levantar el lápiz del papel, o de manera más formal, cuando en el punto coinciden
los lı́mites laterales con el valor de la función en el punto, esto es:

lı́m f (x) = lı́m f (x) = f (a)


x→a+ x→a−

La condición para que una función sea derivable es más fuerte, más restrictiva. Para ello es necesario
definir las derivadas laterales.

Definición: Dado un punto a y una función f (x), se define la derivada lateral por la derecha de la
función f (x) y se expresa por f+ (a), como:

f (a + h) − f (a)
f+ (a) = lı́m
h→0+ h
Dado un punto a y una función f (x), se define la derivada lateral por la izquierda de la función f (x)
y se expresa porpor f− (a), como:

f (a + h) − f (a)
f− (a) = lı́m
h→0− h
Definición: Diremos que una función es derivable en un punto a cuando existen y son finitas las
derivadas laterales y son iguales, es decir:

f+ (a) = f− (a)

Ejemplo: Estudiar la continuidad y derivabilidad de la función:



−x si x ≤ 0
f (x) =
x si x > 0

Calculando los lı́mites laterales:


lı́m f (x) = lı́m x = 0
x→0+ x→0

lı́m f (x) = lı́m −x = 0


x→0− x→0

Además f (0) = 0, por tanto la función es continua en el punto x = 0 que es el único punto conflictivo.
Analicemos la derivabilidad en x = 0:
f (0 + h) − f (0) −h − 0 −h
f− (0) = lı́m = lı́m = lı́m = lı́m −1 = −1
h→0− h h→0 h h→0 h h→0

f (0 + h) − f (0) h−0 h
f+ (0) = lı́m = lı́m = lı́m = lı́m 1 = 1
h→0+ h h→0 h h→0 h h→0

Por tanto la función no es derivable en x = 0.


CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 178

Viendo la gráfica de la función, se observa lo que ocurre:

La función es continua pues se puede dibujar sin levantar el lápiz del papel, pero no es derivable
en el cero porque en dicho punto hay un punto anguloso, una “esquina”. En puntos como estos, la
función no es derivable.
Por tanto, se verifica que aunque una función puede ser continua en un punto y sin embargo no
ser derivable en ese mismo punto.
Sin embargo, la posibilidad contraria no es posible. Resumiendo:

Propiedad:
Si una función es derivable en un punto, entonces es continua en dicho punto.

Sin embargo, el recı́proco no es cierto, si una función es continua en un punto, la función puede ser o
no derivable en dicho punto.

Ejercicios:

1. Estudiar la continuidad y derivabilidad de la función:



−2x − 1 si x ≤ −2
f (x) = x2 − 3 si −2 < x ≤ 2

2x − 3 si x>2

2. Calcula a y b para que sea derivable la función:



ax + 3 si x ≤ 1
g(x) =
2x2 − b si x > 1

Indicación: Primero impón la condición de que sea continua


CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 179

10.6. Aplicaciones de las derivadas al cálculo del crecimiento y de-


crecimiento de una función. Cálculo de extremos
Observemos la siguiente gráfica:

Figura 10.5: La pendiente de las tangentes (la derivada) es positiva si la función crece.

Si trazamos las correspondientes tangentes en diversos puntos, todos ellos donde la función es
creciente, obsevamos como la recta tangente está cada vez menos inclinada, lo que quiere decir (ya
que la inclinación de una recta se mide a través de su pendientes y sabemos que esta coincide con la
derivada ) que la derivada es cada vez menor.
Más aún, como las rectas tangentes tienen inclinación positiva (son rectas crecientes), las pendientes
son cada vez menores y positivas, es decir, la derivada es positiva en aquellos intervalos en los que la
función es creciente.
Si seguimos trazando tangentes, llegamos al punto 3, donde la tangente es totalmente horizontal,
es decir:

Figura 10.6: La pendiente de las tangentes (la derivada) es nula si la función tiene un extremo (un
valor máximo o mı́nimo).
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 180

Decı́amos que la pendiente era decreciente, hasta que llega al máximo de la función, donde se ha
alcanzado el valor extremo de la pendiente. La recta es horizontal, no está inclinada y su pendiente es
cero.
Si seguimos trazando las tangentes, vemos ahora lo siguiente:

Figura 10.7: La pendiente de las tangentes (la derivada) es negativa si la función decrece.

Y ahora observamos que la pendiente de la recta (la derivada) es negativa, y cada vez menor, por
tanto si la función de decreciente, afirmamos que la función derivada es negativa.
Todo lo observado anteriormente lo podemos resumir en la siguiente propiedad.

Propiedad: Dada una función f (x), se cumple que:


a) Si f  (x) > 0 (la derivada es positiva) entonces la función f (x) es creciente.
b) Si f  (x) < 0 (la derivada es negativa) entonces la función f (x) es decreciente.
c) Si f  (x) = 0 entonces la función puede presentar un extremo relativo (máximo o mı́nimo) en
dicho punto.

La manera práctica de proceder, por tanto, para determinar los extremos de una función, ası́ como
aquellos intervalos en los que la función crece o decrece es la siguiente:
* Calculamos la derivada de la función, f  (x), y la igualamos a cero, resolvemos la ecuación resul-
tante, cuyas soluciones son los posibles extremos de la función.
* Realizamos una tabla en la que tenemos que poner los puntos obtenidos anteriormente y además
los puntos conflictivos de la función (aquellos donde la función no está definida, o donde no es deriva-
ble....). Todos estos puntos se denominan puntos crı́ticos.
* En dicha tabla, estudiamos el signo de la derivada primera, f  (x).
Si dicha derivada es positiva, nos indicará el crecimiento de la función, y si es negativa, será un signo
de su decrecimiento. El paso de un intervalo creciente a otro decreciente o viceversa nos indicará la
existencia de un máximo o un mı́nimo relativo de la función f (x).

Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función: f (x) = x3 − 3x.

Comenzamos calculando la derivada: f  (x) = 3x2 − 3.


Igualando a cero:
3x2 − 3 = 0 =⇒ x2 = 1 =⇒ x = ±1
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 181

obtenemos dos puntos crı́ticos, y no hay más pues la función es polinómica y por tanto, su dominio
son todos los números reales y no presenta problemas. Hacemos una tabla como la siguiente:

−∞ −1 1 +∞
f  (x) + − +
f (x)

Para obtener los signos de f  (x) basta tomar, por ejemplo, un punto en cada intervalo y sustituir en
la expresión de la derivada.
Entre −∞ y −1 tomamos el −2, con lo que:

f  (−2) = 12 − 3 = 9 > 0

positiva. Entre −1 y 1, tomamos el 0, quedando:

f  (0) = −3 < 0

negativa. Entre 1 e ∞ se toma el 2, y se obtiene:

f  (2) = 12 − 3 = 9 > 0

positivo.

Concluimos que la función es creciente en el intervalo (−∞, −1) ∪ (1, ∞).


La función es decreciente en (−1, 1).
Además, se observa que presenta un máximo en el punto x = −1, y un mı́nimo en x = 1.
¿Cómo calcular la segunda coordenada del máximo y el mı́nimo?.
Basta sustituir en la función:

El máximo está en el punto (−1, f (−1)) = (−1, 2).


El mı́nimo está en el punto (1, f (1)) = (1, −2).
Ası́, la representación aproximada de la función será:

Figura 10.8: Gráfica de f (x) = x3 − 3x. Intervalos de crecimiento y extremos.


CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 182

Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función:

2x2 − 3x
f (x) =
ex
Derivando:
(4x − 3)ex − ex (2x2 − 3x) ex (−2x2 + 7x − 3) −2x2 + 7x − 3
f  (x) = = =
(ex )2 (ex )2 ex

E igualando a cero:

−2x2 + 7x − 3 1
x
= 0 =⇒ −2x2 + 7x − 3 = 0 =⇒ x = 3, x =
e 2
No hay más puntos conflictivos, pues aunque hay denominador, nunca se hace cero, pues ex , la función
exponencial es siempre positiva, de modo que Dom f (x) = R.
Ası́ pues los únicos puntos crı́ticos son x = 3, x = 12 .
Hacemos la tabla:
1
−∞ 32 +∞
f  (x) − + −
f (x)

   
1 1
Con lo que f (x) es creciente en , 3 , decreciente en −∞, ∪ (3, ∞).
2 2
Por tanto f (x) presenta un máximo relativo en:
 
9
(3, f (3)) = 3, 3 ≈ (3, 045)
e

y un mı́nimo relativo en     
1 1 1 −1
,f = , ≈ (0 5, −061)
2 2 2 e 12
Gráficamente:

2x2 − 3x
Figura 10.9: Gráfica de f (x) = . Intervalos de crecimiento y extremos.
ex
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 183

10.7. Aplicaciones de las derivadas al cálculo de la concavidad y


la convexidad, puntos de inflexión. Criterio para determinar
máximos y mı́nimos.
Igual que se aplican las derivadas para el cálculo de los máximos y los mı́nimos, y el crecimiento
o decrecimiento de la función, también se pueden aplicar para calcular la concavidad y la convexidad.
Fijémonos en la función siguiente, convexa (o, para evitar ambigüedades, cóncava hacia abajo):

Figura 10.10: La pendiente de las tangentes pasa de positiva a negativa (es decir, decrece) si la función
es cóncava hacia abajo

Al trazar las tangentes, nos fijamos en que cada vez son menores.
Empiezan siendo positivas y muy grandes, van decreciendo hasta que valen cero, y luego comienzan
a ser negativas y cada vez menores. Es decir, que la función derivada es decreciente, f  (x) decreciente.
Si f  (x) es decreciente, es que su derivada es negativa, es decir, f  (x) < 0.
Por tanto se deduce que si la derivada segunda de la función es negativa, la función es cóncava
hacia abajo.
De igual modo si nos fijamos en una función cóncava (o cóncava hacia arriba):

Figura 10.11: La pendiente de las tangentes pasa de negativa a positiva (es decir, crece) si la función
es cóncava hacia arriba
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 184

En este caso la derivada es creciente, y por tanto la derivada segunda será positiva. Es decir, si la
derivada segunda es positiva, la función es cóncava hacia arriba.

Propiedad: Dada una función f (x), se cumple que:


a) Si f  (x) > 0, entonces la función f (x) es cóncava hacia arriba.
b) Si f  (x) < 0, entonces la función f (x) es cóncava hacia abajo.
c) Si f  (x) = 0, entonces el punto es un posible punto de inflexión (un punto donde la función
pasa de cóncava hacia arrina a cóncava hacia abajo o viceversa) de la función.
El proceso para determinar la concavidad y puntos de inflexión es, por tanto, muy similar al del
cálculo del crecimiento, únicamente hay que hacer la derivada segunda e igualarla a cero. La tabla es
similar.

Ejemplo: Calcular la concavidad y convexidad de la función:

f (x) = x3 − 3x

Calculando la derivada segunda:

f  (x) = 3x2 − 3 =⇒ f  (x) = 6x

Igualando a cero, 6x = 0, de donde x = 0.


Es el único punto conflictivo, pues la función es polinómica.
Haciendo la tabla:
−∞ 0 +∞
f  (x) − +
f (x) ∩ ∪

Ası́ pues la función es cóncava hacia arriba en (0, ∞) y cóncava hacia abajo en (−∞, 0).
Hay un punto de inflexión es (0, f (0)) = (0, 0).
Se observa gráficamente:

Figura 10.12: Gráfica de f (x) = x3 − 3x. Intervalos de concavidad y puntos de inflexión.


CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 185

Ejercicios: Estudiar la concavidad y convexidad, el crecimiento y el decrecimiento, los extremos


y puntos de inflexión de las siguientes funciones:
a) f (x) = 2x3 − 9x2
2
b) g(x) =
x
c) h(x) = x4 − 12x2 + 8
d) t(x) = x · e−2x

Además la derivada segunda permite discernir si un punto crı́tico es un máximo o un mı́nimo, en base
al siguiente resultado:

Propiedad: Si a es un punto tal que f  (a) = 0 (un posible extremo relativo), entonces:
* Si f  (a) > 0, entonces a es un mı́nimo de la función.
* Si f  (a) < 0, entonces a es un máximo de la función.
* Si f  (a) = 0 no podemos asegurar nada. (Aunque en realidad si se puede saber pero excede los
contenidos del curso).

Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función:

f (x) = x3 − 3x

Comenzamos calculando la derivada: f  (x) = 3x2 − 3.


Igualando a cero:
3x2 − 3 = 0 =⇒ x2 = 1 =⇒ x = ±1
, obtenemos dos puntos crı́ticos.
Calculando la derivada segunda:
f  (x) = 6x
Sustituyendo,
f  (1) = 6 > 0
en x = 1 hay un mı́nimo.
f  (−1) = −6 < 0
en x = −1 hay un máximo.
Como ya habı́amos obtenido anteriormente.

10.8. Representación gráfica de funciones


Con todas estas aplicaciones es sencillo representar gráficamente cualquier función, basándose en
los siguientes puntos:

1. Dominio de definición.

2. Puntos de corte con los ejes:


Con el eje x, y = 0.
Con el eje y, x = 0.

3. Simetrı́as.
Par si f (−x) = f (x).
Impar si f (−x) = −f (x).
No tiene simetrı́a si no se da ninguna de esas condiciones.

4. Ası́ntotas: Verticales, Horizontales y Oblicuas.


CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 186

5. Crecimiento y decrecimiento. Extremos relativos.

6. Concavidad y convexidad. Puntos de inflexión.


3x − 1
Ejemplo: Representa gráficamente la función f (x) = .
3x2 + 1
1. Dominio de definición
Igualando a cero el denominador:

2 −1 2 −1
3x + 1 = 0 =⇒ x = =⇒ x = =
3 3
de modo que Dom f (x) = R.

2. Puntos de corte con los ejes


Con el eje x, f (x) = 0:
3x − 1 1
2
=⇒ 3x − 1 = 0 =⇒ x =
3x + 1 3
 
1
el punto es ,0 .
3
Con el eje y, x = 0:
3·0−1 −1
f (0) = 2
= = −1
3·0 +1 1
el punto es (0, −1).

3. Simetrı́as

3(−x) − 1 −3x − 1 3x − 1
f (−x) = 2
= 2
= 2 = f (x)
3(−x) + 1 3x + 1 3x + 1
f no es par.
3(−x) − 1 −3x − 1 3x − 1
f (−x) = = = − 2 = −f (x)
3(−x)2 + 1 3x2 + 1 3x + 1
f no es impar, luego f no tiene simetrı́as.

4. Ası́ntotas
Verticales: No tiene puesto que Dom f (x) = R.
Horizontales:
3x − 1
lı́m=0
3x2 + 1
x→∞

3x − 1 3(−x) − 1 −3x − 1
lı́m = lı́m = lı́m =0
x→−∞ 3x2 + 1 x→∞ 3(−x)2 + 1 x→∞ 3x2 + 1

Hay una ası́ntota horizontal en y = 0.


Oblicuas: No hay, pues hay horizontales.

5. Crecimiento
Derivando:

3(3x2 + 1) − 6x(3x − 1) −9x2 + 6x + 3


f  (x) = = =0
(3x2 + 1)2 (3x2 + 1)2
Igualando a cero:
−1
−9x2 + 6x + 3 = 0 =⇒ −3x2 + 2x + 1 = 0 =⇒ x = 1 x =
3
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 187

No hay más puntos crı́ticos, pues Dom f (x) = R.


Haciendo la tabla:
−1
−∞ 3 1 +∞

f (x) − + −
f (x)

   
−1 −1
Luego f (x) es creciente en ,1 y decreciente en −∞, ∪ (1, ∞).
3 3
  
1 −1 −2
Tiene un máximo relativo en (1, f (1)) = 1, y un máximo relativo en , 4 =
2 3 3
   
−1 −6 −1 −3
, = , .
3 4 3 2
6. Concavidad
Calculando la derivada segunda, es:

54x3 − 54x2 − 54x + 6


f  (x) =
(3x2 + 1)3
e igualando a cero no se obtienen raı́ces exactas, por lo que no se puede hacer este estudio.

Con los datos que tenemos, podemos hacer un esbozo de la gráfica de la función:

3x − 1
Figura 10.13: Gráfica de f (x) = .
3x2 + 1

10.9. Optimización de funciones


La última aplicación de las derivada es la optimización de funciones. Consiste en calcular los
máximos y los mı́nimos de cierta función que se obtiene de un problema surgido de una situación
cotidiana.
En estos problemas siempre se tiene:
* Una función de la que hay que calcular el máximo o el mı́nimo, y que habitualmente tiene dos
variables, x e y.
* Una relación entre x e y, que permite despejar una de las dos para obtener una función con una
sola variable.
Veamos cómo se aplica:
Ejemplo: De entre todos los números cuya suma es 36, calcula aquellos cuya suma de cuadrados
es mı́nimo.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 188

Los números buscados son x e y.


La función a minimizar es f (x, y) = x2 + y 2 .
Tenemos dos variables, luego todavı́a no podemos derivar.
La relación que tenemos es que los números suman 36, es decir, x + y = 36.
Despejando, y = 36 − x.
Y por tanto, la función a minimizar es:

f (x) = x2 + (36 − x)2

que ya tiene sólo una vatiable.


Para buscar sus mı́nimos, calculamos la derivada f  (x):

f  (x) = 2x + 2(36 − x)(−1) = 2x − 72 + 2x = 4x − 72

Igualando a cero,
72
4x − 72 = 0 =⇒ x = = 18
4
Además calculando la derivada segunda:
f  (x) = 4
con lo que sustituyendo:
f  (18) = 4 > 0
es positivo luego el punto x = 18 es un mı́nimo.
La solución es, por tanto, un número x = 18 y el otro y = 36 − 18 = 18.
Los dos números son iguales a 18.

Ejercicios:

1. Descompón el número 48 en dos sumandos tales que el quı́ntuplo del cuadrado del primero más
el séxtuplo del cuadrado del segundo sea mı́nimo.

2. Halla un número positivo cuya suma con 4 veces su recı́proco sea mı́nima.

3. Halla las dimensiones del rectángulo de área máxima inscrito en una circunferencia de 20 cm de
radio.

4. La suma de tres números es 60. El primero más el doble del segundo más el triple del tercero
suman 120. Halla los números que verifican estas condiciones y cuyo producto es máximo.

5. Un depósito abierto de chapa y de base cuadrada debe tener capacidad para 13500 litros. ¿Cuáles
han de ser sus dimensiones para que se precise la menor cantidad de chapa?

6. Una ventana normanda consiste en un rectángulo coronado con un semicı́rculo. Encontrar las
dimensiones de la ventana de área máxima si su perı́metro es 10 metros.

7. Una hoja de papel debe contener 18 cm2 de texto impreso. Los márgenes superior e inferior
deben tener 2 cm cada uno y los laterales 1 cm. Calcular las dimensiones de la hoja para que el
gasto de papel sea mı́nimo.
Capı́tulo 11

INTEGRACIÓN. CÁLCULO DE
ÁREAS

11.1. Introducción
Si el problema del cálculo de la recta tangente llevó a los matemáticos del siglo XVII al desarrollo de
las técnicas de la derivación, otro problema, el del cálculo del área encerrada por una curva, propició el
desrrollo de las técnicas de integración.
Se trataba, por ejemplo, de hallar el área encerrada bajo la curva f (x) entre los puntos a y b:

Se conocı́an fórmulas para recintos de forma igual a figuras geométricas(rectangulares, triangulares,


e incluso algunas de curvas especı́ficas), pero si la curva no tenı́a forma regular, no se conocı́a, en
general, su área exacta.
El cálculo integral da respuesta a esta y otras cuestiones.

11.2. Primitivas. Integral indefinida


Dada un función f (x), sabemos calcular su derivada f  (x), e incluso sus derivadas sucesivas, f  (x),
f  (x), etc.
Sin embargo ahora nos planteamos el problema recı́proco:
Dada una función f (x), se trata de encontrar otra, F (x), tal que al derivar esta última función,
obtengamos la función inicial, es decir:
F  (x) = f (x)
Veamos un ejemplo:
Tomemos la función f (x) = 2x.
Se trata de encontrar una función F (x) tal que al derivarla nos de f (x).

193
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 194

Si pensamos un poco, llegamos a que tal función puede ser:

F (x) = x2

pues su derivada es precisamente f (x) = 2x.


Ahora bien, no es F (x) la única función que cumple eso.
Tomemos esta otra:
F (x) = x2 + 43
También su derivada es f (x) = 2x.
Esto nos hace ver que no sólo hay una función que cumple lo requerido, sino infinitas, sin más que
añadir cualquier número. Esto se expresa como:

F (x) = x2 + C

Una función F (x) como la que hemos encontrado se llama primitiva de f (x), y hemos visto que si una
función tiene una primitiva, entonces tiene infinitas.

Llamaremos integral indefinida de la función al conjunto de todas estas primitivas.


Lo representaremos, en el caso anterior, como:

2x dx = x2 + C, C ∈ R

Definición: Dada una función f (x), se llama primitiva de f (x) a otra función F (x) tal que:

F  (x) = f (x)

Se denomina integral indefinida de f (x) al conjunto de todas las primitivas (hay infinitas) de f (x), y
se representa por: 
f (x) dx = F (x) + C, C ∈ R

Ası́, el problema de calcular una primitiva de una función es inverso al de calcular una derivada; como
son operaciones inversas la suma y la resta, el producto y el cociente, la potenciación y la radicación.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 195

11.3. Primitivas inmediatas


De modo análogo al caso de las derivadas, debemos recordar algunas primitivas de las funciones
más usuales: 
1. − k dx = kx + C, C ∈ R, k ∈ R


xn+1
2. − xn dx = + C, C ∈ R, , n ∈ R, n = −1
n+1
 
1
3. − x−1 dx = dx = ln x + C, C∈R
x

ax
4. − ax dx = + C, C∈R
ln a

5. − ex dx = ex + C, C∈R


6. − sen x dx = − cos x + C, C∈R


7. − cos x dx = sen x + C, C∈R


1
8. − dx = arctan x, C∈R
1 + x2

1
9. − √ dx = arc sen x + C, C∈R
1 − x2

−1
10. − √ dx = arc cos x + C, C ∈ R
1 − x2
Estas primitivas permiten calcular algunas integrales sencillas.
Además es conveniente la utilización de las dos propiedades siguientes:

1.  
k · f (x) dx = k · f (x) dx, k∈R

Esta propiedad indica que si hay un número multiplicando a toda la integral, entonces se puede
sacar fuera de la integral.

2.   
(f (x) ± g(x)) dx = f (x) dx ± g(x) dx

Lo que indica esta propiedad es que si tenemos una suma (o resta) de dos funciones, entonces
podemos separar la integral en la suma (o resta) de dos integrales.

Utilizando estas propiedades de manera combinada, se calculan las primeras integrales sencillas.
Veamos algunos ejemplos:

Ejemplo: Calcular las integrales siguientes:


    
√ 2
a) x dx b) (15x4 + 10x3 − 12x2 − 8x + 5) dx c) x
+ e − 3 cos x dx
x
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 196

Para la primera integral , expresamos la raı́z en forma de potencia y utlizamos la integral inmediata
2:   1 3 3 √ √
√ 1 x 2 +1 x2 2x 2 2 x3 2x x
x dx = x dx = 1
2 = 3 = = = + C, C ∈ R
2 +1 2
3 3 3
En la segunda, separamos las sucesivas sumas y restas y sacamos los números fuera de las integrales,
aplicando las propiedades de la integral para luego aplicar la integral inmediata 2 de nuevo:
     
4 3 2 4 3 2
(15x + 10x − 12x − 8x + 5) dx = 15x dx + 10x dx − 12x dx − 8x dx + 5 dx =
    
4 3 2 15x5 10x4 12x3 8x2
= 15 x dx + 10 x dx − 12 x dx − 8 x dx + 5 dx = + − − + 5x =
5 4 3 2
5x4
= 3x5 + − 4x3 − 4x2 + 5x + C, C ∈ R
2
Por último, volvemos a separar las integrales y los números y aplicamos la tabla de integrales inme-
diatas:
     
2 x 2
+ e − 3 cos x dx = dx + ex dx − 3 cos x dx =
x x
  
1
=2 dx + ex dx − 3 cos x dx = 2 ln x + ex − 3 · sen x + C, C ∈ R
x

Ejercicio: Calcular las siguientes integrales:


  
5x3 − 4x
a) dx b) sen x + 2 cos x + 3 dx c) (18x + 1) dx
x4
     
2 2 3 4 2 √
d) (2x − 1) (2x + 1) dx e) + 2 + 3 dx f ) (x + 2) dx g) 2 3 x dx
x x x

11.4. Integración por cambio de variable


A veces las integrales no son tan simples como las inmediatas, sino que hay pequeños detalles que
nos impiden aplicar la tabla de primitivas.
Por ejemplo, podemos calcular sin problema la integral:

sen x dx = − cos x + C, C ∈ R

pues es inmediata.
Sin embargo otra integral tan parecida y de aspecto simple como:

sen (2x + 6) dx

ya no la sabemos calcular porque no aparece en la tabla de primitivas inmediatas.


El razonamiento a utilizar en este caso es el siguiente:

Si en vez de tener en la integral anterior 2x + 6, tuviésemos simplemente x, la integral serı́a inmediata.


Por tanto, la idea es la siguiente, vamos a cambiar la variable x por otra nueva (que usualmente
denotaremos por t) y que simplifica la tarea.
Llamaremos t a la variable que tiene la siguiente relación con x, en este caso:

t = 2x + 6
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 197

Ahora bien, se nos plantea otro problema. En la integral aparece el término dx (léase diferencial de x).
Lo lógico es que si la integral tiene una nueva variable t, en vez de aparecer diferencial de x, aparezca
diferencial de t, para no mezclar las variables.
Aunque pueda parecer una forma un poco artificial, daremos aquı́ la forma para calcular dt.
Simplemente se deriva en la expresión del cambio de variable:
Derivando t = 2x + 6, se obtiene, 1 · dt = 2 · dx, es decir que:

dt
dx =
2
Una vez calculado esto, ya podemos calcular la integral:
  
dt 1 1
sen (2x + 6) dx = sen t · = sen t · dt = (− cos t) =
cambio 2 2 2
−1
= cos (2x + 6) + C, C ∈ R
deshacer el cambio 2

El método del cambio de variable permite resolver de manera simple integrales que de otro modo no
se podrı́an abordar.

Ejemplo: 
3 −5
e2x x2 dx

Razonando como antes, se observa que la parte problemática de la integral está en el exponente de
dicha integral.
Hacemos entonces el cambio:
t = 2x3 − 5
y calculando el diferencial:
dt = 6x2 dx
de donde despejamos la parte que aparece en la integral:

dt
x2 dx =
6
y por tanto la integral queda reducida a:
  
3 dt 1 1 1 2x3 −5
e2x −5 x2 dx = et = et dt = et = e + C, C ∈ R
cambio 6 6 6 deshacer el cambio 6

Ejemplo: 
(6x2 + 15x + 3)178 (12x + 15) dx

El cambio necesario en este caso es:


t = 6x2 + 15x + 3
con lo que queda:
dt = 12x + 15 dx
y por tanto la integral es:
 
2 178 t179
(6x + 15x + 3) (12x + 15) dx = = t178 dt = =
cambio 179
(6x2 + 15x + 3)179
= + C, C ∈ R
deshacer el cambio 179
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 198

Ejercicios: Calcula mediante integración por cambio de variable las siguientes integrales:
  
3x2 − 2x 3 2 2
a) dx Cambio:t = x − x + 3 b) cos (x + 1) 2x dx c) 5sen (3x + 1) dx
x3 − x2 + 3
     
2x + 1 5 1
d) cos dx e) ex+2 dx f ) (x − 4) 7 dx g) dx
3 1+x
  
1 + cos x x2 1
h) dx i) xe dx j) dx
x + sen x (x + 2)3

11.5. Determinación de una primitiva particular de una función


Ya hemos visto que si una función tiene una primitiva, entonces tiene infinitas, lo que representamos
añadiendo la constante C al cálculo de la integral.
Ahora bien, si queremos determinar una primitiva concreta de entre todas esas infinitas, necesita-
mos un dato más, como por ejemplo, un punto por el que pase dicha función.

Ejemplo: Calcular la primitiva de la función:

f (x) = x3 − 2x + 5

que pasa por el punto (1, 3).

Calculamos en primer lugar todas las primitivas de f (x), es decir la integral indefinida:

x4 x2 x4
x3 − 2x + 5 dx = − 2 + 5x = − x2 + 5x + C, C ∈ R
4 2 4

De todas estas primitivas, la única que cumple que pasa por el (1, 3), es aquella tal que:

14
− 12 + 5 · 1 + C = 3
4
es decir
1 17 −5
− 1 + 5 + C = 3 =⇒ + C = 3 =⇒ C =
4 4 4
y por tanto la primitiva buscada es:

x4 5
F (x) = − x2 + 5x −
4 4
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 199

11.6. El problema del cálculo del área


Ya se dijo que el desarrollo del cálculo integral en buena medida se debe al problema de calcular
áreas de funciones como esta:

Una aproximación para calcular el área consiste en dividir el intervalo en otros más pequeños y
calcular el área de los rectángulos que se forman bien al tomar el valor de la función en un extremo
del intervalo, bien en otro entremo, es decir:

Figura 11.1: Aproximación del área mediante rectángulos más pequeños que la función

En este caso, hemos dividido el intervalo mayor en 4 subintevalos más pequeños y hemos tomado
como altura de los rectángulos el valor de la función en el extremo superior del intervalo.
Ası́ la suma de las áreas de los rectángulos son más pequeñas que el área buscada.
Área suma rectángulos< Área de la función
Esta suma, en la que la suma de las áreas de los rectángulos es menor que el área total se denomina
suma inferior de la función en el intervalo.
Pero podrı́amos haber tomado estos otros rectángulos:

Figura 11.2: Aproximación del área mediante rectángulos más grandes que la función

Ahora la suma del área de los rectángulos es mayor que el área total, es decir:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 200

Área de la función< Área suma rectángulos

Esta suma, en la que la suma de las áreas de los rectángulos es mayor que el área total se denomina
suma superior de la función en el intervalo.
Por tanto, el área buscada está entre la suma superior y la suma inferior de la función:

Suma inferior≤ Área≤ Suma superior

Además, obervemos lo que ocurre cuando los subintervalos que tomamos son cada vez menores:

Vemos que las sumas inferiores son cada vez mayores y cada vez más cercanas al área buscada, a
medida que los intervalos son más pequeños.

Figura 11.3: La aproximación se mejora al aumentar el número de rectángulos

Por contra, las sumas superiores son cada vez más pequeñas y también cada vez más cercanas al
área buscada, a medida que los intervalos son más pequeños.

A medida que los subintervalos son menores, las sumas superiores e inferiores se acercan al área
buscada. Para llegar a calcular dicha área, necesitamos calcular una suma infinita (la de los infinitos
rectángulos a medida que estos son más pequeños), cosa que en matemáticas se denomina sumar una
serie.
Esto excede con mucho los contenidos del curso. Lo que se necesita saber es que tanto las sumas
superiores como las sumas inferiores convergen (se acercan) al área buscada, y dicha suma se representa,
si la función es f (x) y el intervalo es [a, b], por la integral:
 b
f (x) dx
a

Ahora bien, el siguiente problema es cómo se calcula esta integral, pues en las integrales indefinidas
no habı́amos incluido ningún intervalo.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 201

11.7. La integral definida. La regla de Barrow


Se denomina integral definida de la función f (x) en el intervalo [a, b] a la expresión:
 b
f (x) dx
a

La integral definida posee las mismas propiedades que la definida, es decir:


1.  
b b
k · f (x) dx = k · f (x) dx, k∈R
a a

2.   
b b b
(f (x) ± g(x)) dx = f (x) dx ± g(x) dx
a a a

La integral definida, puesto que representa, si la función es positiva, el área que encierra la función
con el eje x, tiene algunas propiedades tales como:
1. Si c es un punto que está dentro del intervalo [a, b], entonces:
 b  c  b
f (x) dx = f (x) dx + f (x) dx
a a c

En otras palabras, el área de la función desde a hasta b es la suma de las áreas de la función
desde a hasta c y desde c hasta b, si la función es positiva.

2. Si calculamos la integral de derecha a izquierda ,en vez de izquierda a derecha se cumple:


 b  a
f (x) dx = − f (x) dx
a b

3. La integral cuando el intervalo se reduce a un punto es cero:


 a
f (x) dx = 0
a

Pero sin duda la propiedad más importante, y que permite calcular integrales definidas es la llamada
Regla de Barrow.

Regla de Barrow: Si f (x) es una función que tiene primitiva F (x), y queremos calcular su integral
definida en un intervalo [a, b], se cumple que:
 b
f (x) dx = F (x)]x=b
x=a = F (b) − F (a)
a
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 202

Ejemplo: Calcular la integral definida:  3


x2 dx
1
e interpretar el resultado geométricamente.

Aplicando la regla de Barrow, queda:


 3 x=3  
x3 27 1 26
2
x dx = = − = ≈ 8 67 u2
1 3 x=1 3 3 3

donde u2 representa unidades de área.


Geométricamente es el área representada en la figura:

Ejercicio: Utilizando la regla de Barrow, calcula el valor de las siguientes integrales definidas:
 3  4  4  1
3 2 2 4 2
a) (2x −4x +5x−2) dx b) (3x+1) dx c) (2x −3x −7) dx d) (x+1)(x−2) dx
1 −1 2 −2
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 203

11.8. Aplicaciones de la integral definida al cálculo de áreas de re-


cintos planos
La aplicación de la integral definida para el cálculo de áreas depende de cómo sea la función en el
intervalo concreto. Se pueden presentar los siguientes casos:

11.8.1. Áreas limitadas por una función y el eje x


1. La función es siempre positiva siempre en el intevalo: En este caso el área simplemente viene
dada por:
 b
Área = f (x) dx
a
donde a y b son los puntos entre los que queremos calcular el área, y que habitualmente son los
puntos de corte de la función con el eje x.
Geométricamente:

2. La función se siempre negativa dentro del intervalo: En este caso el área viene dada por:
 b 
 
Área =  f (x) dx
a

Geométricamente:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 204

3. Si la función es a veces positiva y a veces negativa en el intervalo, se calculan los puntos de corte
y se calculan las integrales sucesivas, utilizando los apartados anteriores:

En la figura, serı́a:    b
 c  d 
Área = f (x) dx +  f (x) dx + f (x) dx
a c d

En cualquier caso, y cuando calculemos áreas, siempre es conveniente comenzar por calcular los puntos
de corte de la función con el eje x para saber si es positiva o negativa y calcular las integrales
correspondientes, o bien utilizar siempre el valor absoluto para asegurarnos de que el resultado es
positivo.

Ejemplo: Calcular el área que encierra con el eje x la gráfica de la función:

f (x) = x3 − 7x2 + 10x

No hace falta dibujar la gráfica.


Calculamos los puntos de corte con el eje x:

3 2 2 x=0
x − 7x + 10x = 0 =⇒ x(x − 7x + 10) = 0 =⇒ =⇒ x = 0, x = 2, x = 5
x2 − 7x + 10 = 0

Corta al eje x en (0, 0), (2, 0) y (5, 0).


Veamos cómo es la función entre 0 y 2. Tomamos un valor situado en ese intervalo y lo sustituimos
en la función. Se obtiene:

f (1) = 13 − 7 · 12 + 10 · 1 = 1 − 7 + 10 = 4

como 4 es positivo, significa que la función es positiva en ese intervalo, luego el área será:

 2 x=2 
3 x42 x3 x2
Área = x − 7x + 10x dx = − 7 + 10 =
0 4 3 2 x=0
 4   4 
2 23 22 0 03 02 56 16 2
= − 7 + 10 − − 7 + 10 = 4− + 20 = u
4 3 2 4 3 2 3 3

En el otro intervalo, entre el 2 y el 5, tomamos otro valor para saber si la función es positiva o negativa:

f (3) = 33 − 7 · 32 + 10 · 3 = 27 − 63 + 30 = −6
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 205

la función es negativa en el intervalo, luego el área será:


 5    4 x=5 
   x x3
x2

Área =  x3 − 7x2 + 10x dx =  − 7 + 10 =
2  4 3 2 x=2 
 4   4     
 5 5 3
5 2
2 2 3
2 2   −125 16   −63  63 2
=  − 7 + 10 − − 7 + 10 = − = = u
4 3 2 4 3 2   12 3   4  4

En total el área pedida será:


16 63 253 2
+ = u ≈ 21 08 u2
3 4 12
Gráficamente:

Observa lo importante que es diferenciar los dos intervalos, pues si simplemente hubiésemos calcu-
lado, sin más:  5
x3 − 7x2 + 10x dx
0
sin separar, el resultado serı́a:  5
x3 − 7x2 + 10x dx = −10 42
0
(Compruébala) que no es el área buscada, sino la diferencia entre las áreas.
Desde luego, si es posible, es mejor hacer un dibujo para saber como va la gráfica y determinar el
área a calcular.

Ejercicio: Calcula las áreas encerradas por el eje x y las funciones siguientes:
a) f (x) = x − x3
b) g(x) = −x2 + 9
c) h(x) = x2 − 2x − 3 entre x=1 y x=5.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 206

11.8.2. Áreas limitadas por dos funciones


También es posible aplicar las integrales definidas para el cálculo de áreas de recintos limitados
por dos curvas, por ejemplo el de la figura:

Si las curvas son f (x) y g(x) se cumple que el área limitada por las dos curvas en el intervalo [a, b]
es:  b
(f (x) − g(x)) dx
a
siempre que f (x) esté por encima de g(x) en el intervalo [a, b].

Si las curvas se cortan en el intervalo, se subdivide el intervalo en otros menores, en cada uno de los
cuales se aplican la integral anterior, determinando qué curva está por encima, y se suma el resultado.
En todo caso siempre es necesario hallar los puntos de corte entre las curvas, que se calculan
igualando las expresiones algebraicas de ambas funciones:

f (x) = g(x)

y resolviendo la ecuación resultante.

Ejemplo: Calcular el área limitada por las curvas f (x) = x2 − 1 y g(x) = 4x − 4.


Comenzamos calculando los puntos de corte de las funciones:

f (x) = g(x) =⇒ x2 − 1 = 4x − 4 =⇒ x2 − 4x + 3 = 0 =⇒ x = 1, x = 3

Las funciones se cortan en los puntos 1 y 3.


Veamos qué función está por encima y cuál por debajo en ese intervalo.
Dando un valor intermedio, por ejemplo el 2:

f (2) = 22 − 1 = 3 g(2) = 8 − 4 = 4

Como el valor de g(x) es mayor, significa que g(x) está por encima de f (x) en el intervalo, de modo
que el valor del área será el dado por la integral definida:
 3  3  3
2
Área = (g(x) − f (x)) dx = (4x − 4 − (x − 1)) dx = 4x − 3 − x2 dx =
1 1 1
 x=3  
x3 1 4 2
2
= 2x − 3x − = (18 − 9 − 9) − 2 − 3 − = u ≈ 1 33 u2
3 x=1 3 3
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 207

Si se hace un dibujo, lo cuál es sencillo porque se trata de una recta y una parábola:

Ejercicio: Calcular el área encerrada por las curvas:


a) f (x) = x2 − 2x y g(x) = 6x − x2
b) f (x) = x2 y g(x) = x + 2
c) f (x) = x3 y g(x) = 2x

11.9. Otras aplicaciones de las integrales


Las aplicaciones de las integrales a las Ciencias Sociales se relacionan con las de las derivadas.
Sabemos, por ejemplo, que si cierta función I(x), es la función de ingresos de una determinada
empresa, la función de ingresos marginal es su derivada I  (x).
Las integrales, al ser la operación recı́proca, permiten calcular la función de ingresos conocida la
de ingresos marginal, es decir: 
I  (x) dx = I(x) + C, C ∈ R

(Lo mismo si la función es de coste o de beneficio, etc).


Por tanto, en general, conociendo la función de cambio (o crecimiento) de cualquier proceso,
integrando se puede conocer la función que mide dicho proceso.

Ejemplo: El ritmo de crecimiento de la población de palomas en una ciudad viene dado por la función:

f (x) = 2x − 0 5x2

x en años a partir del actual y f (x) en miles de palomas.


Actualmente hay 2500 palomas.
a) ¿Cuántas habrá dentro de x años?
b) ¿En cuánto aumentará la población durante el segundo semestre a partir del momento actual?
c) ¿Hasta cuando aumenta la población de palomas?. ¿Qué número máximo alcanza?.

a) Como conocemos la función de crecimiento, la función que da el número total de palomas será una
primitiva de ésta:
 
1
F (x) = f (x) dx = 2x − 0 5x2 dx = x2 − x3 + C, C ∈ R
6
Para determinar C, sabemos que la población de palomas ahora mismo es de 2500, es decir:

F (0) = 2 5
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 208

luego sustituyendo:
1 3
02 − · 0 + C = 2 5 =⇒ C = 2 5
6
La población de palomas sigue una función:
1
F (x) = x2 − x3 + 2 5
6
b) El segundo semestre, x va desde 0 5 hasta 1, y el aumento de palomas será:
20 131 29
F (1) − F (0 5) = − = = 0 604
6 48 49
es decir, 604 palomas (recuerda que la función viene dada en miles de palomas).
c) Calculamos los máximos y mimimos de F (x).
Como:
F  (x) = f (x)
resulta que igualamos f (x) = 0, y queda:

2x − 0 5x2 = 0 =⇒ x(2 − 0 5x) = 0 =⇒ x = 0, x = 4

Para saber si son máximos o mı́nimos, con la derivada segunda:

F  (x) = 2 − x

luego:
F  (0) = 2
x = 0 es un mı́nimo y:
F  (4) = −2
x = 4 es un máximo, luego a lo sumo, la población de palomas se dará a los 4 años a partir de ahora,
es decir:
1 64
F (4) = 42 − 43 + 2 5 = 16 − + 2 5 = 7 833
6 6
aproximadamente 7833 palomas.
La gráfica de F(x) es:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 209

Ejercicios:

1. Supongamos que dentro de x meses la población de tu ciudad crecerá a razón de 5+4 x personas
por mes.
Si la población actual es de 7500 personas.
a) ¿Cuál será la población dentro de un año?
b) ¿En cuántos habitantes aumentará durante el segundo año?
c) ¿Llegará a algún máximo su número de habitantes?.

2. Halla la función de beneficio de una empresa, B(x), sabiendo que los costes e ingresos marginales
, c(x) e i(x), vienen dados respectivamente por las funciones:

c(x) = 0 04x + 4 i(x) = 200 − 2x

con C(0) = 80 , siendo C(x) la función de coste.


Capı́tulo 9

LÍMITES Y CONTINUIDAD DE
FUNCIONES

9.1. Introducción
El concepto de lı́mite en Matemáticas tiene el sentido de “lugar” hacia el que se dirige una función
en un determinado punto o en el infinito.
Veamos un ejemplo: Consideremos la función dada por la gráfica de la figura y fijémonos en el
punto x = 2 situado en el eje de abscisas:

¿Qué ocurre cuando nos acercamos al punto 2 moviéndonos sobre el eje x? Tomemos algunos
valores como 2’1, 2’01, 2’001.
Vemos en la figura que en este caso las imágenes de dichos puntos sobre la curva, f(2’1), f(2’01),
f(2’001) se acercan a su vez a un valor situado en el eje y, el valor y = 3.
Si nos acercamos a 2 por la otra parte, es decir, con valores como 1’9, 1’99, 1’999 en este caso las
imágenes f(1’9), f(1’99), f(1’999) se acercan también al mismo valor, y = 3.
Concluimos que el lı́mite de la función f(x) cuando nos acercamos a x = 2 es 3, lo cuál expresamos
como:
lı́m f (x) = 3
x→2
Intuitivamente, por tanto, podemos decir que el lı́mite de una función en un punto es el valor en el
eje Oy al que se acerca la función, f (x), cuando la x se acerca, en el eje Ox a dicho punto.

145
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 146

Sin embargo la expresión matemática rigurosa de lı́mite es algo más compleja:

Definición: Dada una función f (x) y un punto x = a, se dice que el lı́mite de f (x) cuando x se acerca
a a es L, y se expresa como:
lı́m f (x) = L
x→a

cuando:

Dado  > 0, existe δ > 0 tal que siempre que |x − a| < δ, entonces |f (x) − L| < 

Lo que viene a expresar esta formulación matemática es que si x está “suficientemente cerca” de
a, entonces su imagen f(x) también está muy próxima a L.

En la práctica en muchas ocasiones es necesario calcular los llamados lı́mites laterales, que como
recordaremos se definen de la siguiente forma:

Definición:
Se define el lı́mite lateral por la derecha de a de la función f (x), y se expresa como:

lı́m f (x)
x→a+

al lı́mite al que se acerca f (x) cuando x se acerca a a y toma valores mayores que a.
De igual modo, el lı́mite lateral por la izquierda de a de la función f (x) se expresa como:

lı́m f (x)
x→a−

y se define como el lı́mite al que se acerca f (x) cuando x se acerca a a y toma valores menores que a.

Propiedad: Para que una función f (x) tenga lı́mite en x = a es necesario y suficiente que existan
ambos lı́mites laterales y coincidan, es decir:

lı́m f (x) = lı́m f (x) = lı́m f (x)


x→a x→a+ x→a−
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 147

9.2. Tipos de lı́mites


Recordaremos algunos tipos de lı́mites que son conocidos:

1. Lı́mites infinitos en un punto finito: En la situación del dibujo, se dice que el lı́mite cuando x
se acerca por la derecha de a es +∞, pués a medida que la x se acerca a a, la función se hace
cada vez mayor:
lı́m f (x) = +∞
x→a+

(de igual forma se puede definir cuando nos acercamos por la izquierda. Intenta hacer el dibujo).
De igual modo se define el lı́mite −∞ cuando nos acercamos a a (por la derecha o por la
izquierda).(Dibuja el que falta)
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 148

Puede ocurrir que uno de los lı́mites laterales sea finito y otro infinito, o cualquier combinación
entre ellos, por ejemplo:

En la figura anterior se cumple que:


lı́m f (x) = +∞
x→2+
y
lı́m f (x) = 2
x→2−

2. Lı́mites finitos en el infinito: Se dice que una función tiene lı́mite b cuando x tiende a +∞
cuando la función se acerca a b cuando la x se hace cada vez mayor, es decir:
lı́m f (x) = b
x→∞

Gráficamente:

En este caso el lı́mite es 2 cuando x tiende a +∞.


De igual modo se define el lı́mite finito cuando x tiende a −∞.
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 149

3. Lı́mites infinitos en el infinito: Aparece este caso cuando si x tiende a +∞ la función se hace
cada vez mayor o menor (lo mismo si x tiende a −∞).
Un ejemplo gráfico de este tipo de lı́mites serı́a:

En este caso:
lı́m f (x) = −∞
x→∞
(Intenta dibujar otros casos diferentes).

9.3. Cálculo de lı́mites


Recordaremos, dada su importancia, algunas de las reglas para el cálculo de lı́mites cuando se
presentan diferentes indeterminaciones:

9.3.1. Lı́mites en el infinito


1. Lı́mites de polinomios: El lı́mite de cualquier polinomio cuando x tiende a ∞ siempre es +∞ o
−∞, dependiendo del coeficiente del término de mayor grado del polinomio:

lı́m (2x5 − 3x2 + 5) = +∞


x→∞

lı́m (−3x7 − 5x2 + 4x − 8) = −∞


x→∞

pues en el primer caso el coeficiente de x5 es positivo, y en el segundo caso el coeficiente de x7


es negativo.

2. Indeterminación : Si tenemos un cociente de polinomios nos encontraremos con una indeter-

minación de este tipo. Para resolverla basta recordar la siguiente regla:
Si tenemos:


 ±∞ si grado(p(x)) > grado(q(x)),

 donde el signo depende de los coeficientes.





p(x)  0 si grado(p(x)) < grado(q(x))
lı́m =
x→∞ q(x) 




 a

 si grado(p(x)) = grado(q(x)), siendo a y b los

 b
coeficientes de los términos de mayor grado de cada polinomio.

Ejemplos: a)
x3 − 5x2 + 6  ∞ 
lı́m = = −∞
x→∞ −x2 + 4 ∞
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 150

porque el grado del numerador es mayor, pero los respectivos coeficientes de mayor grado tienen
signo diferente.
b)
x2 − 5 ∞
lı́m = =0
x→∞ x6 − x4 − 3x2 + 4 ∞
porque el grado del denominador es mayor.
c)
7x3 + 2x − 6  ∞  7
lı́m = =−
x→∞ −3x3 + 6 ∞ 3
porque los grados son iguales.

Nota: La resolución de lı́mites cuando x tiende a −∞ se reduce a estos casos, puesto que:

lı́m f (x) = lı́m f (−x)


x→−∞ x→∞

es decir:
x3 − 5x2 + 4 (−x)3 − 5(−x)2 + 4 −x3 − 5x2 + 4  ∞ 
lı́m = lı́m = lı́m = =∞
x→−∞ −x2 + 5x x→∞ −(−x)2 + 5(−x) x→∞ −x2 − 5x ∞

La misma regla anterior sirve en el caso de que aparezcan raı́ces, siempre que tengan sentido los
lı́mites:

d) √
3+ x3 − 5x  ∞ 
lı́m = =0
x→∞ x2 + 4 ∞
3
puesto que el grado del denominador es 2 y en el numerador la mayor potencia de x es , que
2
es menor que 2.
e) √
−x + 1 + x3
lı́m =
x→∞ 1 + x + 3x3

puesto que aunque los grados de numerador y denominador son iguales, cuando x tiende a +∞
(es positivo y muy grande) resulta que −x + 1 es negativo y como es bien conocido, la raı́z
cuadrada de un número negativo no existe en el cuerpo de los números reales, por tanto el lı́mite
anterior no tiene sentido.
f)
√  √ ∞ 1
−x + 1 + x3 −(−x) + 1 + (−x)3 x + 1 − x3
lı́m = lı́m = lı́m = =
x→−∞ 1 + x + 3x3 x→∞ 1 + (−x) + 3(−x)3 x→∞ 1 − x − 3x3 ∞ 3

pues en este caso la raı́z si tiene sentido y los grados son iguales, quedando el lı́mite el cociente
de los coeficientes de los monomios de mayor grado.

3. Indeterminación ∞ − ∞: Cuando aparece esta indeterminación, si tenemos una resta de frac-


ciones, simplemente se hace la resta para obtener un cociente de polinomios que ya sabemos
resolver:
 2
x2 − x + 1 x + 3 + x2 (x − x + 1)(x − 1) (x + 3 + x2 )(x + 1)
lı́m − = (∞ − ∞) = lı́m − =
x→∞ x+1 x−1 x→∞ (x + 1)(x − 1) (x − 1)(x + 1)
 3
x − 2x2 + 2x − 1 x3 + 2x2 + 4x + 3 −4x2 − 2x − 4  ∞ 
= lı́m − = lı́m = = −4
x→∞ x2 − 1 x2 − 1 x→∞ x2 − 1 ∞
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 151

En caso de que aparezca una raı́z, el proceso es multiplicar y dividir por el conjugado de la
expresión radical:




√ (2x − 1) − x + 1 · (2x − 1) + x + 1
lı́m (2x − 1) − x + 1 = (∞ − ∞) = lı́m √ =
x→∞ x→∞ (2x − 1) + x + 1

(2x − 1)2 − ( x + 1)2 4x2 − 4x + 1 − x − 1
= lı́m √ = lı́m √ =
x→∞ (2x − 1) + x + 1 x→∞ (2x − 1) + x + 1

4x2 − 5x ∞
= lı́m √ = = +∞
x→∞ (2x − 1) + x + 1 ∞

9.3.2. Lı́mites en puntos finitos


Si queremos calcular el lı́mite de una función f (x) cuando x se acerca a cierto valor a, simplemente
hemos de sustituir el valor de a en f (x):

2x2 − 3x + 1 2 · 9 − 3 · (−3) + 1
lı́m = = −28
x→−3 x+2 −3 + 2
El problema que nos podemos encontrar en este caso es que el denominador se haga 0 al sustituir x
por el valor que corresponda.
Nos podemos encontrar, por tanto, varios tipos de indeterminación.
k
1. Indeterminación , (k = 0): Se presenta cuando en el numerador aparece un número cualquiera
0
no nulo y el denominador es 0.
En este caso el lı́mite el siempre ∞, pero para determinar su signo, se calculan los lı́mites
laterales:
a) 

 1 − 2x 1 − 2 · 1 0001 −1

 lı́m = = − = +∞
1 − 2x 1−2 −1  x→1+ 1 − x2 1 − (1 0001)2 0
lı́m = = =
x→1 1 − x2 1−1 0 


 1 − 2x 1 − 2 · 0 9999 −1
 lı́m = = + = −∞
x→1− 1−x 2 1 − (0 9999)2 0
b) 
 −7 −7 −7

 lı́m =  = + = −∞
−7 −7  x→0+ x 0 0001 0
lı́m = =
x→0 x 0 
 −7 −7 −7

 lı́m = = − = +∞
x→0− x −0 0001 0
c)
 −2 −2 −2

 lı́m = = + = −∞

 x→−1+ (x + 1) 2 
(−0 9999 + 1) 2 0
−2 −2
lı́m 2
= =
x→−1 (x + 1) 0 
 −2 −2 −2

 lı́m = = + = −∞
x→−1− (x + 1) 2 
(−1 0001 + 1) 2 0
0
2. Indeterminación : En este caso tanto numerador como denominador se hacen 0.
0
Si tanto en el numerador como en el denominador tenemos polinomios, la forma de resolver la
indeterminación es descomponer los polinomios en factores (mediante, por ejemplo, la regla de
Ruffini) y simplificar para posteriormente volver a sustituir.

x2 − 5x + 6 4 − 10 + 6 0 (x − 2)(x − 3) (x − 3) −1
lı́m = = = lı́m = lı́m =
x→2 x2 − 4 4−4 0 x→2 (x − 2)(x + 2) x→2 (x − 2) 4
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 152

En caso de que también aparezcan raı́ces cuadradas, el proceso es multiplicar y dividir por la
expresión radical conjugada con el fin de simplificar y luego sustituir:
√  √ √
x+4−1 0 ( x + 4 − 1) · ( x + 4 + 1)
lı́m 2 = = lı́m √ =
x→−3 x + 2x − 3 0 x→−3 (x2 + 2x − 3) · ( x + 4 + 1)

( x + 4)2 − 12 x+3
= lı́m √ = lı́m √ =
x→−3 (x2 + 2x − 3) · ( x + 4 + 1) x→−3 (x2 + 2x − 3) · ( x + 4 + 1)

(x + 3) 1 1 −1
= lı́m √ = lı́m √ = =
x→−3 (x + 3) · (x − 1) · ( x + 4 + 1) x→−3 (x − 1) · ( x + 4 + 1) (−4) · (1 + 1) 8

9.3.3. Lı́mites potenciales. Indeterminación 1∞


Cuando aparecen exponentes, hay que recordar algunas reglas básicas.
Si tenemos
lı́m (f (x))g(x)
x→a

o bien
lı́m (f (x))g(x)
x→∞

se pueden presentar varios casos:

1. La base tiende a un número cualquiera no nulo y el exponente a otro número. En este caso el
lı́mite es el número que resulta de realizar la operación correspondiente:
1
lı́m (x + 1)2x−3 = 2−1 =
x→1 2

2. La base tiende a un número positivo mayor que 1 y el exponente a +∞. En este caso el lı́mite
es también +∞. 
2x + 1 2x−3
lı́m = 2∞ = +∞
x→∞ 1+x

3. La base tiene a un número no nulo comprendido entre -1 y 1 y el exponente a +∞. En este caso
el lı́mite es 0.   ∞
1 + x 2x−3 1
lı́m = =0
x→∞ 2x + 1 2

4. La base tiende a un número negativo menor o igual que -1 y el exponente a +∞. En este caso
el lı́mite no existe, pues los productos son alternativamente de signo contrario:
 2x−3
−3x + 1
lı́m = (−3)∞ = 
x→∞ 1+x

5. En el caso en que la base tiende a 1 y el exponente a +∞ tenemos una indeterminación que se


resuelve aplicando la fórmula:

lı́m (g(x) · (f (x) − 1))


lı́m (f (x))g(x) = (1∞ ) = (e)x→a
x→a
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 153

O bien realizando los pasos para resolver tales lı́mites que recordamos:
 2x+3  2x+3
1+x x 3
∞ 1+x x
lı́m = (1) = (1 )
0 = lı́m 1 + −1 =
x→0 2x + 1 se suma y se resta 1 a la base x→0 2x + 1 se hace la resta

 2x+3  2x+3
1 + x − 2x − 1 x −x x
= lı́m 1 + = lı́m 1 + =
x→0 2x + 1 x→0 2x + 1 se baja el numerador dividiendo al denominador

2x+3  2x+1  2x+1


−x 2x+3
· x
x −x
1 1
= lı́m 1 + 2x+1 = lı́m  1 + 
2x+1 =
x→0 se pone el denominador como exponente x→0
−x −x
   
−x 2x+3 −2x−3
lı́m · lı́m
=
se sustituye el corechete por e
(e)x→0 2x+1 x
= (e)x→0
2x+1
= e−3

Ejercicio: Resolver el lı́mite anterior utilizando la fórmula.


Nota: El caso en que el exponente tiende a −∞ se reduce a este sin más que recordar las propiedades
de las potencias:
 a n  b −n
=
b a

9.4. Ası́ntotas
Una primera aplicación del cálculo de lı́mites consiste en el cálculo de las ası́ntotas de una función.
Hay tres tipos de ası́ntotas:
Verticales, Horizontales y Oblicuas (aunque de hecho las ası́ntotas horizontales son un caso par-
ticular de éstas).

9.4.1. Ası́ntotas verticales


Una ası́ntota vertical de una función f (x) es una recta vertical x = k tal que se cumple:
lı́m f (x) = ±∞
x→k+

o bien
lı́m f (x) = ±∞
x→k−
Las posibles ası́ntotas verticales de una función se encuentran entre los puntos que no están en el
dominio de la función, aquellos que anulan el dominador en las funciones racionales, etc...
Para determinar si un punto constituye una ası́ntota vertical de la función, se tiene que cumplir
que alguno de los lı́mites laterales de la función en el punto sea ±∞.
En tal caso, se dirá que la función posee una ası́ntota vertical en dicho punto por el lado en el cuál
dicho lı́mite sea ±∞.

Ejemplo: Estudiar las ası́ntotas verticales de las funciones:


2x + 3 1
f (x) = g(x) = √
x−1 x
a) Para la primera función, la posible ası́ntota estará en el punto x = 1, que es el único número real
que no pertenece a su domino por anular el denominador.
Ası́ pues estudiamos el:

 2x + 3 2 · 1 0001 + 3 5

 lı́m = = + = +∞
2x + 3 5  x→1 + x − 1 1  0001 − 1 0
lı́m = =
x→1 x − 1 0   
 lı́m 2x + 3 = 2 · 0 9999 + 3 = 5 = −∞

x→1− x − 1 0 9999 − 1 0−
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 154

Como ambos lı́mites laterales son infinitos, existe una ası́ntota vertical de la función en x = 1, y es
más, conociendo el valor de los lı́mites podemos asegurar que en las cercanı́as de la ası́ntota la función
se comportará como en el dibujo:

1 √
b) En cuanto a esta función,g(x) = √ , notemos que el denominador se anula cuando x = 0 =⇒
x
x = 0, es decir la posible ası́ntota vertical estará en x = 0. Analizando obtenemos:
 1 1 1

 lı́m √ = √ = + = +∞

1  x→0 x 0 0001 0
+
1
lı́m √ = =
x→0 x 0   1 1

 lı́m √ = √ =
x→0 − x −0 0001
puesto que no hay raı́ces cuadradas de números negativos.
De modo que hay una ası́ntota vertical en x = 0 pero sólo por la derecha, es decir, la gráfica será:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 155

9.4.2. Ası́ntotas horizontales


Las ası́ntotas horizontales, si existen, indican el valor al que se acerca la función cuando la variable
independiente x se hace muy grande o muy pequeña.
Dicho en forma de lı́mites, una función tiene una ası́ntota horizontal en y = k cuando para alguno
de los dos lı́mites:
lı́m f (x) = k
x→∞

o bien
lı́m f (x) = k
x→−∞

Ejemplo: Calcular las ası́ntotas horizontales de las funciones:

x2 + 1 1
f (x) = g(x) = √
x+1 x

a) Para f (x) calculemos los lı́mites anteriores:

x2 + 1
lı́m = +∞
x→∞ x + 1

x2 + 1 (−x)2 + 1 x2 + 1
lı́m = lı́m = lı́m = −∞
x→−∞ x + 1 x→∞ (−x) + 1 x→∞ −x + 1

de modo que la función f(x) no posee ası́ntotas horizontales.


b) En cuanto a g(x), de igual modo:

1
lı́m √ = 0
x→∞ x
1
lı́m √ = 
x→−∞ x
De modo que g(x) posee una ası́ntota horizontal en y = 0 cuando x tiende a ∞. De forma gráfica:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 156

9.4.3. Ası́ntotas Oblicuas


Una recta y = m · x + n es una ası́ntota oblicua de la función f(x) cuando existen y son finitos los
lı́mites: 
f (x)
m = lı́m
x→∞ x
y
n = lı́m (f (x) − m · x)
x→∞
Las ası́ntotas horizontales son un caso particular de las oblicuas para el caso en que m = 0.

x2
Ejemplo: Estudiar las ası́ntotas oblicuas de f (x) = .
x+1
Calculemos m y n:
 x2
f (x) x+1 x2
m = lı́m = lı́m = lı́m =1
x→∞ x x→∞ x x→∞ x2 + x

  2
x2 x
n = lı́m (f (x) − m · x) = lı́m − 1 · x = lı́m −x =
x→∞ x→∞ x + 1 x→∞ x + 1
 2 
x − x2 − x −x
lı́m = lı́m = −1
x→∞ x+1 x→∞ x + 1

Por tanto f (x) tiene una ası́ntota oblicua en y = x − 1 cuando x tiende a +∞.
Se puede comprobar que cuando x tiende a −∞, f (x) tiene esta misma ası́ntota. (Inténtalo).
Gráficamente se obtiene:

Figura 9.1: La ası́ntota oblicua es y = x − 1

Ejercicios:
1. Calcula las ası́ntotas de las funciones:
x x2 x2 − 4
f (x) = 2
g(x) = h(x) =
x −1 x+2 x2 + 4
1
2. Estudia las ası́ntotas de la función:f (x) = e x−2 .
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 157

3. Calcula los lı́mites:


 x2 −1
x3 x3 3x2 − 5
a) lı́m √ b) lı́m √ c) lı́m
x→∞ x2 − 2 x→−∞ x2 − 2 x→∞ 3x2 + x
 x−1
x √
x2 + 4 x2 + 5 − 3 2x2 − 2
d) lı́m e) lı́m √ f ) lı́m
x→1 x+4 x→2 x+7−3 x→1 x2 − 2x + 1

9.5. Continuidad
La idea intuitiva de función continua en un punto es bien sencilla.
Una función continua en un punto es aquella que no “da saltos”, aquella que se puede dibujar sin
levantar el lápiz del papel.
Matemáticamente la definición de función continua es un poco más compleja. Dice ası́:

Definición: Una función f (x) es continua en un punto x = a si:

Dado  > 0, existe δ > 0 tal que siempre que |x − a| < δ, entonces |f (x) − f (a)| < 

Dicho de otra forma, si nos acercamos al punto a, entonces las imágenes se acercan a la imagen de a,
f (a).
Si f (x) no es continua en x = a se dice que f (x) es discontinua en a o que tiene una discontinuidad
en x = a.

Propiedad: Para que una función sea continua en un punto a es necesario y suficiente que:
a) Exista el valor de la función en el punto, f (a).
b) Existan los lı́mites laterales,
lı́m f (x)
x→a+
y
lı́m f (x)
x→a−

, y sean finitos e iguales entre sı́ e iguales a f (a), es decir:

lı́m f (x) = lı́m f (x) = f (a)


x→a+ x→a−

Esta última propiedad proporciona una forma muy sencilla de saber si una función es continua o no
en un punto.

Ejemplo: Estudiar la continuidad de la función:



2x + 1 si x > 2
f (x) = 1
si x ≤ 2
x
En primer lugar, señalemos que la mayorı́a de las funciones que estudiamos son continuas en todos los
puntos salvo en algunos.
¿Cuáles son los posibles puntos de discontinuidad de una función?.
Aquellos en los que no está definida la función (anulan el denominador, etc...) y aquellos en los
que cambia la definición de la función.
En todos los demás puntos las funciones son siempre continuas y no hace falta analizarlos.
En nuestro caso, si nos fijamos en f (x) encontramos 2 posibles puntos de discontinuidad.
El primero es aquel en el que cambia la definición de la función, x = 2. Además, como hay un
demominador, que se anula para x = 0, y además estamos en el tramo de función para valores menores
que 2, el punto x = 0 es otro posible punto de discontinuidad.
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 158

Analicemos si la función es continua o no en esos puntos.


Continuidad en x = 2:
1
f (2) =
2
pues debemos sustituir en la parte inferior de f (x), que es donde está el igual.
Lı́mites laterales:
1 1
lı́m f (x) = lı́m =
x→2 − x→2 x 2
Por otra parte:
lı́m f (x) = lı́m 2x + 1 = 5
x→2+ x→2

Como los lı́mites laterales existen pero son diferentes, concluimos que f (x) es discontinua en x = 2.
Continuidad en x = 0:
f (0) = 
quedarı́a un cero en el denominador.
Con esto ya sabemos que la función no puede ser continua en x = 0. De todos modos calculamos
los lı́mites laterales.
Observemos que cuando nos acercamos a 0, da igual por la derecha que por la izquierda, estamos
siempre en la parte inferior de la función, luego:
1 1
lı́m f (x) = lı́m = − = −∞
x→0− x→0− x 0
Por otra parte:
1 1
lı́m f (x) = lı́m = + = +∞
x→0+ x→0+ x 0
Y f (x) también es discontinua en x = 0.
Por tanto f (x) es continua en todos los números reales salvo en x = 0 y x = 2.

9.6. Tipos de discontinuidad


Analicemos los posibles casos que se pueden dar a la hora de estudiar la continuidad de una función
en un punto.

1. Existe f (a) y los lı́mites laterales, que son iguales y finitos, pero distintos del valor de f (a). Una
discontinuidad de este tipo se denomina discontinuidad evitable. Gráficamente:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 159

Observamos que los lı́mites por la derecha y por la izquierda valen 1, ambos, mientras que
f (0) = 0. Hay una discontinuidad evitable en x = 0.

2. Existe f (a) y los lı́mites laterales existen y son finitos, aunque distintos. Estamos ante una
discontinuidad de salto finito. Gráficamente:

−1
En este caso el lı́mite por la derecha es 1, el izquierdo es 0 y f (0) = , hay una discontinuidad
2
evitable en x = 0.

3. Existe f (a) y alguno de los lı́mites laterales es infinito. En este caso hay una discontinuidad de
salto infinito. Gráficamente:

Ahora f (0) = 1, el lı́mite por la izquierda vale 1 también y el lı́mite lateral por la derecha vale
+∞. Discontinuidad de salto infinito en x = 0.
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 160

4. No existe f (a) o alguno de los lı́mites laterales. Se trata de una discontinuidad esencial. De forma
gráfica:

Los lı́mites laterales, ambos, son +∞, pero f (0) no existe. Hay una discontinuidad esencial en
x = 0.
Capı́tulo 6

MATRICES Y DETERMINANTES

6.1. Introducción
Las matrices y los determinantes son herramientas del álgebra que facilitan el ordenamiento de
datos, ası́ como su manejo.
Los conceptos de matriz y todos los relacionados fueron desarrollados básicamente en el siglo XIX
por matemáticos como los ingleses J.J. Sylvester y Arthur Cayley y el irlandés William Hamilton.
Las matrices se encuentran en aquellos ámbitos en los que se trabaja con datos regularmente
ordenados y aparecen en situaciones propias de las Ciencias Sociales , Económicas y Biológicas.

6.2. Matrices. Definición y primeros ejemplos


Una matriz es una tabla rectangular de números reales dispuestos en filas y columnas del modo:
  
a11 a12 a13 . . . a1n ←
 a21 a22 a23 
 . . . a2n 
←

A= . .. .. .. ..  ← Filas de la matriz A
 .. . . . .   

am1 am2 am3 . . . amn ←
 

Columnas de la matriz A

Abreviadamente se puede expresar A = (aij ). Cada elemento de la matriz lleva dos subı́ndices. El
primero de ellos “i”, indica la fila en la que se encuentra el elemento, y el segundo, “j”, la columna.
Ası́ el elemento a23 está en la fila 2 y columna 3. Las matrices siempre se representarán con letras
mayúsculas.
Ejemplos: Son ejemplos de matrices los siguientes:
 
  √  3 1 0
2 1 6 −4 0  2 −4 0 
A= B= C = −1 1
√ 
3 4 1 2 1 5 2
1 0 0

A tiene 2 filas y 2 columnas, diremos que su tamaño es 2 x 2.¿Qué elemento es a21 ?.


B tiene 2 filas y 3 columnas, diremos que su tamaño es 2 x 3.¿Qué elemento es b23?.
C tiene 4 filas y 3 columnas, diremos que su tamaño es 4 x 3.¿Qué elemento es c42 ?.
En general, si una matriz A tiene m filas y n columnas, diremos que su tamaño o dimensión es m
x n (se lee “m por n”), siempre en primer lugar el nº de filas y en segundo lugar el de columnas.

82
CAPÍTULO 6. MATRICES Y DETERMINANTES 83

6.3. Tipos de matrices


1. Se llama matriz nula a la que tiene todos los elementos cero.
Por ejemplo,  
0 0 0 0 0
A=
0 0 0 0 0
es una matriz nula de tamaño 2x5.
2. Se llama matriz fila a la que sólo tiene una fila, es decir su dimensión es 1x n.
Por ejemplo,  
1 0 −4 9
es una matriz fila de tamaño 1 x 4.
3. Se llama matriz columna a la que sólo consta de una columna, es decir su dimensión será m x
1, como por ejemplo:  
1
C= √ 0 
− 8
es una matriz columna de tamaño 3 x 1.
4. Una matriz es cuadrada cuando tiene el mismo número de filas que de columnas, es decir su
dimensión es n x n. La matriz ( 23 14 ) del primer ejemplo anterior es cuadrada de tamaño 2 x 2 o
simplemente de orden 2.
Otro ejemplo de matriz cuadrada es:
 
1 2 3
D= 6 5 4
−3 −4 0
de orden 3.
Dentro de las matrices cuadradas llamaremos diagonal principal a la formada por los elementos
a11 , a22 , a33, . . . , ann , siendo la matriz:
 
a11 a12 a13 . . . a1n
a21 a22 a23 . . . a2n 
 
A= . .. .. .. .. 
 .. . . . . 
an1 an2 an3 . . . ann
En la matriz D del ejemplo anterior, su diagonal principal estarı́a formada por 1, 5, 0.
Se llama traza de la matriz a la suma de los elementos de la diagonal. Es decir, Traza (A)=a11 +
a22 + a33 + . . . + ann , y en el caso de D, Traza (D)= 1+5+0 = 6.
La diagonal secundaria es la formada por los elementos a1n , a2,n−1, a3,n−2, . . . , an1 .
En la matriz D estarı́a formada por 3, 5, -3.

Una clase especial de matrices cuadradas son las matrices triangulares.


Una matriz es triangular superior si todos los elementos por debajo de la diagonal principal son
nulos y triangular inferior si son nulos todos los elementos situados por encima de dicha diagonal.
Son ejemplos de estas matrices:
 
1 0 0 0  
0 −4 0  1 4 13
0 
E= 3 4 F = 0 9 −5
5 0 
0 0 π
1 3 16 −78 Triangular superior
Triangular inferior
CAPÍTULO 6. MATRICES Y DETERMINANTES 84

Si una matriz es a la vez triangular superior e inferior, sólo tiene elementos en la diagonal principal.
Una matriz de este tipo se denomina matriz diagonal.
Un ejemplo de matriz diagonal serı́a:
 
1 0 0 0
0 −45 0 0
G= 0

0 3 0
0 0 0 0

Por último, si una matriz diagonal tiene en su diagonal principal sólo unos, se denomina matriz unidad
o identidad. Se suelen representar por In , donde n es el orden o tamaño de la matriz. Algunas matrices
identidad son:  
  1 0 0 0
  1 0 0
1 0 0 1 0 0
I2 = I3 = 0 1 0 I4 = 

0 0 1 0

0 1
0 0 1
0 0 0 1

6.4. Aplicaciones de las matrices


Las matrices se utilizan en el contexto de las ciencias como elementos que sirven para clasificar
valores numéricos atendiendo a dos criterios o variables.
Ejemplo: Un importador de globos los importa de dos colores, naranja (N) y fresa (F). Todos
ellos se envasan en paquetes de 2, 5 y 10 unidades, que se venden al precio (en euros) indicado por la
tabla siguiente:

2 unid. 5 unid. 10 unid.


Color N 0’04 0’08 0’12
Color F 0’03 0’05 0’08

Sabiendo que en un año se venden el siguiente número de paquetes:

Color N Color F
2 unid. 700000 50000
5 unid. 600000 40000
10 unid. 500000 500000

Resumir la información anterior en 2 matrices A y B, de tamaño respectivo 2x3 y 3x2 que recojan las
ventas en un año (A) y los precios (B).

Nos piden que organicemos la información anterior en dos matrices de tamaño concreto. Si nos fijamos
en las tablas, es sencillo obtener las matrices:

N F
2 ud 5 ud 10 ud   
  0 04 0 03 2 ud
700000 600000 500000 N 
A= B = 0 08 0 05 5 ud
50000 40000 500000 F
0 12 0 08 10 ud

Estas matrices se denominan matrices de información, y simplemente recogen los datos numéricos del
problema en cuestión.
Otras matrices son las llamadas matrices de relación, que indican si ciertos elementos están o no
relacionados entre sı́. En general, la existencia de relación se expresa con un 1 en la matriz y la ausencia
de dicha relación de expresa con un 0.
Estas matrices se utilizan cuando queremos trasladar la información dada por un grafo y expresarla
numéricamente.
CAPÍTULO 6. MATRICES Y DETERMINANTES 85

En Matemáticas, un grafo es una colección cualquiera de puntos conectados por lineas.


Existen muchos tipos de grafos. Entre ellos, podemos destacar:
* Grafo simple: Es el grafo que no contiene ciclos, es decir, lineas que unan un punto consigo
mismo, ni lineas paralelas, es decir, lineas que conectan el mismo par de puntos.
* Grafo dirigido: Es el grafo que indica un sentido de recorrido de cada linea, mediante una flecha.
Estos tipos de grafo pueden verse en la figura:

Figura 6.1: Grafo, Grafo simple y Grafo dirigido.

Relacionadas con los grafos se pueden definir algunas matrices. Entre todas ellas, nosotros nos
fijaremos en la llamada matriz de adyacencia, que es aquella formada por ceros y unos exclusivamente,
de tal forma que:
* un 1 en el lugar (i,j) expresa la posibilidad de ir desde el punto de la fila i hasta el punto de la
columna j mediante una linea que los una directamente.
* un 0 en el lugar (i,j) expresa la imposibilidad de ir del primer punto al segundo mediante una
linea que los una directamente.

La matriz de adyacencia del grafo dirigido de la figura anterior será:

A B C D
 
A 0 1 0 1
B0 0 1 0
C 1 0 0 0
D 0 0 0 0

Ejercicio
1) Escribe las correspondientes matrices de adyacencia de los grafos:

2) Dibuja los grafos dirigidos que correspondan a las matrices de adyacencia:

A B C D
A B C  
  A 0 1 1 1
A 0 1 0
B0 0 0 1
B 1 0 1
C 1 0 0 0
C 0 0 0
D 0 1 1 0
CAPÍTULO 6. MATRICES Y DETERMINANTES 86

6.5. Operaciones con matrices


6.5.1. Suma y diferencia
Dadas dos matrices A y B podemos realizar su suma o diferencia de acuerdo a la siguiente regla.
Para sumar o restar dos matrices del mismo tamaño, se suman o restan los elementos que se encuentren
en la misma posición, resultando otra matriz de igual tamaño.
Por ejemplo:      
2 1 3 2 0 4 0 1 −1
− =
−4 2 1 3 2 5 −7 0 −4
2x3 2x3 2x3

Si las matrices tienen diferente tamaño, no se pueden sumar o restar entre sı́.

Propiedades de la suma (y diferencia) de matrices:


a) Conmutativa: A + B = B + A
b) Asociativa: A + (B + C) = (A + B) + C
c) Elemento neutro: La matriz nula del tamaño correspondiente.
d) Elemento opuesto de A: La matriz -A, que resulta de cambiar de signo a los elementos de A.
Ejemplo:
Si    
0 −1 0 1
A = −4 −2 =⇒ −A =  4 2
3 −9 −3 9
3x2 3x2
porque:      
0 −1 0 1 0 0
−4 −2 +  4 2 = 0 0
3 −9 −3 9 0 0
3x2 3x2 3x2

Ejercicios:

1. Las exportaciones, en millones de euros, de 3 paı́ses A, B, C a otros tres X, Y, Z, en los años


2000 y 2001 vienen dadas por las matrices:

X Y Z X Y Z
   
A 11 6 7 0 5 A 13 3 
7 1
A2000 = B 14 5 10 1 2 A2001 = B 15 7 11 1 3 2
C 20 9 3 2 2 3 C 21 0 2 4 3

Calcula y expresa en forma de matriz el total de exportaciones para el conjunto de los dos años.
¿Cuántos millones ha exportado el paı́s B al Z en total?
Calcula el incremento de las exportaciones del año 2000 al 2001 con los datos del ejemplo anterior.

2. Calcula x, y, z en la suma:
     
x − y −1 2 y 0 z −1 −1 3
 1 y −x + −z 2 3 =  0 4 4
0 z 2 −2 3 x −2 4 1

3. Calcula a, b, c para que se cumpla la igualdad:


     
3−a b −2 2 a+b 4 −1 a 2
+ =
4 −c + 1 6 1−c 2 0 2 0 6
CAPÍTULO 6. MATRICES Y DETERMINANTES 87

6.5.2. Producto por un número real


Dada una matriz cualquiera A y un número real k, el producto k·A se realiza multiplicando todos
los elementos de A por k, resultando otra matriz de igual tamaño. (Evidentemente la misma regla
sirve para dividir una matriz por un número real).
Por ejemplo:    
2 1 3 −10 −5 −15
−5 · =
−4 2 1 20 −10 −5
2x3 2x3
Propiedades:
a) Distributiva respecto de la suma de matrices: k·(A + B) = k·A + k·B
b) Distributiva respecto de la suma de números: (k + d)·A= k·A + d·A
c) Asociativa: k·(d·A)=(k·d)·A
d) Elemento neutro, el número 1: 1·A=A

Ejercicios:
   
1 1 −1 0
1. Si A = yB= , halla una matriz X que verifique la ecuación:
0 1 0 2
2·X −4·A = B

2. Determina las matrices X y Y sabiendo que:


  

 1 −2
3X − 5Y =
8 1

 2 4
 −X + 3Y =
3 0

6.5.3. Trasposición de matrices


Dada una matriz cualquiera A, se llama matriz traspuesta de A, y se representa por At a la matriz
que resulta de intercambiar
 las filas y las columnas de A.
2 1 0 7
Por ejemplo, si A = , entonces la matriz traspuesta de A es:
−3 4 2 1
 
2 −3
1 4 
At = 
0 2 

7 1

Evidentemente, si A es una matriz de tamaño m x n, su traspuesta At tendrá tamaño n x m, pues el


número de columnas pasa a ser el de filas y viceversa.
Si la matriz A es cuadrada, su traspuesta tendrá el mismo tamaño.

Propiedades:
a) (At )t = A, es decir, la traspuesta de la traspuesta es la matriz inicial.
b) (A + B)t = At + B t
c) (k · A)t = k · At
En base a esta nueva operación, podemos definir otras dos clases de matrices, que son:

Matriz simétrica, que es aquella para la que se cumple que At = A, por ejemplo la matriz:
 
2 1 3

A= 1 0 −2

3 −2 7
CAPÍTULO 6. MATRICES Y DETERMINANTES 88

es simétrica (compruébalo).
En una matriz simétrica, los elementos son simétricos respecto a la diagonal principal.

Ejercicio: ¿Puede ser simétrica una matriz que no sea cuadrada?¿Por qué?.

Matriz antisimétrica, es aquella para la que se cumple que At = −A.


Por ejemplo:  
0 1 3
B = −1 0 −2
−3 2 0
es antisimétrica (comprueba).
En una matriz antisimétrica, los elementos de la diagonal principal son siempre nulos (¿por qué?),
y los restantes son opuestos respecto a dicha diagonal.

Ejercicios:
   
1 3 3 1 1 2
1. Dadas las matrices A = 1 4 3 y B =  2 0 −1 calcula 3At − B t .
1 3 4 −6 −1 0
2. Obtener las matrices X e Y que verifiquen los sistemas:
        

 1 5 
 2 1 
 3 1
2X − 3Y = X + Y = 2X + Y =
a)  4 2
b) 3 0 c) 0 −2

 −1 0 
 6 2 
 1 0
X − Y = X − Y = X + 2Y =
3 6 0 1 −2 4

6.5.4. Producto de matrices


Hay que dejar claro ya desde el principio que no todas las matrices pueden multiplicarse. Dos
matrices se pueden multiplicar cuando se cumple la siguiente condición:

“Para multiplicar dos matrices A y B, en este orden, A·B , es condición indispensable que el número
de columnas de A sea igual al número de filas de B”
Si no se cumple esta condición, el producto A·B no puede realizarse, de modo que esta es una
condición que debemos comprobar previamente a la propia multiplicación.
Una vez comprobado que el producto A·B se puede realizar, si A es una matriz m x n y B es una
matriz n x p (observemos que el nº de columnas de A = n = nº de filas de B), entonces el producto
A·B da como resultado una matriz C de tamaño n x p del siguiente modo:

“El elemento que se encuentra en la fila i y la columna j de la matriz C=A·B, se obtiene multiplicando
los elementos de la fila i de A por la columna j de B y sumando los resultados”

Veámoslo mediante un ejemplo:


Para multiplicar las matrices:
 
  0 −4 1
−3 2 1 4 1 −2 1
A= y B=
2 0 2

2 5 3 −2
2x4 3 2 1
4x3

primero comprobamos que se puede realizar el producto A·B, pues el nº de columnas de A es 4 y el


nº de filas de B también es 4, y el resultado, según lo dicho será una matriz de tamaño 2 x 3, tiene 2
CAPÍTULO 6. MATRICES Y DETERMINANTES 89

filas y 3 columnas:  
  0 −4 1  
−3 2 1 4 1 −2 1
    
· =
2 5 3 −2 2 0 2   
2x4 3 2 1 2x3
4x3

Sólo nos falta completar los elementos de la matriz producto. Para ello, seguimos la regla anterior:
El elemento de la fila 1 y columna 1 de A·B proviene de multiplicar elemento a elemento la fila 1
de A por la columna 1 de B y sumar, es decir:

(−3) · 0 + 2 · 1 + 1 · 2 + 4 · 3 = 0 + 2 + 2 + 12 = 16

El elemento de la fila 1 y columna 2 de A·B proviene de multiplicar elemento a elemento la fila 1 de


A y la columna 2 de B y sumar:

(−3) · (−4) + 2 · (−2) + 1 · 0 + 4 · 2 = 12 − 4 + 0 + 8 = 16

El elemento de la fila 1 y columna 3 de A·B proviene de multiplicar elemento a elemento la fila 1 de


A y la columna 3 de B y sumar:

(−3) · 1 + 2 · 1 + 1 · 2 + 4 · 1 = −3 + 2 + 2 + 4 = 5

Ası́ sucesivamente se obtienen (comprueba):


 
16 16 5
5 −22 11
2x3

Ejercicios:

1. Para las matrices A y B anteriores, calcula B·A


   
1 −3 3 −5
2. Si A = ,B= , calcula si es posible A·B y B·A. ¿Coinciden?.
−2 6 2 1
 
1 −1  
  3 0 2
3. Lo mismo si A = 0 −2 , B = .
1 −1 5
4 1
4. Calcula todos los productos posibles entre las matrices:
   
1 2 3 1  
2 1 0
A = 1 1 1  B = 2 C=
3 4 5
0 2 −1 1

Además, calcula A2 y A3 .

5. Para las matrices


   
    2 3 0 1 2
1 −1 2 0 3 4
A= B= C = −5 1 4 −2 D = 1
4 0 −3 −1 −2 3
1 0 0 −3 3

calcula:

A + B, 3A − 4B, A · B, A · D, B · C, C · D, At · C, Dt · At , B t · A, Dt · D, D · Dt
CAPÍTULO 6. MATRICES Y DETERMINANTES 90

Propiedades del producto de matrices


a) Asociativa: A·(B·C) = (A·B)·C
b) Distributiva respecto de la suma:

A · (B + C) = A · B + A · C

(B + C) · A = B · A + C · A
c) Elemento neutro, la matriz identidad correpondiente, si A es m x n:

A · In = A

Im · A = A
d) En general el producto de matrices no es conmutativo

A · B = B · A

Pueden verse ejemplos en los ejercicios anteriores. Esta es una propiedad muy importante.
e) El producto de dos matrices no nulas A y B puede dar lugar a una matriz nula:
 
  5  
2 1 3   0
· 2 =
0 2 1 0
2x3
−4 2x1
3x1

Se dice que el conjunto de las matrices con la operación producto tiene divisores de cero, es decir, hay
matrices no nulas cuyo producto es nulo.

Ejercicios:

1. Si A y B son dos matrices cuadradas del mismo orden, ¿son ciertas las propiedades siguientes,
que son ciertas para las operaciones con números reales?:
a) (A + B)2 = A2 + B 2 + 2 · A · B
b) (A − B)2 = A2 + B 2 − 2 · A · B
c) (A + B) · (A − B) = A2 − B 2
 
2 −1
2. Determina los valores de a y b de la matriz A = para que A2 = A.
a b
 
1 2
3. ¿Qué matrices conmutan con la matriz ?.
0 1

6.6. La matriz inversa


Sabemos ya multiplicar matrices y hemos visto algunas de las propiedades de esta operación.
Recordemos, en primer lugar, que no siempre es posible efectúar la multiplicación de dos matrices,
y en segundo lugar, que aunque sea posible hacer esta multiplicación, en general no es conmutativo,
es decir A·B es distinto de B·A.
En el caso particular de que tratemos con matrices cuadradas del mismo orden A y B, es claro que
podemos efectuar los productos A·B y B·A, que darán como resultado otra matriz del mismo orden,
aunque, como ya se ha dicho, las matrices resultantes serán, en general, distintas.
Sabemos también que el elemento neutro del producto de matrices es la matriz identidad In .
Por analogı́a con el caso de los números reales, podemos plantearnos la siguiente cuestión:
CAPÍTULO 6. MATRICES Y DETERMINANTES 91

Si tenemos un número real, por ejemplo el 2, podemos interesarnos en buscar el inverso del 2 para
el producto, es decir un número real x tal que 2·x = 1, el producto de 2 por x sea igual al elemento
neutro, el 1.
Evidentemente, en el caso de los números reales es bien fácil despejar x para obtener, en nuestro
1
caso, que x = , es decir, el inverso de un número real es otro número que multiplicado por él da el
2
elemento neutro, el 1.
Todo número real, salvo el 0, tiene inverso.

Trasladando esto a las matrices, nos podemos plantear si dada una matriz cuadrada A de orden n,
cualquiera, existe su inversa X para el producto de matrices,tal que

A · X = In

es decir, el producto de A por su inversa produce el elemento neutro matricial, la matriz identidad In .
Sin embargo, hay algunas diferencias con respecto al caso de los números reales:
In
1) No podemos “despejar” la matriz X del modo X = , porque no hemos definido la división de
A
matrices.
2) No todas las matrices cuadradas no nulas tienen matriz “inversa” (sea lo que sea, por analogı́a
con los números).
Definamos, en primer lugar, el término de matriz inversa:

Dada una matriz cuadrada de orden n , A, se dice que A es invertible (o que posee inversa o que es
no singular o que es regular ), si existe otra matriz del mismo orden, denominada matriz inversa de A
y representada por A−1 y tal que:
A · A−1 = In
y
A−1 · A = In
Si A no tiene inversa, se dice que es singular o no invertible.
Si una matriz tiene inversa, dicha matriz inversa es única (sólo hay una). Para calcular dicha matriz
inversa, podemos utilizar dos vı́as:

6.6.1. Método directo:


Consiste en determinar A−1 planteando un sistema de ecuaciones, es decir, si por ejemplo queremos
1 2
determinar la inversa de la matriz A = , lo que estoy buscando es otra matriz de igual tamaño
−1 1
 
−1 −1 −1 x y
(orden 2) tal que A · A = I2 y A · A = I2 , es decir, si A = , se tiene que cumplir que :
z t
         
−1 1 2 x y 1 0 x + 2z y + 2t 1 0
A · A = I2 =⇒ · = =⇒ =
−1 1 z t 0 1 −x + z −y + t 0 1


 x + 2z = 1

y + 2t = 0

−x +z =0

−y + t = 1
Es decir, hemos de resolver un sistema de 4 ecuaciones con 4 incógnitas, aunque en realidad son 2
sistemas de dos ingónitas cada uno (uno con x y z y otro con y y t).
Resolviendo el sistema se obtiene que
1 −2 1 1
x= ,y = ,z = ,t =
3 3 3 3
CAPÍTULO 6. MATRICES Y DETERMINANTES 92

por lo que la matriz inversa es:


1 −2
  
−1 3 3
1 1 −2
A = 1 1 = ·
3 3 3 1 1

Se puede comprobar que también se cumple que A−1 · A = I2 , luego A es invertible, tiene inversa. Si
el sistema no tiene solución, la matriz no
 tiene inversa.
1 1
Por ejemplo, en el caso en que A = , del mismo modo :
2 2
         
−1 1 1 x y 1 0 x+z y+t 1 0
A·A = I2 =⇒ · = =⇒ =
2 2 z t 0 1 2x + 2z 2y + 2t 0 1


 x+z = 1

y+t = 0

 2x + 2z = 0

2y + 2t = 1
Y por ejemplo de 2x+2z=0 se obtiene x = -z, si se sustituye en la primera ecuación es -z+z=1, es
decir 0 = 1 (imposible). El sistema no tiene solución.
Por tanto A no es invertible, es singular.
Este método directo sólo se suele utilizar para matrices cuadradas de tamaño 2, puesto que para
las de tamaño 3 obtenemos un sistemas de ¡9 ecuaciones con 9 incógnitas! que realmente es difı́cil de
resolver.

6.6.2. Método de Gauss-Jordan:


Consiste en hacer transformaciones elementales en las filas de la matriz para llegar a obtener la
matriz identidad. Realizando estas mismas transformaciones con la matriz identidad llegamos a la
matriz A−1 .
Se llama transformación elemental en una matriz a:
T1) Multiplicar o dividir una fila por un número real distinto de cero.
T2) Sumar o restar a una fila otra multiplicada por un número real no nulo.
T3) Intercambiar el lugar de dos filas entre sı́.  
1 2
Veamos como se realiza el método de Gauss-Jordan, realizándolo a la vez con la matriz .
−1 1
i) Consideramos la matriz formada por A y la matriz identidad correspondiente . En nuestro caso:
  
1 2 1 0
(A|I2 ) =
−1 1 0 1

ii) Se hace la matriz triangular superior (es decir, hacemos ceros por debajo de la diagonal principal)
usando transformaciones elementales en filas.
La mejor forma de realizar esto es hacer cero los elementos por debajo de la diagonal en la primera
columna usando la fila 1. Luego, hacer cero los elementos por debajo de la diagonal en la segunda
columna usando la fila 2, y ası́ sucesivamente.
En nuestro caso, basta sumar la fila 2 con la fila 1, y se obtiene:
     
1 2 1 0 F2 +F1 1 2 1 0
(A|I2 ) = −−−−→
−1 1 0 1 0 3 1 1

iii) Una vez hecha la matriz triangular superior, se hace la matriz triangular inferior, haciendo
ceros a los elementos por encima de la diagonal. El proceso es parecido al anterior:
CAPÍTULO 6. MATRICES Y DETERMINANTES 93

Hacer cero los elementos por encima de la diagonal en la última columna usando la última fila. Lue-
go, hacer cero los elementos por encima de la diagonal en la penúltima columna usando la penúmtima
fila, y ası́ sucesivamente. En nuestro caso:
     
1 2 1 0 3·F1 −2·F2 3 0 1 −2
−−−−−−→
0 3 1 1 0 3 1 1
iv) Ya tenemos una matriz diagonal. Lo único que falta es dividir a cada fila entre el número
adecuado para obtener unos en la diagonal principal, es decir, para obtener la matriz identidad en la
parte izquierda:  
  F1 F2  
3 0 1 −2 3
, 3 1 0 13 −23

− −−→
0 3 1 1 0 1 31 13
v) Una vez se tiene la matriz identidad en la parte de la izquierda, la parte derecha es la matriz inversa,
es decir, llegamos a:
    1 −2   
1 0 13 −2 1 1 −2
(I2 , A−1 ) = 3 =⇒ A−1
= 3 3 = ·
0 1 31 13 1
3
1
3 3 1 1
matriz que habı́amos obtenido antes por el método directo.
Si al realizar el método de Gauss-Jordan en algún momento alguna fila es de ceros, la matriz no
tiene inversa.
Cuanto mayor sea el orden de la matriz, mejor es este método frente al directo.
Veamos otro ejemplo:  
1 1 0
Calcular la inversa de la matriz B = −1 1 2 por el método de Gauss-Jordan.
1 0 1
Siguiendo los pasos anteriores:
        
1 1 0 1 0 0 1 1 0 1 0 0 1 1 0 1 0 0
F +F F −F
(B|I3 ) = −1 1 2 0 1 0 −−2−−→ 1 
0 2 2 1 1 0 −−3−−→ 1 
0 2 2 1 1 0
1 0 1 0 0 1 1 0 1 0 0 1 0 −1 1 −1 0 1
     
1 1 0 1 0 0 1 1 0 1 0 0
2·F +F2 2·F2 −F3 4·F −F2
−−−3−−→ 0 2 2 1 1 0 − −−−−→ 0 4 0 3 1 −2 −−−1−−→

0 0 4 −1 1 2 0 0 4 −1 1 2
     
4 0 0 1 −1 2 F1 F2 F3
, ,
1 0 0 14 −14
2
4
4·F −F2
−−−1−−→ 0 4 0 3 1 −2 −− 4
−−4
−−4→ 0 1 0 43 1 −2 
= (I3 |B −1 )
 4 4
0 0 4 −1 1 2 0 0 1 −1 14 2
 1 −1 1  4 4

4 4 2
=⇒ B −1 =  3
4
1
4
−1 
2
−1 1 1
4 4 2
También se puede expresar, sacando factor común:
 
1 −1 2
1
B −1 = ·  3 1 −2
4
−1 1 2
es la inversa de B.  
1 1
Si calculamos por este método la inversa de A = resulta:
2 2
     
1 1 1 0 F2 −2·F1 1 1 1 0
(A|I2 ) = −−−−−→
2 2 0 1 0 0 −2 1
Como aparece una fila de ceros, la matriz A no tiene inversa.

Ejercicios:
CAPÍTULO 6. MATRICES Y DETERMINANTES 94

1. Calcular por el método de Gauss-Jordan la inversa de las matrices:


   
1 2 −3 −2 1 4
A = 3 2 −4 B= 0 1 2 
2 −1 0 1 0 −1
 
3 0 0
2. Dada la matriz diagonal D = 0 −2 0 calcula su inversa. ¿Cómo calcuları́as de forma
0 0 5
rápida la inversa de una matriz diagonal cualquiera?.

6.7. Rango de una matriz


Un concepto muy importante relacionado con las matrices es el de rango. El concepto de ran-
go se encuentra ligado al de “independencia lineal” de filas o columnas de una matriz, pero no se
introducirá de esta manera porque se requieren conceptos que no conocemos.
Baste saber que se define el rango de una matriz como el número máximo de filas o columnas
linealmente independientes.
Sin embargo, el cálculo del rango de una matriz lo abordaremos desde otra perspectiva, utilizando
el método de Gauss.
Supongamos que tenemos una matriz cualquiera A a la que aplicamos el método de Gauss con el
fin de simplificarla lo más posible (es decir, consiguiendo que tenga el mayor número de ceros posible),
realizando operaciones elementales en filas.
Llamaremos rango de la matriz A y lo representaremos por Rg(A) al número de filas no nulas de
la matriz tras aplicarle el método de Gauss.

Ejemplo: Calcular el rango de las siguientes matrices:


 
    1 1 0  
1 1 0 3 2 4 6
A= B= C= 2 1 1  D=
2 2 1 1 −1 −2 −3
−1 1 −2
   
1 1 F2 −2·F1 1 1
a) −−−−−→ , Rg(A)=1 ,sólo una fila distinta de cero.
2 2 0 0
   
0 3 F2 F1 1 1
b) −−−−→ , Rg(B)=2 hay 2 filas no nulas.
1 1 0 3
       
1 1 0 1 1 0 1 1 0 1 1 0
F2 −2·F1  F +F1  F +2·F2 
c)  2 1 1  −− −−−→ 0 −1 1  −−3−−→ 0 −1 1  −−3−−−→ 0 −1 1
−1 1 −2 −1 1 −2 0 2 −2 0 0 0
Rg(C)=2
 hay 2 filas
 no nulas.  
2 4 6 2·F2 +F1 2 4 6
d) −−−−−→ , Rg(D)=1, sólo una fila no nula.
−1 −2 −3 0 0 0
Los ejemplos anteriores ponen de manifiesto que el rango de cualquier matriz siempre es menor o
igual que el número de filas de la matriz.
De hecho se verifica que el rango de cualquier matriz siempre es menor o igual que su número de
filas y de columnas, pues el proceso para hacer el método de Gauss se puede hacer indistintamente
mediante operaciones elementales en filas o en columnas.
Esto permite, antes de calcular el rango de una matriz, saber entre qué valores va a estar ese rango.
Por ejemplo, en el caso c) del ejemplo, como la matriz es 3x3 , el rango sólo puede ser 0, 1, 2 ó 3,
no hay otras posibilidades.
En el caso del apartado d), como la matriz es 2 x 3, el rango sólo puede ser 0,1 ó 2. (De hecho,
podemos reducir esto algo más , pues una matriz sólo tiene rango cero si es la matriz nula).Resumiendo:
CAPÍTULO 6. MATRICES Y DETERMINANTES 95

Propiedad: Si A es una matriz de tamaño m x n no nula se cumple que:

1 ≤ Rg(A) ≤ min{m, n}

Ejemplo: Calcular en función de k el rango de la matriz:


 
1 1 2
A=
3 3 k

Aplicando Gauss,    
1 1 2 F2 −3·F11 1 2
A= −−−−−→
3 3 k 0 0 k−6
Ahora es evidente que si k-6=0, la última fila es nula. Por tanto, si k=6, la última fila es nula y el
rango de A es 1, Rg(A)=1, mientras que si k-6 es distinto de cero, es decir si k es distinto de 6, hay 2
filas no nulas y el rango de A es 2, Rg(A)=2. Resumiendo:

Si k = 6, entonces Rg(A)=2
Si k=6, entonces Rg(A)=1

La siguiente propiedad permite relacionar el concepto de rango con el de matriz inversa visto
anteriormente:

Propiedad:
Una matriz cuadrada A tiene inversa ⇐⇒ Rg(A) es máximo.

Ejercicios:


1 −2 1
1. Calcula el rango de A según los valores de k: A = 1 1 3.¿Para qué valores de k tiene A
5 −1 k
inversa?.

2. Calcula el rango de las matrices:


 
  0 2 1
1 0 1
A= B = 1 0 −1
2 1 0
0 4 2
 
2 −1 1 1  
0 0 1 0 2 1 5 −1 8
C =
2 1 1 1
 D = −1 2 3 4 5
1 3 10 11 13
0 0 0 1

6.8. Determinantes
Introduciremos a continuación el concepto de determinante asociado a una matriz cuadrada. Este
concepto permite simplificar operaciones matriciales tales como el cálculo del rango o de la matriz
inversa.

Definición:
Si es una matriz 2 x 2 se define el determinante de la matriz A, y se expresa como det(A) o bien
|A|, como el número:  
a11 a12 
det(A) = |A| =   = a11 · a22 − a12 · a21
a21 a22 
Ejemplos: El cálculo de los determinantes de orden 2 es bien sencillo, por ejemplo:
CAPÍTULO 6. MATRICES Y DETERMINANTES 96

 
 1 3

a)   =1·4-(-1)·3=4+3=7.
−1 4
 
−2 −3

b)   =-10+6=-4.
2 5

Para definir determinantes de matrices de orden mayor que 2 es necesario introducir previamente
algunos conceptos.
Dada una matriz cuadrada A de orden n, definimos el menor complementario de un elemento de
A,aij , como el determinante de la matriz que se obtiene al suprimir la fila i y la columna j en la que
se encuentra dicho elemento aij . Se representa por Mij .
 
−2 4 5
Ejemplo: En la matriz A =  6 7 −3 , los menores complementarios de cada uno de los
3 0 2
elementos de la primera fila son:  
7 −3
Menor complementario de -2:M11 =   =14-0=14.
0 2 
 
6 −3
Menor complementario de 4:M12 =   =12+9=21.
3 2
 
6 7
Menor complementario de 5:M13 =   =0-21=-21.
3 0
Y ası́ sucesivamente.

Ejercicio: Obtener los restantes menores complementarios de los elementos de la matriz A.

Estrechamente ligado al concepto de menor complementario se encuentra el de adjunto de una matriz.


Dada una matriz cuadrada A de orden n, definimos el adjunto de un elemento aij de A como el
número:
Aij = (−1)i+j · Mij
es decir, no es más que el menor complementario correspondiente acompañado de un signo más o
menos dependiendo de la fila y la columna en la que se encuentre el elemento en cuestión.
Por ejemplo, para la matriz anterior, los adjuntos de los elementos de la primera fila son:
Adjunto de -2:A11 = (−1)1+1 · M11 = 1 · 14 = 14 (coincide con el menor complementario)
Adjunto de 4:A12 = (−1)1+2 · M12 = (−1) · 21 = −21 (menor complementario con signo cambiado)
Adjunto de 5:A13 = (−1)1+3 · M13 = 1 · −21 = −21 (coincide con el menor complementario).

Ejercicio: Obtener los restantes adjuntos de los elementos de la matriz A.

En general puede saberse si el signo del menor complementario y del adjunto coinciden o no utilizando
una sencilla regla gráfica, por ejemplo, para matrices 3 x 3 y 4 x 4 basta fijarse en las matrices:
 
  + − + −
+ − + − + − + 
− + −  
+ − + − 
+ − +
− + − +

donde el + significa que el adjunto coincide con el menor complementario y el - indica que tienen signo
contrario.

Una vez vistos estos conceptos se puede definir ya:

Definición: Dada una matriz cuadrada A de tamaño n se define su determinante como la suma
CAPÍTULO 6. MATRICES Y DETERMINANTES 97

del producto de los elementos de una linea cualquiera de la matriz (fila o columna) elegida, por sus
correpondientes adjuntos.

Se puede demostrar, aunque dicha demostración excede los contenidos del curso, que el valor del
determinante no depende de la fila o columna elegida para calcularlo.
 
−2 4 5
Ejemplo: Para la matriz A =  6 7 −3 ,aplicando la definición, si elegimos la fila tercera queda:
3 0 2
      
4 5  −2 5  −2 4

det(A) = 3 ·   
+ 0 · −  
+2· =
7 −3 6 −3 6 7
= 3 · (−12 − 35) + 0 · (−(6 − 30)) + 2 · (−14 − 24) = −141 + 0 − 76 = −217

Si hubiésemos elegido otra fila o columna, por ejemplo la columna 2, quedarı́a:

       
6 −3 −2 5 −2 5 
det(A) = 4 · −   +7·   
 3 2 + 0 · −  6 −3 =
3 2 
= 4 · (−(12 + 9)) + 7 · (−4 − 15) + 0 · (−(6 − 30)) = −84 − 133 + 0 = −217

Ejercicio: Calcula, desarrollando por la fila que tú elijas los determinantes de las matrices:
       
1 8 1 3 4 −6 7 8 0 0 3 1
1 7 0  2 −1 1  0 −7 3 −2 0 2
1 6 −1 5 3 −5 1 0 1 3 4 0
     
1 1 1 0 1 2 3 4 1 0 −1 2
1 1 0 1 2 1 3 1 2 3 2 −2
     
1 0 1 1 3 1 4 3 2 4 2 1
0 1 1 1 3 4 1 2 3 1 5 −3

6.9. La regla de Sarrus


La definición de determinante es bastante engorrosa y se hace mucho más pesada a medida que
aumenta el orden de la matriz A.
En el caso de las matrices cuadradas de orden 3, esta regla facilita el cálculo de dichos determi-
nantes.  
a11 a12 a13
Si la matriz es A = a21 a22 a23 , entonces el determinante de A se calcula mediante la resta
a31 a32 a33
de dos expresiones obtenidas del siguiente modo:
Llamaremos sumandos positivos a los obtenidos al multiplicar:
- Los elementos de la diagonal principal,a11 · a22 · a33 .
- Los elementos de la linea paralela superior a la diagonal principal por el elemento aislado de la
esquina inferior izquierda:a12 · a23 · a31 .
- Los elementos de la linea paralela inferior a la diagonal principal por el elemento aislado de la
esquina superior derecha:a21 · a32 · a13 .
CAPÍTULO 6. MATRICES Y DETERMINANTES 98

Gráficamente:

Figura 6.2: Sumandos positivos

Llamaremos sumandos negativos a los obtenidos al multiplicar:


- Los elementos de la diagonal secundaria,a13 · a22 · a31 .
- Los elementos de la linea paralela superior a la diagonal secundaria por el elemento aislado de la
esquina inferior derecha: a12 · a21 · a33 .
- Los elementos de la linea paralela inferior a la diagonal secundaria por el elemento aislado de la
esquina superior izquierda: a32 · a23 · a11 .
Gráficamente:

Figura 6.3: Sumandos negativos

Y entonces det (A)= Sumandos positivos - Sumandos negativos.


Por ejemplo, en el caso de la matriz anterior:
 
−2 4 5
A =  6 7 −3
3 0 2
, se tiene que aplicando la regla de Sarrus:
det(A)=(-2)·7·2+4·3·(-3)+6·5·0-(3·7·5+0·(-2)·(-3)+6·4·2)=-28-36-105-48=-217.

Ejercicio: Comprobar, mediante la regla de Sarrus, los determinantes de orden 3 obtenidos en el


ejercicio anterior.

6.10. Propiedades de los determinantes


Algunas propiedades importantes que tienen los determinantes, y que se enuncian sin demostración,
son:
1. Si una matriz tiene una linea (fila o columna) de ceros, el determinante vale cero.
Esta propiedad es evidente, puesto que por definición de determinante, basta elegir dicha linea
para desarrollar y el determinante será 0.
CAPÍTULO 6. MATRICES Y DETERMINANTES 99

2. Si una matriz tiene dos filas iguales o proporcionales, su determinante es nulo.

3. Si permutamos dos lineas paralelas de una matriz cuadrada, su determinante cambia de signo,
por ejemplo:    
0 1 2 −3  0 1 2 −3 
   
1 3 2 −5  1 3 2 −5
 
2 4 1 
= 91 =⇒   = −91
 3 3 −2 −8 1 
3 −2 −8 1  2 4 3 1

4. Si multiplicamos todos los elementos de una linea de un determinante por un número, el deter-
minante queda multiplicado por ese número. Por ejemplo:
   
0 1 2 −3 0 1 2 −3 
 
1 3 2 −5 2 6 4 −10
 = 91 =⇒  = 182
2 4 3 
1  1 
 2 4 3
3 −2 −8 1  3 −2 −8 1 
 
0 2 4 −6 

2 6 4 −10
pero  = 16 · 91 = 1456
4 8 6 2 
6 −4 −16 2 

5. Si a una linea de una matriz se le suma otra linea multiplicada por un número, el determinante
no cambia.
Esta propiedad permite utilizar un método más sencillo para calcular determinantes de orden
mayor que 3.

6. El determinante de una matriz es igual al de su traspuesta,

|A| = |At|

7. Si A tiene matriz inversa, A−1 , se verifica que:


1
det(A−1 ) =
det(A)

Una estrategia a tener en cuenta en este caso de determinantes de orden 4 o superior, o incluso de
orden 3 si la matriz es compleja, es el método de “hacer ceros”, puesto que el valor del determinante
no varı́a al realizar a la matriz ciertas transformaciones elementales en filas,como indica la propiedad
5 anterior, si bien hemos de ser cuidadosos al aplicar dicha propiedad.
Ası́ pues la mejor forma de calcular un determinante es hacer ceros en una fila o columna y
desarrollar por dicha fila o columna, porque entonces sólo tendremos que calcular un adjunto. Por
ejemplo, si calculamos:
     
0 1 2 −3 0 1 2 −3 0 1 2 −3
  
1 3 2 −5 F3 −2·F2 1 3 2 −5 F4 −3·F2 1 3 2 −5
 =  = 
2 4   =
 3 1  0 −2 −1 11  0 −2 −1 11 
3 −2 −8 1  3 −2 −8 1  0 −11 −14 16 
Desarrollando por la columna 1
  
 1 2 −3

= 1 · −  −2 −1 11  =
−11 −14 16 
= −(−16 − 242 − 84 − (−33 − 154 − 64)) = 91
CAPÍTULO 6. MATRICES Y DETERMINANTES 100

Como hemos dicho, hemos de tener especial cuidado al aplicar esta regla con determinantes, puesto
que no podemos hacer las mismas operaciones que con las matrices, lo que puede confundir.
Por ejemplo, si queremos calcular el determinante:
 
1 2 3
 
C = 0 1 2
4 1 5

mediante la regla de Sarrus es:


det(C)=5+16+0-(12+2+0)=21-14=7.
Si hiciésemos ceros en la primera columna, y desarrollásemos nos deberı́a dar lo mismo. Ahora
bien,podemos hacer cero el 4 de la primera columna mediante:
   
1 2 3 1 2 3   
    1 2 
0 1 2 F3 −4·F1    = −7 + 14 = 7.
  = 0 1 2 =
−7 −7
4 1 5 0 −7 −7

lo que es correcto. Sin embargo, si queremos hacer cero el 1 de la primera columna serı́a un error
hacer:    
1 2 3    
  4·F1 −F3 0 7 7  
0 1 2 −→ 0 1 2 = 4 · 7 7 = 4 · (14 − 7) = 28.
    1 2
4 1 5 4 1 5

no obtenemos lo mismo, porque hemos multiplicado la fila sustituida por un número y eso altera el
valor del determinante. Luego la fila a sustituir conviene no multiplicarla, como en el primer ejemplo,
puesto que si no nos damos cuenta, podemos variar el valor del determinante.

6.11. Relación entre la inversa y los determinantes


Hay una estrecha relación entre la inversa de una matriz cuadrada y su determinante. De hecho se
verifica que:

Propiedad: Una matriz cuadrada A tiene inversa ⇐⇒ |A| =  0.


−1
Además, en este caso, la matriz inversa de A, A se calcula de la manera:

(Adj(A)t
A−1 =
|A|

donde Adj(A) denota la matriz adjunta de A, es decir, aquella que se obtiene de sustituir cada elemento
de A por su adjunto.
 
1 0 −1
Ejemplo: Calcular, si es posible, la inversa de la matriz A =  0 1 −3.
−1 1 0
 
 1 0 −1
 
En primer lugar,|A| =  0 1 −3 = 0 + 0 + 0 − (1 − 3 + 0) = 2 y por tanto A tiene inversa.
−1 1 0 
Calculando Adj(A), se obtiene:
  



 
 
 

1 −3 −  0 −3  0 1
 1 0  −1 0  −1 1   
       3 3 1
 0 −1  1 −1  1 0
Adj(A) =      
− 1 0  −1 0  − −1 1 = −1 −1 −1
  
        1 3 1
 0 −1 1 −1 1 0 
  −    
1 −3 0 −3 0 1
CAPÍTULO 6. MATRICES Y DETERMINANTES 101

Por tanto,  
3 −1 1
(Adj(A)t) = 3 −1 3
1 −1 1
Y entonces, se obtiene: 3 
−1 1
2 2 2
A−1 = 3
2
−1
2
3
2
1 −1 1
2 2 2
Ejercicio: Calcular la inversa anterior por el método de Gauss.

6.12. Aplicación de los determinantes al cálculo del rango


Los determinantes también proporcionan una forma sencilla de calcular el rango de una matriz
cualquiera.
Un definición alternativa de rango de una matriz es:
El Rango de una matriz A es el tamaño del mayor menor complementario no nulo que esté incluido
dentro de la matriz.
Aplicando este criterio, calculemos el rango de las matrices siguientes:
 
    1 1 0  
1 1 0 3   2 4 6
A= B= C= 2 1 1 D=
2 2 1 1 −1 −2 −3
−1 1 −2

a) Sólo hay un menor de orden 2, que es:


 
1 1
 
2 2 = 0

Como es nulo, el rango de la matriz NO es 2. Menores de orden 1 hay 4, por ejemplo |1| = 1, que es
no nulo,luego el rango de la matriz es Rg(A)=1 (el tamaño de dicho menor complementario).
b) Sólo hay un menor de orden 2, que es:
 
0 3
 
1 1 = 0 − 3 = −3

Como no es nulo, el rango de la matriz es Rg(B)=2 (el tamaño de dicho menor complementario).
c) Sólo hay un menor de orden 3, que es:
 
1 1 0
 
 2 1 1  = −2 − 1 + 0 − (0 + 1 − 4) = −3 + 3 = 0
 
−1 1 −2

Como es nulo, podemos asegurar que el rango NO es 3.


Menores de orden 2 hay 9. Calculando alguno:
 
1 0
 
1 1 = 1

resulta que es no nulo, luego el rango es Rg(C)=2 (el tamaño de dicho menor complementario).
d) El menor más grande que podemos formar es de orden 2. Hay 3 de ellos:
     
2 4  2 6  4 6 
  
−1 −2 = −4 + 4 = 0 −1 −3 = −6 + 6 = 0 −2 −3 = −12 + 12 = 0
CAPÍTULO 6. MATRICES Y DETERMINANTES 102

Son todos nulos, luego el rango NO es 2. Menores de orden 1 hay 6, y por ejemplo |6| = 6 = 0, es no
nulo, luego el rango es Rg(D)=1.

Ejercicio Calcula,utilizando los determinantes, el rango de las matrices:


 
  0 2 1
1 0 1
A= B = 1 0 −1
2 1 0
0 4 2
 
2 −1 1 1  
0 0 1 0 2 1 5 −1 8
C =  D = −1 2 3 4 5
2 1 1 1
1 3 10 11 13
0 0 0 1
Capı́tulo 3

DISTRIBUCIÓN BINOMIAL Y
DISTRIBUCIÓN NORMAL

3.1. Introducción
Estudiaremos en este tema dos de las distribuciones de probabilidad más importantes y que son
imprescindibles a la hora de adentrarnos en el estudio de la inferencia estadı́stica. La distribución
binomial es uno de los primeros ejemplos de las llamadas distribuciones discretas (que sólo pueden
tomar un número finito, o infinito numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza,
1654-1705), quién escribió el primer tratado importante sobre probabilidad, “Ars conjectandi” (El
arte de pronosticar). Los Bernoulli formaron una de las sagas de matemáticos más importantes de la
historia. La distribución normal es un ejemplo de las distribuciones continuas, y aparece en multitud
de fenómenos sociales. Fue estudiada, entre otros, por J.K.F. Gauss (Alemania, 1777-1855), uno de los
más famosos matemáticos de la historia. La gráfica de la distribución normal en forma de campana se
denomina Campana de Gauss.

3.2. La distribución binomial o de Bernoulli


La distribución binomial está asociada a experimentos del siguiente tipo:
- Realizamos n veces cierto experimento en el que consideramos sólo la posibilidad de éxito o
fracaso.
- La obtención de éxito o fracaso en cada ocasión es independiente de la obtención de éxito o
fracaso en las demás ocasiones.
- La probabilidad de obtener éxito o fracaso siempre es la misma en cada ocasión.

Veámoslo con un ejemplo


Tiramos un dado 7 veces y contamos el número de cincos que obtenemos. ¿Cuál es la probabilidad
de obtener tres cincos?.
Este es un tı́pico ejemplo de distribución binomial, pues estamos repitiendo 7 veces el experimento
de lanzar un dado. ¿Cuál es nuestro éxito?.
Evidentemente, sacar un 5, que es en lo que nos fijamos.
El fracaso, por tanto, será no sacar 5, sino sacar cualquier otro número.
1
Por tanto, Éxito = E = “sacar un 5” =⇒ p(E) =
6
5
Fracaso = F = “no sacar un 5” =⇒ p(F ) =
6
Para calcular la probabilidad que nos piden, fijémonos en que nos dicen que sacamos 3 cincos y
por lo tanto tenemos 3 éxitos y 4 fracasos, ¿de cuántas maneras pueden darse estas posibilidades?.
Podrı́amos sacar 3 cincos en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir: EEEFFFF
Pero también podrı́amos sacar EFEFFFE, es decir que en realidad estamos calculando de cuántas

38
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 39

maneras se pueden ordenar 4 fracasos y 3 éxitos. Recordando las técnicas combinatorias, este problema
se reduce a calcular las permutaciones con elementos repetidos:
7! 7·6·5
P73,4 = = = 35formas
3! · 4! 3·2·1
1 5
Y por tanto, como p(E) = y tengo 3 éxitos y p(F ) = y tengo 4 fracasos:
6 6
1 1 1 5 5 5 5
p(tener 3 éxitos y 4 fracasos) = 35 · · · · · · · = 0 0781
6 6 6 6 6 6 6
1
Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de éxito ,
6
la probabilidad de obtener 3 éxitos es 0’0781, y lo expresarı́amos:
 
1
Bin 7; , entonces p(X = 3) = 0 0781
6
Como repetir este proceso serı́a bastante penoso en la mayorı́a de los casos, lo mejor es recurrir a la
siguiente fórmula que expresa la probabilidad de obtener cierto número de éxitos en una distribución
binomial:

Definición de distribución binomial:


Si realizamos n veces un experimento en el que podemos obtener éxito, E, con probabilidad p y
fracaso, F, con probabilidad q (q = 1 − p), diremos que estamos ante una distribución binomial de
parámetros n y p, y lo representaremos por Bin(n;p). En este caso la probabilidad de obtener k éxitos
viene dada por:  
n
p(X = k) = · pk · q (n−k)
k
Nota:
Observar que las probabilidades de éxito y fracaso son complementarias, es decir, q = 1-p y p =
1-q, por lo que basta saber una de ellas para calcular la otra.

Ejemplo:  
1
Antes tenı́amos Bin 7; , y querı́amos calcular p(X=3) (obtener 3 éxitos). Aplicando la fórmula:
6
   3  4
7 1 5
p(X = 3) = · · = 0 0781
3 6 6
Ejemplo:
Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la
probabilidad de que una familia con 6 descendientes tenga 2 hijos.
En este caso Éxito = E = “tener hijo” y p(E) = 0’5.
Fracaso = F = “tener hija” y p(F) = 0’5.
Estamos por tanto ante una binomial Bin(6;0’5) y nos piden p(X=2).
Si aplicamos la fórmula es:
 
6
p(X = 2) = · (0 5)2 · (0 5)4 = 0 2344
2
Nota:
La elección de éxito o fracaso es subjetiva y queda a elección de la persona que resuelve el problema,
pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo
anterior, si:
Éxito = “tener hija”, como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos,
si el éxito es tener hija hemos de plantearnos cuál es la probabilidad de tener 4 éxitos (4 hijas), es
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 40

decir:  
6
p(X = 4) = · (0 5)4 · (0 5)2 = 0 2344
4
Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el éxito y el fracaso y
la pregunta que nos hagan.

3.2.1. El uso de las tablas de la distribución binomial


La distribución binomial se encuentra tabulada por lo que es fácil calcular probabilidades sin
necesidad de hacer demasiadas cuentas. Para usar las tablas de la distribución binomial es necesario
conocer:
- El número de veces que se realiza el experimento (n).
- La probabilidad de éxito (p).
- El número de éxitos (k).
La probabilidad p se busca en la primera fila (valores desde 0’01 hasta 0’5).
El número de veces que se realiza el experimento, en la primera columna (valores desde 2 a 10) y
el número de éxitos a su lado.
Por ejemplo en el caso anterior, Bin (6;0’5) , p(X=2), la columna p=0’5 es la última, y cuando
n=6 y k=2 encontramos 0’2344, el valor que habı́amos calculado.
Nota importante: El caso en que p > 0 5, no se encuentra tabulado.
La razón es bien sencilla. Si p > 0 5, entonces q < 0 5 y basta intercambiar los papeles de éxito y
fracaso para que podamos utilizar la tabla.

Ejemplo:
La probabilidad de que un alumno de 2º de Bachillerato apruebe las Matemáticas es de 0’7. Si
consideramos un grupo de 8 alumnos, ¿cuál es la probabilidad de que cinco de ellos aprueben las
Matemáticas?.
Si éxito = “aprobar” y fracaso = “suspender”, entonces p = 0’7 y q = 0’3.
Tenemos, por tanto, una Bin(8;0’7).
Nos piden calcular p(X=5), que no se puede calcular mediante las tablas porque p = 0’7 y sólo
tenemos hasta p = 0’5. Por tanto si intercambiamos éxito = “suspender” y fracaso =“aprobar” entonces
p = 0’3, q = 0’7, es decir la nueva binomial es Bin(8;0’3) y nos piden que aprueben 5 de 8, es decir
que suspendan 3 de 8 o lo que es lo mismo, que tengamos 3 éxitos, p(X=3), y buscando en la tabla es
p(X=3) = 0’2541.
También, desde luego podrı́amos haber utilizado la fórmula desde el principio, utilizar la Bin(8;0’7)
y olvidarnos de tablas para hacer:
 
8
p(X = 5) = · (0 7)5 · (0 3)3 = 0 254
5

3.2.2. Probabilidades acumuladas


Es posible que nos pidan no sólo la probabilidad de que ocurran un cierto número de éxitos en
concreto, sino que ocurran como mucho “k” éxitos o preguntas similares. En el ejemplo anterior, por
ejemplo, podrı́an pedirnos:
a) ¿Cuál es la probabilidad de que aprueben como mucho 2 alumnos?.
Si éxito = aprobar y fracaso = suspender, p= 0’7 y q = 0’3, entonces nos piden p(X ≤ 2). En
este caso, basta pensar en que para que aprueben 2 alumnos como mucho, puede que aprueben 2, 1 o
ninguno, es decir:

p(X ≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0 0001 + 0 0012 + 0 01 = 0 1013

(haz las cuentas)


b) ¿Cuál es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?.
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 41

Del mismo modo:

p(3 ≤ X ≤ 6) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) =


= 0 0467 + 0 1361 + 0 2541 + 0 2965 = 0 7334

Hemos de tener en cuenta que para la distribución binomial, en las tablas sólo se admiten valores
hasta n=10 (10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de
utilizar la fórmula.

Ejemplo:
Los alumnos de cierta clase se encuentran en una proporción del 67 % que estudian inglés y el resto
francés.
Tomamos una muestra de 15 alumnos de la clase, calcular:
a) Probabilidad de que al menos encontremos tres alumnos de inglés.
b) Probabilidad de que los 15 alumnos estudien inglés.
c) Probabilidad de que estudien inglés entre 7 y 10 alumnos.
Si éxito = estudiar inglés, p = 0’67 y fracaso = estudiar francés, q = 1-0’67 = 0’33. Manejamos
por tanto una Bin(15;0’67)
a) p(X ≥ 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + . . . + p(X = 15).
Una opción es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la fórmula para
calcular cada una, la tarea se puede hacer bastante larga. Otra opción, más sencilla, es pasar al
complementario. El complementario de encontrar al menos 3 alumnos de inglés es encontrar como
mucho 2 alumnos de inglés, p(X ≤ 2).
Es decir,

p(X ≥ 3) = 1 − p(X < 3) = 1 − p(X ≤ 2) = 1 − (p(X = 0) + p(X = 1) + p(X = 2))

y sólo tenemos que calcular 3 probabilidades: p(X = 0) ≈ 0 , p(X=1) = 0’000001, p(X=2) = 0’000026
(¡compruébalo!).
Por lo cual,

p(X ≥ 3) = 1 − (0 + 0 000001 + 0 000026) = 1 − 0 000027 = 0 999973

b) p(X=15) = 0’0025 (aplica la fórmula).


c)

p(7 ≤ X ≤ 10) = p(X = 7) + p(X = 8) + p(X = 9) + p(X = 10) =


= 0 0549 + 0 1114 + 0 1759 + 0 2142 = 0 5564.

3.2.3. Media y desviación tı́pica en una distribución binomial


Aunque no se demostará, en una distribución binomial Bin(n;p), el número esperado de éxitos o
media, viene dado por x̄ = n · p. (Recordemos que la media es una medidad de centralización).
La desviación tı́pica, σ , que es una medida de dispersión y mide lo alejados que están los datos

de la media, viene dada por σ = n · p · q.
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 42

3.3. La distribución Normal


Al estudiar aspectos tan cotidianos como:
- Caracteres morfológicos de individuos ( personas, animales, plantas) de una misma raza. como
tallas, pesos, envergaduras, etc.
- Caracteres fisiológicos, como el efecto de una misma dosis de un fármaco, o de una misma cantidad
de abono.
- Caracteres sociológicos, como el consumo de ciertos productos por individuos de un mismo grupo
humano.
- Caracteres psicológicos, como el cociente intelectual, grado de adaptación a un medio.
- Caracteres fı́sicos, como la resistencia a la rotura de ciertas piezas. . .
todos ellos tienen en común que se distribuyen “normalmente”. ¿Qué quiere decir esta expresión?.
Pués, por ejemplo, si hacemos una estadı́stica para conocer la altura de 1400 mujeres y representamos
los resultados en un diagrama de barras, obtenemos:

Figura 3.1: Distribución de estaturas de 1400 mujeres

Las gráficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento
paulatino hasta llegar a la parte central del recorrido, donde está la mayorı́a de ellos.

Definición: Diremos que una distribución de probabilidad sigue una distribución normal de media x
y desviación tı́pica σ, y lo representaremos por N (x; σ) cuando la representación gráfica de su función
de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y
que tiene 2 puntos de inflexión , situados a ambos lados de la media (x − σ y x + σ respectivamente)
y a distancia de σ ella, es decir de la forma:

1
Figura 3.2: Distribución normal N (x; σ). El máximo está en (x, √ )
2·π·σ2
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 43

Dependiendo de los valores que tomen x y σ, la gráfica de esta función puede ser más o menos
alargada, achatada, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetrı́a,
continuidad, etc reseñadas anteriormente.
El concepto de función de densidad introducido anteriormente no se estudiará con profundidad.
Baste decir que la función de densidad determina la forma de cada distribución de probabilidad. En
el caso de la distribución normal de parámetros x y σ, dicha función viene dada por:

1 (x−x)2
f (x) = √ · e− 2·σ 2
2 · π · σ2
Propiedad:
El área encerrada bajo la curva normal N (x; σ) siempre es 1.

La demostración de este resultado no es nada sencilla e implica el uso de resultados matemáticos que
exceden el nivel de este curso.
De entre todas las curvas normales N (x; σ), la más sencilla, usada y conocida es aquella que tiene
por media 0 y por desviación tı́pica 1, N(0, 1).
Esta normal estándar se suele representar por Z.
La gráfica de esta curva se denomina campana de Gauss y se puede observar en la figura:

1
Figura 3.3: Distribución normal N (0; 1). El máximo está en (0, √2·π )

Su función de densidad será:


1 x2
f (x) = √ · e− 2
2·π
Puesto que el área bajo esta curva normal es 1, podemos definir una probabilidad de la siguiente
manera:

Para un valor cualquiera k, definimos la probabilidad de que la distribución Z, N(0;1) , sea menor o
igual que k como:
p(Z ≤ k)= “Área encerrada bajo la curva normal N(0,1) desde −∞ hasta k”
(es decir la parte rayada de la figura siguiente).

Figura 3.4: Área encerrada por la curva normal desde −∞ hasta k

Ahora bien, ¿cómo calcular dicha área?. Fácil: Dichas áreas o probabilidades se encuentran tabu-
ladas.
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 44

3.3.1. Uso de las tablas de la distribución normal N(0;1)


La normal N(0;1) se encuentra tabulada, para valores a partir de 0 y hasta 3’99. Si por ejemplo
queremos calcular p(Z ≤ 2 78), hemos de realizar los pasos:
1. Buscar la parte entera y las décimas en la primera columna (en este caso 2’7).
2. Buscar las centésimas en la primera fila (en este caso 8).
3. En el punto común a la fila y la columna que hemos encontrado, tenemos la probabilidad buscada,
en este caso 0’9973.
Por tanto p(Z ≤ 2 78) = 0 9973.
Si queremos calcular una probabilidad de un valor mayor que 3’99, basta fijarse en que las proba-
bilidades correpondientes a valores tales como 3’62 y mayores ya valen 0’9999 (prácticamente 1). Por
eso, para estos valores mayores que 3’99, diremos que la probabilidad es aproximadamente 1. Ası́:
p(Z ≤ 5 62) ≈ 1
aunque no aparezca en la tabla.

Por otra parte, fijémonos en que en este tipo de distribuciones no tiene sentido plantearse probabili-
dades del tipo p(Z=k), ya que siempre valen 0, al no encerrar ningún área. Por tanto, si nos pidiesen
p(Z=3’2), basta decir que p(Z=3’2)=0.
Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se de-
moniman distribuciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por
ejemplo la binomial, que es una distribución discreta.

Ası́, al pasar al complementario, si tenemos Z ≥ k, su complementario será Z < k, pero como incluir
k no influye en la probabilidad,al calcular probabilidades podemos escribir:
p(Z ≥ k) = 1 − p(Z < k) = 1 − p(Z ≤ k)
Sólo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer
y hay que ser cuidadosos con el paso al complementario.

Ejercicio: Buscar en la tabla de la normal estándar N(0;1) las probabilidades:


a) p(Z ≤ 1 15) b) p(Z ≤ 0 5) c) p(Z ≤ 0 82) d) p(Z ≤ 1 05) e) p(Z ≤ 4 27)

f) p(Z ≤ 18 09)

3.3.2. Cálculo de otras probabilidades


1. Si k es positivo y queremos calcular p(Z ≥ k), es decir el área rayada:

Figura 3.5: p(Z ≥ k). Basta pasar al complementario

basta pasar al complementario, es decir: p(Z ≥ k) = 1 − p(Z ≤ k) y esta última probabilidad ya


se encuentra tabulada.
Ejercicio: Calcular p(Z ≥ 0 3) y p(Z ≥ 2 07).
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 45

2. Si k es positivo y queremos calcular p(Z ≤ −k), es decir el área: por simetrı́a, p(Z ≤ −k) =

Figura 3.6: p(Z ≤ −k).Las probabilidades de valores negativos no están tabuladas

p(Z ≥ k) y ésta se calcula como en el caso anterior. Se puede observar la igualdad de áreas en
la figura:

Figura 3.7: p(Z ≤ −k) = p(Z ≥ k). La simetrı́a permite reducir este caso al anterior

Ejercicio: Calcular p(Z ≤ −0 78) y p(Z ≤ −3 2).

3. Si k es positivo y queremos calcular p(Z ≥ −k), es decir el área rayada:

Figura 3.8: p(Z ≥ −k)

entonces, por simetrı́a p(Z ≥ −k) = p(Z ≤ k):

Figura 3.9: p(Z ≥ −k) = p(Z ≤ k).La simetrı́a permite reducir este caso al que ya está tabulado

Ejercicio: Calcular p(Z ≥ −0 96) y p(Z ≥ −1 01).


CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 46

4. Probabilidades comprendidas entre dos valores,p(k1 ≤ Z ≤ k2 ) ,es decir el área rayada:

Figura 3.10: p(k1 ≤ Z ≤ k2 ). Probabilidad comprendida entre dos valores

se calcula restando las áreas:

Figura 3.11: p(Z ≤ k2 ) en la primera imagen.p(Z ≤ k1 ) en la segunda. Al restar obtenemos el área


pedida.

Se quita la parte correspondiente a Z ≤ k1 ,p(Z ≤ k2 ) − p(Z ≤ k1 ).


Ejercicio: Calcular p(−0 96 ≤ Z ≤ 1 49) y p(−1 32 ≤ Z ≤ −0 57).

Ejercicio: Calcular p(Z=2), p(Z ≤ 2), p(Z ≥ 2), p(Z ≤ −2), p(Z ≥ −2), p(−2 ≤ Z ≤ 2),
p(0 81 ≤ Z ≤ 1 33).

3.3.3. Cálculo de probabilidades en normales N(x; σ)


Si no tenemos una distribución N(0;1), sino una N (x; σ) cualquiera, ¿cómo calcular probabilidades,
si no tenemos tabla salvo para N(0;1)?. El siguiente resultado nos da la respuesta.

Propiedad:
X−x
Si X sigue una distribución N (x; σ) , entonces la variable Z = sigue una distribución N(0,1).
σ
(El paso de la variable X −→ N (x; σ) a la Z −→ N(0;1) se denomina tipificación de la variable X).

Ejemplo:
Las estaturas de 600 soldados se distribuyen de acuerdo a una distribución normal de media 168
y desviación tı́pica 8 cm. ¿Cuántos soldados miden entre 166 y 170 cm?.

Sea X la distribución de los soldados , X es una N(168,8). Nos piden p(166 ≤ X ≤ 170).
Utilizando el resultado anterior, primero restamos x=168 en la desigualdad:

p(166 ≤ X ≤ 170) = p(166 − 168 ≤ X − 168 ≤ 170 − 168) = p(−2 ≤ X − 168 ≤ 2)

Y ahora dividimos entre σ = 8, con lo que acabamos de tipificar:


 
−2 X − 168 2
p(166 ≤ X ≤ 170) = p(−2 ≤ X − 168 ≤ 2) = p ≤ ≤
8 8 8
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 47

X − 168
Llamando a = Z, ésta ya es normal N(0,1) y se encuentra en las tablas:
8

p(166 ≤ X ≤ 170) = p(−0 25 ≤ Z ≤ 0 25) = p(Z ≤ 0 25) − p(Z ≤ −0 25) =


= (tablas) = 0 5987 − 0 4013 = 0 1974.

(pues p(Z ≤ −0 25) = p(Z ≥ 0 25) = 1 − p(Z ≤ 0 25) = 1 − 0 5987 = 0 4013).
Ejercicios: 1) En una distribución N(22,5), calcula: p(X ≤ 27),p(X ≥ 27),p(X ≥ 125), p(15 ≤
X ≤ 20), p(17 ≤ X ≤ 30).
2) Los pesos de 60 soldados siguen una distribución N(67,5). Calcula la probabilidad de que el
peso sea:
a) mayor de 80 kg.
b) 50 kg. o menos
c) menos de 60 kg.
d) 70 kg.
e) Entre 60 y 70 kg inclusive.

3.3.4. Otro uso de las tablas


Hasta ahora nos han dado la distribución normal N(0;1) y nos pedı́an p(Z ≤ k) siendo k un cierto
número, y nos pedı́an calcular dicha probabilidad.
Ahora bien, otra pregunta puede ser: Dado que en una normal N(0;1) sabemos que p(Z ≤ k) =

0 9573, ¿quién es k?.
La resolución es bien sencilla. Basta buscar 0’9573 dentro de la tabla de la distribución normal, y
lo encontramos en el cruce de la fila 1’7 con la columna 2, y por lo tanto k debe ser 1’72.
Ejercicio: Calcular k si:
a) p(Z ≤ k) = 0 8078.
b) p(Z ≥ k) = 0 0028.

En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribución normal,
pueden ocurrir dos posibilidades:
a) Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente)
de cada uno de ellos, por ejemplo: p(Z ≤ k) = 0 7982. En este caso el valor buscado será la media
entre los valores extremos.
Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre los valores
0’7967 (que corresponde a 0’83) y 0’7996 (que corresponde a 0’84). Por tanto el valor de k será:

0 83 + 0 84
k= = 0 835
2
b) Si el valor está entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor,
por ejemplo: p(Z ≤ k) = 0 7970. El valor más cercano es 0’9767 (que corresponde a 0’83) y como el
valor buscado está muy cerca de él, entonces directamente k=0’83.

Si la distribución no es normal N(0;1), sino N (x; σ), tendremos que tipificar previamente.
Por ejemplo, si X sigue una normal N(6;3) y p(X ≤ k) = 0 9082, calcula k.
Tipificando:    
X −6 k−6  k−6
p ≤ = 0 9082 −→ p Z ≤ = 0 9082
3 3 3
Y buscando en la tabla,
k−6
= 1 33 ⇒ k − 6 = 3 99 ⇒ k = 9 99
3
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 48

Ejercicios:

1. Calcular k si p(X ≤ k) = 0 6141 y X sigue una N(15,4).

2. De una variable normal N (x; σ) se sabe que p(X ≤ 7) = 0 9772 y p(X ≤ 6 5) = 0 8413. Calcular:

a) x y σ.
b) p(5 65 ≤ X ≤ 6 25)
c) El número k tal que p(X > k) = 0 3
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 49

3.4. Relación entre la distribución binomial y la distribución normal


Es un hecho comprobado que cuando tenemos una distribución Bin(n;p), a medida que n crece, es
difı́cil hacer uso de las fórmulas y/o tablas.
Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y 33 cin-
cos(inclusive).
1 5
Si éxito = obtener cinco entonces p = y fracaso = no obtener cinco y q = .
  6 6
1
Tenemos una Bin 100; , y nos piden p(20 ≤ X ≤ 33).
6
Es inviable aplicar las tablas (pues repetimos el experimento 100 veces) y tampoco la fórmula pues
es inviable calcular, por ejemplo,
   32  68
100 1 5
p(X = 32) = · ·
32 6 6

¿Cómo resolver el problema?. Del siguiente modo:

Teorema Central del Lı́mite:

La distribución binomial Bin(n;p) se aproxima a una curva normal de media x = n · p y desviación



tı́pica σ = n · p · q, cuando n tiende a ∞, es decir, cuando n se hace muy grande.

La aproximación se puede aplicar (es una buena aproximación) sólo si n es grande, en concreto n ≥ 30
y además n · p ≥ 5 y n · q ≥ 5. Si no se cumplen estas condiciones NO podemos aproximar la binomial
que tengamos por una distribución normal.
En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable
discreta (binomial) a una continua (normal), y por tanto son distribuciones diferentes. El “precio” que
hay que pagar por pasar de una a otra se denomina “corrección por continuidad” y consiste en hacer
determinados ajustes para que la aproximación realizada sea lo más precisa posible.

Ası́, si nos piden p(X=k) en una distribución binomial X, y aproximamos X por una distribución normal
Y, no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en
una distribución continua todas estas probabilidades valen 0. La corrección por continuidad consiste
en tomar un pequeño intervalo de longitud 1 alrededor del punto k.
De otro modo, si nos piden p(X=k) con X binomial, con la aproximación normal Y deberemos
calcular p(k − 0 5 ≤ Y ≤ k + 0 5).
Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos
ejemplos:
Si nos piden p(X < k) con X binomial, aproximando por Y normal calcularemos p(Y ≤ k −0 5). La
explicación de que haya que restar 0’5 y no sumarlo es que queremos que X sea menor estrictamente
que k, con lo cuál, si sumase 0’5 , el propio k aparecerı́a en la probabilidad a calcular y NO debe
aparecer.
Por contra, si debiésemos calcular p(X ≤ k), con X binomial, fijémonos que ahora k SÍ está incluido
en la probabilidad y por tanto al aproximar por la normal Y deberı́amos calcular p(Y ≤ k + 0 5).
Comprender estos dos hechos es fundamental para realizar bien la correción por continuidad al
aproximar una distribución binomial por una normal.

100 √ 500
En el caso anterior,x = n · p = = 16 67 y σ = n · p · q = = 3 73. De modo que, como
6 36
n ≥ 30, n · p = 16 67 ≥ 5 y nq̇ = 83 33 ≥ 5, se pude aproximar la binomial por la normal, es decir:
 
1
X −→ Bin 100; ≈ Y −→ N (16 67; 373)
6
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 50

Entonces:
 
  19 5 − 16 67 Y − 16 67 33 5 − 16 67
≈ p(20 − 0 5 ≤ Y ≤ 33 + 0 5) = p
p(20 ≤ X ≤ 33)  ≤ ≤ =
3 73 3 73 3 73
(∗)

= p(0 89 ≤ Z ≤ 4 51) = p(Z ≤ 4 51) − p(Z ≤ 0 89) ≈ 1 − 0 8133 = 0 1867

Notemos que en el paso señalado por (*) hemos cambiado X(binomial) por Y(normal) y se ha realizado
la corrección por continuidad.
Capı́tulo 2

PROBABILIDAD

La probabilidad y la estadı́stica son, sin duda, las ramas de las Matemáticas que están en mayor
auge en este siglo, y tienen una tremenda aplicabilidad en todos los aspectos y ciencias, especialmente
en las Ciencias Sociales, puesto que aquellas variables que influyen en dichas ciencias, económicas,
demográficas, suelen tener carácter aleatorio,es decir, no son deterministas, y se fundamentan en
predicciones a partir de datos conocidos. Todo aquello que implique predicción nos lleva al terreno de
la probabilidad.

2.1. Experimentos aleatorios


En todos los aspectos de la vida a veces nos encontramos con acontecimientos predeterminados, es
decir, tales que podemos decir el resultado de dichos acontecimientos antes de que finalice o incluso
de que comience. Tal es el caso de:
1. Tirar una piedra desde un edificio ( sabemos que se caerá).
2. Calentar un cazo de agua ( sabemos que la temperatura sube).
3. Golpear una pelota ( sabemos que se va a mover, e incluso conociendo fuerzas que actúan etc,
podemos conocer precisamente dónde caerá ).
Tales acontecimientos o experimentos de los que podemos predecir el resultado antes de que se
realicen se denominan experimentos deterministas.
Sin embargo, analicemos otro tipo de experimentos, mucho más interesantes desde el punto de
vista matemático:
Imaginemos que lanzamos un dado al aire (normal, de 6 caras y no trucado). ¿Podemos predecir
el resultado que vamos a obtener?. Evidentemente no. Este es un experimento que no es determinista.
A este tipo de experimentos, en los cuales no se puede predecir el resultado antes de realizar el
experimento se les denomina experimentos aleatorios.
Otros ejemplos de experimentos aleatorios pueden ser:
Tirar una moneda al aire y observar qué lado cae hacia arriba, rellenar una quiniela de fútbol,
jugar una partida de póker y, en general, cualquier juego en el que intervenga el azar.

2.2. Definiciones básicas


La teorı́a de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda
ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es
más probable que otro o relaciones parecidas. Con este fin, introduciremos algunas definiciones.
Si realizamos un experimento aleatorio, llamaremos espacio muestral del experimento al conjunto
de todos los posibles resultados de dicho experimento.
Al espacio muestral lo representaremos por E (o bien por la letra griega omega Ω ).
A cada elemento que forma parte del espacio muestral se le denomina suceso elemental.

15
CAPÍTULO 2. PROBABILIDAD 16

Ejemplo:

1. ¿Cuál es el espacio muestral asociado al experimento de lanzar un dado normal al aire y observar
la cara que queda hacia arriba?.
Evidentemente, en este caso hay 6 posibles resultados (6 sucesos elementales) y el espacio mues-
tral estará formado por: E={1,2,3,4,5,6}.

2. ¿Y en el caso del lanzamiento de una moneda?


Entonces E={C,X}

Ejercicios:

1. Escribir el espacio muestral asociado al experimento de sacar una carta de entre las diez del palo
de copas de una baraja española.

2. Escribir el espacio muestral asociado al experimento de lanzar dos dados de diferentes colores y
observar la pareja de números que se obtiene.

3. Escribir el espacio muestral asociado al experimento de lanzar dos dados de diferentes colores y
sumar los números que se obtienen.

Llamaremos suceso aleatorio a cualquier subconjunto del espacio muestral. El concepto de suceso
es fundamental en probabilidad. Dicho de forma simple, un suceso de un experimento aleatorio es
cualquier cosa que se nos ocurra afirmar sobre dicho experimento.
Ası́, si tiramos una moneda dos veces, serı́an sucesos todos los siguientes:

1. Sale al menos una cara.

2. Salen más caras que cruces.

3. La moneda cae de canto.

4. No sale ninguna cruz.

Llamaremos suceso imposible al que no tiene ningún elemento y lo representaremos por ∅ .


Llamaremos suceso seguro al formado por todos los posibles resultados (es decir, al espacio mues-
tral) .
Llamaremos espacio de sucesos y lo representaremos por S, al conjunto de todos los sucesos alea-
torios.
Ejemplo:

1. En el caso del lanzamiento de la moneda en el que el espacio muestral era E={C,X} , analicemos
quién es el espacio de sucesos:
- Sucesos con 0 elementos: ∅
- Sucesos con 1 elemento: {C},{X}
- Sucesos con 2 elementos:{C,X}
De modo que el espacio de sucesos es: S={∅,{C},{X},{C,X}}.

2. En el caso del lanzamiento de dos monedas, si haces el diagrama de árbol obtienes el siguiente
espacio muestral:
E = {(C, C), (C, X), (X, C), (X, X)}
El espacio de sucesos tiene ahora 16 elementos, que puedes intentar escribir, siguiendo el esquema
anterior, desde los sucesos con 0 elementos hasta aquellos que tienen 4 elementos. Si describimos
los sucesos que ponı́amos antes como ejemplos, obtenemos:
CAPÍTULO 2. PROBABILIDAD 17

a) Sale al menos una cara={(C,C),(C,X),(X,C)}


b) Salen más caras que cruces={(C,C)}
c) La moneda cae de canto=∅
d ) No sale ninguna cruz={(C,C)}

3. En el caso del lanzamiento del dado el espacio de sucesos es mucho más amplio (64 elementos.
Serı́a interesante que intentases escribirlos todos o al menos te dieses cuenta de cómo son ,
aunque no los escribas todos)
En este mismo ejemplo, se puede considerar el suceso A= ”sacar un número par”. ¿De qué sucesos
elementales consta el suceso A?. Evidentemente, A={{2},{4},{6}}.
Otros sucesos pueden ser: B = ”Sacar un número mayor que 5-{{6}}.
C = ”Sacar un número par y menor que 5-{{2},{4}}.

Ejercicio: Una urna contiene dentro 4 bolas de las cuales 2 son blancas, 1 roja y otra azul. Se saca
una bola de la urna.
a) Escribir el espacio muestral.
b) Escribir los sucesos “no sacar bola azul” y “sacar bola roja o blanca”.
c) Escribir el espacio de sucesos.

Los sucesos admiten una representación gráfica que facilita su interpretación; del modo:

Figura 2.1: Representación en diagrama de Venn del suceso A

Por ejemplo, en el caso del dado:

Figura 2.2: Representación en diagrama de Venn para un dado

A = ”salir par y menor que 5”. Estos diagramas se denominan diagramas de Venn.
Propiedad:
Si el espacio muestral tiene n elementos, el espacio de sucesos tiene 2n elementos.

Ejemplo:
En el caso del dado, el espacio muestral tenı́a 6 elementos y el espacio de sucesos tiene 26 = 64
elementos.
En el caso de la moneda, el espacio muestral tenı́a dos elementos y el espacio de sucesos tiene
22 = 4 elementos.
CAPÍTULO 2. PROBABILIDAD 18

2.3. Operaciones con sucesos


Si realizamos un experimento aleatorio y consideramos varios sucesos A, B, C, etc, asociados a
dicho experimento, podemos realizar varias operaciones entre ellos. Los más importantes son:

1. Igualdad de sucesos: Dos sucesos A y B son iguales si están compuestos por los mismos elementos.
Lo expresaremos por A = B.

2. Intersección de sucesos: Llamaremos suceso intersección de los sucesos A y B, y lo representare-


mos por A ∩ B, al suceso “ocurren A y B a la vez”.
Ejemplo: Si tiramos un dado, ya sabemos que el espacio muestral asociado es E={1,2,3,4,5,6}.
Sean los sucesos A=“sacar un nº par”={2,4,6}, y B=“sacar un número entre 2 y 4 (inclusi-
ve)”={2,3,4}.
El suceso A ∩ B es tal que ocurren A y B a la vez, es decir:
A ∩ B=“sacar un nº par y que esté entre 2 y 4 (inclusive)”={2,4}.
El suceso A ∩ B son los elementos comunes a los conjuntos A y B (elementos que están en los
dos conjuntos).
Representado en diagramas de Venn:

Figura 2.3: Intersección de sucesos: A ∩ B

En ocasiones podremos encontrarnos con sucesos que NO tengan elementos en común. En estos
casos se dice que los sucesos A y B son incompatibles, y su intersección se representa con el
conjunto vacı́o:
A∩B =∅
Evidentemente, si los sucesos sı́ tienen intersección, diremos que son compatibles.

3. Unión de sucesos: Llamaremos suceso unión de los sucesos A y B y se representa por A ∪ B al


suceso “ocurre A o bien ocurre B o bien ocurren ambos a la vez”(también podemos decir que
“ocurre alguno”).
Es decir A ∪ B son los elementos que están en ambos conjuntos (aunque no necesariamente en
los dos a la vez). Representado en diagrama de Venn:

Figura 2.4: Unión de sucesos: A ∪ B


CAPÍTULO 2. PROBABILIDAD 19

Ejemplo: En el caso anterior:


A ∪ B=”sacar un nº par o un nº que esté entre 2 y 4 (inclusive)”={2,3,4,6}.
NOTA:
Observemos que la intersección de dos conjuntos siempre es ”menor”que la unión, de hecho es
“menor” que el propio conjunto.
Escrito matemáticamente:

A∩B ⊂ A∪B A∩B ⊂ A A∩B ⊂ B A ⊂ A∪B B ⊂ A∪B

(El sı́mbolo ⊂ significa “contenido”, o que el primer conjunto es un subconjunto del segundo)

4. Suceso contrario de otro: Dado un suceso A, denominaremos suceso contrario de A y se repre-



sentará por Ā (o bien A o bien Ac ) al suceso que tiene por elementos a todos aquellos que no
pertenecen a A.
Ejemplo: Si tiramos un dado, ya sabemos que el espacio muestral asociado es E={1,2,3,4,5,6}.
Como antes, los sucesos A=“sacar un nº par”={2,4,6}, por tanto Ā={1,3,5} y B= “sacar un
número entre 2 y 4 (inclusive)”={2,3,4}, de modo que B̄={1,5,6}.
En un diagrama de Venn:

Figura 2.5: La parte punteada es Ā.(Todo lo que no está incluido en A)

5. Diferencia de sucesos: Si A y B son dos sucesos, llamaremos diferencia entre A y B al suceso


B −A, que consta de los elementos que están en B pero no están en A.Por ejemplo, si A={2,4,6},
B={2,3,4}, tenemos que B − A={3}. Se cumple que B − A = B − A ∩ B, y también que
B − A = Ā ∩ B. Representado en un diagrama de Venn:

Figura 2.6: La parte rayada es B − A, todos los elementos de B que no estén en A

De todas formas, hemos de ser cuidadosos con esta operación: No se debe confundir con una
simple resta como operación numérica, sino que es una diferencia conjuntista, quitar los elementos
comunes a dos conjuntos.
Ejercicio: En una urna tenemos 9 bolas numeradas del 1 al 9. Sacamos una y anotamos su número.
Sean los sucesos: A=”sacar un nº primo”B=“sacar un nº cuadrado” (por ejemplo 4 es un número
cuadrado, porque 4=22 ). Se pide:
a) Describir el espacio muestral.
b) ¿Cuántos elementos tiene el espacio de sucesos?.
CAPÍTULO 2. PROBABILIDAD 20

c) Calcula A ∩ B y A ∪ B.
d) ¿Son A y B compatibles o incompatibles?.
e) Calcula Ā y B̄.
f) Si C=“sale un número impar”, calcula A ∩ C, B ∩ C,C̄ , A ∪ C,Ā ∩ C̄.
Propiedades de las operaciones con sucesos:
Las operaciones con sucesos tienen las siguientes propiedades, la mayorı́a de ellas bien conocidas:

Intersección Unión
Conmutativa A∩B = B∩A A∪B = B∪A
Asociativa A ∩ (B ∩ C) = (A ∩ B) ∩ C A ∪ (B ∪ C) = (A ∪ B) ∪ C
Idempotente A∩A=A A∪A = A
Simplificación A ∩ (A ∪ B) = A A ∪ (A ∩ B) = A
Distributiva A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Elemento neutro A∩E =A A∪∅ = A
Absorción A∪∅ = A A∪E = A

Además de estas sencillas propiedades (que se demuestran fácilmente mediante un diagrama de


Venn), las operaciones con sucesos tienen otras dos propiedades muy importantes:

Leyes de De Morgan: Si A y B son dos sucesos, se verifican:

(A ∪ B) = Ā ∩ B̄

(A ∩ B) = Ā ∪ B̄
Demostración: Demostraremos la primera de las igualdades.
En primer lugar, representemos en un diagrama de Venn (A ∪ B). Para ello, primero representamos
A ∪ B, y luego su contrario (A ∪ B):

Figura 2.7: Imagen 1 corresponde a A ∪ B. Imagen 2 corresponde a A ∪ B

Ahora, representaremos en otro diagrama el otro miembro, es decir Ā ∩ B̄. En primer lugar,
representaremos Ā, luego B̄ y luego su intersección:

Figura 2.8: Imagen 1 corresponde a Ā. Imagen 2 corresponde a B̄. Imagen 3 corresponde a Ā ∩ B̄.

Observando los dos resultados, vemos que las partes rayadas son iguales, por lo que la igualdad es
cierta.
CAPÍTULO 2. PROBABILIDAD 21

Ejercicio:

1. Mediante un procedimiento similar, demostrar la segunda ley de De Morgan.

2. Luisa y Marı́a interviene en un torneo de ajedrez. La primera que gane dos partidas seguidas o
tres alternas gana el torneo. Encuentra el espacio muestral con todos los resultados posibles (
suponemos que nunca hacen tablas).
(Indicación: Utiliza un diagrama de árbol).

3. Consideramos el fenómeno aleatorio extraer una carta de una baraja de 40 y anotarla . Sean los
sucesos A= “sacar oro”, B= “sacar rey”, C= “sacar el rey de bastos”.
Determina los sucesos:
A ∩ C̄, A ∩ B ∩ C, Ā ∪ B̄ ∪ C̄, Ā ∪ B̄

2.4. Asignación de probabilidades. Regla de Laplace


Hasta el momento hemos descrito lo que es un experimento aleatorio y hemos definido los con-
ceptos básicos asociados a este experimento. Nos falta responder a esta pregunta: ¿Cómo asignar
probabilidades a cada uno de los sucesos de un experimento aleatorio?.
Hay muchas maneras de asignar probabilidades. La más sencilla e intuitiva la dio el matemático
francés Pierre Simon Laplace (1749-1827), quién enunció la regla que lleva su nombre:

Regla de Laplace:
Si realizamos un experimento aleatorio en el que hay n sucesos elementales, todos igualmente
probables, entonces si A es un suceso, la probabilidad de que ocurra el suceso A es:
número de casos favorables al suceso A
p(A) =
número de casos posibles

Ejemplo: Lanzamos un dado normal al aire. Consideramos el suceso A= “sale par”. Calcular p(A).
Casos posibles hay 6, pues E={1,2,3,4,5,6}.
Casos favorables al suceso A={2,4,6}.
3 1
Por tanto p(A) = = = 0 5.
6 2
(Notemos que la probabilidad siempre es un número positivo y menor, o a lo sumo igual a 1).

El inconveniente que plantea la definición de Laplace es que necesariamente los sucesos elementales
tienen que tener la misma probabilidad de ocurrir.
Observemos un caso tan sencillo como el siguiente:
De una urna que contiene 8 bolas rojas, 5 amarillas y 7 verdes se extrae una bola al azar. Calcula
la probabilidad de que la bola extraı́da sea :
a) roja
b) verde
c) amarilla

El espacio muestral en este caso serı́a: E={R,V,A}, que consta sólo de tres elementos, pero serı́a un
poco ingenuo asignar las probabilidades mediante la regla de Laplace,
1 1 1
p(R) = p(V ) = p(A) =
3 3 3
porque ya intuitivamente se ve que hay más posibilidades, por ejemplo, de que salga una bola roja
que de que salga una bola amarilla, de modo que ¿cómo asignar probabilidades?.
CAPÍTULO 2. PROBABILIDAD 22

Fue el matemático ruso Kolmogorov quién precisó este término:

Definición axiomática de probabilidad:

Una probabilidad p es una función que asocia a cada suceso A del espacio de sucesos S , un número
real p(A), es decir: p : S −→ R , y que cumple las propiedades:

1. 0 ≤ p(A) ≤ 1, (es decir, cualquier suceso tiene probabilidad positiva y menor o igual que 1).

2. p(E) = 1 (la probabilidad del suceso seguro es 1).

3. Si A y B son incompatibles, es decir A ∩ B = ∅, entonces p(A ∪ B) = p(A) + p(B). (es decir


la probabilidad de la unión es la suma de las probabilidades si los sucesos tienen intersección
vacı́a).

Ejemplo:
Sea un experimento aleatorio cualquiera y definamos en S (espacio de sucesos) la siguiente proba-
bilidad:
número de elementos del conjunto A
p(A) =
número total de elementos
Comprobemos que p es una probabilidad.
Para ello, comprobemos las tres propiedades:
a) Se ve que la probabilidad de cualquier suceso está entre cero y uno, puesto que cualquier conjunto
que tenga elementos ya tendrá probabilidad positiva, y el número de elementos de cualquier conjunto
no puede ser mayor que el número total de elementos existentes.
b) p(E) = 1, es evidente.
c) Tomemos dos sucesos A y B que no tengan elementos en común. Entonces:

elementos que forman parte de A o de B


p(A ∪ B) = =
número total de elementos
número de elementos de A + número de elementos de B
= = p(A) + p(B)
número total de elementos
puesto que si A y B no tienen elementos comunes, el número de elementos de la unión es la suma de
los elementos de cada conjunto por separado.
Por tanto se cumplen las 3 propiedades y p ası́ definida es una probabilidad. Esta será la definición
de probabilidad que utilicemos a partir de ahora.

Ejemplo:
En el ejemplo de las urnas anterior, lo lógico es definir la probabilidad ası́: Como en total hay 20
8 7 5
bolas y 8 son rojas, 7 verdes y 5 amarillas, p(R) = p(V ) = p(A) = .
20 20 20
Se puede comprobar que ası́ definida p es una probabilidad.

Sin embargo, comprobar las propiedades de la definición de Kolmogorov es una labor larga y engorrosa,
puesto que hay que verificar que se cumple para todos aquellos sucesos del espacio de sucesos S, que es
ciertamente amplio en muchas ocasiones. El siguiente resultado simplifica la tarea de decidir cuándo
una función p sobre el espacio de sucesos es una probabilidad, basándose sólo en los sucesos elementales,
es decir, aquellos que forman parte del espacio muestral. Lo enunciaremos sin demostración:
CAPÍTULO 2. PROBABILIDAD 23

Propiedad
Si w1 , w2 , . . ., wn son los n sucesos elementales de un suceso aleatorio cualquiera,p una función
p : S −→ R de modo que cumple las propiedades:

1. 0 ≤ p(wi) ≤ 1 ∀ i ∈ {1, 2, . . . , n}

2. p(w1) + p(w2) + . . . + p(wn ) = 1

Entonces p es una probabilidad.

Ejemplo: Comprobar si las siguientes funciones definidas para los sucesos elementales son probabilidad,
siendo E={a,b,c,d} el espacio muestral del experimento aleatorio:
1 1 1 1
a) p(a) = , p(b) = , p(c) = , p(d) =
2 3 4 5
Es obvio que la primera propiedad se cumple, puesto que las 4 probabilidades son números positivos
menores que 1.
Para ver si se cumple la segunda, basta realizar la suma:
1 1 1 1 30 + 20 + 15 + 12 77
+ + + = =
2 3 4 5 60 60
que evidentemente NO es 1, luego p NO es probabilidad.
1 1 1
b) p(a) = , p(b) = , p(c) = 0, p(d) =
4 2 2
Es obvio que la primera propiedad se cumple, puesto que las 4 probabilidades son números positivos
o cero menores que 1.
Para ver si se cumple la segunda, basta realizar la suma:
1 1 1 1+2+1
+ + = =1
4 2 4 4

luego p SÍ es probabilidad.

Consecuencias de la definición de probabilidad:

1. p(Ā) = 1 − p(A)
En efecto, puesto que E = A ∪ Ā y además A y Ā son incompatibles, resulta por la propiedad
3) de la definición que
p(E) = p(A ∪ Ā) = p(A) + p(Ā)

Y por la propiedad 2), p(E)=1, luego 1 = p(A) + p(Ā) y por tanto p(Ā) = 1 − p(A).

2. p(∅) = 0
Como Ē = ∅, resulta que:

p(Ē) = p(∅) = 1 − p(E) = 1 − 1 = 0

3. Si A y B son dos sucesos cualesquiera,

p(A ∪ B) = p(A) + p(B) − p(A ∩ B)

4. Si A, B y C son tres sucesos cualesquiera,

p(A ∪ B ∪ C) = p(A) + p(B) + p(C) − p(A ∩ B) − p(A ∩ C) − p(B ∩ C) + p(A ∩ B ∩ C)


CAPÍTULO 2. PROBABILIDAD 24

Ejemplo:
Se tira una moneda 3 veces. Calcular la probabilidad de obtener alguna cara.

Los problemas de este tipo, en los que se pide la probabilidad de obtener “alguna” cosa, se suelen
resolver muy bien por paso al complementario. En este caso concreto, A = “obtener alguna cara”.
Ā= “no obtener ninguna cara”= “obtener 3 cruces”.
1
Entonces, p(A) = , pues hay 8 casos posibles (2·2·2, ¡haz el diagrama de árbol!) y sólo uno
8
favorable (XXX, 3 cruces), por tanto:

1 7
p(A) = 1 − p(Ā) = 1 − =
8 8
Ejercicio:
Calcular la probabilidad de obtener al menos 1 seis si se lanza 4 veces un dado.
Ejemplo:
Se lanza un dado dos veces y se suman las dos caras. Sea A el suceso A= “la suma de resultados
es mayor o igual que 10” y B= “la suma de los resultados es múltiplo de 6”. Calcular p(A), p(B) y
p(A ∩ B).
Hay 36 posibles resultados al lanzar dos veces un dado. ¿Cuántos de ellos suman 10 o más?
Que sumen 10: (4,6), (5,5), (6,4)
Que sumen 11: (5,6), (6,5)
Que sumen 12: (6,6)
6 1
Por tanto, p(A) = = .
36 6
¿Cuántos hay que sumen múltiplo de 6?
Que sumen 6: (1,5), (2,4),(3,3), (4,2), (5,1)
Que sumen 12: (6,6)
6 1
Por tanto, p(B) = = .
36 6
1
En cuanto a A ∩ B = (6, 6), luego p(A ∩ B) = .
36

Ejercicios:

1. Se ha encargado la impresión de una encuesta a una imprenta, que imprime 12 folios defectuosos
de cada 1000. Hallar la probabilidad de que elegido un folio de la encuesta al azar:
a) Esté mal impreso.
b) Esté correctamente impreso.

2. Una bolsa contiene 8 bolas numeradas. Se extrae una bola y anota su número. Sean los sucesos
A= “salir par”, B= “salir impar”, C= “salir múltiplo de 4”.
Calcular las probabilidades de A ∪ B, A ∪ C, B ∪ C, A ∪ B ∪ C.

3. Extraemos una carta de una baraja española. Calcula:


a) La probabilidad de que sea un rey o un as.
b) La probabilidad de que sea un rey o una copa.
c) La probabilidad de que sea un rey y una copa.

4. En el banquete posterior a una boda se sientan en la presidencia 10 personas, entre los cuales se
encuentran los novios. Calcular la probabilidad de que los novios estén juntos en el centro de la
mesa.
CAPÍTULO 2. PROBABILIDAD 25

2.5. Probabilidad condicionada


Hasta ahora nos hemos limitado a calcular probabilidades únicamente partiendo de un experimento
aleatorio, sin tener más información. Pero, ¿qué ocurre si conocemos alguna información adicional?.
Supongamos que estamos realizando el experimento aleatorio de lanzar un dado y obtener el
1
número que sale. Consideremos el suceso A= “sale un 4”. Evidentemente, p(A) = .
6
Ahora bien, ¿variarı́a esta probabilidad si al lanzar el dado alguien pasa por allı́ y nos dice que ha
salido un número par?.
Disponemos entonces de una información adicional, B={2,4,6}.
Hemos reducido nuestro espacio muestral, que ahora sólo consta de 3 elementos y tenemos que
cambiar las probabilidades asignadas.
1
Ahora el suceso A no tiene una posibilidad entre 6 de ocurrir, sino una entre tres, es decir, p(A) = .
3
Esta es la idea de la probabilidad condicionada: La información obtenida B, modifica la proba-
1
bilidad de A. Lo expresaremos ası́: p(A/B) = y se lee “probabilidad de A condicionada a B” o
3
“probabilidad de A conociendo B”.
El caso anterior es muy sencillo, pues directamente podemos calcular p(A/B), pero si el espacio
muestral se amplı́a, el problema es más complicado. La fórmula siguiente simplifica el problema.
Definición:
Sea A un suceso aleatorio asociado a un experimento aleatorio, y sea B otro suceso que sabemos
que se ha realizado.
Llamaremos probabilidad de A condicionada a B y lo expresaremos por p(A/B) a la expresión:

p(A ∩ B)
p(A/B) =
p(B)

(de idéntico modo se define p(B/A), escribe la fórmula).

Ejemplo: Para el caso anterior,


3 1
A={4},B={2,4,6} −→ p(B) = = .
6 2
1
A ∩ B = {4} −→ p(A ∩ B) = .
6
Luego:
1
p(A ∩ B) 2 1
p(A/B) = = 6 = =
p(B) 1 6 3
2
es lo mismo que obtenı́amos antes directamente.

Ejercicios:

1. Calcula la probabilidad de que la suma de las caras de dos dados sea mayor a igual que 10
sabiendo que en el primer dado ha salido un seis.

2. Se lanzan dos dados:¿cuál es la probabilidad de obtener una suma de puntos igual a siete?.
Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados haya
salido un 3?
CAPÍTULO 2. PROBABILIDAD 26

2.6. Sucesos independientes


Si bien el conocer cierta información adicional modifica la probabilidad de algunos sucesos, puede
ocurrir que otros mantengan su probabilidad, pese a conocer dicha información.
Por ejemplo, en el lanzamiento de un dado, consideremos los sucesos: A= “sacar un número par”
y B= “sacar un número menor o igual que 2” Es claro que A= {2,4,6} y B= {1,2}.
Calculemos la probabilidad de A conociendo que se ha realizado el suceso B, es decir, p(A/B).
Utilizando la fórmula:
1
p(A ∩ B) 3 1
p(A/B) = = 6 = = = 0 5
p(B) 1 6 2
3
1 1
puesto que p(A ∩ B)=p(sacar par y menor o igual que 2)= y p(B)= .
6 3
Pero si no conociésemos la información B, ¿cuál serı́a la probabilidad de A?.
3
p(A)=p(sacar par)= = 0 5, es decir que p(A/B)=p(A), y por tanto el conocer la información B
6
no modifica la probabilidad de A.
Cuando esto ocurre es decir, cuando p(A/B) = p(A), diremos que los sucesos A y B son indepen-
dientes (el hecho de que ocurra B no modifica la probabilidad de A).

Propiedad:

A y B son sucesos independientes ⇐⇒ p(A ∩ B) = p(A) · (B).

Demostración: =⇒) Si A y B son independientes, p(A/B) = p(A), y por la fórmula de la probabilidad


p(A ∩ B) p(A ∩ B)
condicionada,p(A/B) = , luego = p(A), y por tanto p(A ∩ B) = p(A) · p(B).
p(B) p(B)
⇐=) Partiendo de p(A ∩ B) = p(A) · p(B), entonces

p(A ∩ B) p(A) · p(B)


p(A/B) = = = p(A)
p(B) p(B)

luego p(A/B) = p(A) y por tanto A y B son independientes.

Ejemplo:
1 1 1
En el caso anterior, p(A ∩ B) = , y por otra parte p(A) = y p(B) = ,luego se cumple que
6 2 3
1 1 1
p(A ∩ B) = = · = p(A) · p(B)
6 2 3
luego A y B son independientes.
Ejercicio:
2 1
De dos sucesos conocemos que p(A ∪ B) = y p(A) = , calcula p(A ∩ B) y p(B) para que A y
3 5
B sean independientes.
(Indicación: Utilizar la fórmula de la unión de dos sucesos y la de la independencia de sucesos).
7 7
(Solución: p(B) = 12 , p(A ∩ B) = 60 ).
CAPÍTULO 2. PROBABILIDAD 27

NOTA IMPORTANTE:
No se deben confundir los conceptos de sucesos incompatibles y sucesos independientes. Dos sucesos
son incompatibles cuando no tienen elementos en común, es decir, A ∩ B = ∅, o con diagramas de
Venn:

Figura 2.9: A y B incompatibles, sin elementos en común.

Dos sucesos son independientes si p(A ∩ B) = p(A) · p(B). Son conceptos totalmente distintos. Uno
se refiere a CONJUNTOS y otro se refiere a PROBABILIDADES.

2.7. Experimentos compuestos. Teorema de la probabilidad total.


Un experimento compuesto es aquel que consta de dos o más experimentos aleatorios simples.
Es decir, si tiramos un dado, o una moneda, son experimentos aleatorios simples, pero si realizamos
el experimento de tirar un dado y posteriormente una moneda, estamos realizando un experimento
compuesto.
Propiedad:
De la fórmula para calcular la probabilidad condicionada se deduce inmediatamente que:

p(A ∩ B) = p(B) · p(A/B) y p(A ∩ B) = p(A) · p(B/A)

Ejemplo: Se extraen 2 cartas, sucesivamente, de una baraja de 40. Calcular la probabilidad de extraer
2 sotas.
Sea A = “sacar sota en la 1ª” y B = “sacar sota en la 2ª”.
Nos piden p(A ∩ B).
Según la fórmula anterior, p(A ∩ B) = p(A) · p(B/A).
4 1 3 1 1 1 1
Ahora bien , p(A) = = y p(B/A) = = , por lo que p(A) = · = .
40 10 39 13 10 13 130
La forma más sencilla de calcular probabilidades en experimentos compuestos es un digrama de
árbol, donde en cada rama situamos la probabilidad que le corresponde al suceso del final de dicha
rama. Estas probabilidades que se van poniendo en el árbol son probabilidades condicionadas, porque
dependen de los resultados anteriores.
En el caso del ejercicio anterior, el diagrama serı́a:

Figura 2.10: Diagrama de árbol para la extracción de sota(S) u otra carta (S̄)
CAPÍTULO 2. PROBABILIDAD 28

Nota:
Este mismo resultado se podrı́a haber obtenido
  sin usar la probabilidad condicionada, del modo:
40
Formas de elegir 2 cartas de entre 40= .
  2
4
Formas de elegir 2 sotas entre 4= .
2  
4
casos favorables 2 6 1
Por la regla de Laplace, p(obtener 2 sotas)= = = = .
casos posibles 40 780 130
2
Ejercicios:
1. Una urna contiene 9 bolas rojas y 5 negras. Se extraen sucesivamente 2 bolas. Calcula la proba-
bilidad de que:
a) la primera bola sea roja y la segunda negra.
b) una sea roja y la otra negra.
2. En una bolsa hay 4 canicas rojas, 4 azules y 2 verdes. Se extraen 3 canicas que resultan ser 2
rojas y una azul. Sin devolverlas a la bolsa se saca otra canica, ¿de qué color es más probable
que salga?.
Ejemplo:
Tenemos dos urnas, una con 7 bolas rojas y 2 azules, y otra con 3 bolas rojas y 8 azules. Tiramos
un dado. Si nos sale un 3 o un 5, sacamos una bola de la primera urna y en caso contrario, sacamos
una bola de la segunda urna. ¿Cuál es la probabilidad de que la bola extraı́da sea azul?.

Evidentemente estamos realizando un experimento compuesto. En primer lugar, se trata de elegir una
urna, para lo cuál lanzamos un dado. Si U1 = “elegir la urna 1” y U2 = “elegir la urna 2”, es claro que
2 1 4 2
p(U1 )= = y p(U2 )= = .
6 3 6 3
Por otra parte, luego realizamos otro experimento consistente en sacar una bola de la urna elegida.
Si A= “sacar una bola azul”, las probabilidades que conocemos son:
2
p(A/U1 ) =
9
y
8
p(A/U2 ) =
11
Lo que nos piden es p(A). Para calcular dicha probabilidad, si representamos el diagrama de árbol:

Figura 2.11: Diagrama de árbol para la extracción de bolas

Como la probabilidad de A depende de la urna en la que estemos, basta multiplicar las probabili-
dades de cada rama que llegue a la bola azul y luego sumar los 2 resultados, es decir:
2 2 4 8 4 32 166
p(A) = · + · = + = = 0 559
6 9 6 11 54 66 297
CAPÍTULO 2. PROBABILIDAD 29

La justificación teórica para proceder ası́ la da el teorema de la probabilidad total.

Teorema de la probabilidad total: Si A1 , A2 , . . . , An son sucesos incompatibles 2 a 2, y cuya unión


es el espacio muestral (A1 ∪ A2 ∪ . . . ∪ An = E), y B es otro suceso, resulta que:

p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )

Nota: El conjunto A1 , A2 , . . . , An que verifica la incompatibilidad 2 a 2 y que la unión de todos ellos es


el espacio muestral se denomina sistema completo de sucesos y este sistema “divide el espacio muestral
en partes que no se solapan”. Mediante representación gráfica:

Figura 2.12: Sistema completo de sucesos: A1 , A2 , . . . , An

Ejemplo: Para el caso anterior, A1 = “sacar la bola de la urna 1”.


A2 = “sacar la bola de la urna 2”.
B= “sacar bola azul”.
Y aplicando el teorema:
2 2 4 8 4 32 166
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) = · + · = + = = 0 559
6 9 6 11 54 66 297
Ejemplo: En un colegio se imparten sólo los idiomas inglés y francés. El 80 % de los alumnos
estudian inglés y el resto francés. El 30 % de los alumnos de inglés son socios del club musical del
colegio y de los que estudian francés son socios de dicho club el 40 %. Se elige un alumno al azar.
Calcular la probabilidad de que pertenezca al club musical.
En estos problemas es importante elegir el sistema completo de sucesos. En este caso: A1 = “estudiar
inglés”
A2 = “estudiar francés”
B= “ser del club musical”
Nos piden p(B). Por el teorema anterior:
80 30 20 40 8
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) = · + · = = 0 32
100 100 100 100 25
Mediante el diagrama de árbol:

Figura 2.13: Diagrama de árbol para el problema de idiomas y club musical

Se obtiene el mismo resultado.


CAPÍTULO 2. PROBABILIDAD 30

Ejercicio:
Se tienen dos urnas, la primera de las cuales tiene 6 bolas blancas, 4 negras y 2 rojas y la urna 2
tiene 3 bolas blancas y 7 negras.
Se lanza un dado al aire, y si sale múltiplo de 3 se saca de la primera urna y en otro caso se saca
una bola de la segunda urna.
Calcular la probabilidad de que sea:
a) bola blanca b) bola negra c) bola roja.
Solución: 11 26 1
30 45 18 .
, ,

2.8. Tablas de contingencia


Las tablas de contingencia están referidas a 2 caracterı́sticas que presentan cada una dos o más
sucesos.

Ejemplo: En un taller se sabe que acuden, por la mañana 3 automóviles con problemas de eléctricos,
8 con problemas mecánicos y 3 con problemas de chapa. Por la tarde hay 2 con problemas eléctricos,
3 con problemas mecánicos y 1 con problemas de chapa.
a) Calcular el porcentaje de los que acuden por la tarde.
b) Calcular el porcentaje de los que acuden con problemas mecánicos
c) Calcular la probabilidad de que un automóvil con problemas eléctricos acuda por la mañana.
Resumiendo los datos en una tabla de contingencia:

Pr. eléctricos Pr. Mecánicos Pr. de chapa Total


Mañana 3 8 3 14
Tarde 2 3 1 6
Total 5 11 4 20

a) En total acuden 20 y por la tarde acuden 6, luego:


6
p(acudir por la tarde)= = 0 3, es decir, el 30 %.
20
b) En total acuden 20 y con problemas mecánicos hay 11, luego:
11
p(problemas mecánicos)= = 0 55, es decir, el 55 %.
20
c) Aquı́ tenemos una información adicional (es un coche que tiene problemas eléctricos), luego se
trata de una probabilidad condicionada.Con problemas eléctricos hay 5 y de ellos 3 por la mañana,
luego:
3
p(acudir por la mañana/problemas eléctricos)= = 0 6, es decir, el 60 %.
5
En una tabla de contingencia puede que nos falten datos, pero se pueden hallar fácilmente con los
datos que son conocidos.
Ejemplo Para tratar de curar una enfermedad se aplica un tratamiento nuevo a 81 pacientes de un
hospital, mientras que en el mismo hospital hay otros 79 pacientes que siguen un tratamiento antiguo
contra la misma enfermedad. En total, con ambos tratamientos los curados son 103, de los cuales 60
lo son gracias al tratamiento nuevo. Si tratamos de construir la tabla, con los datos del problema se
obtiene:
Tratamiento antiguo Tratamiento nuevo Total
Curarse 60 103
No curarse
Total 79 81
CAPÍTULO 2. PROBABILIDAD 31

Completa la tabla y responde a las cuestiones:


Si se elige un individuo al azar, calcula la probabilidad de que:

1. Se haya curado.

2. No se haya curado.

3. Se haya curado con el nuevo tratamiento.

4. No se haya curado con el nuevo tratamiento.

5. Se haya curado con el tratamiento antiguo.

6. No se haya curado con el tratamiento antiguo

2.9. El teorema de Bayes.


Como consecuencia del teorema de la probabilidad total y de las propiedades de la probabilidad
condicionada, resulta este importante teorema que permite calcular probabilidades condicionadas.

Teorema de Bayes:
Si A1 , A2 , . . . , An son sucesos incompatibles 2 a 2, y cuya unión es el espacio muestral
(A1 ∪ A2 ∪ . . . ∪ An = E), y B es otro suceso, resulta que:

p(Ai ) · p(B/Ai )
p(Ai /B) =
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )

Demostración:
p(Ai ∩ B)
Por definición,p(Ai /B) = .
p(B)
Ai ∩ B
Ahora bien, recordando que p(Ai ∩ B) = p(Ai ) · p(B/Ai ), debido a que p(B/Ai ) = .
p(Ai )
Por tanto, combinando los dos hechos:

p(Ai ∩ B) p(Ai ) · p(B/Ai )


p(Ai /B) = =
p(B) p(B)

Como por el teorema de la probabilidad total es:

p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )

resulta que sustituyendo:

p(Ai ) · p(B/Ai ) p(Ai ) · p(B/Ai )


p(Ai/B) = =
p(B) p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )

y el teorema queda demostrado.

Nota:
Las probabilidades p(Ai ) se denominan probabilidades a priori.
Las probabilidades p(Ai /B) se denominan probabilidades a posteriori.
Las probabilidades p(B/Ai ) se denominan verosimilitudes.
CAPÍTULO 2. PROBABILIDAD 32

Ejemplo:
Dos clases de 2º de Bachillerato, una de 28 alumnos y otra de 35 alumnos hacen conjuntamente
un examen de Matemáticas. La probabilidad de aprobar de los alumnos de la primera clase es de 0’68
y los de la segunda del 0’73. Se toma un examen al azar y resulta que está aprobado. ¿Cuál es la
probabilidad de que sea de un alumno de la 1ª clase?.
Sea A1 = “el examen es de un alumno de la primera clase”
A2 = “el examen es de un alumno de la segunda clase”
B= “el examen está aprobado”
Nos piden p(A1 /B).
Hagamos antes que nada un diagrama de árbol:

Figura 2.14: Diagrama de árbol para el problema del examen

Por el teorema de Bayes:

p(A1 ) · p(B/A1 )
p(A1 /B) =
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 )

Sustituyendo:
28 
· 0 68 0 302
p(A1 /B) = 63 =  = 0 427
28  35  0 708
· 0 68 + · 0 73
63 63
p(A1 ) es la probabilidad “a priori”, es decir , antes de realizar el experimento y careciendo de
información.
28
En este caso p(A1 ) = = 0 444.
63
p(A1 /B) es la probabilidad “a posteriori”, después de realizarlo y conocer más información. En
este caso p(A1 /B) = 0 427 (es algo menor).

Ejercicio:
Se tienen dos urnas. En la primera hay 10 bolas blancas, 7 negras y 5 rojas. En la segunda 24
blancas, 4 negras y 9 rojas. Se elige una urna al azar y se saca una bola. Calcular:
a) Probabilidad de sacar bola blanca.
b) Sabiendo que la bola extraı́da es blanca, probabilidad de que provenga de la segunda urna.
Solución: 449 264
814 , 449 .
Capı́tulo 8

PROGRAMACIÓN LINEAL

8.1. Introducción
La programación lineal es una técnica matemática relativamente reciente (siglo XX), que consiste
en una serie de métodos y procedimientos que permiten resolver problemas de optimización en el
ámbito, sobre todo, de las Ciencias Sociales.
Nos centraremos en este tema en aquellos problemas simples de programación lineal, los que tienen
sólamente 2 variables, problemas bidimensionales.
Para sistemas de más variables, el procedimiento no es tan sencillo y se resuelven por el llamado
método Simplex (ideado por G.B.Danzig, matemático estadounidense en 1951).
Recientemente (1984) el matemático indio establecido en Estados Unidos, Narenda Karmarkar,
ha encontrado un algoritmo, llamado algoritmo de Karmarkar, que es más rápido que el método
simplex en ciertos casos. Los problemas de este tipo, en el que intervienen gran número de variables,
se implementan en ordenadores.

8.2. Inecuaciones lineales con 2 variables


Una inecuación lineal con 2 variables es una expresión de la forma:

ax + by ≤ c

(donde el sı́mbolo ≤ puede ser también ≥ , < o bien >), donde a, b y c son números reales y x e y las
incógnitas.
Para resolver estas inecuaciones, se recordará de otros cursos, hay que representar gráficamente en
el plano la recta dada por la correspondiente ecuación lineal y marcar una de las dos regiones en que
dicha recta divide al plano.

Ejemplo: Si queremos resolver la inecuación: 2x + 3y ≥ −3, representamos en primer lugar la recta


2x + 3y = −3:

127
CAPÍTULO 8. PROGRAMACIÓN LINEAL 128

La recta divide al plano en dos regiones, una de las cuales es la solución de la inecuación. Para
saber qué parte es, hay dos procedimientos:

1. Se despeja la y de la inecuación, poniendo cuidado en que si en una inecuación multiplicamos o


dividimos por un número negativo, la desigualdad cambia de sentido.
En este caso tendı́amos que:
−3 − 2x
y≥
3
Observando el dibujo vemos que la recta divide al eje de ordenadas (y) en dos partes.
La solución de la inecuación será aquella parte en la que la y sea mayor que la recta, es decir, la
parte superior.

Figura 8.1: Solución de la inecuación lineal

2. Se toma un punto cualquiera que no pertenezca a la recta, por ejemplo el (1,2).


Para que dicho punto sea solución, se tendrá que cumplir la desigualdad, por lo que sustituimos
en la inecuación inicial el (1,2):
2 · 1 + 3 · 2 ≥ −3, es decir, 8 ≥ −3.
Como esta última desigualdad es evidentemente cierta, concluimos que el (1,2) es solución y
por tanto el semiplano que contiene al (1,2) es la solución, es decir el semiplano superior, como
habı́amos obtenido antes.
Cualquiera de los procedimientos es válido si se realiza con corrección.

8.3. Sistemas de inecuaciones lineales con dos variables


Un sistema de inecuaciones lineales, por tanto, es un conjunto de inecuaciones del tipo anterior, y
resolverlo consistirá en resolver gráficamente cada inecuación (como en el caso anterior), representar
la solución en un mismo gráfico y la solución total será la parte común a todas las soluciones.
CAPÍTULO 8. PROGRAMACIÓN LINEAL 129

Ejemplo: Resolver el sistema de inecuaciones siguiente:



 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
Si representamos las rectas: 
 2x + 3y = −3 (recta r)
2x − y − 9 = 0 (recta s)

2x − 5y − 5 = 0 (recta t)

Figura 8.2: Solución del sistema de inecuaciones lineales

El triángulo rayado es la solución del sistema.


Además, para los problemas de programación lineal es necesario el cálculo de los vértices de la
región solución. Es sencillo su cálculo, pues se reduce a resolver sistemas de ecuaciones lineales son
dos incógnitas, que provienen de igualar las ecuaciones de las rectas correspondientes.
Por ejemplo, en este caso, si queremos el punto intersección de las rectas r y t tendremos que
resolver el sistema formado por:
 
2x + 3y = −3 −2x − 3y = 3
=⇒
2x − y − 9 = 0 2x − y − 9 = 0
Sumando −4y = 12 =⇒ y = −3.
Y sustituyendo que da 2x + 3(−3) = −3, es decir 2x − 9 = −3, y entonces x = 3.
Luego r y t se cortan en el punto (3,-3).

Ejercicios:
1. Calcular los otros dos vértices.
2. Resolver los sistemas de inecuaciones lineales siguientes encontrando los vértices de las regiones
que sean solución:

  
 x + 2y ≤ 12

3x + 6y ≥ 420 3x + 5y ≤ 150 2x + y ≥ 4
a) b) c)
4x + 2y ≥ 290 3x + 3y ≤ 120 
 x − 2y ≤ 6

x−y ≥0
CAPÍTULO 8. PROGRAMACIÓN LINEAL 130

Nota: Rectas horizontales y verticales.


En ocasiones, en estos sistemas, aparecen inecuaciones del tipo x ≥ k o bien y ≥ k, donde falta
alguna de las dos incógnitas.
Estas inecuaciones en realidad corresponden a rectas horizontales y verticales, y su representación
es bien sencilla.
Por ejemplo, la inecuación x ≤ −2 no es más que el conjunto de puntos a la izquierda de la recta
vertical que pasa por el punto x = −2, gráficamente:

Lo mismo ocurre con y ≤ 1, que será en este caso la parte inferior a la recta horizontal y = 1, es
decir:

En el caso particular de que sea x ≥ 0 o y ≥ 0, las rectas coincidirán con los ejes de coordenadas.

Ejercicios: Resolver los sistemas de inecuaciones lineales siguientes, encontrando los vértices de las
regiones que sean solución:

  x + 3y ≥ 50 
5x + 15y ≤ 150 
  2x + y ≤ 10

 
 9x − 8y ≥ 0 

6x + 8y ≤ 120 x + 3y ≤ 12
a) b) 3x + 4y ≥ 60 c)

 x ≥ 0 
 
 0≤x≤8
 
 x≥0 
y≥0  0≤y≤2
y≥0

Nota: Las dobles desigualdades como 0 ≤ x ≤ 8 se pueden desdobler en otras dos, x ≥ 0 y x ≤ 8.


CAPÍTULO 8. PROGRAMACIÓN LINEAL 131

8.4. Problemas de optimización de una función sujeta a restricciones


En un problema de programación lineal de dos variables x e y, se trata de optimizar (hacer máxima
o mı́nima, según los casos) una función (llamada función objetivo) de la forma:
F (x, y) = A · x + B · y
sujeta a una serie de restricciones dadas mediante un sistema de inecuaciones lineales del tipo:


 a1 x + b1 y ≤ c1

 a2 x + b2 y ≤ c2
 ..

 .

am x + bm y ≤ cm
Los puntos del plano que cumplen el sistema de desigualdades forman un recinto convexo acotado
(poligonal) o no acotado, llamado región factible del problema.
Todos los puntos de dicha región cumplen el sistema de desigualdades. Se trata de buscar, entre
todos esos puntos, aquel o aquellos que hagan el valor de F(x,y) máximo o mı́nimo, según sea el
problema.
Los puntos de la región factible se denominan soluciones factibles.
De todas esas soluciones factibles, aquellas que hacen óptima (máxima o mı́nima) la función obje-
tivo se llaman soluciones óptimas.
En general,un problema de programación lineal puede tener una, infinitas o ninguna solución.
Lo que si se verifica es la siguiente propiedad:

Propiedad:
Si hay una única solución óptima, ésta se encuentra en un vértice de la región factible, y si hay
infinitas soluciones óptimas, se encontrarán en un lado de la región factible.

Es posible que no haya solución óptima, pues cuando el recinto es no acotado, la función objetivo
puede crecer o decrecer indefinidamente.
Para resolver el problema, podemos abordarlo de dos formas, pero antes a aplicar cualquiera
de ellas siempre hay que dibujar la región factible, resolviendo el sistema de inecuaciones lineales
correspondiente, como se ha visto en los epı́grafes anteriores (la región factible puede estar acotada o
no), y se calculan los vértices de dicha región.

8.4.1. Forma geométrica


En este caso se representa el vector director de la recta que viene dada por la ecuación de la función
objetivo,F (x, y) = A · x + B · y , que hay que maximizar o minimizar.
El vector director de la recta A · x + B · y viene dado por v = (−B, A). Además, como lo único que
nos importa es la dirección del vector y no su módulo (longitud), podemos dividir a las coordenadas
del vector si los números son muy grandes, puesto que vectores con coordenadas proporcionales tienen
la misma dirección.
Posteriormente, se trazan rectas paralelas a este vector que pasen por los vértices de la región
factible (si es acotada) , o por todo el borde de la región factible (cuándo no es acotada) y se observa
en qué vértice la función F se hace máxima (o mı́nima) sin más que tener en cuenta cuál de las rectas
tiene mayor (o menor) ordenada en el origen, es decir, qué recta corta en un punto mayor o menor al
eje y.

Ejemplo: Maximizar la función F (x, y) = 2000x + 5000y sujeta a las restricciones:



 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
CAPÍTULO 8. PROGRAMACIÓN LINEAL 132

La región factible en este caso es:

Los vértices eran los puntos (0,-1), (5,1) y (3,-3).


Como la función es F (x, y) = 2000x + 5000y, el vector director es v = (−5000, 2000), que tiene la
misma dirección que el v = (−5, 2) y representándolo queda:

Figura 8.3: Región factible y vector de la función objetivo


CAPÍTULO 8. PROGRAMACIÓN LINEAL 133

Se trata ahora de trazar paralelas al vector que pasen por los vértices anteriores, es decir:

Figura 8.4: Solución gráfica. Paralelas al vector por los vértices.

Se observa gráficamente que de las tres paralelas trazadas, la que corta al eje y en un punto mayor
es la que pasa por el punto (5,1), que por tanto será la solución óptima al problema de máximos
planteado.
Para saber cuál es este valor ,máximo sustituimos en la función:
F (5, 1) = 2000 · 5 + 5000 · 1 = 10000 + 5000 = 15000
Luego la función tiene su solución óptima en (5,1) donde toma el valor 15000.

8.4.2. Forma algebraica


Consiste, simplemente, en susituir cada uno de los vértices de la región en la función objetivo. La
solución óptima vendrá dada por aquel que tome el mayor (o menor) valor.

Ejemplo: Maximizar la función F (x, y) = 2000x + 5000y sujeta a las restricciones:



 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
Con la misma región factible que en el caso anterior.
Los vértices eran los puntos (0,-1), (5,1) y (3,-3).
De esta forma sustituyendo:

F (5, 1) = 2000 · 5 + 5000 · 1 = 10000 + 5000 = 15000


F (0, −1) = 2000 · 0 + 5000 · (−1) = 0 − 5000 = −5000
F (3, −3) = 2000 · 3 + 5000 · (−3) = 6000 − 15000 = −9000
Vemos que el valor máximo se alcanza para el vértice (5,1) y que dicho valor es 15. La misma solución
que se obtenı́a antes.

Ejercicio: Resolver los problemas de programación lineal:


CAPÍTULO 8. PROGRAMACIÓN LINEAL 134



 2x + y ≤ 10

x + 3y ≤ 12
1. Maximizar F (x, y) = 4x + 5y sujeto a: .

 0≤x≤8

0≤y≤2


 3x + 2y ≥ 12

4x + 5y ≥ 29
2. Minimizar F (x, y) = 12x + 10y sujeto a: .

 x≥0

y≥0


 4x + 2y ≤ 6

7x + 8y ≤ 28
3. Maximizar F (x, y) = 120x + 80y sujeto a: .

 x≥0

y≥0

4x + 5y ≥ 20
4. Minimizar F (x, y) = 12x + 8y sujeto a: 7x + 2y ≥ 14 .

x≤y

8.5. Algunos ejemplos de casos extremos


Puede ocurrir que la solución óptima no sea única, e incluso que no exista, como en los ejemplos
siguientes:

Ejemplo 1: 

 x + y ≥ 14

2x + 3y ≥ 36
Maximizar g(x, y) = 3x + 4y sujeta a las rectricciones: .

 4x + y ≥ 16

x − 3y ≥ 0
Si representamos la región factible:

Los vértices serán:  


2 40
A= , , B = (6, 8), C = (12, 4)
3 3
Observemos que la región factible es NO acotada superiormente.
CAPÍTULO 8. PROGRAMACIÓN LINEAL 135

Si aplicamos el método geométrico, deberı́a trazar paralelas al vector director por los vértices, pero
como la región en no acotada, dichas rectas son cada vez mayores al trazarlas sobre los puntos de la
recta t, que son soluciones factibles. Por tanto el problema no tiene solución.

Figura 8.5: Las paralelas cortan cada vez en un punto mayor.

En general, un problema de máximos no tiene solución si la región factible no está acotada supe-
riormente, y un problema de mı́nimos no tiene solución si la región no está acotada inferiormente.
También puede tener el problema infinitas soluciones:

Ejemplo 2: 

 x+y ≥5


 ≤ x+3
y
Minimizar g(x, y) = 3x + 3y sujeta a las restricciones 3y − x ≥ −1 .



 y + 2x ≤ 16

4y − x ≤ 22
La región es, en este caso:
CAPÍTULO 8. PROGRAMACIÓN LINEAL 136

Los vértices respectivos son: A=(1,4), B=(2,5), C=(6,4), D=(7,2) y E=(4,1).


Si utilizamos el método gráfico, obtenemos:

Es decir, como buscamos el valor mı́nimo, todos los puntos comprendidos entre A y E sirven, es
decir, hay infinitas soluciones.
Si utilizamos el método algebraico: g(x, y) = 3x + 3y, luego:

A : g(1, 4) = 3 + 12 = 15

B : g(2, 5) = 6 + 15 = 21
C : g(6, 4) = 18 + 12 = 30
D : g(7, 2) = 21 + 6 = 27
E : g(4, 1) = 12 + 3 = 15
Observamos que el valor mı́nimo se toma en A y en E, y por tanto en todos los puntos comprendidos
entre ellos, es decir, hay infinitas soluciones.

8.6. Aplicación a problemas concretos


El verdadero valor de las técnicas de la programación lineal consiste en poder aplicarlas a problemas
reales.
Para resolver estos problemas se deben seguir los siguientes pasos, a la vez que vemos como se
aplicarı́a a un ejemplo concreto.

Ejemplo:
Una fábrica de muebles fabrica dos tipos de sillones, S1 y S2. La fábrica cuenta con dos secciones;
carpinterı́a y tapicerı́a.
Hacer un sillón de tipo S1 requiere 1 hora de carpinterı́a y 2 de tapicerı́a, mientras que uno de tipo
S2 requiere 3 horas de carpinterı́a y 1 de tapicerı́a.
El personal de tapicerı́a trabaja un total de 80 horas, y el de carpinterı́a 90.
Las ganancias por las ventas de S1 y S2 (unidad) son, respectivamente 60 y 30 euros. Calcular
cuántos sillones de cada tipo hay que hacer para maximizar las ganancias.
CAPÍTULO 8. PROGRAMACIÓN LINEAL 137

Este es un problema tı́pico en el que hay que usar las técnicas de programación lineal. Intentaremos
seguir el siguiente esquema:

1. Leer el enunciado , determinar la función objetivo y definir las variables.


En este caso, queremos hacer máximo el beneficio, es decir, queremos maximizar una función.
Como queremos determinar las cantidades de sillones S1 y S2 respectivamente, llamemos x=nº
de unidades de S1 e y=nº de unidades de S2.
La función beneficio a maximizar será: B(x, y) = 60 · x + 30 · y, que es la función objetivo.

2. Reordenar los datos del problema y escribir las inecuaciones correspondientes.


En este paso es conveniente el uso de tablas:

Tiempo(horas) Carpinterı́a Tapicerı́a


S1 1 2
S2 3 1
Disponible 90 80
Tiempo(horas) Cantidad Carpinterı́a Tapicerı́a
S1 x x 2x
S2 y 3y y
Necesario x + 3y 2x + y
Disponible 90 80

De aquı́ se deduce que:


x + 3y ≤ 90
2x + y ≤ 80
y además
x≥0
y≥0
pues el nº de unidades producidas no puede ser negativo.
Ya tenemos por tanto las restricciones.

3. Representar gráficamente la región factible, calcular sus vértices y el vector si usamos el método
geométrico.
En este caso, representando la región factible:
CAPÍTULO 8. PROGRAMACIÓN LINEAL 138

Siendo los vértices A=(0,0), B=(0,30), C=(30,20), D=(40,0).


60), equivalente a (−10,
El vector será (−30, 20).
Gráficamente se observa que la solución no es única, sino que se encuentran infinitas soluciones
en el lado correspondiente CD, sobre la recta 2x + y = 80, desde que x vale 30 hasta que vale
40, todas las soluciones son válidas.

4. Sustituir las coordenadas en la función objetivo y dar la solución correcta.


En este caso se obtiene:
B(0, 0) = 0
B(0, 30) = 900
B(30, 20) = 2400
B(40, 0) = 2400
con lo cuál hay infinitas soluciones y el beneficio que se obtiene es 2400 euros.

5. Analizar la solución obtenida en el contexto del problema: ¿tiene sentido?.


Debemos interpretar que en el contexto del problema no todas las soluciones son válidas, sino
que sólo sirven soluciones enteras, es decir, no se pueden fabricar, por ejemplo 3’8 sillones del
tipo S1. Las soluciones con sentido vendrı́an dadas por:

S1 30 31 32 33 34 35 36 37 38 39 40
S2 20 18 16 14 12 10 8 6 4 2 0

Encontramos por tanto sólo 11 soluciones que son las de la tabla


En cualquiera de estas soluciones el beneficio es de 2400 euros, que es el máximo bajo las
condiciones del problema.
CAPÍTULO 8. PROGRAMACIÓN LINEAL 139

8.7. El problema del transporte


Es uno de los problemas que dieron lugar a la programación lineal.
Un ejemplo tı́pico serı́a el siguiente:

Ejemplo:
Una empresa tiene 2 plantas de producción (P1 y P2) de cierto artı́culo que vende en 3 ciudades
(C1,C2 y C3). En P1 produce 5000 unidades, y en P2 7000 unidades. De estas 12000 unidades las
vende ası́: 3500 es C1, 4000 en C2 y 4500 en C3. Los costes de transporte, en euros por unidad de
producto, desde las plantas de producción a las ciudades son:
Envı́os Hasta C1 Hasta C2 Hasta C3
Desde P1 3 2’5 3’5
Desde P2 2’25 3’75 4

Determina el nº de artı́culos que debe enviar la empresa desde cada planta a cada ciudad para que los
costes de transporte sean mı́nimos.

Para problemas de este tipo necesitamos una nueva variable.


Sea x=unidades de P1 a C1, y=unidades de P1 a C2 y z=unidades de P1 a C3.
Tiene que verificarse entonces que x + y + z = 5000.
Si desde P1 a C1 se envı́an x unidades, como en C1 necesitan 3500, desde P2 se mandarán a C1
3500 − x. Razonando del mismo modo con y y z, se obtiene la tabla:
Envı́os Hasta C1 Hasta C2 Hasta C3
Desde P1 x y z = 5000 − x − y
Desde P2 3500 − x 4000 − y 4500 − z = 4500 − (5000 − x − y)
Hemos sustituido z por 5000 − y − x, porque x + y + z = 5000 y ası́ transformamos las 3 incógnitas
en sólo 2.
Para obtener las restricciones imponemos que cada cantidad ha de ser mayor o igual que cero, es
decir:
x≥0
3500 − x ≥ 0
y≥0
4000 − y ≥ 0
5000 − x − y ≥ 0
−500 + x + y ≥ 0
Por tanto el sistema de inecuaciones es:


 x≥0

 x ≤ 3500



y≥0

 y ≤ 4000


x + y ≤ 5000


x + y ≥ 500

Como se trata de minimizar costes, la función objetivo es:

C(x, y) = 3 · x + 2 5 · y + 3 5 · (5000 − x − y) + 2 25 · (3500 − x) + 3 75 · (4000 − y) + 4 · (−500 + x + y)

C(x, y) = 1 25 · x − 0 75 · y + 22625
CAPÍTULO 8. PROGRAMACIÓN LINEAL 140

Dibujando la región factible:

Resulta que A=(0,500), B=(0,4000), C=(1000,4000), D=(3500,1500), E= (3500,0) y F=(500,0).


Sustituyendo es:
C(0, 500) = 22250
C(0, 4000) = 19625
C(1000, 4000) = 20875
C(3500, 1500) = 25875
C(3500, 0) = 27000
C(500, 0) = 23250
El mı́nimo se da en B, cuando x = 0 e y = 4000.
Es decir, las unidades a distribuir son:

Envı́os Hasta C1 Hasta C2 Hasta C3


Desde P1 0 4000 1000
Desde P2 3500 0 3500

Ejercicio:
Dos fábricas de cemento, F1 y F2, producen respectivamente 3000 y 4000 sacos de cemento al dı́a.
Hay que enviar ese cemento a tres centros de ventas C1, C2 y C3 en cantidades de 3000, 2500 y
1500 sacos respectivamente.
Los costes de transporte de cada fábrica a los puntos de venta vienen dados, en euros por cada
saco, por:

Envı́os Hasta C1 Hasta C2 Hasta C3


Desde F1 2 2’5 2
Desde F2 1’5 3 1

Determina cómo hay que distribuir la producción para que el transporte resulte lo más económico
posible.
Capı́tulo 7

SISTEMAS DE ECUACIONES
LINEALES

7.1. Introducción
Se denomina ecuación lineal a aquella que tiene la forma de un polinomio de primer grado, es decir,
las incógnitas no están elevadas a potencias, ni multiplicadas entre sı́, ni en el denominador.
Por ejemplo, 3x + 2y + 6z = 6 es una ecuación lineal con tres incógnitas.
Como es bien sabido, las ecuaciones lineales con 2 incógnitas representan una recta en el plano.
Si la ecuación lineal tiene 3 incógnitas, su representación gráfica es un plano en el espacio.
Un ejemplo de ambas representaciones puede observarse en la figura:

Figura 7.1: Representación gráfica de la recta −x + 2y = 3 en el plano y del del plano x + y + z = 1


en el espacio

El objetivo del tema es el estudio de los sistemas de ecuaciones lineales, es decir, un conjunto de
varias ecuaciones lineales. Diremos que dos ecuaciones son equivalentes si tienen las mismas soluciones,
o geométricamente representan la misma recta o plano.

109
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 110

7.2. Sistemas de ecuaciones lineales


Un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales de la forma:

a11 · x1 + a12 · x2 + a13 · x3 + · · · + a1n · xn = b1 


a21 · x1 + a22 · x2 + a23 · x3 + · · · + a2n · xn = b2 
..
. 



am1 · x1 + am2 · x2 + am3 · x3 + · · · + amn · xn = bm
En este caso tenemos m ecuaciones y n incógnitas.
Los números reales aij se denominan coeficientes y los xi se denominan incógnitas (o números a
determinar) y bj se denominan términos independientes.
En el caso de que las incógnitas sean 2 se suelen designar simplemente por x e y en vez de x1 y x2
, y en el caso de tres, x, y, z en lugar de x1 , x2 y x3 pero esto es indiferente a la hora de resolver el
sistema.
Resolver el sistema consiste en calcular las incógnitas para que se cumplan TODAS las ecuaciones
del sistema simultáneamente.
Diremos que dos sistemas son equivalentes cuando tienen las mismas soluciones.

7.3. Expresión matricial de un sistema


Cualquier sistema de ecuaciones lineales se puede expresar en forma matricial del modo:
     
a11 a12 a13 . . . a1n x1 b1
 a21 a22 a23 . . . a2n   x2   b2 
     
 .. .. .. . . ..  ·  ..  =  .. 
 . . . . .   .   . 
am1 am2 am3 . . . amn xn bm
mxn nx1 mx1
   
a11 a12 a13 ... a1n x1
 a21 a22 a23 ... a2n  x2 
   
La matriz A =  . .. .. .. ..  se llama matriz de coeficientes, la matriz X =  .. 
 .. . . . .   . 
am1 am2 am3 . . . amn xn
 
b1
 b2 
 
se llama matriz de incógnitas, y la matriz B =  .  se llama matriz de términos independientes.
 .. 
bm
La matriz formada por A y B conjuntamente, es decir:
 
a11 a12 a13 . . . a1n b1
 a21 a22 a23 . . . a2n b2 
 
(A|B) =  . .. .. .. .. .. 
 .. . . . . . 
am1 am2 am3 . . . amn bm

se llama matriz ampliada del sistema y se representará por (A|B) o bien por A∗ .

x+y−z = 5 
Ejemplo: El sistema: x+y =7 escrito matricialmente es:

2x + 2y − z = 12
     
1 1 −1 x 5
1 1 0  ·  y  =  7 
2 2 −1 z 12
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 111

y la matriz ampliada es:


 
1 1 −1 5
(A|B) = 1 1 0 7 
2 2 −1 12

7.4. Tipos de sistemas


En general,buscaremos las soluciones de los sistemas en los números reales R. Dependiendo del
posible número de tales soluciones reales que tenga un sistema, éstos de pueden clasificar en:

 * INCOMPATIBLES (No tienen solución)  → S.I.
* DETERMINADOS (Solución única)→ S.C.D.
 * COMPATIBLES (Tienen solución)
* INDETERMINADOS (Infinitas soluciones)→ S.C.I.

7.5. Sistemas con dos incógnitas


Los sistemas más sencillos son aquellos en los que sólo hay dos incógnitas y 2 ecuaciones, y que ya
son conocidos de cursos pasados.
Hay varios sistemas para resolverlos, los más habituales:
* Reducción
* Igualación
* Sustitución
en los que ya no nos entretendremos.

Como cada ecuación lineal con 2 incógnitas se interpreta geométricamente como una recta, el estudio
de la solución del sistema se limita a estudiar la posición de 2 rectas en el plano.
Veamos algunos  ejemplos con los tres casos que se pueden presentar. Resolver e interpretar el
x + 2y = −3
sistema: .
−2x + y = 1

Por reducción:
2x+4y=-6
-2x+ y=1
5y=-5

de donde y = -1 y sustituyendo x + 2·(-1) = -3, x = -1.


Es decir, la solución del sistema es única, x = -1, y = -1 lo que significa que el sistema es compatible
y determinado, y que las rectas se cortan en un punto, precisamente el (-1,-1):

Figura 7.2: Solución del sistema, punto (-1,-1)


CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 112


x + 2y = −3
Resolver e interpretar el sistema: .
−2x − 4y = 5

x = −3 − 2y
Por igualación: 5 + 4y de donde:
x= 
−2
5 + 4y
−3 − 2y = =⇒ 4y + 6 = 5 + 4y =⇒ 0y = −1 =⇒ 0 = −1
−2
lo cuál es imposible y por tanto el sistema no tiene solución, es un sistema incompatible y por
tanto las rectas son paralelas. Geométricamente:

Figura 7.3: Sistema sin solución. Rectas paralelas


x + 2y = −3
Resolver e interpretar el sistema: .
3x + 6y = −9

Por sustitución, como x = −2y − 3 resulta 3(−2y − 3) + 6y = −9, es decir −6y − 9 + 6y = −9, por
tanto 0y = 0, 0 = 0.
Como 0 = 0 es una igualdad siempre cierta, quiere decir que el sistema tiene infinitas soluciones,
es compatible indeterminado, o que las rectas son la misma.

Figura 7.4: Infinitas soluciones. Las rectas coinciden

Lo expresaremos ası́. Como x = −2y − 3, dando valores a y se obtiene x.


Ası́ si le damos a y el valor arbitrario de λ (lambda), entonces expresaremos la solución como:

x = −2λ − 3
siendo λ ∈ R
y=λ

y como λ puede ser cualquier número real, hay infinitas soluciones.


Estos son los únicos casos que pueden darse con dos ecuaciones y dos incógnitas, y su interpretación
geométrica.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 113

Ejercicio: Estudiar la solución de los siguientes sistemas e interpretarla geométricamente:


  
x+y = 5 2x + y = 1 x + 2y = 3
a) b) c)
2x − y = 7 3x + 2y = 4 x−y = 4

7.5.1. Discución de sistemas de 2 ecuaciones con 2 incógnitas



ax + 3y = 5
Si alguno de los coeficientes del sistema es desconocido, por ejemplo, , no estamos
2x − y = 6
ante un sólo sistema, sino ante infinitos, uno para cada valor de a, y cada sistema será distinto en
función del valor que tome dicha letra (llamada parámetro).
Para estudiarlo, se resuelve el sistema como habitualmente y se estudian los distintos casos que se
pueden dar. Por ejemplo , por reducción:
ax+3y=5
6x-3y=18
ax+6x =23
por tanto, x(6 + a) = 23. Entonces, si 6 + a = 0 no podremos despejar x, es decir si a = −6, obtenemos
una ecuación del tipo 0 = 23, es decir, imposible.
Por tanto, si a = −6 el sistema es incompatible.
23
En cualquier otro caso, podemos despejar x,x = , y se puede sacar y sustituyendo, por tanto,
6+a
si a = −6, el sistema es compatible determinado.

Ejercicio: Discutir los sistemas en función del parámetro desconocido:


  1
x+y =5 ky + x =
a) b) 2
ax + 2y = 10 y − 3x = 5

7.6. Sistemas de 2 incógnitas y 3 ecuaciones


Podemos añadir a los clásicos sistemas de 2 ecuaciones y 2 incógnitas cuantas ecuaciones queramos
para obtener diferentes tipos de sistemas con 3, 4, 5 o más ecuaciones.
En cualquier caso, los tipos de sistemas a los que dan lugar son los mismos reseñados anteriormente.
Al aumentar el número de ecuaciones, la resolución del sistema por alguno de los tres métodos
clásicos se vuelve más farragoso, por lo que conviene aplicar ya el conocido método de Gauss para
determinar el tipo de sistema.
Para ello expresaremos el sistema en la forma matricial, analizando la matriz ampliada asociada,
que tendrá 2 columnas y tantas filas como ecuaciones tengamos.
Analizaremos tan sólo aquellos sistemas con 3 ecuaciones y 2 incógnitas.
La matriz ampliada genérica es:
 
a11 a12 b1
(A|B) = a21 a22 b2 
a31 a32 b3

Aplicar el método de Gauss consiste en realizar transformaciones elementales mediante las filas de la
matriz para obtener la matriz escalonada siguiente:
 
a11 a12 b1
(A|B) =  0 a∗22 b∗2 
0 0 b∗3

Recordemos que las operaciones elementales permitidas en las filas de la matriz (ecuaciones del sistema)
eran:
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 114

T1) Multiplicar o dividir una fila por un número real distinto de cero.
T2) Sumar o restar a una fila otra multiplicada por un número real no nulo.
T3) Intercambiar el lugar de dos filas entre sı́.
Utilizando estas transformaciones, los sucesivos sistemas que se obtienen son equivalentes al pri-
mero, es decir, tienen las mismas soluciones.
Debemos eliminar, en este orden, el elemento a21 utilizando la fila 1, el elemento a31 , utilizando
también la fila 1, y por último el elemento a32 utilizando la fila 2, de modo análogo al método de
Gauss-Jordan para la inversa.
Además, es conveniente en cada paso indicar la operación realizada con las filas, poniendo en
primer lugar aquella que se va a sustituir por otra.
Llegados a la matriz ampliada escalonada al final del proceso, pueden darse los casos siguientes:
1. a∗22 = 0. Entonces hay dos posibilidades:
a) b∗3 = 0. Sistema incompatible (hay una ecuación del tipo 0=k), sin solución.
Geométricamente, puede ocurrir que:
a) Dos rectas sean paralelas y la otra las corte.
b) Las rectas se corten dos a dos (formen un triángulo).

b) b∗3 = 0. Aparece una ecuación 0=0 que no influye en la resolución del sistema, que redu-
cido a las dos ecuaciones iniciales tiene solución única, es decir, el Sistema es Compatible
Determinado.
Geométricamente:
a) Dos rectas son coincidentes y la otra las corta.
b) Las tres rectas se cortan en un mismo punto.

2. a∗22 = 0. Entonces hay tres posibilidades:


a) Si b∗2 = b∗3 = 0, aparecen dos ecuaciones 0=0, que no influyen en la resolución del siste-
ma, que ahora tiene infinitas soluciones (1 ecuación y dos incógnitas). Sistema compatible
indeterminado.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 115

Geométricamente, las tres rectas coinciden (son la misma):

b) Si b∗2 = 0, b∗3 = 0 o bien b∗2 = 0, b∗3 = 0, aparece una ecuación 0=0 (que no influye) y otra
0=k (que es imposible). El sistema es incompatible.
Geométricamente:
a) Dos rectas son paralelas y la otra las corta.
b) Dos rectas coinciden y la otra es paralela.

c) Si b∗2 = 0, b∗3 = 0, hay dos ecuaciones 0=k que son imposibles, el sistema es incompatible.
Geométricamente, las tres rectas son paralelas o dos son coincidentes y una paralela.

En cada uno de los casos, para determinar la posición concreta de las rectas, basta representarlas.

Ejemplo Estudiar el sistema siguiente, dando la interpretación geométrica:



−x + 2y = 5 
3x + y = 7

2x + 3y = 12
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 116

A partir de la matriz ampliada y aplicando el método de Gauss, obtenemos:


     
−1 2 5 −1 2 5 −1 2 5
F +3F1  F −F2 
(A|B) =  3 1 7  −−2−−−→ 0 7 22 −−3−−→ 0 7 22
F3 +2F1
2 3 12 0 7 22 0 0 0
En este caso aparece una ecuación 0=0 que no influye y el elemento a∗22 es no nulo. El sistema es
compatible determinado, tiene solución única.
Geométricamente, puede ocurrir que:
a) Dos rectas son coincidentes y la otra las corta.
b) Las tres rectas se cortan en un mismo punto.
Resolviendo y dibujando, obtenemos:

−x + 2y = 5
7y = 22
22 9
De donde y = y sustituyendo es x = (compruébalo).
7 7
Dibujando las rectas:

 
9 22
Figura 7.5: Solución del sistema. Las tres rectas se cortan en un punto: P= ,
7 7

 se observa
 que las rectas se cortan en un punto, precisamente el punto solución del sistema: P =
9 22
, .
7 7

Ejercicios
a) Resuelve e interpreta geométricamente los sistemas:
  
 x+y =0  x − y = −2  2x + y = 2
a) −x + y = 2 b) x + 2y = 1 c) −x + y = −3
  
x + 3y = −2 4x − 10y = −14 y = −2x
b) Discute y resuelve en función del parámetro:
 
 x−y = 1  2x + y = 3
a) x + 2y = −1 b) −x + 3y = 0
 
2x + my = 0 mx + 4y = 3
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 117

7.7. Sistemas de 3 ecuaciones y 3 incógnitas


Cuando los sistemas tienen más de dos ecuaciones y tres o más incógnitas se utilizará el ya conocido
método de Gauss.
Ahora partiremos de la matriz ampliada:
 
a11 a12 a13 b1
(A|B) = a21 a22 a23 b2 
a31 a32 a33 b3

para dejar dicha matriz escalonada, es decir, del tipo:


 
a11 a12 a13 b1

 0 a∗22 a∗23 b 
2
0 0 a∗33 b∗
3

utilizando las transformaciones conocidas, y de la forma indicada en ocasiones anteriores.


Los tipos de sistema que pueden obtenerse dependiendo del número de soluciones son los reseñados
en apartados anteriores.
Al aplicar el método de Gauss podemos encontrarnos con distintos casos:
* Si se obtiene un sistema escalonado con coeficientes no nulos, el sistema es compatible determi-
nado, tiene solución única.
* Si se obtiene una o más filas en las que todos los elementos sean cero, el sistema tiene infinitas
soluciones, y hay que despejar una o varias incógnitas en función de otras, es un sistema compatible
indeterminado.
* Si se obtiene una o más filas de ceros, salvo el elemento correspondiente al término independiente,
que es distinto de cero, digamos k, entonces como la fila en cuestión corresponderı́a a una ecuación
del tipo 0 = k , lo que es imposible, el sistema no tiene solución y por tanto es incompatible.
Veamos un ejemplo:

 2x + y − z = 11
Ejemplo Resolver por el método de Gauss: x − 3y = −20 .

4x + 2y + 5z = 8
 
2 1 −1 11
La matriz ampliada es (A|B) = 1 −3 0 −20. Aplicando el método de Gauss:
4 2 5 8
    
2 1 −1 11 2 1 −1 11  2x + y − z = 11
2F2 −F1
1 −3 0 −20 − 
−−−−→ 0 −7 1 −51 =⇒  −7y + z = −51
F3 −2F1 
4 2 5 8 0 0 7 −14 7z = −14

obtenemos un sistema escalonado, que es compatible y determinado, pués podemos despejar z,


obteniendo z = −2, y luego −7y − 2 = −51, de donde −7y = −49 es decir y = 7 y sustituyendo en la
primera ecuación es 2x + 7 + 2 = 11, luego 2x = 2 , es decir x = 1.
La solución es (1, 7, −2).
Este proceso de resolución, que comienza calculando z y permite calcular las demás incógnitas
sustituyendo en las ecuaciones anteriores se denomina sustitución regresiva.

7.7.1. Interpretación geométrica de los sistemas con 3 ecuaciones y 3 incógnitas


Como cada ecuación lineal con 3 incógnitas corresponde a un plano en el espacio, la solución del
sistema correspoderá a la posición en que dichos planos estén en el espacio.
Lo más sencillo es saber que ocurre con los planos 2 a 2, pues en el espacio dos planos sólo pueden
estar en 3 posiciones:
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 118

* Son coincidentes: Lo cuál es fácil de saber porque sus correspondientes ecuaciones tienen coefi-
cientes de las incógnitas y los términos independientes proporcionales, es decir, si los planos son:

α ≡ Ax + By + Cz = D
β ≡ A x + B  y + C  z = D

entonces se verifica:
A B C D

=  =  = 
A B C D
(siempre que se puedan realizar las divisiones).
Por ejemplo, los planos 2x + 3y − z = 5, y −10x − 15y + 5z = −15 son coincidentes.
* Son paralelos: También es sencillo de saber porque los coeficientes de las incógnitas son propor-
cionales, pero los términos independientes NO. Es decir, en este caso:

α ≡ Ax + By + Cz = D
β ≡ A x + B  y + C  z = D

entonces se verifica:
A B C D

=  =  = 
A B C D
(siempre que se puedan realizar las divisiones).
Por ejemplo, los planos 2x + 3y − z = 5 y −10x − 15y + 5z = 7 son paralelos.
* Son secantes: Simplemente los coeficientes no son proporcionales, es decir:

α ≡ Ax + By + Cz = D
β ≡ A x + B  y + C  z = D

entonces se verifica:
A B C D

=  =  = 
A B C D
(siempre que se puedan realizar las divisiones, y basta con que un par de ellas correspondientes a las
incógnitas sean diferentes).
Por ejemplo, los planos 7x + 3y − z = 5 y −10x − 15y + 5z = 7 son secantes.

Puesto que podemos determinar la posición de los planos 2 a 2, podemos determinar en qué posición
se encuentran los 3 a la vez, fijándonos en los casos:

1. Si el sistema es S.C.D. (Solución única), es que los tres planos se cortan en un punto, que es la
solución del sistema.

2. Si el sistema es S.C.I. (Infinitas soluciones), puede ocurrir que:

a) Los tres planos se corten en una recta.


b) Dos planos son coincidentes y el otro los corta en una recta.
c) Los tres planos son coincidentes.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 119

Y determinaremos la opción correspondiente estudiándolos de dos en dos.

3. Si el sistema es S.I. (Sin solución), puede ocurrir que:

a) Los planos se cortan dos a dos.


b) Dos planos son paralelos y el otro los corta.
c) Los tres planos son paralelos.
d ) Dos planos son paralelos y el otro coincidente con uno de ellos.

Y determinaremos la opción correspondiente estudiándolos de dos en dos.

Ejemplo: Estudiar el sistema e interpretarlo geométricamente:



 2x + y − z = −6
3x − y + z = −5

4x + 2y − 2z = −1
 
2 1 −1 −6
Aplicando Gauss a (A|B) = 3 −1 1 −5, se obtiene:
4 2 −2 −1
    
2 1 −1 −6 2 1 −1 −6  2x + y − z = −6
3 −1 1 −5 − 2F2 −3F1  8  =⇒
− − −−→ 0 −5 5 −5y + 5z = 8
F3 −2F1 
4 2 −2 −1 0 0 0 11 0 = 11

Lo que indica que el sistema es incompatible y por tanto no tiene solución, los planos no tienen puntos
comunes.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 120

Si estudiamos la posición de los planos 2 a 2, se obtiene que el primero y el segundo tienen


coeficientes que no son proporcionales, luego se cortan.
El primero y el tercero tienen coeficientes proporcionales pero no los términos independientes,
luego son paralelos.
Y el segundo y el tercero no tienen coeficientes proporcionales, por lo que se cortan.
Concluimos por tanto que los planos primero y tercero son paralelos y son cortados por el segundo
plano, ésta es la interpretación geométrica:

Ejercicios: Estudiar e interpretar geométricamente los sistemas:


   
 2x − y + 3z = −1  x+y+z = 2  x + y − z = −2  x+y+z = 8
a) 4x − 2y + 6z = −5 b) 2x + y + 3z = 1 c) 2x − y + 3z = −5 d) 7x + y + 6z = 7
   
−2x + y − 3z = −7 x + 2y + z = 4 3x + 2z = −7 x + 7y + z = 1

7.7.2. Discusión de sistemas de 3 ecuaciones y 3 incógnitas


Si aparece algún coeficiente desconocido,aplicaremos el método de Gauss e investigaremos según
los valores del parámetro la posibilidad de que aparezca o no una fila de ceros.

 x+y+z = m+1
Ejemplo: Discutir según los valores de m el sistema: mx + y + (m − 1)z = m

x + 7y + z = 1
Aplicando Gauss a la matriz ampliada:
   
1 1 1 m + 1 1 1 1 m + 1
F2 −mF1 F −F1
m 1 m − 1 m  − −−−−→ 0 1 − m −1 −m2  −−3−−→
(m=0)
1 m 1 1 1 7 1 1
   
1 1 1 m + 1 1 1 1 m + 1
F −F1 F3 +F2
−−3−−→ 0 1 − m −1 −m2  − −−−→ 0 1 − m −1 −m2 

0 m − 1 0 −m 0 0 −1 −m − m2
Debemos, llegados a este punto, fijarnos en dos aspectos:
a) El desarrollo anterior sólo es posible si m = 0, luego el caso m = 0 debe estudiarse por separado.
b) En el sistema escalonado final, hay problemas cuando el valor 1 − m = 0, es decir, cuando
m = 1. En cualquier otro caso, no hay problemas.
De modo que, resumiendo, si m = 0 y m = 1, el sistema es S.C.D.
Estudiemos ahora cada caso por separado:
Si m = 0, al aplicar Gauss, queda:
     
1 1 1 1 1 1 1 1 1 1 1 1
F3 −F1 F +F2
0 1 −1 0 − −−−→ 0 1 −1 0 −−3−−→ 0 1 −1 0

1 0 1 1 0 −1 0 0 0 0 −1 0
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 121

que vuelve a ser S.C.D.


Si m = 1, al aplicar Gauss queda:
 
1 1 1 1
0 0 −1 −1

0 0 −1 −2

Se obtienen dos valores distintos de z, lo que es absurdo y el sistema en este caso no tiene solución
(S.I.)
Conclusión:
* Si m = 1 S.I.
* Si m = 1 S.C.D.

Ejercicios:

1. Discutir en función del parámetro desconocido los sistemas siguientes e interpretar geométrica-
mente el resultado:
 
x + y + az = 1  x + y − 6z = 0
a) x + ay + z = 1 b) x − 2y + 6z = 0
 
ax + y + z = 1 3x + −y + mz = 0
 
 3x + y + 2z = 1 − a x + y + az = a2
c) (1 + a)x + 2y + z = a d) x + ay + z = a
 
ax − y + z = 1 − a ax + y + z = 1

 x + 2y − z = 8
2. Dado el sistema 2x − 3y + z = −1 , se pide:

3x − y + kz = 5
a) Hallar el valor de k que hace el sistema incompatible.
b) Hallar el valor de k que hace el sistema compatible y además z= -1.
c) Para el valor de k hallado en b), resolver el sistema.

7.8. Aplicación de las matrices y determinantes a la resolución de


sistemas. Regla de Cramer
7.8.1. Aplicación de las matrices
Si tenemos un sistema con el mismo número de ecuaciones que de incógnitas ( un sistema de ese
tipo de llama cuadrado), entonces la matriz A de coeficientes es cuadrada y podemos escribir el sistema
matricialmente ası́:

A·X =B
donde A,X y B son las matrices ya definidas de coeficientes, incógnitas y términos independientes
respectivamente.
Como el objetivo es calcular la matriz X de incógnitas, el problema estarı́a resuelto si conseguimos
despejar X de dicha ecuación.
Sabemos que eso se puede hacer sólo cuando la matriz A posee inversa, y en ese caso aplicarı́amos
que:
A · X = B =⇒ A−1 · A · X = A−1 · B =⇒ I · X = A−1 · B =⇒ X = A−1 · B
es decir podrı́amos calcular X, y el sistema tendrı́a solución única.
Si A no posee inversa, no podemos despejar X y el sistema no se puede resolver de esta manera.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 122

Conclusión: En un sistema cuadrado y cuya matriz de coeficientes tenga inversa, la solución del
sistema viene dada por:
X = A−1 · B

 2x + y − z = 11
Ejemplo: Resolver, aplicando la inversa, el sistema: x − 3y = −20 .

4x + 2y + 5z = 8
 
2 1 −1
La matriz de coeficentes es 1 −3 0 .
4 2 5
Para poder aplicar lo anterior es necesario que A tenga inversa, lo que por ejemplo comprobamos
haciendo det (A).
Como det(A) = −49, no nulo, A tiene inversa. Por tanto y según lo dicho,X = A−1 · B , es decir:
   −1  
x 2 1 −1 11
y  = 1 −3 0  · −20
z 4 2 5 8

Si hacemos la inversa de A (¡compruébalo!), resulta:


 15 1 3

49 7 49
A−1 =  5 −2 1 
49 7 49
−2 1
49 0 7

y por tanto,    15     
1 3
x 49 7 49 11 1
y  =  5 −2 1 
· −20 = 2
49 7 49
−2 1
z 49 0 7 8 7
es decir x=1, y=7 , z=-2 , solución que ya habı́amos obtenido utilizando el método de Gauss.

7.8.2. Regla de Cramer


En el caso de sistemas que cumplan las mismas condiciones que los del anterior apartado, es decir,
que sean cuadrados y tales que su matriz de coeficientes tenga inversa (los sistemas que cumplen estas
dos condiciones se llaman sistemas de Cramer ), se puede aplicar una regla muy sencilla para calular
la solución y que se basa en los determinantes, conocida como regla de Cramer.
Si det(A) es cero, evidentemente la regla no se puede aplicar.

La regla de Cramer:
Para un sistema de Cramer (cuadrado y con matriz regular) se verifica que la incónita número k
se calcula dividiendo entre el determinante de A el determinante que resulta de sustituir la columna
k (correspodiente al lugar que ocupe la incógnita que se está calculando) por la columna de términos
independientes.

 2x + y − z = 11
Ejemplo: Resolver el sistema x − 3y = −20 .

4x + 2y + 5z = 8
Como el sistema es de Cramer puesto que det(A) = −49, aplicamos la regla de Cramer:
Para x sustituimos la primera columna por la de términos independientes pues x es la primera
incógnita:
11 1 −1

−20 −3 0

8 2 5 −49
x= = =1
−49 −49
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 123

Para y sustituimos la segunda columna por la de términos independientes pues y es la segunda incógni-
ta.
2 11 −1

1 −20 0

4 8 5 −343
y= = =7
−49 −49
Para z sustituimos la tercera columna por la de términos independientes pues z es la tercera incógnita).

2 1 11

1 −3 −20

4 2 8 98
x= = = −2
−49 −49
Y obtenemos la solución como antes.
Recordemos que esto sólo se puede aplicar para sistemas de Cramer.

Ejercicio: Resolver, mediante estos dos métodos, los sistemas:


  
3x − 2y + z = −1 x+y+z = 6  3x + y + z = 2
a) 2x + y − z = 2 b) x − y + 2z = 5 c) 2x + 2y + z = 5
  
x − 3y + z = 0 x+y−z = 0 x−y +z = 0

7.9. Estudio de sistemas cualesquiera mediante el cálculo del rango.


Teorema de Rouché-Frobenius
Saber si un sistema tiene o no solución (si es compatible), y cuántas soluciones tiene (si es deter-
minado o indeterminado), se reduce para cualquier tipo de sistemas a estudiar rangos. El resultado
fundamental es el:

Teorema de Rouché-Frobenius:
Un sistema cualquiera de matriz A y matriz ampliada (A|B) tiene solución (es compatible) si y
solamente si Rg(A) = Rg(A|B).
Por tanto si los dos rangos son distintos el sistema no tiene solución (S.I.).
Además, si dicho rango coincide con el número de incógnitas del sistema, la solución es única
(S.C.D.), y si dicho rango es menor que el número de incógnitas, hay infinitas soluciones (S.C.I.).

Es importante darse cuenta de que Rg(A) ≤ Rg(A|B), puesto que la matriz de coeficientes forma
parte de la ampliada, es decir, la matriz A no puede tener rango mayor que la ampliada.

Aún siendo importante, el único problema que plantea este teorema es que NO ofrece ningún método
para calcular la solución, sólamente dice si hay solución o no.

Ejercicio: Aplicar el teorema de Rouché para determinar el tipo de sistema que es:
  
 x+y−z+t = 4  2x − y = 1  x + 3y = 3 
3x + 3y − z = −1
a) 2x − y + 3z + 2t = −1 b) x + 3y = −2 c) 3x + 5y = 7 d)
   x + y − 5z = 2
−4x + 5y − 11z − 4t = 11 5x − 4y = 7 2x + 4y = 5
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 124

7.10. Sistemas homogéneos


Un sistema homogéneo es aquél que tiene todos los términos independientes nulos.
Cualquier sistema homogeneo es evidente que es compatible, pues dando a cada incógnita el valor
0, se cumplen las ecuaciones. Esta solución (que todas las incógnitas sean nulas) se llama solución
trivial.
El problema entonces está en determinar si dichos sistemas son compatibles determinados o inde-
terminados.
Aplicando el teorema de Rouché sólo podemos tener dos casos:
a) Rg (A) = nº incógnitas. En este caso el sistema es compatible determinado, y por tanto tiene
solución única que es la trivial (todas las incógnitas valen cero)
b) Rg(A) < nº incógnitas. En este caso el sistema es compatible indeterminado y tiene infinitas
soluciones que se determinan de la manera conocida.

Ejercicios:

1. Estudiar la solución de los sistemas homogéneos siguientes:



  x+y−z = 0
x+y = 0 x+y+z = 0
a) b) c) 2x − y + z = 0
x−y = 0 2x − y + z = 0 
4x + y − z = 0

 6x + 18y − bz = 0
2. Discutir el sistema homogéneo: 7x − 2y − 4z = 0 .

4x + 10y − 6z = 0
Capı́tulo 5

TEST DE HIPÓTESIS

5.1. Introducción
En este tema trataremos el importante aspecto de la toma de decisiones, referida a decidir si un
valor obtenido a partir de la muestra es probable que pertenezca a la población.
En general, la media (o proporción) en una muestra suele ser distinta a la media de la población,
de la cuál se extrae la muestra. Lo normal suele ser que tal diferencia entre la media muestral y
poblacional sea pequeña y debida al azar, pero podrı́a suceder que dicha diferencia no esté justificada
por el azar y se deba a un cambio en la población, y debamos modificar los datos que conocemos
previamente.
Ejemplos:
a) Hace algunos años, la media de estatura de los españoles adultos varones era de 170 cm y su
desviación tı́pica 9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una medida de 172
cm. ¿Puede afirmarse que esa diferencia de 2 cm es debida al azar o realmente la estatura media ha
aumentado?.
b) Supongamos que, respecto a una determinada ley, el 52 % de los ciudadanos está en contra.
Pasado el tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han
descendido hasta el 49 %.¿Ha cambiado realmente la opinión pública o tal resultado es debido al
azar?.
c) El porcentaje de aprobados en las PAU en un determinado distritouniversitario ha sido del 82 %.
En una ciudad de ese distrito, el porcentaje de aprobados fue del 86 %. ¿Puede afirmarse con un nivel
de confianza del 90 % que los resultados en esa ciudad son superiores a la media?.
Los métodos de decisión estadı́stica están ligados a los de estimación de parámetros mediante los
intervalos de confianza, aunque también aparecerán otros nuevos conceptos.

5.2. Hipótesis estadı́sticas


Trataremos de utilizar los datos obtenidos en una muestra para tomar decisiones sobre la población.
Para ello, debemos realizar ciertos supuestos o conjeturas sobre las poblaciones. Estos supuestos, que
pueden ser o no ciertos,se llaman hipótesis estadı́sticas.
Podemos, entonces, definir el test de hipótesis o contraste de hipótesis como el procedimiento
estadı́stico mediante el cuál se investiga la verdad o falsedad de una hipótesis acerca de una población
o poblaciones.
Dichas hipótesis se formularán sobre la media poblacional µ o la proporción poblacional p.

Llamaremos hipótesis nula, y se representa por H0 , a la hipótesis que se formula y por tanto se quiere
contrastar o rechazar, e hipótesis alternativa, y se representa por H1 , a cualquier otra hipótesis que
sea diferente de la formulada, y que sea contraria a H0 , de forma que la aceptación de la hipótesis nula
H0 implica el rechazo de la alternativa H1 y viceversa, el rechazo de H0 implica la aceptación de H1 .

72
CAPÍTULO 5. TEST DE HIPÓTESIS 73

En un problema de contraste de hipótesis, pues, siempre tiene que formularse una hipótesis nula H0 ,
y ha de ir acompañada de una alternativa, H0 que es la que aspira a desplazar a la nula.

Ejemplo: Un investigador afirma que la temperatura del cuerpo humano en un adulto sano se distri-
buye según una normal de media µ = 37º C y desviación tı́pica σ = 0 9º C. Formular la hipótesis
nula y la hipótesis alternativa
A la vista de los datos, el investigador afirma que la temperatura media del cuerpo humano es 37º,
es decir la hipótesis o conjetura que formula es:

H0 = 37 (hipótesis nula)

Como hipótesis alternativa, hemos de tomar aquella contraria a esta, que la media sea distinta de 37º
C, es decir:
H1 = 37 (hipótesis alternativa)
Si la hipótesis nula fuese del tipo µ ≥ k la hipótesis alternativas serı́a:µ < k.

5.3. Errores
Hay ocasiones en que la hipótesis nula, H0 , es cierta, pero a la vista de la muestra tengamos que
rechazarla. En tal caso, estamos cometiendo un error.
El error que consiste en rechazar la hipótesis nula cuando ésta es verdadera, se denomina error de
tipo I.
Otro tipo de error puede ocurrir cuando, siendo H0 falsa, las evidencias de la muestra, sin embargo,
nos lleven a aceptarla.
Este error, cometido al aceptar cuando ésta es falsa, se denomina error de tipo II. Resumiendo:
Situación
H0 verdadera H1 verdadera (H0 falsa)
Mantener H0 Decisión correcta Decisión incorrecta:
Probabilidad=1 − α ERROR DE TIPO II
Decisión Probabilidad=β

Rechazar H0 Decisión incorrecta: Decisión correcta


ERROR DE TIPO I Probabilidad=1 − β
Probabilidad=α
donde α es el nivel de significación y 1 − α es el nivel de confianza.
Con esta notación y utilizando probabilidades condicionadas:

α = p (Rechazar H0 /H0 es cierta) = p(Error de tipo I)

y
α = p (Aceptar H0 /H0 es cierta)
Por otra parte:
β = p (Aceptar H0 /H0 es falsa) = p(Error de tipo II)
y
1 − β = p (Rechazar H0 /H0 es falsa)
A la probabilidad 1 − β se le denomina potencia del contraste.
CAPÍTULO 5. TEST DE HIPÓTESIS 74

5.4. Región crı́tica y región de aceptación


Sabemos ya formular la hipótesis nula y la hipótesis alternativa. Lo que necesitamos ahora es
un criterio para saber si debemos aceptar una u otra, es decir, ¿con cuál de las dos hipótesis nos
quedamos?.
Al tener ya formulada la hipótesis nula, es necesario que las evidencias sean muy fuertes para
rechazarla; es decir, puede que haya cambios debidos al azar, en cuyo caso el cambio no es significativo,
y no cambiamos , pero puede que los cambios sean debidos a otras causas. En este último caso es cuando
el cambio es significativo y rechazaremos.
Por lo tanto, lo primero que debemos hacer es fijar un cierto intervalo dentro del cuál es normal
que haya cambios, es decir, una región tal que si el parámetro se mantiene en dicho intervalo, nos
seguimos quedando con H0 , pues esas pequeñas variaciones son debidas al azar. Ese intervalo o región
se denomina región de aceptación, y será mayor o menor dependiendo del nivel de confianza que
precisemos, 1 − α.
La región que quede fuera de la región de aceptación indica que en este caso los cambios no se
pueden atribuir al azar, y por tanto hemos de rechazar H0 y aceptar H1 . Tal región se llama región
crı́tica o de rechazo.
Llegados a este punto, hemos de distinguir entre dos tipos de contraste o test, que determinan la
región de aceptación y la región de rechazo.
1. Contraste bilateral (o de dos colas): En este caso la región de rechazo o región crı́tica
está formada por dos conjuntos de puntos disjuntos. Dicho caso se presenta cuando la hipótesis
nula es del tipo H0 : µ = k (o bien H0 : p = k) y la hipótesis alternativa, por tanto, es del tipo
H1 : µ = k (o bien H1 : p = k).
La región crı́tica para un cierto nivel α serı́a, en la N(0;1):

Figura 5.1: El intervalo (−z α2 , z α2 ) es la Región de Aceptación. La región no sombreada es la Región


crı́tica, formada por dos partes o colas.

Fijémonos en que el nivel de significación α se concentra en dos partes (o colas) simétricas


respecto de la media.
La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad
para x o p̂, es decir:  
σ σ
µ − z α2 · √ , µ + z α2 · √
n n
o bien:    
p·q p·q
p − z α2 · , p + z α2 ·
n n
Las correspondientes regiones crı́ticas serán:
   
σ σ
−∞, µ − z α2 · √ ∪ µ + z α2 · √ , ∞
n n
o bien      
p·q p·q
−∞, p − z α2 · ∪ p + z α2 · ,∞
n n
CAPÍTULO 5. TEST DE HIPÓTESIS 75

2. Contraste unilateral (o de una cola): En este caso la región crı́tica está formada por un
sólo conjunto de puntos.
Como se observa en las figuras, el nivel de significación α se concentra sólo en una parte o cola.
Este caso se presenta cuando la hipótesis nula es del tipo H0 : µ ≥ k (o bien H0 : p ≥ k) y la
hipótesis alternativa, por tanto, es del tipo H1 : µ < k (o bien H1 : p < k).(También si aparece
≤)
A nivel de confianza 1 − α, las regiones serı́an, en la N(0;1):

a) Unilateral por la derecha:

Figura 5.2: El intervalo (−∞, zα ) es la Región de Aceptación. La región no sombreada es la Región


crı́tica, formada por una partes o cola. El nivel α se concentra ahı́.

La región de aceptación en este caso será:


 
σ
−∞, µ + zα · √
n
o bien:   
p·q
−∞, p + zα ·
n
Las correspondientes regiones crı́ticas serán:
 
σ
µ + zα · √ , ∞
n
o bien   
p·q
p + zα · ,∞
n
b) Unilateral por la izquierda:

Figura 5.3: El intervalo (zα , ∞) es la Región de Aceptación. La región no sombreada es la Región


crı́tica, formada por una partes o cola. El nivel α se concentra ahı́.

La región de aceptación en este caso será:


 
σ
µ − zα · √ , ∞
n
CAPÍTULO 5. TEST DE HIPÓTESIS 76

o bien   
p·q
p − zα · ,∞
n
Las correspondientes regiones crı́ticas serán:
 
σ
−∞, µ − zα · √
n

o bien:   
p·q
−∞, p − zα ·
n
En todos los casos, conociendo el nivel de confianza 1 − α, tendremos que determinar el valor z α2
(para contrastes bilaterales) o bien zα (para contrastes unilaterales), que separa las regiones de rechazo
y aceptación.
Algunos de estos valores más comunes se dan en la tabla adjunta, que en los bilaterales son los
mismos que para intervalos de confianza o probabilidad, ya vistos con anterioridad:

Figura 5.4: Valores más comunes para contrastes bilaterales y unilaterales derechos. Los correspon-
dientes para los unilaterales izquierdos son negativos.

5.5. Etapas de la prueba de hipótesis


Los procedimientos seguidos en las pruebas de hipótesis correspondientes a las situaciones de
decisión estadı́stica se encuentran totalmente prefijados y se llevan a cabo en una serie de etapas que
facilitan su comprensión, y que son:

1. Enunciar la hipótesis nula H0 y la alternativa H1 .


Deben ser excluyentes entre sı́. Analizar, una vez enunciadas, si el contraste es bilateral o unila-
teral (Es bilateral si la hipótesis alternativa es del tipo = y unilateral si es del tipo > o <).

2. Determinar el valor z α2 (para contrastes bilaterales) o bien zα (para contrastes unilaterales),


que separa las regiones de rechazo y aceptación, a partir del nivel de confianza 1 − α o el de
significación α.
CAPÍTULO 5. TEST DE HIPÓTESIS 77

3. Determinar la distribución que sigue el parámetro muestral (x o p̂) y en base a ella y al valor
obtenido en la etapa anterior, escribir las correspondientes regiones de aceptación y rechazo.
4. Calcular el estadı́stico usado en la prueba (en nuestro caso, calcular media muestral x o propor-
ción muestral p̂, a partir de la muestra).
5. Aplicar el test,es decir, dependiendo de si el estadı́stico cae en la región de aceptación o de
rechazo, tomar la decisión de aceptar una de las dos hipótesis.
A continuación se ofrecen algunos ejemplos de problemas de test de hipótesis:
1. La vida media de una muestra de 100 tubos fluorescentes producidos por una empresa es de
1570 horas, una desviación tı́pica de 120 horas. Si es la vida media media de los tubos de dicha
empresa, ¿se puede afirmar a nivel de significación 0’05 que la duración media de los tubos es
de 1600 horas?.
Determinar los errores de tipo I y II

Etapa 1: Queremos saber si la duración media de los tubos es de 1600 horas, es decir, que nuestra
hipótesis nula es H0 : µ = 1600.
Por lo tanto, la hipótesis alternativa será que la duración no sea de 1600 horas, es decir, la
hipótesis alternativa es H1 : µ = 1600.
Por tanto estamos ante un contraste bilateral.
Etapa 2: A nivel de significación α = 0 05 =⇒ 1 − α = 0 95, y realizando el dibujo habitual
(hacer como ejercicio), obtenemos que z α2 = z0 025 = 1 96.
Etapa 3: Determinemos la distribución de la media muestral, x, teniendo en cuente que como la
desviación tı́pica de la población no la conocemos, tomamos la muestral, que es s = 120, y por
tanto sabemos que la media muestral sigue una normal:
 
120
N 1600; √ = N (1600; 12)
100
Por tanto la región de aceptación será el intervalo de probabilidad:

 
120 120
1600 − √ , 1600 + √ = (1600 − 1 96 · 12, 1600 + 1 96 · 12) = (157648, 162352)
100 100
De modo que, Región de Aceptación:(1576’48,1623’52)
Región de Rechazo: (−∞, 157648) ∪ (162352, ∞)
Etapa 4: En la muestra se ha obtenido que x = 1570.
Etapa 5: Para aplicar el test, simplemente hemos de comprobar si el valor de está dentro de la
región de aceptación o de la de rehazo.
Como en este caso se observa que
/ (157648, 162352)
1570 ∈
es decir, 1570 no está en la región de aceptación, sino en la de rechazo.
Por tanto, hemos de rechazar que la media es 1600 (hipótesis nula) y aceptar la alternativa.
A este nivel de confianza no se puede afirmar que la duración media de los tubos sea de 1600
horas.
En cuanto a los errores:
Error de tipo I es afirmar que la duración media no es de 1600 horas cuando en realidad sı́ lo es.
Error de tipo II es afirmar que la duración media es de 1600 horas cuando en realidad no lo es.
CAPÍTULO 5. TEST DE HIPÓTESIS 78

2. Una encuesta, realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de duración
de un empleo en la misma era de 6’5 años con una desviación tı́pica de 4. ¿Sirve esta afirmación
para aceptar, con un nivel de significación del 5 %, que el tiempo medio de empleo en esa fábrica
es menor o igual que 6? Justificar adecuadamente la respuesta.
El enunciado no puede ser más claro a la hora de determinar las hipótesis nula y alternativa.
Queremos comprobar si el tiempo medio de empleo en esa fábrica es menor o igual que 6, luego
la hipótesis alternativa será que dicho tiempo medio de empleo sea MAYOR que 6, es decir:

H0 : µ ≤ 6

o simplemente H0 : µ = 6 (lo que queremos comprobar) frente a:

H1 : µ > 6

Es claramente un contraste unilateral. La región de aceptación será


 
s
−∞, µ + zα √
n
puesto que aceptamos todos los valores menores que un cierto tope. Notemos que concemos el
valor de s (en la muestra) y no el de σ, pero eso no inluye en la fórmula. La región de rechazo,
por tanto, es:  
s
µ + zα √ , ∞
n

Para calcular el nivel zα = z0 05 , y por tanto z0 05 = 1 645. Ası́ pues, la región de aceptación es,
puesto que µ = 6 , s = 4 y n = 64, resulta ser, aproximadamente:

(−∞, 6 8225)

Y la región crı́tica:
(6 8225, ∞)

Como en la muestra resulta que x = 6 5, que pertenece a la región de aceptación, es decir,


aceptamos la hipótesis nula, la media es de 6 años, al 95 % de confianza.

3. Un investigador, utilizando información de anteriores comicios, sostiene que, en una determinada


zona, el nivel de abstención en las próximas elecciones es del 40 % como mı́nimo. Se elige una
muestra aleatoria de 200 individuos para los que se concluye que 75 estarı́an dispuestos a votar.
Determinar, con un nivel de significación del 1 %, si se puede admitir como cierta la afirmación
del investigador.
Se trata ahora de un contraste de proporciones. La hipótesis a contrastar está muy clara: El
investigador dice que el nivel de abstención es de un 40 % por lo menos, es decir, sólo rechazaremos
su hipótesis cuando la proporción sea menor que este valor, es decir:

H0 : p ≥ 0 4

o simplemente H0 : p = 0 4 (lo que dice el investigador) frente a:

H1 : p < 0 4

(la proporción de abstención es menor)


Ası́ pues la región de aceptación es:
  
pq
p − zα ,∞
n
CAPÍTULO 5. TEST DE HIPÓTESIS 79

Y la de rechazo:   
pq
−∞, p − zα
n

Para calcular el nivel zα = z0 01 , y por tanto z0 01 = 2 33. Ası́ pues, la región de aceptación es,
puesto que p = 0 4 , q = 0 6 y n = 200, resulta ser, aproximadamente:

(0 3192, ∞)

Y la región crı́tica:
(−∞, 0 3192)

Como en la muestra resulta que


125
p̂ = = 0 625
200
, los 125 que no votan de los 200 a los que se pregunta. Al 99 % de confianza entonces, resulta
que dicho valor en la muestra pertenece a la región de aceptación, es decir,aceptamos la hipótesis
nula y el investigador tiene razón, la abstención será, al menos del 40 %.

Potrebbero piacerti anche