Matematicas Bachiller

Capı́tulo 1
COMBINATORIA
Previamente al estudio de la probabilidad en sı́, conviene dedicar algún tiempo al repaso de las
técnicas combinatorias.
Recordemos que la Combinatoria es la parte de las Matemáticas que se ocupa de la resolución de
problemas de elección y disposición de los elementos de cierto conjunto, de acuerdo con ciertas reglas.
Es decir, dentro de la Combinatoria es dónde tienen sentido preguntas del tipo:
1. ¿Cuántas quinielas distintas pueden hacerse?.
2. ¿Cuántas posibles combinaciones pueden darse en la loterı́a primitiva?.
3. ¿Qué posibilidades hay de que me toquen los cuatro ases en una mano de tute?.
4. ¿De cuántas formas se pueden sentar 5 personas en 5 asientos de un cine?.
Trataremos de dar respuesta a estas cuestiones y algunas más.
1.1. Conceptos fundamentales

En todo problema combinatorio hay varios conceptos claves que debemos distinguir:
1. Población: Es el conjunto de elementos que estamos estudiando. Llamaremos tamaño de la

población al número de elementos de este conjunto.
2. Muestra: Es un subconjunto de la población. Llamaremos tamaño de la muestra al número de
elementos que la componen.
Los diferentes tipos de muestra vienen determinados por dos aspectos:
a) El orden, es decir, si es importante que los elementos de la muestra aparezcan ordenados o no.
b) La posibilidad de repetición o no de los elementos.
Ejemplo: Veamos con qué tipo de poblaciones y muestras trabajamos en los ejemplos anteriores:
1. La población en este caso es {1,X,2}, que tiene tamaño 3 (no hay otras posibilidades en una
quiniela).
Una quiniela (teniendo en cuenta el ”pleno al 15”) es una muestra de tamaño 15 de la población
anterior (por ejemplo : 1XX121XXX212111).
Es evidente que el orden en esta muestra es importante (no es lo mismo una X en la segunda
casilla que en la quinta) y que se permiten elementos repetidos ( los unos , equis o doses se
pueden repetir).
Es por tanto una muestra ordenada y con repetición.
5
CAPÍTULO 1. COMBINATORIA 6
2. En este caso la población es mayor, pués son todos los números desde el 1 al 49, es decir
{1,2,3. . . .,49}.
Por tanto, y si nos olvidamos del complementario, una apuesta de loterı́a primitiva es una muestra
de tamaño 6 de dicha población (por ejemplo 3, 18, 40, 41, 43, 45 ).
Aquı́ el orden no influye y los elementos no se pueden repetir (no puede salir un número más de
una vez). Son muestras no ordenadas y sin repetición.
3. La población ahora está formada por las 40 cartas que componen una baraja española, es decir
{1 oros, 2 oros,. . . .,Rey bastos} , y para el caso de 4 jugadores, tenemos una muestra de 10
cartas, que evidentemente no se pueden repetir y además el orden no importa.
Muestras no ordenadas y sin repetición.
4. La población son las 5 personas a elegir, y la muestra tiene el mismo tamaño, 5, pues elegimos a
las 5 personas. Eso sı́, ahora el orden sı́ que es importante y además las personas no se pueden
repetir.
Son muestras ordenadas y sin repetición.
5. Un ejemplo de muestra no ordenada y con repetición podrı́a ser una mano de cartas pero teniendo
en cuenta que jugamos con 2 barajas idénticas mezcladas (80 cartas).
Si se reparten 10 a cada uno de 4 jugadores, tenemos una muestra de tamaño 10 en la que
es evidente que el orden no importa y que podemos tener cartas repetidas (por ejemplo, dos
caballos de oros).
El objetivo de la Combinatoria es calcular cuántos tipos de muestras de un determinado tamaño

se pueden extraer de cierta población. El resultado en el que nos basaremos a la hora de calcular el
número de muestras es el siguiente:
Principio de multiplicación:
Si un procedimiento se puede separar en r etapas, de modo que el resultado de una de ellas no influye
en el resultado de las otras, y en cada una de estas etapas se obtienen respectivamente n1 , n2 , n3 , . . ., nr
resultados, entonces el procedimiento global conduce a n1 · n2 · n3 · . . . · nr resultados.
Ejemplo: ¿Cuántos resultados podemos obtener al lanzar una moneda tres veces?.
Aplicando el principio anterior, en el primer lanzamiento obtenemos 2 resultados (Cara o cruz), en el

segundo lanzamiento, otros 2 y en el tercero también 2.
Por tanto, en total hay 2 · 2 · 2 = 8 posibles resultados. Si lo disponemos en forma de diagrama de
árbol, obtenemos los 8 resultados:
Figura 1.1: Diagrama de árbol

1.2. Muestras ordenadas

1.2.1. Muestras ordenadas sin repetición
Si tenemos una población de tamaño n y queremos extraer una muestra ordenada y sin repetición
de tamaño k (k < n), razonemos de este modo:
El primer elemento lo podemos elegir entre n elementos.
El segundo, al no poder repetir, podemos elegirlo entre n − 1 elementos.
..
.
El elemento k, lo podremos elegir entre n − k + 1 elementos.
Por tanto, y aplicando el principio de multiplicación en total hay :
n · (n − 1) · . . . · (n − k + 1)
muestras de tamaño k ordenadas y sin repetición.
Ejemplos:
1. ¿De cuántas formas se pueden elegir 2 cartas, extraı́das sucesivamente y sin repetir, de una
baraja española?
La primera se puede elegir de 40 formas.
La segunda, al no poder repetir, sólo se puede elegir de 39 maneras.
Por tanto, en total hay 40·39 = 1560 posibilidades.
2. Seis ciclistas llegan al sprint en una prueba de la Olimpiadas, ¿De cuántas maneras se pueden
colocar los tres primeros puestos?.
Para el primer puesto hay 6 posibilidades.
Para el segundo, sólo 5 posibilidades.
Para el tercero, quedan 4 opciones.
Por tanto hay en total 6·5·4 = 120 maneras.
Las muestras ordenadas y sin repetición se denominan Variaciones sin repetición. Por tanto,
si el tamaño de la población es n y el de la muestra k, el número de variaciones sin repetición lo
expresaremos por:
Vnk = n · (n − 1) · . . . · (n − k + 1)
(notemos que k, tamaño de la muestra indica el número de factores que hay que multiplicar, por
ejemplo, en los ejemplos anteriores, en el primero las muestra eran de tamaño 2 y multiplicábamos 2
factores, y en el segundo eran muestras de tamaño tres y multiplicábamos tres factores).
Ejercicio: ¿Cuántos números de cuatro cifras no repetidas se pueden formar con las cifras del 1 al 9
(ambas inclusive)?
1.2.2. Permutaciones
En el caso particular de que se tome una muestra de tamaño igual al tamaño de la población, es
decir, k = n, las variaciones se denominan permutaciones y se obtendrı́a:
Vnn = n · (n − 1) · . . . · (n − n + 1) = n · (n − 1) · . . . · 1
El producto de todos los números enteros desde el 1 hasta el n se denomina factorial de n y se

representa por n!. Por definición, 0!=1 y 1!=1. Evidentemente no existen los factoriales de los números
negativos (Si intentásemos calcular, por ejemplo (-4)!, por definición deberı́amos escribir:
(−4) · (−3) · (−2) · (−1) · 0 · 1 = 0
, es decir, el 0 siempre aparecerı́a en un factorial de un entero negativo, y dicho factorial serı́a siempre
0. No tiene sentido, por tanto, calcular el factorial en este caso).
Por tanto este caso particular de variaciones sin repetición se denomina permutaciones sin repeti-
ción de n elementos y se expresa:
Pn = n!
Ejemplo: ¿De cuántas maneras se pueden sentar 5 personas en 5 asientos en un cine?.
La primera persona se puede sentar en 5 sitios.
La segunda sólo en 4, la tercera en 3, la cuarta en 2 y la quinta en 1.
De modo que hay 5·4·3·2·1 = 120 posibilidades, es decir, P5 = 5! = 120.
Ejercicio: ¿Cuántas palabras de 8 letras (con o sin sentido) se pueden formar con las letras A B C
D E F G H?.
1.2.3. Permutaciones con elementos repetidos

Si queremos calcular el número de permutaciones de n elementos de los cuáles hay n1 de una
clase,n2 de otra, etc. . . de modo que n1 + n2 + . . . + nr = n , entonces hablamos de permutaciones de
n elementos, algunos de los cuales están repetidos, lo que se expresa como:
n!
Pnn1 ,n2 ,...,nr =
n1 ! · n2 ! · . . . · nr !
Ejemplo: Con las letras A A A B B ,¿cuántas palabras, con o sin sentido, pueden formarse?
La A se repite 3 veces y la letra B se repite 2 veces, y en total hay 5 letras. Ası́ el número total de
palabras son:
5! 5·4·3·2·1 5·4
P53,2 = = = = 10
3! · 2! 3·2·1·2·1 2
Dichas palabras serı́an: AAABB, AABAB, AABBA, ABAAB, ABABA, ABBAA
Escribe los 4 restantes.
Ejercicio: Con 5 signos + y 3 signos - ¿Cuántas cadenas de sı́mbolos se pueden formar?
1.2.4. Muestras ordenadas con repetición

Si la población es de tamaño n y la muestra de tamaño k, pero ahora permitimos repeticiones
,procedemos ası́:
El primer elemento se puede elegir de n maneras.
Como podemos repetir, el segundo también se puede elegir de n maneras.
..
.
El elemento número k se puede elegir de n maneras.
En total tendremos n·n·. . . ·n (k veces ) = nk muestras de este tipo.
Ejemplos:
1. ¿De cuántas maneras se pueden elegir 2 cartas (no necesariamente distintas de una baraja de 40
cartas?.
La primera se puede elegir de 40 maneras.
La segunda, al poder repetir, también se puede elegir de 40 maneras.
En total hay 40·40 = 1600 formas.
2. ¿De cuántas formas se puede entregar el Premios al primer clasificado, al segundo, al tercero, y
al cuarto entre 5 pelı́culas diferentes en un festival de cine?
El primer Premio se puede dar de 5 maneras, el segundo también, el tercero también y el cuarto
también.
Por tanto hay 54 = 625 posibilidades.
Las muestras ordenadas y con repetición se denominan Variaciones con repetición y lo expresare-
mos:
V Rkn = nk
Ejercicio: ¿Cuántos números de tres cifras (no necesariamente distintas) pueden formarse con los
dı́gitos 1,6,7,8,9?.
1.3. Muestras no ordenadas

1.3.1. Muestras no ordenadas y sin repetición
Para estudiar este caso, es conveniente fijarse en un ejemplo.
Supongamos que tenemos una bolsa con 5 bolas numeradas del 1 al 5. Sacamos dos bolas, sin
importarnos el orden y sin repetir, ¿cuántos posibles resultados hay?.
Examinemos las posibilidades. Si el orden fuese importante ya sabemos que tendrı́amos 5·4 = 20
posibilidades (V52 = 5 · 4) que serı́an:
1, 2 1, 3 1, 4 1, 5
2, 1 2, 3 2, 4 2, 5
3, 1 3, 2 3, 4 3, 5
4, 1 4, 2 4, 3 4, 5
5, 1 5, 2 5, 3 5, 4
Ahora bien, como no nos importa el orden, para nosotros las parejas 2,1 y 1,2 que son 2, en realidad
sólo deberı́an contar como una, y lo mismo ocurre con el resto de parejas.
Estamos contando cada pareja 2 veces. Por tanto, para obtener el número de parejas que buscamos
tenemos que dividir entre 2. Ası́ resulta que el número de muestras no ordenadas y sin repetición que
20
tenemos es de: = 10 , sólo 10 posibilidades que son:
2
{1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5}, {4, 5}
donde las llaves indican que el orden no importa.
Si sacásemos 3 bolas en lugar de 2, tendrı́amos los trı́os: 1,2,3 1,2,4 1,2,5 etc. . . en total 5·4·3 =
60 posibilidades (V53 = 5 · 4 · 3).
Razonando de igual manera al caso anterior, todos aquellos trı́os en los que estuviesen por ejemplo,
el 1, el 2 y el 3 estarı́an repetidos. Ahora bien, ¿cuántas veces se repite cada trı́o?. Veamos, tomando
como ejemplo los trı́os con 1,2 y 3 obtenemos: 1,2,3 1,3,2 2,1,3 2,3,1 3,1,2 3,2,1 6 posibilidades
(P3 = 3!) que en realidad representan lo mismo pues no nos importa el orden. Lo mismo ocurre con
cada trı́o, de modo que cada uno de ellos se repite 6 veces, ası́ pués si no tenemos en cuenta el orden,
60
el número de muestras no son 60 sino: = 10 maneras (no ordenadas y sin repetición).
6
Ejercicio: Escribir los 10 trı́os del ejemplo anterior.
Formalizando lo anterior, si la población es de tamaño n y se extraen muestras de tamaño k, si
fuesen ordenadas serı́an
Vnk = n · (n − 1) · . . . · (n − k + 1)
pero como son no ordenadas tenemos que dividir por el número de maneras de ordenar esas muestras
de tamaño k, es decir hay que dividir por
Pk = k!
Resumiendo, el número de muestras no ordenadas y sin repetición de tamaño k que se extraen de

una población de tamaño n es:
Vnk
Pk
Las muestras no ordenadas y sin repetición se denominan Combinaciones sin repetición y las
expresaremos:
Vk
Cnk = n
Pk
El número de combinaciones sin repetición Cnk se recuerda de manera más sencilla mediante otra
fórmula:
n
Cnk =
k

n
La expresión se denomina número combinatorio y se lee ”n sobre k”.
k
Una regla sencilla que permite calcular este número combinatorio es:

n n!
=
k k! · (n − k)!
Ejemplos:
1. ¿De cuántas maneras se pueden sacar 3 bolas numeradas en cualquier orden, de una bolsa que
contiene 5 bolas?.
Serı́an combinaciones de 5 elementos de los que sacamos 3, es decir, tenemos que calcular:

5 5!
C53 = = = 10
3 3! · 2!
son las maneras que habı́amos calculado en el ejemplo de la introducción.
2. ¿De cuántas formas se puede formar un grupo de trabajo de 6 alumnos de entre una clase de
27?.
En este caso son combinaciones (no importa el orden ) de 27 elementos de los que se escogen 6
, es decir:
6 27 27! 27!
C27 = = = = 296010
6 6! · (27 − 6)! 6! · 21!
(¡Compruébalo!).
Ejercicio: ¿De cuántas maneras se pueden extraer 6 bolas de un bombo que contiene 49 bolas?
(Loterı́a Primitiva)
Hay algunos tipos más de muestras, en concreto las muestras no ordenadas con repetición, pero
no se estudiarán en este momento.
Números combinatorios y factoriales en la calculadora
Las calculadoras cientı́ficas poseen algunas teclas útiles para el cálculo de factoriales y números com-
binatorios.
Para el factorial, se utiliza la tecla !, que suele encontrarse sobre alguna otra tecla, por lo que al
utilizarla habrá que presionar antes la tecla SHIFT (o INV).
Dado que los factoriales crecen a una velocidad enorme, un calculadora normal sólo puede calcular
hasta el factorial de 69, y ya si pretendemos calcular 70!, se produce un mensaje de error.
Observemos que un número tan inofensivo como 13! ya tiene un valor de 6.227.020.800
Para el caso de los números combinatorios, algunas calculadoras poseen una función para calcu-
larlos. Suele estar situada sobre la tecla de la división (depende mucho del modelo de calculadora).
Dicha función es
nCr

n 5
y calcula el número combinatorio , de modo que si queremos calcular , basta con introducir
r 3
el 5, luego SHIFT (o INV) , posteriormente el 3 y luego presionar la tecla de = para obtener 10. (Ya
lo habı́amos calculado antes).
Evidentemente si alguna de estas funciones tiene una tecla propia en la calculadora, es decir, no
está encima de otra, no es necesario presionar la tecla SHIFT (o INV) para operar con ella.
Capı́tulo 10
DIFERENCIABILIDAD DE
FUNCIONES. OPTIMIZACIÓN
10.1. Introducción
Sin duda uno de los pilares básicos de las matemáticas lo constituye el cálculo diferencial (o cálculo
de derivadas). Las aplicaciones de las derivadas son múltiples y se dan en muchos y muy diversos
campos.
El cálculo diferencial tuvo su gérmen en los trabajos del ilustres matemáticos como I.Newton y
G.W. Leibnitz, quienes, independientemente uno del otro, llegaron a resultados similares en el siglo
XVII.
En este tema se añalizarán algunas de las principales aplicaciones de las derivadas de funciones,
que posibilitan el cálculo de extremos relativos, concavidad y puntos de inflexión, facilitan el trazado
de curvas y sirven de herramienta para la resolución de los llamados problemas de optimización, en
los cuales se trata de encontrar la solución óptima (máxima o mı́nima) a cierto problema.
10.2. Introducción al concepto de derivada. Tasas de variación me-

dia e instantánea.
Sabemos que las funciones son crecientes en ocasiones, decrecientes en otras, e incluso constantes
en alguna de sus partes.
Ahora bien, no todas las funciones crecientes crecen de igual modo, e incluso una misma función
creciente puede crecer de distinta forma, dependiendo de que nos encontremos en una parte u otra.
−x
Analicemos un ejemplo. La siguiente figura muestra la gráfica de la función f (x) = :
x−2
Es evidente que la función es creciente a partir del punto de abscisa x = 2. Ahora bien, ¿siempre
crece de igual modo?.
168
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 169
Evidentemente no.
Tomemos un intervalo, por ejemplo el intervalo [3, 4].
¿Cuánto ha crecido la función en ese intervalo?. Como:
−3
f (3) = = −3
1
y
−4
f (4) = = −2
2
la función ha crecido en realidad:
f (4) − f (3) = 1
1 unidad.
Si nos fijamos en otro intervalo donde la función también sea creciente, el [4, 6], veamos como crece
la función.
Como f (4) = −2 y
−6 −3
f (6) = =
4 2
el crecimiento total es de
−3 1
f (6) − f (4) = − (−2) =
2 2
tan sólo media unidad, aunque el intervalo es dos veces mayor que el primero.
Podemos inferir entonces que la función es mucho más creciente, o que crece más rápidamente en
el intervalo [3, 4] que en el [4, 6].
La formalización de estas ideas la da la Tasa de Variación Media de una función.
Definición: Se llama Tasa de Variación Media en un intervalo [a, b] de una función f (x), y se expresa
por T V M [a, b], al cociente:
f (b) − f (a)
T V M [a, b] =
b−a
La T V M no es más que la diferencia entre los valores de la función en los extremos del intervalo
dividida entre la longitud del intervalo.
Por tanto, de esta primera definición podemos deducir algunas propiedades:
* Si la T V M en el intervalo es positiva, significa que la función crece, globalmente en el intervalo.
(Entiéndase globalmente en el sentido de que no es necesariamente creciente en todo el intervalo, pero
en definitiva hay un crecimiento de la función en dicho intervalo).
* Si la T V M en el intervalo es negativa, la función decrecerá.
* La magnitud del crecimiento o el decrecimiento dependerá de la magnitud de la T V M .
Ası́ pues la T V M nos da una idea de cómo crece o decrece la función y con qué rapidez lo hace.
Sin embargo, la T V M no resuelve todos los problemas, puesto que nos podemos plantear si la
función es creciente o no en un punto concreto, no en un intervalo.
La T V M y el concepto de lı́mite solucionan el problema:
Si queremos saber si la función tiene una tendencia creciente o decreciente en un punto a, utiliza-
remos el concepto de T V M como antes en un intervalo [a, a + h]:
f (a + h) − f (a) f (a + h) − f (a)
T V M [a, a + h] = =
a+h−a h
A medida que nos acercamos al punto a, es decir, a medida que h se acerca a 0, la tasa de variación
media en ese intervalo se acerca al dato buscado, la tasa de variación en ese punto concreto. Más
concretamente:
Definición: Se llama Tasa de Variación Instantánea en un punto a de una función f (x) al valor,
denotado por T V I(a):
f (a + h) − f (a)
T V I(a) = lı́m
h→0 h
x
Ejemplo: Calcular la tasa de variación instantánea de la función f (x) = en el punto 2.
x−1
Aplicando la definición:
2+h 2 2+h
f (2 + h) − f (2) − 2−1
2+h−1 −2
T V I(2) = lı́m = lı́m = lı́m 1+h =
h→0 h h→0 h h→0 h
2+h−2−2h −h
1+h −h −1
= lı́m = lı́m 1+h = lı́m = lı́m =1
h→0 h h→0 h h→0 h(h + 1) h→0 h + 1
Ejercicio: Calcula la Tasa de Variación Instantánea para las siguientes funciones en los puntos indi-
cados:
2x − 1
a) f (x) = en x = 0 y x = −1.
x+1
b) g(x) = √x3 − x + 3 en x = 1 y x = −2.
c) h(x) = x + 3 en x = 6 y x = −2.
10.3. Definición de derivada. Reglas de derivación. Interpretación

geométrica
La tasa de variación instantánea en un punto es precisamente la derivada de la función en un
punto. Formalicemos:
Definición: Dada una función f (x) y un punto a, se llama derivada de la función f (x) en el punto
a, y se representa por f (a) a:
f (a + h) − f (a)
f (a) = lı́m
h→0 h
es decir la derivada en un punto es la tasa de variación instantánea en ese punto.
El problema que nos podemos encontrar es el siguiente.

Si tenemos una función, digamos f (x) = 2x2 + 1, y calculamos su derivada en un punto x = −3,
tendremos que hacer:
f (−3 + h) − f (−3) 2(−3 + h)2 + 1 − (2(−3)2 + 1)

f (−3) = lı́m = lı́m =
h→0 h h→0 h
2(9 + h2 − 6h) + 1 − 19 2h2 − 12h h(2h − 12)
= lı́m = lı́m = lı́m = lı́m 2h − 12 = −12
h→0 h h→0 h h→0 h h→0
Ahora bien, si queremos calcular la derivada en el punto 2 de la misma función, tenemos que volver a
calcular ese lı́mite, lo cuál es un trabajo engorroso.
Conviene, por tanto calcular la función derivada de f (x), es decir f (x).
Esta función derivada permite calcular la derivada en cualquier punto sin más que sustituir en el
punto concreto. Por ello es conveniente dominar las llamadas reglas de derivación para las funciones
más habituales.
Por otra parte, es posible calcular las derivadas sucesivas de una función.
La derivada segunda será la derivada de la función derivada, y se representará por f (x), y ası́ su-
cesivamente las funciones derivadas tercera (f (x)), cuarta, etc.
10.3.1. Propiedades de las derivadas. Reglas de derivación

1. La derivada de una constante es nula:
f (x) = k =⇒ f (x) = 0
donde k ∈ R.
2. Derivada de la suma (o diferencia de funciones):
(f ± g)(x) = f (x) ± g (x)
3. Derivada del producto de una función por una constante:
(k · f ) (x) = k · f (x)
donde k ∈ R.
4. Derivada del producto de funciones:
(f · g) (x) = f (x) · g(x) + f (x) · g (x)
5. Derivada del cociente de funciones:

f f (x) · g(x) − f (x) · g (x)
(x) =
g (g(x))2
6. Derivada de la composición de funciones (Regla de la cadena):
(f ◦ g) (x) = f (g(x)) · g (x)

10.3.2. Derivadas elementales

Función elemental Derivada
1.- f (x) = xk , k ∈ R f (x) = k · xk−1
2.- f (x) = ex f (x) = ex
3.- f (x) = ax , a ∈ R+ f (x) = ax · ln a
1 1
4.- f (x) = logax, a ∈ R+ f (x) = ·
x ln a
1
5.- f (x) = ln x f (x) =
x
6.- f (x) = sen x f (x) = cos x
7.- f (x) = cos x f (x) = −sen x
1
8.- f (x) = tan x f (x) = 1 + tan2 x = sec2 x =
cos2 x
9.- f (x) = csc x f (x) = − cot x · csc x
10.- f (x) = sec x f (x) = tan x · sec x
−1
11.- f (x) = cot x f (x) = = − csc2 x
sen 2 x
1
12.- f (x) = arc sen x f (x) = √
1 − x2
−1
13.- f (x) = arc cos x f (x) = √
1 − x2
1
14.- f (x) = arctan x f (x) =
1 + x2
√ 1
15.- f (x) = x f (x) = √
2· x
√ 1
16.- f (x) = n
x f (x) = √
n
n · xn−1
Con todas estas propiedades es mucho más fácil derivar, por ejemplo, para la función y el punto
anterior, calculamos la función derivada:
f (x) = 2x2 + 1 =⇒ f (x) = 4x
y ahora, conocida la función derivada podemos calcular la derivada en cualquier punto: En x = 2,
f (2) = 4 · 2 = 8
En x = −3,
f (−3) = 4 · (−3) = −12
Es mucho más cómodo y no tenemos que recurrir a la definición.
10.3.3. Interpretación geométrica de la derivada

La derivada tiene una interpretación geométrica muy sencilla.
Observemos la función f (x). Si calculamos las respectivas tasas de variación media en los intervalos
que se acercan al punto a, como la tasa de variación media es:
f (a + h) − f (a)
T V M [a, a + h] =
h
este cociente corresponde a la pendiente (o inclinación) de la recta que une los puntos (a, f (a)) y
(a + h, f (a + h)):
f (a + h) − f (a)
Figura 10.1: La pendiente de la recta secante es .
h
Por tanto cuando nos acercamos al punto a, es decir, cuando calculamos el valor de la tasa de
variación instantánea o derivada en el punto a, dicho valor es precisamente la pendiente de la recta
tangente en el punto a, es decir, aquella recta que sólo corta (en las cercanı́as del punto) a la función
f (x) en el punto a.
Figura 10.2: La pendiente de la recta tangente es f (a).

Recordemos que la pendiente de una recta es, en cierta forma, la inclinación de la recta.
Si α es al ángulo que forma la recta con el eje x y m es la pendiente de la recta, se cumple que:
m = tan α
Figura 10.3: La pendiente de la recta tangente es m = tan α
Ası́, si f (x) es la función y queremos calcular la tangente en el punto (a, f (a)), sabemos que la
pendiente de la recta tangente es m = f (a), y utilizando la ecuación de la recta en la forma punto-
pendiente, sabemos que la ecuación de dicha recta tangente es:
y − f (a) = f (a) · (x − a)
Ejemplo: Calcula la ecuación de la recta tangente a la curva f (x) = e2x+2 en el punto −1.
Como a = −1, en primer lugar calculamos:
f (−1) = e−2+2 = e0 = 1
Para calcular f (−1), derivamos:

f (x) = 2 · e2x+2
y por tanto la derivada en el punto a = −1 será:
f (−1) = 2 · e−2+2 = 2 · e0 = 2
Con estos datos, la ecuación de la recta tangente es:
y − f (−1) = f (−1) · (x − (−1)) =⇒ y − 1 = 2(x + 1) =⇒ y = 2x + 3

Graficamente la función y la recta tangente son:
Figura 10.4: Curva f (x) = e2x+2 y tangente en x = −1, y = 2x + 3.
10.4. Aplicaciones de las derivadas a la Fı́sica y la Economı́a

10.4.1. Aplicación a la Fı́sica
La derivada tiene una importante aplicación en el campo de la fı́sica.
Si una partı́cula lleva un movimiento cualquiera en el que el espacio recorrido viene dado por una
función e(t), es decir, el espacio dado en función del tiempo, entonces se cumple que:
a) La derivada del espacio, e (t) representa la velocidad de la partı́cula en el instante t, es decir, la
derivada del espacio es la velocidad:
v(t) = e (t)
b) Además, la derivada de la velocidad, v (t) representa la aceleración de la partı́cula en cualquier
instante t, es decir, la derivada de la velocidad (o la derivada segunda del espacio) es la aceleración:
a(t) = v (t) = e (t)
Ejemplo: El espacio recorrido por un móvil viene dado por la función e(t) = 3t2 − t + 1.
a) Calcular la tasa de variación en el intervalo [2, 6].
b) Hallar la velocidad en el instante t = 0.
c) Hallar la velocidad y aceleración en el instante t = 2.
a) Aplicando la fórmula:
e(6) = 108 − 6 + 1 = 103, e(2) = 12 − 2 + 1 = 11
luego:
e(6) − e(2) 103 − 11 92
T V M [2, 6] = = = = 23 m/s
6−2 4 4
b) La velocidad será:
v(t) = e (t) = 6t − 1 =⇒ v(0) = −1 m/s
c) En el instante 2:
v(2) = 11 m/s
Y la aceleración en ese mismo instante;
a(t) = v (t) = 6
Por tanto,
a(2) = 6 m/s2
la aceleración es constante, es un movimiento uniformemente acelerado.
10.4.2. Aplicación a la Economı́a

La aplicación a la Economı́a se refiere al concepto de marginalidad.
Ası́, el coste marginal de fabricación de un producto es el incremento de coste que se produce
cuando se aumenta la producción en una unidad más.
Del mismo modo se habları́a del incremento de los ingresos por la última unidad vendida, ingreso
marginal.
En cualquier caso, siempre que se utilice el término marginal , se trata de la derivada de la función
de que se esté tratando, respecto de la variable de producción, que se mide en unidades fabricadas.
Supongamos, por ejemplo, que la función de costes de cierto producto viene dada por la expresión
c(x) = 30 + 50x − x2 , donde c(x) se expresa en euros y x en unidades.
El coste marginal para producir la unidad x + 1 serı́a c (x) = 50 − 2x.
En realidad, la derivada no proporciona exactamente el coste marginal, sino una aproximación
que facilita el cálculo. Dicho coste marignal, rigurosamente, viene dado por c(x + 1) − c(x), pero esta
diferencia se puede aproximar bien por la derivada c (x).
Si queremos calcular el coste marginal producido al producir la 3ª unidad, fijémonos en que es-
tarı́amos calculando el coste marginal de la unidad nº 2, c (2) = 46, es decir, 46 euros.
Si no utilizásemos la derivada, el coste marginal serı́a:
c(3) = 30 + 150 − 9 = 171, c(2) = 30 + 100 − 4 = 126 =⇒ c(3) − c(2) = 171 − 126 = 45
no es el valor que obtenı́amos con la derivada, pero es una buena aproximación.

Las funciones de la Economı́a tienen un campo de validez que, por lo general, es restringido respecto
al dominio de definición de la función.
En este caso, por ejemplo, la función es válida desde x = 0 hasta x = 25; a partir de ahı́, si obser-
vamos el coste marginal, disminuyen los costes de fabricación, lo que es absurdo si se está fabricando
más.
Notemos, además que si queremos calcular el coste marginal si se quiere producir la unidad número
n, hemos de calcular la función de coste marginal evaluada en la unidad anterior, que es la última
unidad producida, es decir, en la unidad n − 1.
Lo mismo se puede decir si la función es de ingresos o de beneficios.
Ejercicios:
1. El desplazamiento de un móvil que se mueve a lo largo de una linea recta viene dado por la
2
función e(t) = et − 1.
Halla la velocidad y la aceleración del movimiento. En el instante inicial, ¿cuáles son éstas?.
2. Las funciones de ingresos y gastos correspondientes a cierto producto de consumo son, respecti-
vamente:
I(x) = 80x − 0 1x2 , C(x) = 500 + 20x
. Halla la función beneficio y el beneficio marginal. ¿Para qué valores de x están definidas estas
funciones?.
10.5. Derivabilidad y continuidad

Se estudió en el tema anterior el concepto de continuidad de una función en un punto.
Vimos, por ejemplo, que intuitivamente se puede decir que una función es continua cuando se
puede dibujar sin levantar el lápiz del papel, o de manera más formal, cuando en el punto coinciden
los lı́mites laterales con el valor de la función en el punto, esto es:
lı́m f (x) = lı́m f (x) = f (a)

x→a+ x→a−
La condición para que una función sea derivable es más fuerte, más restrictiva. Para ello es necesario
definir las derivadas laterales.
Definición: Dado un punto a y una función f (x), se define la derivada lateral por la derecha de la
función f (x) y se expresa por f+ (a), como:
f (a + h) − f (a)
f+ (a) = lı́m
h→0+ h
Dado un punto a y una función f (x), se define la derivada lateral por la izquierda de la función f (x)
y se expresa porpor f− (a), como:
f (a + h) − f (a)
f− (a) = lı́m
h→0− h
Definición: Diremos que una función es derivable en un punto a cuando existen y son finitas las
derivadas laterales y son iguales, es decir:
f+ (a) = f− (a)
Ejemplo: Estudiar la continuidad y derivabilidad de la función:

−x si x ≤ 0
f (x) =
x si x > 0
Calculando los lı́mites laterales:

lı́m f (x) = lı́m x = 0
x→0+ x→0
lı́m f (x) = lı́m −x = 0

x→0− x→0
Además f (0) = 0, por tanto la función es continua en el punto x = 0 que es el único punto conflictivo.
Analicemos la derivabilidad en x = 0:
f (0 + h) − f (0) −h − 0 −h
f− (0) = lı́m = lı́m = lı́m = lı́m −1 = −1
h→0− h h→0 h h→0 h h→0
f (0 + h) − f (0) h−0 h
f+ (0) = lı́m = lı́m = lı́m = lı́m 1 = 1
h→0+ h h→0 h h→0 h h→0
Por tanto la función no es derivable en x = 0.

Viendo la gráfica de la función, se observa lo que ocurre:
La función es continua pues se puede dibujar sin levantar el lápiz del papel, pero no es derivable
en el cero porque en dicho punto hay un punto anguloso, una “esquina”. En puntos como estos, la
función no es derivable.
Por tanto, se verifica que aunque una función puede ser continua en un punto y sin embargo no
ser derivable en ese mismo punto.
Sin embargo, la posibilidad contraria no es posible. Resumiendo:
Propiedad:
Si una función es derivable en un punto, entonces es continua en dicho punto.
Sin embargo, el recı́proco no es cierto, si una función es continua en un punto, la función puede ser o
no derivable en dicho punto.
Ejercicios:
1. Estudiar la continuidad y derivabilidad de la función:


−2x − 1 si x ≤ −2
f (x) = x2 − 3 si −2 < x ≤ 2

2x − 3 si x>2
2. Calcula a y b para que sea derivable la función:

ax + 3 si x ≤ 1
g(x) =
2x2 − b si x > 1
Indicación: Primero impón la condición de que sea continua

10.6. Aplicaciones de las derivadas al cálculo del crecimiento y de-

crecimiento de una función. Cálculo de extremos
Observemos la siguiente gráfica:
Figura 10.5: La pendiente de las tangentes (la derivada) es positiva si la función crece.
Si trazamos las correspondientes tangentes en diversos puntos, todos ellos donde la función es
creciente, obsevamos como la recta tangente está cada vez menos inclinada, lo que quiere decir (ya
que la inclinación de una recta se mide a través de su pendientes y sabemos que esta coincide con la
derivada ) que la derivada es cada vez menor.
Más aún, como las rectas tangentes tienen inclinación positiva (son rectas crecientes), las pendientes
son cada vez menores y positivas, es decir, la derivada es positiva en aquellos intervalos en los que la
función es creciente.
Si seguimos trazando tangentes, llegamos al punto 3, donde la tangente es totalmente horizontal,
es decir:
Figura 10.6: La pendiente de las tangentes (la derivada) es nula si la función tiene un extremo (un
valor máximo o mı́nimo).
Decı́amos que la pendiente era decreciente, hasta que llega al máximo de la función, donde se ha
alcanzado el valor extremo de la pendiente. La recta es horizontal, no está inclinada y su pendiente es
cero.
Si seguimos trazando las tangentes, vemos ahora lo siguiente:
Figura 10.7: La pendiente de las tangentes (la derivada) es negativa si la función decrece.
Y ahora observamos que la pendiente de la recta (la derivada) es negativa, y cada vez menor, por
tanto si la función de decreciente, afirmamos que la función derivada es negativa.
Todo lo observado anteriormente lo podemos resumir en la siguiente propiedad.
Propiedad: Dada una función f (x), se cumple que:

a) Si f (x) > 0 (la derivada es positiva) entonces la función f (x) es creciente.
b) Si f (x) < 0 (la derivada es negativa) entonces la función f (x) es decreciente.
c) Si f (x) = 0 entonces la función puede presentar un extremo relativo (máximo o mı́nimo) en
dicho punto.
La manera práctica de proceder, por tanto, para determinar los extremos de una función, ası́ como
aquellos intervalos en los que la función crece o decrece es la siguiente:
* Calculamos la derivada de la función, f (x), y la igualamos a cero, resolvemos la ecuación resul-
tante, cuyas soluciones son los posibles extremos de la función.
* Realizamos una tabla en la que tenemos que poner los puntos obtenidos anteriormente y además
los puntos conflictivos de la función (aquellos donde la función no está definida, o donde no es deriva-
ble....). Todos estos puntos se denominan puntos crı́ticos.
* En dicha tabla, estudiamos el signo de la derivada primera, f (x).
Si dicha derivada es positiva, nos indicará el crecimiento de la función, y si es negativa, será un signo
de su decrecimiento. El paso de un intervalo creciente a otro decreciente o viceversa nos indicará la
existencia de un máximo o un mı́nimo relativo de la función f (x).
Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función: f (x) = x3 − 3x.
Comenzamos calculando la derivada: f (x) = 3x2 − 3.

Igualando a cero:
3x2 − 3 = 0 =⇒ x2 = 1 =⇒ x = ±1
obtenemos dos puntos crı́ticos, y no hay más pues la función es polinómica y por tanto, su dominio
son todos los números reales y no presenta problemas. Hacemos una tabla como la siguiente:
−∞ −1 1 +∞
f (x) + − +
f (x)

Para obtener los signos de f (x) basta tomar, por ejemplo, un punto en cada intervalo y sustituir en
la expresión de la derivada.
Entre −∞ y −1 tomamos el −2, con lo que:
f (−2) = 12 − 3 = 9 > 0
positiva. Entre −1 y 1, tomamos el 0, quedando:
f (0) = −3 < 0
negativa. Entre 1 e ∞ se toma el 2, y se obtiene:
f (2) = 12 − 3 = 9 > 0
positivo.
Concluimos que la función es creciente en el intervalo (−∞, −1) ∪ (1, ∞).

La función es decreciente en (−1, 1).
Además, se observa que presenta un máximo en el punto x = −1, y un mı́nimo en x = 1.
¿Cómo calcular la segunda coordenada del máximo y el mı́nimo?.
Basta sustituir en la función:
El máximo está en el punto (−1, f (−1)) = (−1, 2).

El mı́nimo está en el punto (1, f (1)) = (1, −2).
Ası́, la representación aproximada de la función será:
Figura 10.8: Gráfica de f (x) = x3 − 3x. Intervalos de crecimiento y extremos.

Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función:
2x2 − 3x
f (x) =
ex
Derivando:
(4x − 3)ex − ex (2x2 − 3x) ex (−2x2 + 7x − 3) −2x2 + 7x − 3
f (x) = = =
(ex )2 (ex )2 ex
E igualando a cero:
−2x2 + 7x − 3 1
x
= 0 =⇒ −2x2 + 7x − 3 = 0 =⇒ x = 3, x =
e 2
No hay más puntos conflictivos, pues aunque hay denominador, nunca se hace cero, pues ex , la función
exponencial es siempre positiva, de modo que Dom f (x) = R.
Ası́ pues los únicos puntos crı́ticos son x = 3, x = 12 .
Hacemos la tabla:
1
−∞ 32 +∞
f (x) − + −
f (x)

1 1
Con lo que f (x) es creciente en , 3 , decreciente en −∞, ∪ (3, ∞).
2 2
Por tanto f (x) presenta un máximo relativo en:

9
(3, f (3)) = 3, 3 ≈ (3, 045)
e
y un mı́nimo relativo en
1 1 1 −1
,f = , ≈ (0 5, −061)
2 2 2 e 12
Gráficamente:
2x2 − 3x
Figura 10.9: Gráfica de f (x) = . Intervalos de crecimiento y extremos.
ex
10.7. Aplicaciones de las derivadas al cálculo de la concavidad y

la convexidad, puntos de inflexión. Criterio para determinar
máximos y mı́nimos.
Igual que se aplican las derivadas para el cálculo de los máximos y los mı́nimos, y el crecimiento
o decrecimiento de la función, también se pueden aplicar para calcular la concavidad y la convexidad.
Fijémonos en la función siguiente, convexa (o, para evitar ambigüedades, cóncava hacia abajo):
Figura 10.10: La pendiente de las tangentes pasa de positiva a negativa (es decir, decrece) si la función
es cóncava hacia abajo
Al trazar las tangentes, nos fijamos en que cada vez son menores.
Empiezan siendo positivas y muy grandes, van decreciendo hasta que valen cero, y luego comienzan
a ser negativas y cada vez menores. Es decir, que la función derivada es decreciente, f (x) decreciente.
Si f (x) es decreciente, es que su derivada es negativa, es decir, f (x) < 0.
Por tanto se deduce que si la derivada segunda de la función es negativa, la función es cóncava
hacia abajo.
De igual modo si nos fijamos en una función cóncava (o cóncava hacia arriba):
Figura 10.11: La pendiente de las tangentes pasa de negativa a positiva (es decir, crece) si la función
es cóncava hacia arriba
En este caso la derivada es creciente, y por tanto la derivada segunda será positiva. Es decir, si la
derivada segunda es positiva, la función es cóncava hacia arriba.
Propiedad: Dada una función f (x), se cumple que:

a) Si f (x) > 0, entonces la función f (x) es cóncava hacia arriba.
b) Si f (x) < 0, entonces la función f (x) es cóncava hacia abajo.
c) Si f (x) = 0, entonces el punto es un posible punto de inflexión (un punto donde la función
pasa de cóncava hacia arrina a cóncava hacia abajo o viceversa) de la función.
El proceso para determinar la concavidad y puntos de inflexión es, por tanto, muy similar al del
cálculo del crecimiento, únicamente hay que hacer la derivada segunda e igualarla a cero. La tabla es
similar.
Ejemplo: Calcular la concavidad y convexidad de la función:
f (x) = x3 − 3x
Calculando la derivada segunda:
f (x) = 3x2 − 3 =⇒ f (x) = 6x
Igualando a cero, 6x = 0, de donde x = 0.

Es el único punto conflictivo, pues la función es polinómica.
Haciendo la tabla:
−∞ 0 +∞
f (x) − +
f (x) ∩ ∪
Ası́ pues la función es cóncava hacia arriba en (0, ∞) y cóncava hacia abajo en (−∞, 0).
Hay un punto de inflexión es (0, f (0)) = (0, 0).
Se observa gráficamente:
Figura 10.12: Gráfica de f (x) = x3 − 3x. Intervalos de concavidad y puntos de inflexión.

Ejercicios: Estudiar la concavidad y convexidad, el crecimiento y el decrecimiento, los extremos

y puntos de inflexión de las siguientes funciones:
a) f (x) = 2x3 − 9x2
2
b) g(x) =
x
c) h(x) = x4 − 12x2 + 8
d) t(x) = x · e−2x
Además la derivada segunda permite discernir si un punto crı́tico es un máximo o un mı́nimo, en base
al siguiente resultado:
Propiedad: Si a es un punto tal que f (a) = 0 (un posible extremo relativo), entonces:
* Si f (a) > 0, entonces a es un mı́nimo de la función.
* Si f (a) < 0, entonces a es un máximo de la función.
* Si f (a) = 0 no podemos asegurar nada. (Aunque en realidad si se puede saber pero excede los
contenidos del curso).
Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función:
f (x) = x3 − 3x
Comenzamos calculando la derivada: f (x) = 3x2 − 3.

Igualando a cero:
3x2 − 3 = 0 =⇒ x2 = 1 =⇒ x = ±1
, obtenemos dos puntos crı́ticos.
Calculando la derivada segunda:
f (x) = 6x
Sustituyendo,
f (1) = 6 > 0
en x = 1 hay un mı́nimo.
f (−1) = −6 < 0
en x = −1 hay un máximo.
Como ya habı́amos obtenido anteriormente.
10.8. Representación gráfica de funciones

Con todas estas aplicaciones es sencillo representar gráficamente cualquier función, basándose en
los siguientes puntos:
1. Dominio de definición.
2. Puntos de corte con los ejes:

Con el eje x, y = 0.
Con el eje y, x = 0.
3. Simetrı́as.
Par si f (−x) = f (x).
Impar si f (−x) = −f (x).
No tiene simetrı́a si no se da ninguna de esas condiciones.
4. Ası́ntotas: Verticales, Horizontales y Oblicuas.

5. Crecimiento y decrecimiento. Extremos relativos.
6. Concavidad y convexidad. Puntos de inflexión.

3x − 1
Ejemplo: Representa gráficamente la función f (x) = .
3x2 + 1
1. Dominio de definición
Igualando a cero el denominador:

2 −1 2 −1
3x + 1 = 0 =⇒ x = =⇒ x = =
3 3
de modo que Dom f (x) = R.
2. Puntos de corte con los ejes

Con el eje x, f (x) = 0:
3x − 1 1
2
=⇒ 3x − 1 = 0 =⇒ x =
3x + 1 3

1
el punto es ,0 .
3
Con el eje y, x = 0:
3·0−1 −1
f (0) = 2
= = −1
3·0 +1 1
el punto es (0, −1).
3. Simetrı́as
3(−x) − 1 −3x − 1 3x − 1
f (−x) = 2
= 2
= 2 = f (x)
3(−x) + 1 3x + 1 3x + 1
f no es par.
3(−x) − 1 −3x − 1 3x − 1
f (−x) = = = − 2 = −f (x)
3(−x)2 + 1 3x2 + 1 3x + 1
f no es impar, luego f no tiene simetrı́as.
4. Ası́ntotas
Verticales: No tiene puesto que Dom f (x) = R.
Horizontales:
3x − 1
lı́m=0
3x2 + 1
x→∞
3x − 1 3(−x) − 1 −3x − 1
lı́m = lı́m = lı́m =0
x→−∞ 3x2 + 1 x→∞ 3(−x)2 + 1 x→∞ 3x2 + 1
Hay una ası́ntota horizontal en y = 0.

Oblicuas: No hay, pues hay horizontales.
5. Crecimiento
Derivando:
3(3x2 + 1) − 6x(3x − 1) −9x2 + 6x + 3

f (x) = = =0
(3x2 + 1)2 (3x2 + 1)2
Igualando a cero:
−1
−9x2 + 6x + 3 = 0 =⇒ −3x2 + 2x + 1 = 0 =⇒ x = 1 x =
3
No hay más puntos crı́ticos, pues Dom f (x) = R.

Haciendo la tabla:
−1
−∞ 3 1 +∞

f (x) − + −
f (x)

−1 −1
Luego f (x) es creciente en ,1 y decreciente en −∞, ∪ (1, ∞).
3 3

1 −1 −2
Tiene un máximo relativo en (1, f (1)) = 1, y un máximo relativo en , 4 =
2 3 3

−1 −6 −1 −3
, = , .
3 4 3 2
6. Concavidad
Calculando la derivada segunda, es:
54x3 − 54x2 − 54x + 6

f (x) =
(3x2 + 1)3
e igualando a cero no se obtienen raı́ces exactas, por lo que no se puede hacer este estudio.
Con los datos que tenemos, podemos hacer un esbozo de la gráfica de la función:
3x − 1
Figura 10.13: Gráfica de f (x) = .
3x2 + 1
10.9. Optimización de funciones

La última aplicación de las derivada es la optimización de funciones. Consiste en calcular los
máximos y los mı́nimos de cierta función que se obtiene de un problema surgido de una situación
cotidiana.
En estos problemas siempre se tiene:
* Una función de la que hay que calcular el máximo o el mı́nimo, y que habitualmente tiene dos
variables, x e y.
* Una relación entre x e y, que permite despejar una de las dos para obtener una función con una
sola variable.
Veamos cómo se aplica:
Ejemplo: De entre todos los números cuya suma es 36, calcula aquellos cuya suma de cuadrados
es mı́nimo.
Los números buscados son x e y.

La función a minimizar es f (x, y) = x2 + y 2 .
Tenemos dos variables, luego todavı́a no podemos derivar.
La relación que tenemos es que los números suman 36, es decir, x + y = 36.
Despejando, y = 36 − x.
Y por tanto, la función a minimizar es:
f (x) = x2 + (36 − x)2
que ya tiene sólo una vatiable.

Para buscar sus mı́nimos, calculamos la derivada f (x):
f (x) = 2x + 2(36 − x)(−1) = 2x − 72 + 2x = 4x − 72
Igualando a cero,
72
4x − 72 = 0 =⇒ x = = 18
4
Además calculando la derivada segunda:
f (x) = 4
con lo que sustituyendo:
f (18) = 4 > 0
es positivo luego el punto x = 18 es un mı́nimo.
La solución es, por tanto, un número x = 18 y el otro y = 36 − 18 = 18.
Los dos números son iguales a 18.
Ejercicios:
1. Descompón el número 48 en dos sumandos tales que el quı́ntuplo del cuadrado del primero más
el séxtuplo del cuadrado del segundo sea mı́nimo.
2. Halla un número positivo cuya suma con 4 veces su recı́proco sea mı́nima.
3. Halla las dimensiones del rectángulo de área máxima inscrito en una circunferencia de 20 cm de
radio.
4. La suma de tres números es 60. El primero más el doble del segundo más el triple del tercero
suman 120. Halla los números que verifican estas condiciones y cuyo producto es máximo.
5. Un depósito abierto de chapa y de base cuadrada debe tener capacidad para 13500 litros. ¿Cuáles
han de ser sus dimensiones para que se precise la menor cantidad de chapa?
6. Una ventana normanda consiste en un rectángulo coronado con un semicı́rculo. Encontrar las
dimensiones de la ventana de área máxima si su perı́metro es 10 metros.
7. Una hoja de papel debe contener 18 cm2 de texto impreso. Los márgenes superior e inferior
deben tener 2 cm cada uno y los laterales 1 cm. Calcular las dimensiones de la hoja para que el
gasto de papel sea mı́nimo.
Capı́tulo 11
INTEGRACIÓN. CÁLCULO DE
ÁREAS
11.1. Introducción
Si el problema del cálculo de la recta tangente llevó a los matemáticos del siglo XVII al desarrollo de
las técnicas de la derivación, otro problema, el del cálculo del área encerrada por una curva, propició el
desrrollo de las técnicas de integración.
Se trataba, por ejemplo, de hallar el área encerrada bajo la curva f (x) entre los puntos a y b:
Se conocı́an fórmulas para recintos de forma igual a figuras geométricas(rectangulares, triangulares,

e incluso algunas de curvas especı́ficas), pero si la curva no tenı́a forma regular, no se conocı́a, en
general, su área exacta.
El cálculo integral da respuesta a esta y otras cuestiones.
11.2. Primitivas. Integral indefinida

Dada un función f (x), sabemos calcular su derivada f (x), e incluso sus derivadas sucesivas, f (x),
f (x), etc.
Sin embargo ahora nos planteamos el problema recı́proco:
Dada una función f (x), se trata de encontrar otra, F (x), tal que al derivar esta última función,
obtengamos la función inicial, es decir:
F (x) = f (x)
Veamos un ejemplo:
Tomemos la función f (x) = 2x.
Se trata de encontrar una función F (x) tal que al derivarla nos de f (x).
193
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 194
Si pensamos un poco, llegamos a que tal función puede ser:
F (x) = x2
pues su derivada es precisamente f (x) = 2x.

Ahora bien, no es F (x) la única función que cumple eso.
Tomemos esta otra:
F (x) = x2 + 43
También su derivada es f (x) = 2x.
Esto nos hace ver que no sólo hay una función que cumple lo requerido, sino infinitas, sin más que
añadir cualquier número. Esto se expresa como:
F (x) = x2 + C
Una función F (x) como la que hemos encontrado se llama primitiva de f (x), y hemos visto que si una
función tiene una primitiva, entonces tiene infinitas.
Llamaremos integral indefinida de la función al conjunto de todas estas primitivas.

Lo representaremos, en el caso anterior, como:

2x dx = x2 + C, C ∈ R
Definición: Dada una función f (x), se llama primitiva de f (x) a otra función F (x) tal que:
F (x) = f (x)
Se denomina integral indefinida de f (x) al conjunto de todas las primitivas (hay infinitas) de f (x), y
se representa por:
f (x) dx = F (x) + C, C ∈ R
Ası́, el problema de calcular una primitiva de una función es inverso al de calcular una derivada; como
son operaciones inversas la suma y la resta, el producto y el cociente, la potenciación y la radicación.
11.3. Primitivas inmediatas

De modo análogo al caso de las derivadas, debemos recordar algunas primitivas de las funciones
más usuales:
1. − k dx = kx + C, C ∈ R, k ∈ R

xn+1
2. − xn dx = + C, C ∈ R, , n ∈ R, n = −1
n+1

1
3. − x−1 dx = dx = ln x + C, C∈R
x

ax
4. − ax dx = + C, C∈R
ln a

5. − ex dx = ex + C, C∈R

6. − sen x dx = − cos x + C, C∈R

7. − cos x dx = sen x + C, C∈R

1
8. − dx = arctan x, C∈R
1 + x2

1
9. − √ dx = arc sen x + C, C∈R
1 − x2

−1
10. − √ dx = arc cos x + C, C ∈ R
1 − x2
Estas primitivas permiten calcular algunas integrales sencillas.
Además es conveniente la utilización de las dos propiedades siguientes:
1.
k · f (x) dx = k · f (x) dx, k∈R
Esta propiedad indica que si hay un número multiplicando a toda la integral, entonces se puede
sacar fuera de la integral.
2.
(f (x) ± g(x)) dx = f (x) dx ± g(x) dx
Lo que indica esta propiedad es que si tenemos una suma (o resta) de dos funciones, entonces
podemos separar la integral en la suma (o resta) de dos integrales.
Utilizando estas propiedades de manera combinada, se calculan las primeras integrales sencillas.
Veamos algunos ejemplos:
Ejemplo: Calcular las integrales siguientes:

√ 2
a) x dx b) (15x4 + 10x3 − 12x2 − 8x + 5) dx c) x
+ e − 3 cos x dx
x
Para la primera integral , expresamos la raı́z en forma de potencia y utlizamos la integral inmediata
2: 1 3 3 √ √
√ 1 x 2 +1 x2 2x 2 2 x3 2x x
x dx = x dx = 1
2 = 3 = = = + C, C ∈ R
2 +1 2
3 3 3
En la segunda, separamos las sucesivas sumas y restas y sacamos los números fuera de las integrales,
aplicando las propiedades de la integral para luego aplicar la integral inmediata 2 de nuevo:

4 3 2 4 3 2
(15x + 10x − 12x − 8x + 5) dx = 15x dx + 10x dx − 12x dx − 8x dx + 5 dx =

4 3 2 15x5 10x4 12x3 8x2
= 15 x dx + 10 x dx − 12 x dx − 8 x dx + 5 dx = + − − + 5x =
5 4 3 2
5x4
= 3x5 + − 4x3 − 4x2 + 5x + C, C ∈ R
2
Por último, volvemos a separar las integrales y los números y aplicamos la tabla de integrales inme-
diatas:

2 x 2
+ e − 3 cos x dx = dx + ex dx − 3 cos x dx =
x x

1
=2 dx + ex dx − 3 cos x dx = 2 ln x + ex − 3 · sen x + C, C ∈ R
x
Ejercicio: Calcular las siguientes integrales:

5x3 − 4x
a) dx b) sen x + 2 cos x + 3 dx c) (18x + 1) dx
x4

2 2 3 4 2 √
d) (2x − 1) (2x + 1) dx e) + 2 + 3 dx f ) (x + 2) dx g) 2 3 x dx
x x x
11.4. Integración por cambio de variable

A veces las integrales no son tan simples como las inmediatas, sino que hay pequeños detalles que
nos impiden aplicar la tabla de primitivas.
Por ejemplo, podemos calcular sin problema la integral:

sen x dx = − cos x + C, C ∈ R
pues es inmediata.
Sin embargo otra integral tan parecida y de aspecto simple como:

sen (2x + 6) dx
ya no la sabemos calcular porque no aparece en la tabla de primitivas inmediatas.

El razonamiento a utilizar en este caso es el siguiente:
Si en vez de tener en la integral anterior 2x + 6, tuviésemos simplemente x, la integral serı́a inmediata.

Por tanto, la idea es la siguiente, vamos a cambiar la variable x por otra nueva (que usualmente
denotaremos por t) y que simplifica la tarea.
Llamaremos t a la variable que tiene la siguiente relación con x, en este caso:
t = 2x + 6
Ahora bien, se nos plantea otro problema. En la integral aparece el término dx (léase diferencial de x).
Lo lógico es que si la integral tiene una nueva variable t, en vez de aparecer diferencial de x, aparezca
diferencial de t, para no mezclar las variables.
Aunque pueda parecer una forma un poco artificial, daremos aquı́ la forma para calcular dt.
Simplemente se deriva en la expresión del cambio de variable:
Derivando t = 2x + 6, se obtiene, 1 · dt = 2 · dx, es decir que:
dt
dx =
2
Una vez calculado esto, ya podemos calcular la integral:

dt 1 1
sen (2x + 6) dx = sen t · = sen t · dt = (− cos t) =
cambio 2 2 2
−1
= cos (2x + 6) + C, C ∈ R
deshacer el cambio 2
El método del cambio de variable permite resolver de manera simple integrales que de otro modo no
se podrı́an abordar.
Ejemplo:
3 −5
e2x x2 dx
Razonando como antes, se observa que la parte problemática de la integral está en el exponente de
dicha integral.
Hacemos entonces el cambio:
t = 2x3 − 5
y calculando el diferencial:
dt = 6x2 dx
de donde despejamos la parte que aparece en la integral:
dt
x2 dx =
6
y por tanto la integral queda reducida a:

3 dt 1 1 1 2x3 −5
e2x −5 x2 dx = et = et dt = et = e + C, C ∈ R
cambio 6 6 6 deshacer el cambio 6
Ejemplo:
(6x2 + 15x + 3)178 (12x + 15) dx
El cambio necesario en este caso es:

t = 6x2 + 15x + 3
con lo que queda:
dt = 12x + 15 dx
y por tanto la integral es:

2 178 t179
(6x + 15x + 3) (12x + 15) dx = = t178 dt = =
cambio 179
(6x2 + 15x + 3)179
= + C, C ∈ R
deshacer el cambio 179
Ejercicios: Calcula mediante integración por cambio de variable las siguientes integrales:

3x2 − 2x 3 2 2
a) dx Cambio:t = x − x + 3 b) cos (x + 1) 2x dx c) 5sen (3x + 1) dx
x3 − x2 + 3

2x + 1 5 1
d) cos dx e) ex+2 dx f ) (x − 4) 7 dx g) dx
3 1+x

1 + cos x x2 1
h) dx i) xe dx j) dx
x + sen x (x + 2)3
11.5. Determinación de una primitiva particular de una función

Ya hemos visto que si una función tiene una primitiva, entonces tiene infinitas, lo que representamos
añadiendo la constante C al cálculo de la integral.
Ahora bien, si queremos determinar una primitiva concreta de entre todas esas infinitas, necesita-
mos un dato más, como por ejemplo, un punto por el que pase dicha función.
Ejemplo: Calcular la primitiva de la función:
f (x) = x3 − 2x + 5
que pasa por el punto (1, 3).
Calculamos en primer lugar todas las primitivas de f (x), es decir la integral indefinida:

x4 x2 x4
x3 − 2x + 5 dx = − 2 + 5x = − x2 + 5x + C, C ∈ R
4 2 4
De todas estas primitivas, la única que cumple que pasa por el (1, 3), es aquella tal que:
14
− 12 + 5 · 1 + C = 3
4
es decir
1 17 −5
− 1 + 5 + C = 3 =⇒ + C = 3 =⇒ C =
4 4 4
y por tanto la primitiva buscada es:
x4 5
F (x) = − x2 + 5x −
4 4
11.6. El problema del cálculo del área

Ya se dijo que el desarrollo del cálculo integral en buena medida se debe al problema de calcular
áreas de funciones como esta:
Una aproximación para calcular el área consiste en dividir el intervalo en otros más pequeños y
calcular el área de los rectángulos que se forman bien al tomar el valor de la función en un extremo
del intervalo, bien en otro entremo, es decir:
Figura 11.1: Aproximación del área mediante rectángulos más pequeños que la función
En este caso, hemos dividido el intervalo mayor en 4 subintevalos más pequeños y hemos tomado
como altura de los rectángulos el valor de la función en el extremo superior del intervalo.
Ası́ la suma de las áreas de los rectángulos son más pequeñas que el área buscada.
Área suma rectángulos< Área de la función
Esta suma, en la que la suma de las áreas de los rectángulos es menor que el área total se denomina
suma inferior de la función en el intervalo.
Pero podrı́amos haber tomado estos otros rectángulos:
Figura 11.2: Aproximación del área mediante rectángulos más grandes que la función
Ahora la suma del área de los rectángulos es mayor que el área total, es decir:
Área de la función< Área suma rectángulos
Esta suma, en la que la suma de las áreas de los rectángulos es mayor que el área total se denomina
suma superior de la función en el intervalo.
Por tanto, el área buscada está entre la suma superior y la suma inferior de la función:
Suma inferior≤ Área≤ Suma superior
Además, obervemos lo que ocurre cuando los subintervalos que tomamos son cada vez menores:
Vemos que las sumas inferiores son cada vez mayores y cada vez más cercanas al área buscada, a
medida que los intervalos son más pequeños.
Figura 11.3: La aproximación se mejora al aumentar el número de rectángulos
Por contra, las sumas superiores son cada vez más pequeñas y también cada vez más cercanas al
área buscada, a medida que los intervalos son más pequeños.
A medida que los subintervalos son menores, las sumas superiores e inferiores se acercan al área
buscada. Para llegar a calcular dicha área, necesitamos calcular una suma infinita (la de los infinitos
rectángulos a medida que estos son más pequeños), cosa que en matemáticas se denomina sumar una
serie.
Esto excede con mucho los contenidos del curso. Lo que se necesita saber es que tanto las sumas
superiores como las sumas inferiores convergen (se acercan) al área buscada, y dicha suma se representa,
si la función es f (x) y el intervalo es [a, b], por la integral:
b
f (x) dx
a
Ahora bien, el siguiente problema es cómo se calcula esta integral, pues en las integrales indefinidas
no habı́amos incluido ningún intervalo.
11.7. La integral definida. La regla de Barrow

Se denomina integral definida de la función f (x) en el intervalo [a, b] a la expresión:
b
f (x) dx
a
La integral definida posee las mismas propiedades que la definida, es decir:

1.
b b
k · f (x) dx = k · f (x) dx, k∈R
a a
2.
b b b
(f (x) ± g(x)) dx = f (x) dx ± g(x) dx
a a a
La integral definida, puesto que representa, si la función es positiva, el área que encierra la función
con el eje x, tiene algunas propiedades tales como:
1. Si c es un punto que está dentro del intervalo [a, b], entonces:
b c b
f (x) dx = f (x) dx + f (x) dx
a a c
En otras palabras, el área de la función desde a hasta b es la suma de las áreas de la función
desde a hasta c y desde c hasta b, si la función es positiva.
2. Si calculamos la integral de derecha a izquierda ,en vez de izquierda a derecha se cumple:

b a
f (x) dx = − f (x) dx
a b
3. La integral cuando el intervalo se reduce a un punto es cero:

a
f (x) dx = 0
a
Pero sin duda la propiedad más importante, y que permite calcular integrales definidas es la llamada
Regla de Barrow.
Regla de Barrow: Si f (x) es una función que tiene primitiva F (x), y queremos calcular su integral
definida en un intervalo [a, b], se cumple que:
b
f (x) dx = F (x)]x=b
x=a = F (b) − F (a)
a
Ejemplo: Calcular la integral definida: 3

x2 dx
1
e interpretar el resultado geométricamente.
Aplicando la regla de Barrow, queda:

3 x=3
x3 27 1 26
2
x dx = = − = ≈ 8 67 u2
1 3 x=1 3 3 3
donde u2 representa unidades de área.

Geométricamente es el área representada en la figura:
Ejercicio: Utilizando la regla de Barrow, calcula el valor de las siguientes integrales definidas:
3 4 4 1
3 2 2 4 2
a) (2x −4x +5x−2) dx b) (3x+1) dx c) (2x −3x −7) dx d) (x+1)(x−2) dx
1 −1 2 −2
11.8. Aplicaciones de la integral definida al cálculo de áreas de re-

cintos planos
La aplicación de la integral definida para el cálculo de áreas depende de cómo sea la función en el
intervalo concreto. Se pueden presentar los siguientes casos:
11.8.1. Áreas limitadas por una función y el eje x

1. La función es siempre positiva siempre en el intevalo: En este caso el área simplemente viene
dada por:
b
Área = f (x) dx
a
donde a y b son los puntos entre los que queremos calcular el área, y que habitualmente son los
puntos de corte de la función con el eje x.
Geométricamente:
2. La función se siempre negativa dentro del intervalo: En este caso el área viene dada por:
b

Área = f (x) dx
a
Geométricamente:
3. Si la función es a veces positiva y a veces negativa en el intervalo, se calculan los puntos de corte
y se calculan las integrales sucesivas, utilizando los apartados anteriores:
En la figura, serı́a: b
c d
Área = f (x) dx + f (x) dx + f (x) dx
a c d
En cualquier caso, y cuando calculemos áreas, siempre es conveniente comenzar por calcular los puntos
de corte de la función con el eje x para saber si es positiva o negativa y calcular las integrales
correspondientes, o bien utilizar siempre el valor absoluto para asegurarnos de que el resultado es
positivo.
Ejemplo: Calcular el área que encierra con el eje x la gráfica de la función:
f (x) = x3 − 7x2 + 10x
No hace falta dibujar la gráfica.

Calculamos los puntos de corte con el eje x:

3 2 2 x=0
x − 7x + 10x = 0 =⇒ x(x − 7x + 10) = 0 =⇒ =⇒ x = 0, x = 2, x = 5
x2 − 7x + 10 = 0
Corta al eje x en (0, 0), (2, 0) y (5, 0).

Veamos cómo es la función entre 0 y 2. Tomamos un valor situado en ese intervalo y lo sustituimos
en la función. Se obtiene:
f (1) = 13 − 7 · 12 + 10 · 1 = 1 − 7 + 10 = 4
como 4 es positivo, significa que la función es positiva en ese intervalo, luego el área será:
2 x=2
3 x42 x3 x2
Área = x − 7x + 10x dx = − 7 + 10 =
0 4 3 2 x=0
4 4
2 23 22 0 03 02 56 16 2
= − 7 + 10 − − 7 + 10 = 4− + 20 = u
4 3 2 4 3 2 3 3
En el otro intervalo, entre el 2 y el 5, tomamos otro valor para saber si la función es positiva o negativa:
f (3) = 33 − 7 · 32 + 10 · 3 = 27 − 63 + 30 = −6
la función es negativa en el intervalo, luego el área será:

5 4 x=5
x x3
x2

Área = x3 − 7x2 + 10x dx = − 7 + 10 =
2 4 3 2 x=2
4 4
5 5 3
5 2
2 2 3
2 2 −125 16 −63 63 2
= − 7 + 10 − − 7 + 10 = − = = u
4 3 2 4 3 2 12 3 4 4
En total el área pedida será:

16 63 253 2
+ = u ≈ 21 08 u2
3 4 12
Gráficamente:
Observa lo importante que es diferenciar los dos intervalos, pues si simplemente hubiésemos calcu-
lado, sin más: 5
x3 − 7x2 + 10x dx
0
sin separar, el resultado serı́a: 5
x3 − 7x2 + 10x dx = −10 42
0
(Compruébala) que no es el área buscada, sino la diferencia entre las áreas.
Desde luego, si es posible, es mejor hacer un dibujo para saber como va la gráfica y determinar el
área a calcular.
Ejercicio: Calcula las áreas encerradas por el eje x y las funciones siguientes:
a) f (x) = x − x3
b) g(x) = −x2 + 9
c) h(x) = x2 − 2x − 3 entre x=1 y x=5.
11.8.2. Áreas limitadas por dos funciones

También es posible aplicar las integrales definidas para el cálculo de áreas de recintos limitados
por dos curvas, por ejemplo el de la figura:
Si las curvas son f (x) y g(x) se cumple que el área limitada por las dos curvas en el intervalo [a, b]
es: b
(f (x) − g(x)) dx
a
siempre que f (x) esté por encima de g(x) en el intervalo [a, b].
Si las curvas se cortan en el intervalo, se subdivide el intervalo en otros menores, en cada uno de los
cuales se aplican la integral anterior, determinando qué curva está por encima, y se suma el resultado.
En todo caso siempre es necesario hallar los puntos de corte entre las curvas, que se calculan
igualando las expresiones algebraicas de ambas funciones:
f (x) = g(x)
y resolviendo la ecuación resultante.
Ejemplo: Calcular el área limitada por las curvas f (x) = x2 − 1 y g(x) = 4x − 4.

Comenzamos calculando los puntos de corte de las funciones:
f (x) = g(x) =⇒ x2 − 1 = 4x − 4 =⇒ x2 − 4x + 3 = 0 =⇒ x = 1, x = 3
Las funciones se cortan en los puntos 1 y 3.

Veamos qué función está por encima y cuál por debajo en ese intervalo.
Dando un valor intermedio, por ejemplo el 2:
f (2) = 22 − 1 = 3 g(2) = 8 − 4 = 4
Como el valor de g(x) es mayor, significa que g(x) está por encima de f (x) en el intervalo, de modo
que el valor del área será el dado por la integral definida:
3 3 3
2
Área = (g(x) − f (x)) dx = (4x − 4 − (x − 1)) dx = 4x − 3 − x2 dx =
1 1 1
x=3
x3 1 4 2
2
= 2x − 3x − = (18 − 9 − 9) − 2 − 3 − = u ≈ 1 33 u2
3 x=1 3 3
Si se hace un dibujo, lo cuál es sencillo porque se trata de una recta y una parábola:
Ejercicio: Calcular el área encerrada por las curvas:

a) f (x) = x2 − 2x y g(x) = 6x − x2
b) f (x) = x2 y g(x) = x + 2
c) f (x) = x3 y g(x) = 2x
11.9. Otras aplicaciones de las integrales

Las aplicaciones de las integrales a las Ciencias Sociales se relacionan con las de las derivadas.
Sabemos, por ejemplo, que si cierta función I(x), es la función de ingresos de una determinada
empresa, la función de ingresos marginal es su derivada I (x).
Las integrales, al ser la operación recı́proca, permiten calcular la función de ingresos conocida la
de ingresos marginal, es decir:
I (x) dx = I(x) + C, C ∈ R
(Lo mismo si la función es de coste o de beneficio, etc).

Por tanto, en general, conociendo la función de cambio (o crecimiento) de cualquier proceso,
integrando se puede conocer la función que mide dicho proceso.
Ejemplo: El ritmo de crecimiento de la población de palomas en una ciudad viene dado por la función:
f (x) = 2x − 0 5x2
x en años a partir del actual y f (x) en miles de palomas.

Actualmente hay 2500 palomas.
a) ¿Cuántas habrá dentro de x años?
b) ¿En cuánto aumentará la población durante el segundo semestre a partir del momento actual?
c) ¿Hasta cuando aumenta la población de palomas?. ¿Qué número máximo alcanza?.
a) Como conocemos la función de crecimiento, la función que da el número total de palomas será una
primitiva de ésta:

1
F (x) = f (x) dx = 2x − 0 5x2 dx = x2 − x3 + C, C ∈ R
6
Para determinar C, sabemos que la población de palomas ahora mismo es de 2500, es decir:
F (0) = 2 5
luego sustituyendo:
1 3
02 − · 0 + C = 2 5 =⇒ C = 2 5
6
La población de palomas sigue una función:
1
F (x) = x2 − x3 + 2 5
6
b) El segundo semestre, x va desde 0 5 hasta 1, y el aumento de palomas será:
20 131 29
F (1) − F (0 5) = − = = 0 604
6 48 49
es decir, 604 palomas (recuerda que la función viene dada en miles de palomas).
c) Calculamos los máximos y mimimos de F (x).
Como:
F (x) = f (x)
resulta que igualamos f (x) = 0, y queda:
2x − 0 5x2 = 0 =⇒ x(2 − 0 5x) = 0 =⇒ x = 0, x = 4
Para saber si son máximos o mı́nimos, con la derivada segunda:
F (x) = 2 − x
luego:
F (0) = 2
x = 0 es un mı́nimo y:
F (4) = −2
x = 4 es un máximo, luego a lo sumo, la población de palomas se dará a los 4 años a partir de ahora,
es decir:
1 64
F (4) = 42 − 43 + 2 5 = 16 − + 2 5 = 7 833
6 6
aproximadamente 7833 palomas.
La gráfica de F(x) es:
Ejercicios:
√
1. Supongamos que dentro de x meses la población de tu ciudad crecerá a razón de 5+4 x personas
por mes.
Si la población actual es de 7500 personas.
a) ¿Cuál será la población dentro de un año?
b) ¿En cuántos habitantes aumentará durante el segundo año?
c) ¿Llegará a algún máximo su número de habitantes?.
2. Halla la función de beneficio de una empresa, B(x), sabiendo que los costes e ingresos marginales
, c(x) e i(x), vienen dados respectivamente por las funciones:
c(x) = 0 04x + 4 i(x) = 200 − 2x
con C(0) = 80 , siendo C(x) la función de coste.

Capı́tulo 9
LÍMITES Y CONTINUIDAD DE
FUNCIONES
9.1. Introducción
El concepto de lı́mite en Matemáticas tiene el sentido de “lugar” hacia el que se dirige una función
en un determinado punto o en el infinito.
Veamos un ejemplo: Consideremos la función dada por la gráfica de la figura y fijémonos en el
punto x = 2 situado en el eje de abscisas:
¿Qué ocurre cuando nos acercamos al punto 2 moviéndonos sobre el eje x? Tomemos algunos
valores como 2’1, 2’01, 2’001.
Vemos en la figura que en este caso las imágenes de dichos puntos sobre la curva, f(2’1), f(2’01),
f(2’001) se acercan a su vez a un valor situado en el eje y, el valor y = 3.
Si nos acercamos a 2 por la otra parte, es decir, con valores como 1’9, 1’99, 1’999 en este caso las
imágenes f(1’9), f(1’99), f(1’999) se acercan también al mismo valor, y = 3.
Concluimos que el lı́mite de la función f(x) cuando nos acercamos a x = 2 es 3, lo cuál expresamos
como:
lı́m f (x) = 3
x→2
Intuitivamente, por tanto, podemos decir que el lı́mite de una función en un punto es el valor en el
eje Oy al que se acerca la función, f (x), cuando la x se acerca, en el eje Ox a dicho punto.
145
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 146
Sin embargo la expresión matemática rigurosa de lı́mite es algo más compleja:
Definición: Dada una función f (x) y un punto x = a, se dice que el lı́mite de f (x) cuando x se acerca
a a es L, y se expresa como:
lı́m f (x) = L
x→a
cuando:
Dado > 0, existe δ > 0 tal que siempre que |x − a| < δ, entonces |f (x) − L| <
Lo que viene a expresar esta formulación matemática es que si x está “suficientemente cerca” de
a, entonces su imagen f(x) también está muy próxima a L.
En la práctica en muchas ocasiones es necesario calcular los llamados lı́mites laterales, que como
recordaremos se definen de la siguiente forma:
Definición:
Se define el lı́mite lateral por la derecha de a de la función f (x), y se expresa como:
lı́m f (x)
x→a+
al lı́mite al que se acerca f (x) cuando x se acerca a a y toma valores mayores que a.
De igual modo, el lı́mite lateral por la izquierda de a de la función f (x) se expresa como:
lı́m f (x)
x→a−
y se define como el lı́mite al que se acerca f (x) cuando x se acerca a a y toma valores menores que a.
Propiedad: Para que una función f (x) tenga lı́mite en x = a es necesario y suficiente que existan
ambos lı́mites laterales y coincidan, es decir:
lı́m f (x) = lı́m f (x) = lı́m f (x)

x→a x→a+ x→a−
9.2. Tipos de lı́mites

Recordaremos algunos tipos de lı́mites que son conocidos:
1. Lı́mites infinitos en un punto finito: En la situación del dibujo, se dice que el lı́mite cuando x
se acerca por la derecha de a es +∞, pués a medida que la x se acerca a a, la función se hace
cada vez mayor:
lı́m f (x) = +∞
x→a+
(de igual forma se puede definir cuando nos acercamos por la izquierda. Intenta hacer el dibujo).
De igual modo se define el lı́mite −∞ cuando nos acercamos a a (por la derecha o por la
izquierda).(Dibuja el que falta)
Puede ocurrir que uno de los lı́mites laterales sea finito y otro infinito, o cualquier combinación
entre ellos, por ejemplo:
En la figura anterior se cumple que:

lı́m f (x) = +∞
x→2+
y
lı́m f (x) = 2
x→2−
2. Lı́mites finitos en el infinito: Se dice que una función tiene lı́mite b cuando x tiende a +∞
cuando la función se acerca a b cuando la x se hace cada vez mayor, es decir:
lı́m f (x) = b
x→∞
Gráficamente:
En este caso el lı́mite es 2 cuando x tiende a +∞.

De igual modo se define el lı́mite finito cuando x tiende a −∞.
3. Lı́mites infinitos en el infinito: Aparece este caso cuando si x tiende a +∞ la función se hace
cada vez mayor o menor (lo mismo si x tiende a −∞).
Un ejemplo gráfico de este tipo de lı́mites serı́a:
En este caso:
lı́m f (x) = −∞
x→∞
(Intenta dibujar otros casos diferentes).
9.3. Cálculo de lı́mites

Recordaremos, dada su importancia, algunas de las reglas para el cálculo de lı́mites cuando se
presentan diferentes indeterminaciones:
9.3.1. Lı́mites en el infinito

1. Lı́mites de polinomios: El lı́mite de cualquier polinomio cuando x tiende a ∞ siempre es +∞ o
−∞, dependiendo del coeficiente del término de mayor grado del polinomio:
lı́m (2x5 − 3x2 + 5) = +∞

x→∞
lı́m (−3x7 − 5x2 + 4x − 8) = −∞

x→∞
pues en el primer caso el coeficiente de x5 es positivo, y en el segundo caso el coeficiente de x7

es negativo.
∞
2. Indeterminación : Si tenemos un cociente de polinomios nos encontraremos con una indeter-
∞
minación de este tipo. Para resolverla basta recordar la siguiente regla:
Si tenemos:


 ±∞ si grado(p(x)) > grado(q(x)),

 donde el signo depende de los coeficientes.





p(x)  0 si grado(p(x)) < grado(q(x))
lı́m =
x→∞ q(x) 




 a

 si grado(p(x)) = grado(q(x)), siendo a y b los

 b
coeficientes de los términos de mayor grado de cada polinomio.
Ejemplos: a)
x3 − 5x2 + 6 ∞
lı́m = = −∞
x→∞ −x2 + 4 ∞
porque el grado del numerador es mayor, pero los respectivos coeficientes de mayor grado tienen
signo diferente.
b)
x2 − 5 ∞
lı́m = =0
x→∞ x6 − x4 − 3x2 + 4 ∞
porque el grado del denominador es mayor.
c)
7x3 + 2x − 6 ∞ 7
lı́m = =−
x→∞ −3x3 + 6 ∞ 3
porque los grados son iguales.
Nota: La resolución de lı́mites cuando x tiende a −∞ se reduce a estos casos, puesto que:
lı́m f (x) = lı́m f (−x)

x→−∞ x→∞
es decir:
x3 − 5x2 + 4 (−x)3 − 5(−x)2 + 4 −x3 − 5x2 + 4 ∞
lı́m = lı́m = lı́m = =∞
x→−∞ −x2 + 5x x→∞ −(−x)2 + 5(−x) x→∞ −x2 − 5x ∞
La misma regla anterior sirve en el caso de que aparezcan raı́ces, siempre que tengan sentido los
lı́mites:
d) √
3+ x3 − 5x ∞
lı́m = =0
x→∞ x2 + 4 ∞
3
puesto que el grado del denominador es 2 y en el numerador la mayor potencia de x es , que
2
es menor que 2.
e) √
−x + 1 + x3
lı́m =
x→∞ 1 + x + 3x3
puesto que aunque los grados de numerador y denominador son iguales, cuando x tiende a +∞
(es positivo y muy grande) resulta que −x + 1 es negativo y como es bien conocido, la raı́z
cuadrada de un número negativo no existe en el cuerpo de los números reales, por tanto el lı́mite
anterior no tiene sentido.
f)
√ √ ∞ 1
−x + 1 + x3 −(−x) + 1 + (−x)3 x + 1 − x3
lı́m = lı́m = lı́m = =
x→−∞ 1 + x + 3x3 x→∞ 1 + (−x) + 3(−x)3 x→∞ 1 − x − 3x3 ∞ 3
pues en este caso la raı́z si tiene sentido y los grados son iguales, quedando el lı́mite el cociente
de los coeficientes de los monomios de mayor grado.
3. Indeterminación ∞ − ∞: Cuando aparece esta indeterminación, si tenemos una resta de frac-

ciones, simplemente se hace la resta para obtener un cociente de polinomios que ya sabemos
resolver:
2
x2 − x + 1 x + 3 + x2 (x − x + 1)(x − 1) (x + 3 + x2 )(x + 1)
lı́m − = (∞ − ∞) = lı́m − =
x→∞ x+1 x−1 x→∞ (x + 1)(x − 1) (x − 1)(x + 1)
3
x − 2x2 + 2x − 1 x3 + 2x2 + 4x + 3 −4x2 − 2x − 4 ∞
= lı́m − = lı́m = = −4
x→∞ x2 − 1 x2 − 1 x→∞ x2 − 1 ∞
En caso de que aparezca una raı́z, el proceso es multiplicar y dividir por el conjugado de la
expresión radical:

√
√

√ (2x − 1) − x + 1 · (2x − 1) + x + 1
lı́m (2x − 1) − x + 1 = (∞ − ∞) = lı́m √ =
x→∞ x→∞ (2x − 1) + x + 1
√
(2x − 1)2 − ( x + 1)2 4x2 − 4x + 1 − x − 1
= lı́m √ = lı́m √ =
x→∞ (2x − 1) + x + 1 x→∞ (2x − 1) + x + 1
4x2 − 5x ∞
= lı́m √ = = +∞
x→∞ (2x − 1) + x + 1 ∞
9.3.2. Lı́mites en puntos finitos

Si queremos calcular el lı́mite de una función f (x) cuando x se acerca a cierto valor a, simplemente
hemos de sustituir el valor de a en f (x):
2x2 − 3x + 1 2 · 9 − 3 · (−3) + 1
lı́m = = −28
x→−3 x+2 −3 + 2
El problema que nos podemos encontrar en este caso es que el denominador se haga 0 al sustituir x
por el valor que corresponda.
Nos podemos encontrar, por tanto, varios tipos de indeterminación.
k
1. Indeterminación , (k = 0): Se presenta cuando en el numerador aparece un número cualquiera
0
no nulo y el denominador es 0.
En este caso el lı́mite el siempre ∞, pero para determinar su signo, se calculan los lı́mites
laterales:
a) 

 1 − 2x 1 − 2 · 1 0001 −1

 lı́m = = − = +∞
1 − 2x 1−2 −1  x→1+ 1 − x2 1 − (1 0001)2 0
lı́m = = =
x→1 1 − x2 1−1 0 


 1 − 2x 1 − 2 · 0 9999 −1
 lı́m = = + = −∞
x→1− 1−x 2 1 − (0 9999)2 0
b) 
 −7 −7 −7

 lı́m = = + = −∞
−7 −7  x→0+ x 0 0001 0
lı́m = =
x→0 x 0 
 −7 −7 −7

 lı́m = = − = +∞
x→0− x −0 0001 0
c)
 −2 −2 −2

 lı́m = = + = −∞

 x→−1+ (x + 1) 2
(−0 9999 + 1) 2 0
−2 −2
lı́m 2
= =
x→−1 (x + 1) 0 
 −2 −2 −2

 lı́m = = + = −∞
x→−1− (x + 1) 2
(−1 0001 + 1) 2 0
0
2. Indeterminación : En este caso tanto numerador como denominador se hacen 0.
0
Si tanto en el numerador como en el denominador tenemos polinomios, la forma de resolver la
indeterminación es descomponer los polinomios en factores (mediante, por ejemplo, la regla de
Ruffini) y simplificar para posteriormente volver a sustituir.

x2 − 5x + 6 4 − 10 + 6 0 (x − 2)(x − 3) (x − 3) −1
lı́m = = = lı́m = lı́m =
x→2 x2 − 4 4−4 0 x→2 (x − 2)(x + 2) x→2 (x − 2) 4
En caso de que también aparezcan raı́ces cuadradas, el proceso es multiplicar y dividir por la
expresión radical conjugada con el fin de simplificar y luego sustituir:
√ √ √
x+4−1 0 ( x + 4 − 1) · ( x + 4 + 1)
lı́m 2 = = lı́m √ =
x→−3 x + 2x − 3 0 x→−3 (x2 + 2x − 3) · ( x + 4 + 1)
√
( x + 4)2 − 12 x+3
= lı́m √ = lı́m √ =
x→−3 (x2 + 2x − 3) · ( x + 4 + 1) x→−3 (x2 + 2x − 3) · ( x + 4 + 1)
(x + 3) 1 1 −1
= lı́m √ = lı́m √ = =
x→−3 (x + 3) · (x − 1) · ( x + 4 + 1) x→−3 (x − 1) · ( x + 4 + 1) (−4) · (1 + 1) 8
9.3.3. Lı́mites potenciales. Indeterminación 1∞

Cuando aparecen exponentes, hay que recordar algunas reglas básicas.
Si tenemos
lı́m (f (x))g(x)
x→a
o bien
lı́m (f (x))g(x)
x→∞
se pueden presentar varios casos:
1. La base tiende a un número cualquiera no nulo y el exponente a otro número. En este caso el
lı́mite es el número que resulta de realizar la operación correspondiente:
1
lı́m (x + 1)2x−3 = 2−1 =
x→1 2
2. La base tiende a un número positivo mayor que 1 y el exponente a +∞. En este caso el lı́mite
es también +∞.
2x + 1 2x−3
lı́m = 2∞ = +∞
x→∞ 1+x
3. La base tiene a un número no nulo comprendido entre -1 y 1 y el exponente a +∞. En este caso
el lı́mite es 0. ∞
1 + x 2x−3 1
lı́m = =0
x→∞ 2x + 1 2
4. La base tiende a un número negativo menor o igual que -1 y el exponente a +∞. En este caso
el lı́mite no existe, pues los productos son alternativamente de signo contrario:
2x−3
−3x + 1
lı́m = (−3)∞ =
x→∞ 1+x
5. En el caso en que la base tiende a 1 y el exponente a +∞ tenemos una indeterminación que se

resuelve aplicando la fórmula:
lı́m (g(x) · (f (x) − 1))

lı́m (f (x))g(x) = (1∞ ) = (e)x→a
x→a
O bien realizando los pasos para resolver tales lı́mites que recordamos:
2x+3 2x+3
1+x x 3
∞ 1+x x
lı́m = (1) = (1 )
0 = lı́m 1 + −1 =
x→0 2x + 1 se suma y se resta 1 a la base x→0 2x + 1 se hace la resta
2x+3 2x+3
1 + x − 2x − 1 x −x x
= lı́m 1 + = lı́m 1 + =
x→0 2x + 1 x→0 2x + 1 se baja el numerador dividiendo al denominador
2x+3  2x+1  2x+1

−x 2x+3
· x
x −x
1 1
= lı́m 1 + 2x+1 = lı́m  1 + 
2x+1 =
x→0 se pone el denominador como exponente x→0
−x −x

−x 2x+3 −2x−3
lı́m · lı́m
=
se sustituye el corechete por e
(e)x→0 2x+1 x
= (e)x→0
2x+1
= e−3
Ejercicio: Resolver el lı́mite anterior utilizando la fórmula.

Nota: El caso en que el exponente tiende a −∞ se reduce a este sin más que recordar las propiedades
de las potencias:
a n b −n
=
b a
9.4. Ası́ntotas
Una primera aplicación del cálculo de lı́mites consiste en el cálculo de las ası́ntotas de una función.
Hay tres tipos de ası́ntotas:
Verticales, Horizontales y Oblicuas (aunque de hecho las ası́ntotas horizontales son un caso par-
ticular de éstas).
9.4.1. Ası́ntotas verticales

Una ası́ntota vertical de una función f (x) es una recta vertical x = k tal que se cumple:
lı́m f (x) = ±∞
x→k+
o bien
lı́m f (x) = ±∞
x→k−
Las posibles ası́ntotas verticales de una función se encuentran entre los puntos que no están en el
dominio de la función, aquellos que anulan el dominador en las funciones racionales, etc...
Para determinar si un punto constituye una ası́ntota vertical de la función, se tiene que cumplir
que alguno de los lı́mites laterales de la función en el punto sea ±∞.
En tal caso, se dirá que la función posee una ası́ntota vertical en dicho punto por el lado en el cuál
dicho lı́mite sea ±∞.
Ejemplo: Estudiar las ası́ntotas verticales de las funciones:

2x + 3 1
f (x) = g(x) = √
x−1 x
a) Para la primera función, la posible ası́ntota estará en el punto x = 1, que es el único número real
que no pertenece a su domino por anular el denominador.
Ası́ pues estudiamos el:

 2x + 3 2 · 1 0001 + 3 5

 lı́m = = + = +∞
2x + 3 5  x→1 + x − 1 1 0001 − 1 0
lı́m = =
x→1 x − 1 0  
 lı́m 2x + 3 = 2 · 0 9999 + 3 = 5 = −∞

x→1− x − 1 0 9999 − 1 0−
Como ambos lı́mites laterales son infinitos, existe una ası́ntota vertical de la función en x = 1, y es
más, conociendo el valor de los lı́mites podemos asegurar que en las cercanı́as de la ası́ntota la función
se comportará como en el dibujo:
1 √
b) En cuanto a esta función,g(x) = √ , notemos que el denominador se anula cuando x = 0 =⇒
x
x = 0, es decir la posible ası́ntota vertical estará en x = 0. Analizando obtenemos:
 1 1 1

 lı́m √ = √ = + = +∞

1  x→0 x 0 0001 0
+
1
lı́m √ = =
x→0 x 0   1 1

 lı́m √ = √ =
x→0 − x −0 0001
puesto que no hay raı́ces cuadradas de números negativos.
De modo que hay una ası́ntota vertical en x = 0 pero sólo por la derecha, es decir, la gráfica será:
9.4.2. Ası́ntotas horizontales

Las ası́ntotas horizontales, si existen, indican el valor al que se acerca la función cuando la variable
independiente x se hace muy grande o muy pequeña.
Dicho en forma de lı́mites, una función tiene una ası́ntota horizontal en y = k cuando para alguno
de los dos lı́mites:
lı́m f (x) = k
x→∞
o bien
lı́m f (x) = k
x→−∞
Ejemplo: Calcular las ası́ntotas horizontales de las funciones:
x2 + 1 1
f (x) = g(x) = √
x+1 x
a) Para f (x) calculemos los lı́mites anteriores:
x2 + 1
lı́m = +∞
x→∞ x + 1
x2 + 1 (−x)2 + 1 x2 + 1
lı́m = lı́m = lı́m = −∞
x→−∞ x + 1 x→∞ (−x) + 1 x→∞ −x + 1
de modo que la función f(x) no posee ası́ntotas horizontales.

b) En cuanto a g(x), de igual modo:
1
lı́m √ = 0
x→∞ x
1
lı́m √ =
x→−∞ x
De modo que g(x) posee una ası́ntota horizontal en y = 0 cuando x tiende a ∞. De forma gráfica:
9.4.3. Ası́ntotas Oblicuas

Una recta y = m · x + n es una ası́ntota oblicua de la función f(x) cuando existen y son finitos los
lı́mites:
f (x)
m = lı́m
x→∞ x
y
n = lı́m (f (x) − m · x)
x→∞
Las ası́ntotas horizontales son un caso particular de las oblicuas para el caso en que m = 0.
x2
Ejemplo: Estudiar las ası́ntotas oblicuas de f (x) = .
x+1
Calculemos m y n:
x2
f (x) x+1 x2
m = lı́m = lı́m = lı́m =1
x→∞ x x→∞ x x→∞ x2 + x
2
x2 x
n = lı́m (f (x) − m · x) = lı́m − 1 · x = lı́m −x =
x→∞ x→∞ x + 1 x→∞ x + 1
2
x − x2 − x −x
lı́m = lı́m = −1
x→∞ x+1 x→∞ x + 1
Por tanto f (x) tiene una ası́ntota oblicua en y = x − 1 cuando x tiende a +∞.
Se puede comprobar que cuando x tiende a −∞, f (x) tiene esta misma ası́ntota. (Inténtalo).
Gráficamente se obtiene:
Figura 9.1: La ası́ntota oblicua es y = x − 1
Ejercicios:
1. Calcula las ası́ntotas de las funciones:
x x2 x2 − 4
f (x) = 2
g(x) = h(x) =
x −1 x+2 x2 + 4
1
2. Estudia las ası́ntotas de la función:f (x) = e x−2 .
3. Calcula los lı́mites:

x2 −1
x3 x3 3x2 − 5
a) lı́m √ b) lı́m √ c) lı́m
x→∞ x2 − 2 x→−∞ x2 − 2 x→∞ 3x2 + x
x−1
x √
x2 + 4 x2 + 5 − 3 2x2 − 2
d) lı́m e) lı́m √ f ) lı́m
x→1 x+4 x→2 x+7−3 x→1 x2 − 2x + 1
9.5. Continuidad
La idea intuitiva de función continua en un punto es bien sencilla.
Una función continua en un punto es aquella que no “da saltos”, aquella que se puede dibujar sin
levantar el lápiz del papel.
Matemáticamente la definición de función continua es un poco más compleja. Dice ası́:
Definición: Una función f (x) es continua en un punto x = a si:
Dado > 0, existe δ > 0 tal que siempre que |x − a| < δ, entonces |f (x) − f (a)| <
Dicho de otra forma, si nos acercamos al punto a, entonces las imágenes se acercan a la imagen de a,
f (a).
Si f (x) no es continua en x = a se dice que f (x) es discontinua en a o que tiene una discontinuidad
en x = a.
Propiedad: Para que una función sea continua en un punto a es necesario y suficiente que:
a) Exista el valor de la función en el punto, f (a).
b) Existan los lı́mites laterales,
lı́m f (x)
x→a+
y
lı́m f (x)
x→a−
, y sean finitos e iguales entre sı́ e iguales a f (a), es decir:
lı́m f (x) = lı́m f (x) = f (a)

x→a+ x→a−
Esta última propiedad proporciona una forma muy sencilla de saber si una función es continua o no
en un punto.
Ejemplo: Estudiar la continuidad de la función:

2x + 1 si x > 2
f (x) = 1
si x ≤ 2
x
En primer lugar, señalemos que la mayorı́a de las funciones que estudiamos son continuas en todos los
puntos salvo en algunos.
¿Cuáles son los posibles puntos de discontinuidad de una función?.
Aquellos en los que no está definida la función (anulan el denominador, etc...) y aquellos en los
que cambia la definición de la función.
En todos los demás puntos las funciones son siempre continuas y no hace falta analizarlos.
En nuestro caso, si nos fijamos en f (x) encontramos 2 posibles puntos de discontinuidad.
El primero es aquel en el que cambia la definición de la función, x = 2. Además, como hay un
demominador, que se anula para x = 0, y además estamos en el tramo de función para valores menores
que 2, el punto x = 0 es otro posible punto de discontinuidad.
Analicemos si la función es continua o no en esos puntos.

Continuidad en x = 2:
1
f (2) =
2
pues debemos sustituir en la parte inferior de f (x), que es donde está el igual.
Lı́mites laterales:
1 1
lı́m f (x) = lı́m =
x→2 − x→2 x 2
Por otra parte:
lı́m f (x) = lı́m 2x + 1 = 5
x→2+ x→2
Como los lı́mites laterales existen pero son diferentes, concluimos que f (x) es discontinua en x = 2.
Continuidad en x = 0:
f (0) =
quedarı́a un cero en el denominador.
Con esto ya sabemos que la función no puede ser continua en x = 0. De todos modos calculamos
los lı́mites laterales.
Observemos que cuando nos acercamos a 0, da igual por la derecha que por la izquierda, estamos
siempre en la parte inferior de la función, luego:
1 1
lı́m f (x) = lı́m = − = −∞
x→0− x→0− x 0
Por otra parte:
1 1
lı́m f (x) = lı́m = + = +∞
x→0+ x→0+ x 0
Y f (x) también es discontinua en x = 0.
Por tanto f (x) es continua en todos los números reales salvo en x = 0 y x = 2.
9.6. Tipos de discontinuidad

Analicemos los posibles casos que se pueden dar a la hora de estudiar la continuidad de una función
en un punto.
1. Existe f (a) y los lı́mites laterales, que son iguales y finitos, pero distintos del valor de f (a). Una
discontinuidad de este tipo se denomina discontinuidad evitable. Gráficamente:
Observamos que los lı́mites por la derecha y por la izquierda valen 1, ambos, mientras que
f (0) = 0. Hay una discontinuidad evitable en x = 0.
2. Existe f (a) y los lı́mites laterales existen y son finitos, aunque distintos. Estamos ante una
discontinuidad de salto finito. Gráficamente:
−1
En este caso el lı́mite por la derecha es 1, el izquierdo es 0 y f (0) = , hay una discontinuidad
2
evitable en x = 0.
3. Existe f (a) y alguno de los lı́mites laterales es infinito. En este caso hay una discontinuidad de
salto infinito. Gráficamente:
Ahora f (0) = 1, el lı́mite por la izquierda vale 1 también y el lı́mite lateral por la derecha vale
+∞. Discontinuidad de salto infinito en x = 0.
4. No existe f (a) o alguno de los lı́mites laterales. Se trata de una discontinuidad esencial. De forma
gráfica:
Los lı́mites laterales, ambos, son +∞, pero f (0) no existe. Hay una discontinuidad esencial en
x = 0.
Capı́tulo 6
MATRICES Y DETERMINANTES
6.1. Introducción
Las matrices y los determinantes son herramientas del álgebra que facilitan el ordenamiento de
datos, ası́ como su manejo.
Los conceptos de matriz y todos los relacionados fueron desarrollados básicamente en el siglo XIX
por matemáticos como los ingleses J.J. Sylvester y Arthur Cayley y el irlandés William Hamilton.
Las matrices se encuentran en aquellos ámbitos en los que se trabaja con datos regularmente
ordenados y aparecen en situaciones propias de las Ciencias Sociales , Económicas y Biológicas.
6.2. Matrices. Definición y primeros ejemplos

Una matriz es una tabla rectangular de números reales dispuestos en filas y columnas del modo:
  
a11 a12 a13 . . . a1n ←
 a21 a22 a23 
 . . . a2n 
←

A= . .. .. .. ..  ← Filas de la matriz A
 .. . . . .   

am1 am2 am3 . . . amn ←

Columnas de la matriz A
Abreviadamente se puede expresar A = (aij ). Cada elemento de la matriz lleva dos subı́ndices. El
primero de ellos “i”, indica la fila en la que se encuentra el elemento, y el segundo, “j”, la columna.
Ası́ el elemento a23 está en la fila 2 y columna 3. Las matrices siempre se representarán con letras
mayúsculas.
Ejemplos: Son ejemplos de matrices los siguientes:
 
√ 3 1 0
2 1 6 −4 0  2 −4 0 
A= B= C = −1 1
√ 
3 4 1 2 1 5 2
1 0 0
A tiene 2 filas y 2 columnas, diremos que su tamaño es 2 x 2.¿Qué elemento es a21 ?.

B tiene 2 filas y 3 columnas, diremos que su tamaño es 2 x 3.¿Qué elemento es b23?.
C tiene 4 filas y 3 columnas, diremos que su tamaño es 4 x 3.¿Qué elemento es c42 ?.
En general, si una matriz A tiene m filas y n columnas, diremos que su tamaño o dimensión es m
x n (se lee “m por n”), siempre en primer lugar el nº de filas y en segundo lugar el de columnas.
82
CAPÍTULO 6. MATRICES Y DETERMINANTES 83
6.3. Tipos de matrices

1. Se llama matriz nula a la que tiene todos los elementos cero.
Por ejemplo,
0 0 0 0 0
A=
0 0 0 0 0
es una matriz nula de tamaño 2x5.
2. Se llama matriz fila a la que sólo tiene una fila, es decir su dimensión es 1x n.
Por ejemplo,
1 0 −4 9
es una matriz fila de tamaño 1 x 4.
3. Se llama matriz columna a la que sólo consta de una columna, es decir su dimensión será m x
1, como por ejemplo:  
1
C= √ 0 
− 8
es una matriz columna de tamaño 3 x 1.
4. Una matriz es cuadrada cuando tiene el mismo número de filas que de columnas, es decir su
dimensión es n x n. La matriz ( 23 14 ) del primer ejemplo anterior es cuadrada de tamaño 2 x 2 o
simplemente de orden 2.
Otro ejemplo de matriz cuadrada es:
 
1 2 3
D= 6 5 4
−3 −4 0
de orden 3.
Dentro de las matrices cuadradas llamaremos diagonal principal a la formada por los elementos
a11 , a22 , a33, . . . , ann , siendo la matriz:
 
a11 a12 a13 . . . a1n
a21 a22 a23 . . . a2n 
 
A= . .. .. .. .. 
 .. . . . . 
an1 an2 an3 . . . ann
En la matriz D del ejemplo anterior, su diagonal principal estarı́a formada por 1, 5, 0.
Se llama traza de la matriz a la suma de los elementos de la diagonal. Es decir, Traza (A)=a11 +
a22 + a33 + . . . + ann , y en el caso de D, Traza (D)= 1+5+0 = 6.
La diagonal secundaria es la formada por los elementos a1n , a2,n−1, a3,n−2, . . . , an1 .
En la matriz D estarı́a formada por 3, 5, -3.
Una clase especial de matrices cuadradas son las matrices triangulares.

Una matriz es triangular superior si todos los elementos por debajo de la diagonal principal son
nulos y triangular inferior si son nulos todos los elementos situados por encima de dicha diagonal.
Son ejemplos de estas matrices:
 
1 0 0 0  
0 −4 0  1 4 13
0 
E= 3 4 F = 0 9 −5
5 0 
0 0 π
1 3 16 −78 Triangular superior
Triangular inferior
Si una matriz es a la vez triangular superior e inferior, sólo tiene elementos en la diagonal principal.
Una matriz de este tipo se denomina matriz diagonal.
Un ejemplo de matriz diagonal serı́a:
 
1 0 0 0
0 −45 0 0
G= 0

0 3 0
0 0 0 0
Por último, si una matriz diagonal tiene en su diagonal principal sólo unos, se denomina matriz unidad
o identidad. Se suelen representar por In , donde n es el orden o tamaño de la matriz. Algunas matrices
identidad son:  
  1 0 0 0
1 0 0
1 0 0 1 0 0
I2 = I3 = 0 1 0 I4 = 

0 0 1 0

0 1
0 0 1
0 0 0 1
6.4. Aplicaciones de las matrices

Las matrices se utilizan en el contexto de las ciencias como elementos que sirven para clasificar
valores numéricos atendiendo a dos criterios o variables.
Ejemplo: Un importador de globos los importa de dos colores, naranja (N) y fresa (F). Todos
ellos se envasan en paquetes de 2, 5 y 10 unidades, que se venden al precio (en euros) indicado por la
tabla siguiente:
2 unid. 5 unid. 10 unid.

Color N 0’04 0’08 0’12
Color F 0’03 0’05 0’08
Sabiendo que en un año se venden el siguiente número de paquetes:
Color N Color F
2 unid. 700000 50000
5 unid. 600000 40000
10 unid. 500000 500000
Resumir la información anterior en 2 matrices A y B, de tamaño respectivo 2x3 y 3x2 que recojan las
ventas en un año (A) y los precios (B).
Nos piden que organicemos la información anterior en dos matrices de tamaño concreto. Si nos fijamos
en las tablas, es sencillo obtener las matrices:
N F
2 ud 5 ud 10 ud  
0 04 0 03 2 ud
700000 600000 500000 N 
A= B = 0 08 0 05 5 ud
50000 40000 500000 F
0 12 0 08 10 ud
Estas matrices se denominan matrices de información, y simplemente recogen los datos numéricos del
problema en cuestión.
Otras matrices son las llamadas matrices de relación, que indican si ciertos elementos están o no
relacionados entre sı́. En general, la existencia de relación se expresa con un 1 en la matriz y la ausencia
de dicha relación de expresa con un 0.
Estas matrices se utilizan cuando queremos trasladar la información dada por un grafo y expresarla
numéricamente.
En Matemáticas, un grafo es una colección cualquiera de puntos conectados por lineas.

Existen muchos tipos de grafos. Entre ellos, podemos destacar:
* Grafo simple: Es el grafo que no contiene ciclos, es decir, lineas que unan un punto consigo
mismo, ni lineas paralelas, es decir, lineas que conectan el mismo par de puntos.
* Grafo dirigido: Es el grafo que indica un sentido de recorrido de cada linea, mediante una flecha.
Estos tipos de grafo pueden verse en la figura:
Figura 6.1: Grafo, Grafo simple y Grafo dirigido.
Relacionadas con los grafos se pueden definir algunas matrices. Entre todas ellas, nosotros nos
fijaremos en la llamada matriz de adyacencia, que es aquella formada por ceros y unos exclusivamente,
de tal forma que:
* un 1 en el lugar (i,j) expresa la posibilidad de ir desde el punto de la fila i hasta el punto de la
columna j mediante una linea que los una directamente.
* un 0 en el lugar (i,j) expresa la imposibilidad de ir del primer punto al segundo mediante una
linea que los una directamente.
La matriz de adyacencia del grafo dirigido de la figura anterior será:
A B C D
 
A 0 1 0 1
B0 0 1 0
C 1 0 0 0
D 0 0 0 0
Ejercicio
1) Escribe las correspondientes matrices de adyacencia de los grafos:
2) Dibuja los grafos dirigidos que correspondan a las matrices de adyacencia:
A B C D
A B C  
  A 0 1 1 1
A 0 1 0
B0 0 0 1
B 1 0 1
C 1 0 0 0
C 0 0 0
D 0 1 1 0
6.5. Operaciones con matrices

6.5.1. Suma y diferencia
Dadas dos matrices A y B podemos realizar su suma o diferencia de acuerdo a la siguiente regla.
Para sumar o restar dos matrices del mismo tamaño, se suman o restan los elementos que se encuentren
en la misma posición, resultando otra matriz de igual tamaño.
Por ejemplo:
2 1 3 2 0 4 0 1 −1
− =
−4 2 1 3 2 5 −7 0 −4
2x3 2x3 2x3
Si las matrices tienen diferente tamaño, no se pueden sumar o restar entre sı́.
Propiedades de la suma (y diferencia) de matrices:

a) Conmutativa: A + B = B + A
b) Asociativa: A + (B + C) = (A + B) + C
c) Elemento neutro: La matriz nula del tamaño correspondiente.
d) Elemento opuesto de A: La matriz -A, que resulta de cambiar de signo a los elementos de A.
Ejemplo:
Si    
0 −1 0 1
A = −4 −2 =⇒ −A =  4 2
3 −9 −3 9
3x2 3x2
porque:      
0 −1 0 1 0 0
−4 −2 +  4 2 = 0 0
3 −9 −3 9 0 0
3x2 3x2 3x2
Ejercicios:
1. Las exportaciones, en millones de euros, de 3 paı́ses A, B, C a otros tres X, Y, Z, en los años

2000 y 2001 vienen dadas por las matrices:
X Y Z X Y Z
   
A 11 6 7 0 5 A 13 3
7 1
A2000 = B 14 5 10 1 2 A2001 = B 15 7 11 1 3 2
C 20 9 3 2 2 3 C 21 0 2 4 3
Calcula y expresa en forma de matriz el total de exportaciones para el conjunto de los dos años.
¿Cuántos millones ha exportado el paı́s B al Z en total?
Calcula el incremento de las exportaciones del año 2000 al 2001 con los datos del ejemplo anterior.
2. Calcula x, y, z en la suma:
     
x − y −1 2 y 0 z −1 −1 3
 1 y −x + −z 2 3 =  0 4 4
0 z 2 −2 3 x −2 4 1
3. Calcula a, b, c para que se cumpla la igualdad:

3−a b −2 2 a+b 4 −1 a 2
+ =
4 −c + 1 6 1−c 2 0 2 0 6
6.5.2. Producto por un número real

Dada una matriz cualquiera A y un número real k, el producto k·A se realiza multiplicando todos
los elementos de A por k, resultando otra matriz de igual tamaño. (Evidentemente la misma regla
sirve para dividir una matriz por un número real).
Por ejemplo:
2 1 3 −10 −5 −15
−5 · =
−4 2 1 20 −10 −5
2x3 2x3
Propiedades:
a) Distributiva respecto de la suma de matrices: k·(A + B) = k·A + k·B
b) Distributiva respecto de la suma de números: (k + d)·A= k·A + d·A
c) Asociativa: k·(d·A)=(k·d)·A
d) Elemento neutro, el número 1: 1·A=A
Ejercicios:

1 1 −1 0
1. Si A = yB= , halla una matriz X que verifique la ecuación:
0 1 0 2
2·X −4·A = B
2. Determina las matrices X y Y sabiendo que:



 1 −2
3X − 5Y =
8 1

 2 4
 −X + 3Y =
3 0
6.5.3. Trasposición de matrices

Dada una matriz cualquiera A, se llama matriz traspuesta de A, y se representa por At a la matriz
que resulta de intercambiar
las filas y las columnas de A.
2 1 0 7
Por ejemplo, si A = , entonces la matriz traspuesta de A es:
−3 4 2 1
 
2 −3
1 4 
At = 
0 2 

7 1
Evidentemente, si A es una matriz de tamaño m x n, su traspuesta At tendrá tamaño n x m, pues el

número de columnas pasa a ser el de filas y viceversa.
Si la matriz A es cuadrada, su traspuesta tendrá el mismo tamaño.
Propiedades:
a) (At )t = A, es decir, la traspuesta de la traspuesta es la matriz inicial.
b) (A + B)t = At + B t
c) (k · A)t = k · At
En base a esta nueva operación, podemos definir otras dos clases de matrices, que son:
Matriz simétrica, que es aquella para la que se cumple que At = A, por ejemplo la matriz:
 
2 1 3

A= 1 0 −2
√
3 −2 7
es simétrica (compruébalo).
En una matriz simétrica, los elementos son simétricos respecto a la diagonal principal.
Ejercicio: ¿Puede ser simétrica una matriz que no sea cuadrada?¿Por qué?.
Matriz antisimétrica, es aquella para la que se cumple que At = −A.

Por ejemplo:  
0 1 3
B = −1 0 −2
−3 2 0
es antisimétrica (comprueba).
En una matriz antisimétrica, los elementos de la diagonal principal son siempre nulos (¿por qué?),
y los restantes son opuestos respecto a dicha diagonal.
Ejercicios:
   
1 3 3 1 1 2
1. Dadas las matrices A = 1 4 3 y B =  2 0 −1 calcula 3At − B t .
1 3 4 −6 −1 0
2. Obtener las matrices X e Y que verifiquen los sistemas:
  

 1 5 
 2 1 
 3 1
2X − 3Y = X + Y = 2X + Y =
a) 4 2
b) 3 0 c) 0 −2

 −1 0 
 6 2 
 1 0
X − Y = X − Y = X + 2Y =
3 6 0 1 −2 4
6.5.4. Producto de matrices

Hay que dejar claro ya desde el principio que no todas las matrices pueden multiplicarse. Dos
matrices se pueden multiplicar cuando se cumple la siguiente condición:
“Para multiplicar dos matrices A y B, en este orden, A·B , es condición indispensable que el número
de columnas de A sea igual al número de filas de B”
Si no se cumple esta condición, el producto A·B no puede realizarse, de modo que esta es una
condición que debemos comprobar previamente a la propia multiplicación.
Una vez comprobado que el producto A·B se puede realizar, si A es una matriz m x n y B es una
matriz n x p (observemos que el nº de columnas de A = n = nº de filas de B), entonces el producto
A·B da como resultado una matriz C de tamaño n x p del siguiente modo:
“El elemento que se encuentra en la fila i y la columna j de la matriz C=A·B, se obtiene multiplicando
los elementos de la fila i de A por la columna j de B y sumando los resultados”
Veámoslo mediante un ejemplo:

Para multiplicar las matrices:
 
0 −4 1
−3 2 1 4 1 −2 1
A= y B=
2 0 2

2 5 3 −2
2x4 3 2 1
4x3
primero comprobamos que se puede realizar el producto A·B, pues el nº de columnas de A es 4 y el

nº de filas de B también es 4, y el resultado, según lo dicho será una matriz de tamaño 2 x 3, tiene 2
filas y 3 columnas:  
0 −4 1
−3 2 1 4 1 −2 1
 
· =
2 5 3 −2 2 0 2
2x4 3 2 1 2x3
4x3
Sólo nos falta completar los elementos de la matriz producto. Para ello, seguimos la regla anterior:
El elemento de la fila 1 y columna 1 de A·B proviene de multiplicar elemento a elemento la fila 1
de A por la columna 1 de B y sumar, es decir:
(−3) · 0 + 2 · 1 + 1 · 2 + 4 · 3 = 0 + 2 + 2 + 12 = 16
El elemento de la fila 1 y columna 2 de A·B proviene de multiplicar elemento a elemento la fila 1 de

A y la columna 2 de B y sumar:
(−3) · (−4) + 2 · (−2) + 1 · 0 + 4 · 2 = 12 − 4 + 0 + 8 = 16
El elemento de la fila 1 y columna 3 de A·B proviene de multiplicar elemento a elemento la fila 1 de

A y la columna 3 de B y sumar:
(−3) · 1 + 2 · 1 + 1 · 2 + 4 · 1 = −3 + 2 + 2 + 4 = 5
Ası́ sucesivamente se obtienen (comprueba):

16 16 5
5 −22 11
2x3
Ejercicios:
1. Para las matrices A y B anteriores, calcula B·A

1 −3 3 −5
2. Si A = ,B= , calcula si es posible A·B y B·A. ¿Coinciden?.
−2 6 2 1
 
1 −1
  3 0 2
3. Lo mismo si A = 0 −2 , B = .
1 −1 5
4 1
4. Calcula todos los productos posibles entre las matrices:
   
1 2 3 1
2 1 0
A = 1 1 1  B = 2 C=
3 4 5
0 2 −1 1
Además, calcula A2 y A3 .
5. Para las matrices

   
2 3 0 1 2
1 −1 2 0 3 4
A= B= C = −5 1 4 −2 D = 1
4 0 −3 −1 −2 3
1 0 0 −3 3
calcula:
A + B, 3A − 4B, A · B, A · D, B · C, C · D, At · C, Dt · At , B t · A, Dt · D, D · Dt
Propiedades del producto de matrices

a) Asociativa: A·(B·C) = (A·B)·C
b) Distributiva respecto de la suma:
A · (B + C) = A · B + A · C
(B + C) · A = B · A + C · A
c) Elemento neutro, la matriz identidad correpondiente, si A es m x n:
A · In = A
Im · A = A
d) En general el producto de matrices no es conmutativo
A · B = B · A
Pueden verse ejemplos en los ejercicios anteriores. Esta es una propiedad muy importante.
e) El producto de dos matrices no nulas A y B puede dar lugar a una matriz nula:
 
5
2 1 3   0
· 2 =
0 2 1 0
2x3
−4 2x1
3x1
Se dice que el conjunto de las matrices con la operación producto tiene divisores de cero, es decir, hay
matrices no nulas cuyo producto es nulo.
Ejercicios:
1. Si A y B son dos matrices cuadradas del mismo orden, ¿son ciertas las propiedades siguientes,
que son ciertas para las operaciones con números reales?:
a) (A + B)2 = A2 + B 2 + 2 · A · B
b) (A − B)2 = A2 + B 2 − 2 · A · B
c) (A + B) · (A − B) = A2 − B 2

2 −1
2. Determina los valores de a y b de la matriz A = para que A2 = A.
a b

1 2
3. ¿Qué matrices conmutan con la matriz ?.
0 1
6.6. La matriz inversa

Sabemos ya multiplicar matrices y hemos visto algunas de las propiedades de esta operación.
Recordemos, en primer lugar, que no siempre es posible efectúar la multiplicación de dos matrices,
y en segundo lugar, que aunque sea posible hacer esta multiplicación, en general no es conmutativo,
es decir A·B es distinto de B·A.
En el caso particular de que tratemos con matrices cuadradas del mismo orden A y B, es claro que
podemos efectuar los productos A·B y B·A, que darán como resultado otra matriz del mismo orden,
aunque, como ya se ha dicho, las matrices resultantes serán, en general, distintas.
Sabemos también que el elemento neutro del producto de matrices es la matriz identidad In .
Por analogı́a con el caso de los números reales, podemos plantearnos la siguiente cuestión:
Si tenemos un número real, por ejemplo el 2, podemos interesarnos en buscar el inverso del 2 para
el producto, es decir un número real x tal que 2·x = 1, el producto de 2 por x sea igual al elemento
neutro, el 1.
Evidentemente, en el caso de los números reales es bien fácil despejar x para obtener, en nuestro
1
caso, que x = , es decir, el inverso de un número real es otro número que multiplicado por él da el
2
elemento neutro, el 1.
Todo número real, salvo el 0, tiene inverso.
Trasladando esto a las matrices, nos podemos plantear si dada una matriz cuadrada A de orden n,
cualquiera, existe su inversa X para el producto de matrices,tal que
A · X = In
es decir, el producto de A por su inversa produce el elemento neutro matricial, la matriz identidad In .
Sin embargo, hay algunas diferencias con respecto al caso de los números reales:
In
1) No podemos “despejar” la matriz X del modo X = , porque no hemos definido la división de
A
matrices.
2) No todas las matrices cuadradas no nulas tienen matriz “inversa” (sea lo que sea, por analogı́a
con los números).
Definamos, en primer lugar, el término de matriz inversa:
Dada una matriz cuadrada de orden n , A, se dice que A es invertible (o que posee inversa o que es
no singular o que es regular ), si existe otra matriz del mismo orden, denominada matriz inversa de A
y representada por A−1 y tal que:
A · A−1 = In
y
A−1 · A = In
Si A no tiene inversa, se dice que es singular o no invertible.
Si una matriz tiene inversa, dicha matriz inversa es única (sólo hay una). Para calcular dicha matriz
inversa, podemos utilizar dos vı́as:
6.6.1. Método directo:

Consiste en determinar A−1 planteando un sistema de ecuaciones, es decir, si por ejemplo queremos
1 2
determinar la inversa de la matriz A = , lo que estoy buscando es otra matriz de igual tamaño
−1 1

−1 −1 −1 x y
(orden 2) tal que A · A = I2 y A · A = I2 , es decir, si A = , se tiene que cumplir que :
z t

−1 1 2 x y 1 0 x + 2z y + 2t 1 0
A · A = I2 =⇒ · = =⇒ =
−1 1 z t 0 1 −x + z −y + t 0 1


 x + 2z = 1

y + 2t = 0

−x +z =0

−y + t = 1
Es decir, hemos de resolver un sistema de 4 ecuaciones con 4 incógnitas, aunque en realidad son 2
sistemas de dos ingónitas cada uno (uno con x y z y otro con y y t).
Resolviendo el sistema se obtiene que
1 −2 1 1
x= ,y = ,z = ,t =
3 3 3 3
por lo que la matriz inversa es:

1 −2

−1 3 3
1 1 −2
A = 1 1 = ·
3 3 3 1 1
Se puede comprobar que también se cumple que A−1 · A = I2 , luego A es invertible, tiene inversa. Si
el sistema no tiene solución, la matriz no
tiene inversa.
1 1
Por ejemplo, en el caso en que A = , del mismo modo :
2 2

−1 1 1 x y 1 0 x+z y+t 1 0
A·A = I2 =⇒ · = =⇒ =
2 2 z t 0 1 2x + 2z 2y + 2t 0 1


 x+z = 1

y+t = 0

 2x + 2z = 0

2y + 2t = 1
Y por ejemplo de 2x+2z=0 se obtiene x = -z, si se sustituye en la primera ecuación es -z+z=1, es
decir 0 = 1 (imposible). El sistema no tiene solución.
Por tanto A no es invertible, es singular.
Este método directo sólo se suele utilizar para matrices cuadradas de tamaño 2, puesto que para
las de tamaño 3 obtenemos un sistemas de ¡9 ecuaciones con 9 incógnitas! que realmente es difı́cil de
resolver.
6.6.2. Método de Gauss-Jordan:

Consiste en hacer transformaciones elementales en las filas de la matriz para llegar a obtener la
matriz identidad. Realizando estas mismas transformaciones con la matriz identidad llegamos a la
matriz A−1 .
Se llama transformación elemental en una matriz a:
T1) Multiplicar o dividir una fila por un número real distinto de cero.
T2) Sumar o restar a una fila otra multiplicada por un número real no nulo.
T3) Intercambiar el lugar de dos filas entre sı́.
1 2
Veamos como se realiza el método de Gauss-Jordan, realizándolo a la vez con la matriz .
−1 1
i) Consideramos la matriz formada por A y la matriz identidad correspondiente . En nuestro caso:

1 2 1 0
(A|I2 ) =
−1 1 0 1
ii) Se hace la matriz triangular superior (es decir, hacemos ceros por debajo de la diagonal principal)
usando transformaciones elementales en filas.
La mejor forma de realizar esto es hacer cero los elementos por debajo de la diagonal en la primera
columna usando la fila 1. Luego, hacer cero los elementos por debajo de la diagonal en la segunda
columna usando la fila 2, y ası́ sucesivamente.
En nuestro caso, basta sumar la fila 2 con la fila 1, y se obtiene:

1 2 1 0 F2 +F1 1 2 1 0
(A|I2 ) = −−−−→
−1 1 0 1 0 3 1 1
iii) Una vez hecha la matriz triangular superior, se hace la matriz triangular inferior, haciendo
ceros a los elementos por encima de la diagonal. El proceso es parecido al anterior:
Hacer cero los elementos por encima de la diagonal en la última columna usando la última fila. Lue-
go, hacer cero los elementos por encima de la diagonal en la penúltima columna usando la penúmtima
fila, y ası́ sucesivamente. En nuestro caso:

1 2 1 0 3·F1 −2·F2 3 0 1 −2
−−−−−−→
0 3 1 1 0 3 1 1
iv) Ya tenemos una matriz diagonal. Lo único que falta es dividir a cada fila entre el número
adecuado para obtener unos en la diagonal principal, es decir, para obtener la matriz identidad en la
parte izquierda:
F1 F2
3 0 1 −2 3
, 3 1 0 13 −23
−
− −−→
0 3 1 1 0 1 31 13
v) Una vez se tiene la matriz identidad en la parte de la izquierda, la parte derecha es la matriz inversa,
es decir, llegamos a:
1 −2
1 0 13 −2 1 1 −2
(I2 , A−1 ) = 3 =⇒ A−1
= 3 3 = ·
0 1 31 13 1
3
1
3 3 1 1
matriz que habı́amos obtenido antes por el método directo.
Si al realizar el método de Gauss-Jordan en algún momento alguna fila es de ceros, la matriz no
tiene inversa.
Cuanto mayor sea el orden de la matriz, mejor es este método frente al directo.
Veamos otro ejemplo:  
1 1 0
Calcular la inversa de la matriz B = −1 1 2 por el método de Gauss-Jordan.
1 0 1
Siguiendo los pasos anteriores:
     
1 1 0 1 0 0 1 1 0 1 0 0 1 1 0 1 0 0
F +F F −F
(B|I3 ) = −1 1 2 0 1 0 −−2−−→ 1 
0 2 2 1 1 0 −−3−−→ 1 
0 2 2 1 1 0
1 0 1 0 0 1 1 0 1 0 0 1 0 −1 1 −1 0 1
   
1 1 0 1 0 0 1 1 0 1 0 0
2·F +F2 2·F2 −F3 4·F −F2
−−−3−−→ 0 2 2 1 1 0 − −−−−→ 0 4 0 3 1 −2 −−−1−−→

0 0 4 −1 1 2 0 0 4 −1 1 2
   
4 0 0 1 −1 2 F1 F2 F3
, ,
1 0 0 14 −14
2
4
4·F −F2
−−−1−−→ 0 4 0 3 1 −2 −− 4
−−4
−−4→ 0 1 0 43 1 −2 
= (I3 |B −1 )
4 4
0 0 4 −1 1 2 0 0 1 −1 14 2
 1 −1 1  4 4
4 4 2
=⇒ B −1 =  3
4
1
4
−1 
2
−1 1 1
4 4 2
También se puede expresar, sacando factor común:
 
1 −1 2
1
B −1 = ·  3 1 −2
4
−1 1 2
es la inversa de B.
1 1
Si calculamos por este método la inversa de A = resulta:
2 2

1 1 1 0 F2 −2·F1 1 1 1 0
(A|I2 ) = −−−−−→
2 2 0 1 0 0 −2 1
Como aparece una fila de ceros, la matriz A no tiene inversa.
Ejercicios:
1. Calcular por el método de Gauss-Jordan la inversa de las matrices:

   
1 2 −3 −2 1 4
A = 3 2 −4 B= 0 1 2 
2 −1 0 1 0 −1
 
3 0 0
2. Dada la matriz diagonal D = 0 −2 0 calcula su inversa. ¿Cómo calcuları́as de forma
0 0 5
rápida la inversa de una matriz diagonal cualquiera?.
6.7. Rango de una matriz

Un concepto muy importante relacionado con las matrices es el de rango. El concepto de ran-
go se encuentra ligado al de “independencia lineal” de filas o columnas de una matriz, pero no se
introducirá de esta manera porque se requieren conceptos que no conocemos.
Baste saber que se define el rango de una matriz como el número máximo de filas o columnas
linealmente independientes.
Sin embargo, el cálculo del rango de una matriz lo abordaremos desde otra perspectiva, utilizando
el método de Gauss.
Supongamos que tenemos una matriz cualquiera A a la que aplicamos el método de Gauss con el
fin de simplificarla lo más posible (es decir, consiguiendo que tenga el mayor número de ceros posible),
realizando operaciones elementales en filas.
Llamaremos rango de la matriz A y lo representaremos por Rg(A) al número de filas no nulas de
la matriz tras aplicarle el método de Gauss.
Ejemplo: Calcular el rango de las siguientes matrices:

 
1 1 0
1 1 0 3 2 4 6
A= B= C= 2 1 1  D=
2 2 1 1 −1 −2 −3
−1 1 −2

1 1 F2 −2·F1 1 1
a) −−−−−→ , Rg(A)=1 ,sólo una fila distinta de cero.
2 2 0 0

0 3 F2 F1 1 1
b) −−−−→ , Rg(B)=2 hay 2 filas no nulas.
1 1 0 3
       
1 1 0 1 1 0 1 1 0 1 1 0
F2 −2·F1  F +F1  F +2·F2 
c)  2 1 1  −− −−−→ 0 −1 1  −−3−−→ 0 −1 1  −−3−−−→ 0 −1 1
−1 1 −2 −1 1 −2 0 2 −2 0 0 0
Rg(C)=2
hay 2 filas
no nulas.
2 4 6 2·F2 +F1 2 4 6
d) −−−−−→ , Rg(D)=1, sólo una fila no nula.
−1 −2 −3 0 0 0
Los ejemplos anteriores ponen de manifiesto que el rango de cualquier matriz siempre es menor o
igual que el número de filas de la matriz.
De hecho se verifica que el rango de cualquier matriz siempre es menor o igual que su número de
filas y de columnas, pues el proceso para hacer el método de Gauss se puede hacer indistintamente
mediante operaciones elementales en filas o en columnas.
Esto permite, antes de calcular el rango de una matriz, saber entre qué valores va a estar ese rango.
Por ejemplo, en el caso c) del ejemplo, como la matriz es 3x3 , el rango sólo puede ser 0, 1, 2 ó 3,
no hay otras posibilidades.
En el caso del apartado d), como la matriz es 2 x 3, el rango sólo puede ser 0,1 ó 2. (De hecho,
podemos reducir esto algo más , pues una matriz sólo tiene rango cero si es la matriz nula).Resumiendo:
Propiedad: Si A es una matriz de tamaño m x n no nula se cumple que:
1 ≤ Rg(A) ≤ min{m, n}
Ejemplo: Calcular en función de k el rango de la matriz:

1 1 2
A=
3 3 k
Aplicando Gauss,
1 1 2 F2 −3·F11 1 2
A= −−−−−→
3 3 k 0 0 k−6
Ahora es evidente que si k-6=0, la última fila es nula. Por tanto, si k=6, la última fila es nula y el
rango de A es 1, Rg(A)=1, mientras que si k-6 es distinto de cero, es decir si k es distinto de 6, hay 2
filas no nulas y el rango de A es 2, Rg(A)=2. Resumiendo:

Si k = 6, entonces Rg(A)=2
Si k=6, entonces Rg(A)=1
La siguiente propiedad permite relacionar el concepto de rango con el de matriz inversa visto
anteriormente:
Propiedad:
Una matriz cuadrada A tiene inversa ⇐⇒ Rg(A) es máximo.
Ejercicios:


1 −2 1
1. Calcula el rango de A según los valores de k: A = 1 1 3.¿Para qué valores de k tiene A
5 −1 k
inversa?.
2. Calcula el rango de las matrices:

 
0 2 1
1 0 1
A= B = 1 0 −1
2 1 0
0 4 2
 
2 −1 1 1  
0 0 1 0 2 1 5 −1 8
C =
2 1 1 1
 D = −1 2 3 4 5
1 3 10 11 13
0 0 0 1
6.8. Determinantes
Introduciremos a continuación el concepto de determinante asociado a una matriz cuadrada. Este
concepto permite simplificar operaciones matriciales tales como el cálculo del rango o de la matriz
inversa.
Definición:
Si es una matriz 2 x 2 se define el determinante de la matriz A, y se expresa como det(A) o bien
|A|, como el número:
a11 a12
det(A) = |A| = = a11 · a22 − a12 · a21
a21 a22
Ejemplos: El cálculo de los determinantes de orden 2 es bien sencillo, por ejemplo:

1 3

a) =1·4-(-1)·3=4+3=7.
−1 4

−2 −3

b) =-10+6=-4.
2 5
Para definir determinantes de matrices de orden mayor que 2 es necesario introducir previamente
algunos conceptos.
Dada una matriz cuadrada A de orden n, definimos el menor complementario de un elemento de
A,aij , como el determinante de la matriz que se obtiene al suprimir la fila i y la columna j en la que
se encuentra dicho elemento aij . Se representa por Mij .
 
−2 4 5
Ejemplo: En la matriz A =  6 7 −3 , los menores complementarios de cada uno de los
3 0 2
elementos de la primera fila son:
7 −3
Menor complementario de -2:M11 = =14-0=14.
0 2

6 −3
Menor complementario de 4:M12 = =12+9=21.
3 2

6 7
Menor complementario de 5:M13 = =0-21=-21.
3 0
Y ası́ sucesivamente.
Ejercicio: Obtener los restantes menores complementarios de los elementos de la matriz A.
Estrechamente ligado al concepto de menor complementario se encuentra el de adjunto de una matriz.

Dada una matriz cuadrada A de orden n, definimos el adjunto de un elemento aij de A como el
número:
Aij = (−1)i+j · Mij
es decir, no es más que el menor complementario correspondiente acompañado de un signo más o
menos dependiendo de la fila y la columna en la que se encuentre el elemento en cuestión.
Por ejemplo, para la matriz anterior, los adjuntos de los elementos de la primera fila son:
Adjunto de -2:A11 = (−1)1+1 · M11 = 1 · 14 = 14 (coincide con el menor complementario)
Adjunto de 4:A12 = (−1)1+2 · M12 = (−1) · 21 = −21 (menor complementario con signo cambiado)
Adjunto de 5:A13 = (−1)1+3 · M13 = 1 · −21 = −21 (coincide con el menor complementario).
Ejercicio: Obtener los restantes adjuntos de los elementos de la matriz A.
En general puede saberse si el signo del menor complementario y del adjunto coinciden o no utilizando
una sencilla regla gráfica, por ejemplo, para matrices 3 x 3 y 4 x 4 basta fijarse en las matrices:
 
  + − + −
+ − + − + − + 
− + −  
+ − + − 
+ − +
− + − +
donde el + significa que el adjunto coincide con el menor complementario y el - indica que tienen signo
contrario.
Una vez vistos estos conceptos se puede definir ya:
Definición: Dada una matriz cuadrada A de tamaño n se define su determinante como la suma
del producto de los elementos de una linea cualquiera de la matriz (fila o columna) elegida, por sus
correpondientes adjuntos.
Se puede demostrar, aunque dicha demostración excede los contenidos del curso, que el valor del
determinante no depende de la fila o columna elegida para calcularlo.
 
−2 4 5
Ejemplo: Para la matriz A =  6 7 −3 ,aplicando la definición, si elegimos la fila tercera queda:
3 0 2

4 5 −2 5 −2 4

det(A) = 3 ·
+ 0 · −
+2· =
7 −3 6 −3 6 7
= 3 · (−12 − 35) + 0 · (−(6 − 30)) + 2 · (−14 − 24) = −141 + 0 − 76 = −217
Si hubiésemos elegido otra fila o columna, por ejemplo la columna 2, quedarı́a:

6 −3 −2 5 −2 5
det(A) = 4 · − +7·
3 2 + 0 · − 6 −3 =
3 2
= 4 · (−(12 + 9)) + 7 · (−4 − 15) + 0 · (−(6 − 30)) = −84 − 133 + 0 = −217
Ejercicio: Calcula, desarrollando por la fila que tú elijas los determinantes de las matrices:
       
1 8 1 3 4 −6 7 8 0 0 3 1
1 7 0  2 −1 1  0 −7 3 −2 0 2
1 6 −1 5 3 −5 1 0 1 3 4 0
     
1 1 1 0 1 2 3 4 1 0 −1 2
1 1 0 1 2 1 3 1 2 3 2 −2
     
1 0 1 1 3 1 4 3 2 4 2 1
0 1 1 1 3 4 1 2 3 1 5 −3
6.9. La regla de Sarrus

La definición de determinante es bastante engorrosa y se hace mucho más pesada a medida que
aumenta el orden de la matriz A.
En el caso de las matrices cuadradas de orden 3, esta regla facilita el cálculo de dichos determi-
nantes.  
a11 a12 a13
Si la matriz es A = a21 a22 a23 , entonces el determinante de A se calcula mediante la resta
a31 a32 a33
de dos expresiones obtenidas del siguiente modo:
Llamaremos sumandos positivos a los obtenidos al multiplicar:
- Los elementos de la diagonal principal,a11 · a22 · a33 .
- Los elementos de la linea paralela superior a la diagonal principal por el elemento aislado de la
esquina inferior izquierda:a12 · a23 · a31 .
- Los elementos de la linea paralela inferior a la diagonal principal por el elemento aislado de la
esquina superior derecha:a21 · a32 · a13 .
Gráficamente:
Figura 6.2: Sumandos positivos
Llamaremos sumandos negativos a los obtenidos al multiplicar:

- Los elementos de la diagonal secundaria,a13 · a22 · a31 .
- Los elementos de la linea paralela superior a la diagonal secundaria por el elemento aislado de la
esquina inferior derecha: a12 · a21 · a33 .
- Los elementos de la linea paralela inferior a la diagonal secundaria por el elemento aislado de la
esquina superior izquierda: a32 · a23 · a11 .
Gráficamente:
Figura 6.3: Sumandos negativos
Y entonces det (A)= Sumandos positivos - Sumandos negativos.

Por ejemplo, en el caso de la matriz anterior:
 
−2 4 5
A =  6 7 −3
3 0 2
, se tiene que aplicando la regla de Sarrus:
det(A)=(-2)·7·2+4·3·(-3)+6·5·0-(3·7·5+0·(-2)·(-3)+6·4·2)=-28-36-105-48=-217.
Ejercicio: Comprobar, mediante la regla de Sarrus, los determinantes de orden 3 obtenidos en el

ejercicio anterior.
6.10. Propiedades de los determinantes

Algunas propiedades importantes que tienen los determinantes, y que se enuncian sin demostración,
son:
1. Si una matriz tiene una linea (fila o columna) de ceros, el determinante vale cero.
Esta propiedad es evidente, puesto que por definición de determinante, basta elegir dicha linea
para desarrollar y el determinante será 0.
2. Si una matriz tiene dos filas iguales o proporcionales, su determinante es nulo.
3. Si permutamos dos lineas paralelas de una matriz cuadrada, su determinante cambia de signo,
por ejemplo:
0 1 2 −3 0 1 2 −3

1 3 2 −5 1 3 2 −5

2 4 1
= 91 =⇒ = −91
3 3 −2 −8 1
3 −2 −8 1 2 4 3 1
4. Si multiplicamos todos los elementos de una linea de un determinante por un número, el deter-
minante queda multiplicado por ese número. Por ejemplo:

0 1 2 −3 0 1 2 −3

1 3 2 −5 2 6 4 −10
= 91 =⇒ = 182
2 4 3
1 1
2 4 3
3 −2 −8 1 3 −2 −8 1

0 2 4 −6

2 6 4 −10
pero = 16 · 91 = 1456
4 8 6 2
6 −4 −16 2
5. Si a una linea de una matriz se le suma otra linea multiplicada por un número, el determinante
no cambia.
Esta propiedad permite utilizar un método más sencillo para calcular determinantes de orden
mayor que 3.
6. El determinante de una matriz es igual al de su traspuesta,
|A| = |At|
7. Si A tiene matriz inversa, A−1 , se verifica que:

1
det(A−1 ) =
det(A)
Una estrategia a tener en cuenta en este caso de determinantes de orden 4 o superior, o incluso de
orden 3 si la matriz es compleja, es el método de “hacer ceros”, puesto que el valor del determinante
no varı́a al realizar a la matriz ciertas transformaciones elementales en filas,como indica la propiedad
5 anterior, si bien hemos de ser cuidadosos al aplicar dicha propiedad.
Ası́ pues la mejor forma de calcular un determinante es hacer ceros en una fila o columna y
desarrollar por dicha fila o columna, porque entonces sólo tendremos que calcular un adjunto. Por
ejemplo, si calculamos:

0 1 2 −3 0 1 2 −3 0 1 2 −3

1 3 2 −5 F3 −2·F2 1 3 2 −5 F4 −3·F2 1 3 2 −5
= =
2 4 =
3 1 0 −2 −1 11 0 −2 −1 11
3 −2 −8 1 3 −2 −8 1 0 −11 −14 16
Desarrollando por la columna 1
 
1 2 −3

= 1 · − −2 −1 11  =
−11 −14 16
= −(−16 − 242 − 84 − (−33 − 154 − 64)) = 91
Como hemos dicho, hemos de tener especial cuidado al aplicar esta regla con determinantes, puesto
que no podemos hacer las mismas operaciones que con las matrices, lo que puede confundir.
Por ejemplo, si queremos calcular el determinante:

1 2 3

C = 0 1 2
4 1 5
mediante la regla de Sarrus es:

det(C)=5+16+0-(12+2+0)=21-14=7.
Si hiciésemos ceros en la primera columna, y desarrollásemos nos deberı́a dar lo mismo. Ahora
bien,podemos hacer cero el 4 de la primera columna mediante:

1 2 3 1 2 3
1 2
0 1 2 F3 −4·F1 = −7 + 14 = 7.
= 0 1 2 =
−7 −7
4 1 5 0 −7 −7
lo que es correcto. Sin embargo, si queremos hacer cero el 1 de la primera columna serı́a un error
hacer:
1 2 3
4·F1 −F3 0 7 7
0 1 2 −→ 0 1 2 = 4 · 7 7 = 4 · (14 − 7) = 28.
1 2
4 1 5 4 1 5
no obtenemos lo mismo, porque hemos multiplicado la fila sustituida por un número y eso altera el
valor del determinante. Luego la fila a sustituir conviene no multiplicarla, como en el primer ejemplo,
puesto que si no nos damos cuenta, podemos variar el valor del determinante.
6.11. Relación entre la inversa y los determinantes

Hay una estrecha relación entre la inversa de una matriz cuadrada y su determinante. De hecho se
verifica que:
Propiedad: Una matriz cuadrada A tiene inversa ⇐⇒ |A| = 0.

−1
Además, en este caso, la matriz inversa de A, A se calcula de la manera:
(Adj(A)t
A−1 =
|A|
donde Adj(A) denota la matriz adjunta de A, es decir, aquella que se obtiene de sustituir cada elemento
de A por su adjunto.
 
1 0 −1
Ejemplo: Calcular, si es posible, la inversa de la matriz A =  0 1 −3.
−1 1 0

1 0 −1

En primer lugar,|A| = 0 1 −3 = 0 + 0 + 0 − (1 − 3 + 0) = 2 y por tanto A tiene inversa.
−1 1 0
Calculando Adj(A), se obtiene:




1 −3 − 0 −3 0 1
 1 0 −1 0 −1 1   
  3 3 1
 0 −1 1 −1 1 0
Adj(A) = 
− 1 0 −1 0 − −1 1 = −1 −1 −1
  
  1 3 1
 0 −1 1 −1 1 0 
−
1 −3 0 −3 0 1
Por tanto,  
3 −1 1
(Adj(A)t) = 3 −1 3
1 −1 1
Y entonces, se obtiene: 3 
−1 1
2 2 2
A−1 = 3
2
−1
2
3
2
1 −1 1
2 2 2
Ejercicio: Calcular la inversa anterior por el método de Gauss.
6.12. Aplicación de los determinantes al cálculo del rango

Los determinantes también proporcionan una forma sencilla de calcular el rango de una matriz
cualquiera.
Un definición alternativa de rango de una matriz es:
El Rango de una matriz A es el tamaño del mayor menor complementario no nulo que esté incluido
dentro de la matriz.
Aplicando este criterio, calculemos el rango de las matrices siguientes:
 
1 1 0
1 1 0 3   2 4 6
A= B= C= 2 1 1 D=
2 2 1 1 −1 −2 −3
−1 1 −2
a) Sólo hay un menor de orden 2, que es:

1 1

2 2 = 0
Como es nulo, el rango de la matriz NO es 2. Menores de orden 1 hay 4, por ejemplo |1| = 1, que es
no nulo,luego el rango de la matriz es Rg(A)=1 (el tamaño de dicho menor complementario).
b) Sólo hay un menor de orden 2, que es:

0 3

1 1 = 0 − 3 = −3
Como no es nulo, el rango de la matriz es Rg(B)=2 (el tamaño de dicho menor complementario).
c) Sólo hay un menor de orden 3, que es:

1 1 0

2 1 1 = −2 − 1 + 0 − (0 + 1 − 4) = −3 + 3 = 0

−1 1 −2
Como es nulo, podemos asegurar que el rango NO es 3.

Menores de orden 2 hay 9. Calculando alguno:

1 0

1 1 = 1
resulta que es no nulo, luego el rango es Rg(C)=2 (el tamaño de dicho menor complementario).
d) El menor más grande que podemos formar es de orden 2. Hay 3 de ellos:

2 4 2 6 4 6

−1 −2 = −4 + 4 = 0 −1 −3 = −6 + 6 = 0 −2 −3 = −12 + 12 = 0
Son todos nulos, luego el rango NO es 2. Menores de orden 1 hay 6, y por ejemplo |6| = 6 = 0, es no
nulo, luego el rango es Rg(D)=1.
Ejercicio Calcula,utilizando los determinantes, el rango de las matrices:

 
0 2 1
1 0 1
A= B = 1 0 −1
2 1 0
0 4 2
 
2 −1 1 1  
0 0 1 0 2 1 5 −1 8
C =  D = −1 2 3 4 5
2 1 1 1
1 3 10 11 13
0 0 0 1
Capı́tulo 3
DISTRIBUCIÓN BINOMIAL Y
DISTRIBUCIÓN NORMAL
3.1. Introducción
Estudiaremos en este tema dos de las distribuciones de probabilidad más importantes y que son
imprescindibles a la hora de adentrarnos en el estudio de la inferencia estadı́stica. La distribución
binomial es uno de los primeros ejemplos de las llamadas distribuciones discretas (que sólo pueden
tomar un número finito, o infinito numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza,
1654-1705), quién escribió el primer tratado importante sobre probabilidad, “Ars conjectandi” (El
arte de pronosticar). Los Bernoulli formaron una de las sagas de matemáticos más importantes de la
historia. La distribución normal es un ejemplo de las distribuciones continuas, y aparece en multitud
de fenómenos sociales. Fue estudiada, entre otros, por J.K.F. Gauss (Alemania, 1777-1855), uno de los
más famosos matemáticos de la historia. La gráfica de la distribución normal en forma de campana se
denomina Campana de Gauss.
3.2. La distribución binomial o de Bernoulli

La distribución binomial está asociada a experimentos del siguiente tipo:
- Realizamos n veces cierto experimento en el que consideramos sólo la posibilidad de éxito o
fracaso.
- La obtención de éxito o fracaso en cada ocasión es independiente de la obtención de éxito o
fracaso en las demás ocasiones.
- La probabilidad de obtener éxito o fracaso siempre es la misma en cada ocasión.
Veámoslo con un ejemplo

Tiramos un dado 7 veces y contamos el número de cincos que obtenemos. ¿Cuál es la probabilidad
de obtener tres cincos?.
Este es un tı́pico ejemplo de distribución binomial, pues estamos repitiendo 7 veces el experimento
de lanzar un dado. ¿Cuál es nuestro éxito?.
Evidentemente, sacar un 5, que es en lo que nos fijamos.
El fracaso, por tanto, será no sacar 5, sino sacar cualquier otro número.
1
Por tanto, Éxito = E = “sacar un 5” =⇒ p(E) =
6
5
Fracaso = F = “no sacar un 5” =⇒ p(F ) =
6
Para calcular la probabilidad que nos piden, fijémonos en que nos dicen que sacamos 3 cincos y
por lo tanto tenemos 3 éxitos y 4 fracasos, ¿de cuántas maneras pueden darse estas posibilidades?.
Podrı́amos sacar 3 cincos en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir: EEEFFFF
Pero también podrı́amos sacar EFEFFFE, es decir que en realidad estamos calculando de cuántas
38
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 39
maneras se pueden ordenar 4 fracasos y 3 éxitos. Recordando las técnicas combinatorias, este problema
se reduce a calcular las permutaciones con elementos repetidos:
7! 7·6·5
P73,4 = = = 35formas
3! · 4! 3·2·1
1 5
Y por tanto, como p(E) = y tengo 3 éxitos y p(F ) = y tengo 4 fracasos:
6 6
1 1 1 5 5 5 5
p(tener 3 éxitos y 4 fracasos) = 35 · · · · · · · = 0 0781
6 6 6 6 6 6 6
1
Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de éxito ,
6
la probabilidad de obtener 3 éxitos es 0’0781, y lo expresarı́amos:

1
Bin 7; , entonces p(X = 3) = 0 0781
6
Como repetir este proceso serı́a bastante penoso en la mayorı́a de los casos, lo mejor es recurrir a la
siguiente fórmula que expresa la probabilidad de obtener cierto número de éxitos en una distribución
binomial:
Definición de distribución binomial:

Si realizamos n veces un experimento en el que podemos obtener éxito, E, con probabilidad p y
fracaso, F, con probabilidad q (q = 1 − p), diremos que estamos ante una distribución binomial de
parámetros n y p, y lo representaremos por Bin(n;p). En este caso la probabilidad de obtener k éxitos
viene dada por:
n
p(X = k) = · pk · q (n−k)
k
Nota:
Observar que las probabilidades de éxito y fracaso son complementarias, es decir, q = 1-p y p =
1-q, por lo que basta saber una de ellas para calcular la otra.
Ejemplo:
1
Antes tenı́amos Bin 7; , y querı́amos calcular p(X=3) (obtener 3 éxitos). Aplicando la fórmula:
6
3 4
7 1 5
p(X = 3) = · · = 0 0781
3 6 6
Ejemplo:
Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la
probabilidad de que una familia con 6 descendientes tenga 2 hijos.
En este caso Éxito = E = “tener hijo” y p(E) = 0’5.
Fracaso = F = “tener hija” y p(F) = 0’5.
Estamos por tanto ante una binomial Bin(6;0’5) y nos piden p(X=2).
Si aplicamos la fórmula es:

6
p(X = 2) = · (0 5)2 · (0 5)4 = 0 2344
2
Nota:
La elección de éxito o fracaso es subjetiva y queda a elección de la persona que resuelve el problema,
pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo
anterior, si:
Éxito = “tener hija”, como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos,
si el éxito es tener hija hemos de plantearnos cuál es la probabilidad de tener 4 éxitos (4 hijas), es
decir:
6
p(X = 4) = · (0 5)4 · (0 5)2 = 0 2344
4
Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el éxito y el fracaso y
la pregunta que nos hagan.
3.2.1. El uso de las tablas de la distribución binomial

La distribución binomial se encuentra tabulada por lo que es fácil calcular probabilidades sin
necesidad de hacer demasiadas cuentas. Para usar las tablas de la distribución binomial es necesario
conocer:
- El número de veces que se realiza el experimento (n).
- La probabilidad de éxito (p).
- El número de éxitos (k).
La probabilidad p se busca en la primera fila (valores desde 0’01 hasta 0’5).
El número de veces que se realiza el experimento, en la primera columna (valores desde 2 a 10) y
el número de éxitos a su lado.
Por ejemplo en el caso anterior, Bin (6;0’5) , p(X=2), la columna p=0’5 es la última, y cuando
n=6 y k=2 encontramos 0’2344, el valor que habı́amos calculado.
Nota importante: El caso en que p > 0 5, no se encuentra tabulado.
La razón es bien sencilla. Si p > 0 5, entonces q < 0 5 y basta intercambiar los papeles de éxito y
fracaso para que podamos utilizar la tabla.
Ejemplo:
La probabilidad de que un alumno de 2º de Bachillerato apruebe las Matemáticas es de 0’7. Si
consideramos un grupo de 8 alumnos, ¿cuál es la probabilidad de que cinco de ellos aprueben las
Matemáticas?.
Si éxito = “aprobar” y fracaso = “suspender”, entonces p = 0’7 y q = 0’3.
Tenemos, por tanto, una Bin(8;0’7).
Nos piden calcular p(X=5), que no se puede calcular mediante las tablas porque p = 0’7 y sólo
tenemos hasta p = 0’5. Por tanto si intercambiamos éxito = “suspender” y fracaso =“aprobar” entonces
p = 0’3, q = 0’7, es decir la nueva binomial es Bin(8;0’3) y nos piden que aprueben 5 de 8, es decir
que suspendan 3 de 8 o lo que es lo mismo, que tengamos 3 éxitos, p(X=3), y buscando en la tabla es
p(X=3) = 0’2541.
También, desde luego podrı́amos haber utilizado la fórmula desde el principio, utilizar la Bin(8;0’7)
y olvidarnos de tablas para hacer:

8
p(X = 5) = · (0 7)5 · (0 3)3 = 0 254
5
3.2.2. Probabilidades acumuladas

Es posible que nos pidan no sólo la probabilidad de que ocurran un cierto número de éxitos en
concreto, sino que ocurran como mucho “k” éxitos o preguntas similares. En el ejemplo anterior, por
ejemplo, podrı́an pedirnos:
a) ¿Cuál es la probabilidad de que aprueben como mucho 2 alumnos?.
Si éxito = aprobar y fracaso = suspender, p= 0’7 y q = 0’3, entonces nos piden p(X ≤ 2). En
este caso, basta pensar en que para que aprueben 2 alumnos como mucho, puede que aprueben 2, 1 o
ninguno, es decir:
p(X ≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0 0001 + 0 0012 + 0 01 = 0 1013
(haz las cuentas)

b) ¿Cuál es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?.
Del mismo modo:
p(3 ≤ X ≤ 6) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) =

= 0 0467 + 0 1361 + 0 2541 + 0 2965 = 0 7334
Hemos de tener en cuenta que para la distribución binomial, en las tablas sólo se admiten valores
hasta n=10 (10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de
utilizar la fórmula.
Ejemplo:
Los alumnos de cierta clase se encuentran en una proporción del 67 % que estudian inglés y el resto
francés.
Tomamos una muestra de 15 alumnos de la clase, calcular:
a) Probabilidad de que al menos encontremos tres alumnos de inglés.
b) Probabilidad de que los 15 alumnos estudien inglés.
c) Probabilidad de que estudien inglés entre 7 y 10 alumnos.
Si éxito = estudiar inglés, p = 0’67 y fracaso = estudiar francés, q = 1-0’67 = 0’33. Manejamos
por tanto una Bin(15;0’67)
a) p(X ≥ 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + . . . + p(X = 15).
Una opción es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la fórmula para
calcular cada una, la tarea se puede hacer bastante larga. Otra opción, más sencilla, es pasar al
complementario. El complementario de encontrar al menos 3 alumnos de inglés es encontrar como
mucho 2 alumnos de inglés, p(X ≤ 2).
Es decir,
p(X ≥ 3) = 1 − p(X < 3) = 1 − p(X ≤ 2) = 1 − (p(X = 0) + p(X = 1) + p(X = 2))
y sólo tenemos que calcular 3 probabilidades: p(X = 0) ≈ 0 , p(X=1) = 0’000001, p(X=2) = 0’000026
(¡compruébalo!).
Por lo cual,
p(X ≥ 3) = 1 − (0 + 0 000001 + 0 000026) = 1 − 0 000027 = 0 999973
b) p(X=15) = 0’0025 (aplica la fórmula).

c)
p(7 ≤ X ≤ 10) = p(X = 7) + p(X = 8) + p(X = 9) + p(X = 10) =

= 0 0549 + 0 1114 + 0 1759 + 0 2142 = 0 5564.
3.2.3. Media y desviación tı́pica en una distribución binomial

Aunque no se demostará, en una distribución binomial Bin(n;p), el número esperado de éxitos o
media, viene dado por x̄ = n · p. (Recordemos que la media es una medidad de centralización).
La desviación tı́pica, σ , que es una medida de dispersión y mide lo alejados que están los datos
√
de la media, viene dada por σ = n · p · q.
3.3. La distribución Normal

Al estudiar aspectos tan cotidianos como:
- Caracteres morfológicos de individuos ( personas, animales, plantas) de una misma raza. como
tallas, pesos, envergaduras, etc.
- Caracteres fisiológicos, como el efecto de una misma dosis de un fármaco, o de una misma cantidad
de abono.
- Caracteres sociológicos, como el consumo de ciertos productos por individuos de un mismo grupo
humano.
- Caracteres psicológicos, como el cociente intelectual, grado de adaptación a un medio.
- Caracteres fı́sicos, como la resistencia a la rotura de ciertas piezas. . .
todos ellos tienen en común que se distribuyen “normalmente”. ¿Qué quiere decir esta expresión?.
Pués, por ejemplo, si hacemos una estadı́stica para conocer la altura de 1400 mujeres y representamos
los resultados en un diagrama de barras, obtenemos:
Figura 3.1: Distribución de estaturas de 1400 mujeres
Las gráficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento
paulatino hasta llegar a la parte central del recorrido, donde está la mayorı́a de ellos.
Definición: Diremos que una distribución de probabilidad sigue una distribución normal de media x
y desviación tı́pica σ, y lo representaremos por N (x; σ) cuando la representación gráfica de su función
de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y
que tiene 2 puntos de inflexión , situados a ambos lados de la media (x − σ y x + σ respectivamente)
y a distancia de σ ella, es decir de la forma:
1
Figura 3.2: Distribución normal N (x; σ). El máximo está en (x, √ )
2·π·σ2
Dependiendo de los valores que tomen x y σ, la gráfica de esta función puede ser más o menos
alargada, achatada, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetrı́a,
continuidad, etc reseñadas anteriormente.
El concepto de función de densidad introducido anteriormente no se estudiará con profundidad.
Baste decir que la función de densidad determina la forma de cada distribución de probabilidad. En
el caso de la distribución normal de parámetros x y σ, dicha función viene dada por:
1 (x−x)2
f (x) = √ · e− 2·σ 2
2 · π · σ2
Propiedad:
El área encerrada bajo la curva normal N (x; σ) siempre es 1.
La demostración de este resultado no es nada sencilla e implica el uso de resultados matemáticos que
exceden el nivel de este curso.
De entre todas las curvas normales N (x; σ), la más sencilla, usada y conocida es aquella que tiene
por media 0 y por desviación tı́pica 1, N(0, 1).
Esta normal estándar se suele representar por Z.
La gráfica de esta curva se denomina campana de Gauss y se puede observar en la figura:
1
Figura 3.3: Distribución normal N (0; 1). El máximo está en (0, √2·π )
Su función de densidad será:

1 x2
f (x) = √ · e− 2
2·π
Puesto que el área bajo esta curva normal es 1, podemos definir una probabilidad de la siguiente
manera:
Para un valor cualquiera k, definimos la probabilidad de que la distribución Z, N(0;1) , sea menor o
igual que k como:
p(Z ≤ k)= “Área encerrada bajo la curva normal N(0,1) desde −∞ hasta k”
(es decir la parte rayada de la figura siguiente).
Figura 3.4: Área encerrada por la curva normal desde −∞ hasta k
Ahora bien, ¿cómo calcular dicha área?. Fácil: Dichas áreas o probabilidades se encuentran tabu-
ladas.
3.3.1. Uso de las tablas de la distribución normal N(0;1)

La normal N(0;1) se encuentra tabulada, para valores a partir de 0 y hasta 3’99. Si por ejemplo
queremos calcular p(Z ≤ 2 78), hemos de realizar los pasos:
1. Buscar la parte entera y las décimas en la primera columna (en este caso 2’7).
2. Buscar las centésimas en la primera fila (en este caso 8).
3. En el punto común a la fila y la columna que hemos encontrado, tenemos la probabilidad buscada,
en este caso 0’9973.
Por tanto p(Z ≤ 2 78) = 0 9973.
Si queremos calcular una probabilidad de un valor mayor que 3’99, basta fijarse en que las proba-
bilidades correpondientes a valores tales como 3’62 y mayores ya valen 0’9999 (prácticamente 1). Por
eso, para estos valores mayores que 3’99, diremos que la probabilidad es aproximadamente 1. Ası́:
p(Z ≤ 5 62) ≈ 1
aunque no aparezca en la tabla.
Por otra parte, fijémonos en que en este tipo de distribuciones no tiene sentido plantearse probabili-
dades del tipo p(Z=k), ya que siempre valen 0, al no encerrar ningún área. Por tanto, si nos pidiesen
p(Z=3’2), basta decir que p(Z=3’2)=0.
Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se de-
moniman distribuciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por
ejemplo la binomial, que es una distribución discreta.
Ası́, al pasar al complementario, si tenemos Z ≥ k, su complementario será Z < k, pero como incluir
k no influye en la probabilidad,al calcular probabilidades podemos escribir:
p(Z ≥ k) = 1 − p(Z < k) = 1 − p(Z ≤ k)
Sólo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer
y hay que ser cuidadosos con el paso al complementario.
Ejercicio: Buscar en la tabla de la normal estándar N(0;1) las probabilidades:

a) p(Z ≤ 1 15) b) p(Z ≤ 0 5) c) p(Z ≤ 0 82) d) p(Z ≤ 1 05) e) p(Z ≤ 4 27)

f) p(Z ≤ 18 09)
3.3.2. Cálculo de otras probabilidades

1. Si k es positivo y queremos calcular p(Z ≥ k), es decir el área rayada:
Figura 3.5: p(Z ≥ k). Basta pasar al complementario
basta pasar al complementario, es decir: p(Z ≥ k) = 1 − p(Z ≤ k) y esta última probabilidad ya

se encuentra tabulada.
Ejercicio: Calcular p(Z ≥ 0 3) y p(Z ≥ 2 07).
2. Si k es positivo y queremos calcular p(Z ≤ −k), es decir el área: por simetrı́a, p(Z ≤ −k) =
Figura 3.6: p(Z ≤ −k).Las probabilidades de valores negativos no están tabuladas
p(Z ≥ k) y ésta se calcula como en el caso anterior. Se puede observar la igualdad de áreas en
la figura:
Figura 3.7: p(Z ≤ −k) = p(Z ≥ k). La simetrı́a permite reducir este caso al anterior
Ejercicio: Calcular p(Z ≤ −0 78) y p(Z ≤ −3 2).
3. Si k es positivo y queremos calcular p(Z ≥ −k), es decir el área rayada:
Figura 3.8: p(Z ≥ −k)
entonces, por simetrı́a p(Z ≥ −k) = p(Z ≤ k):
Figura 3.9: p(Z ≥ −k) = p(Z ≤ k).La simetrı́a permite reducir este caso al que ya está tabulado
Ejercicio: Calcular p(Z ≥ −0 96) y p(Z ≥ −1 01).

4. Probabilidades comprendidas entre dos valores,p(k1 ≤ Z ≤ k2 ) ,es decir el área rayada:
Figura 3.10: p(k1 ≤ Z ≤ k2 ). Probabilidad comprendida entre dos valores
se calcula restando las áreas:
Figura 3.11: p(Z ≤ k2 ) en la primera imagen.p(Z ≤ k1 ) en la segunda. Al restar obtenemos el área

pedida.
Se quita la parte correspondiente a Z ≤ k1 ,p(Z ≤ k2 ) − p(Z ≤ k1 ).

Ejercicio: Calcular p(−0 96 ≤ Z ≤ 1 49) y p(−1 32 ≤ Z ≤ −0 57).
Ejercicio: Calcular p(Z=2), p(Z ≤ 2), p(Z ≥ 2), p(Z ≤ −2), p(Z ≥ −2), p(−2 ≤ Z ≤ 2),
p(0 81 ≤ Z ≤ 1 33).
3.3.3. Cálculo de probabilidades en normales N(x; σ)

Si no tenemos una distribución N(0;1), sino una N (x; σ) cualquiera, ¿cómo calcular probabilidades,
si no tenemos tabla salvo para N(0;1)?. El siguiente resultado nos da la respuesta.
Propiedad:
X−x
Si X sigue una distribución N (x; σ) , entonces la variable Z = sigue una distribución N(0,1).
σ
(El paso de la variable X −→ N (x; σ) a la Z −→ N(0;1) se denomina tipificación de la variable X).
Ejemplo:
Las estaturas de 600 soldados se distribuyen de acuerdo a una distribución normal de media 168
y desviación tı́pica 8 cm. ¿Cuántos soldados miden entre 166 y 170 cm?.
Sea X la distribución de los soldados , X es una N(168,8). Nos piden p(166 ≤ X ≤ 170).
Utilizando el resultado anterior, primero restamos x=168 en la desigualdad:
p(166 ≤ X ≤ 170) = p(166 − 168 ≤ X − 168 ≤ 170 − 168) = p(−2 ≤ X − 168 ≤ 2)
Y ahora dividimos entre σ = 8, con lo que acabamos de tipificar:

−2 X − 168 2
p(166 ≤ X ≤ 170) = p(−2 ≤ X − 168 ≤ 2) = p ≤ ≤
8 8 8
X − 168
Llamando a = Z, ésta ya es normal N(0,1) y se encuentra en las tablas:
8
p(166 ≤ X ≤ 170) = p(−0 25 ≤ Z ≤ 0 25) = p(Z ≤ 0 25) − p(Z ≤ −0 25) =

= (tablas) = 0 5987 − 0 4013 = 0 1974.
(pues p(Z ≤ −0 25) = p(Z ≥ 0 25) = 1 − p(Z ≤ 0 25) = 1 − 0 5987 = 0 4013).
Ejercicios: 1) En una distribución N(22,5), calcula: p(X ≤ 27),p(X ≥ 27),p(X ≥ 125), p(15 ≤
X ≤ 20), p(17 ≤ X ≤ 30).
2) Los pesos de 60 soldados siguen una distribución N(67,5). Calcula la probabilidad de que el
peso sea:
a) mayor de 80 kg.
b) 50 kg. o menos
c) menos de 60 kg.
d) 70 kg.
e) Entre 60 y 70 kg inclusive.
3.3.4. Otro uso de las tablas

Hasta ahora nos han dado la distribución normal N(0;1) y nos pedı́an p(Z ≤ k) siendo k un cierto
número, y nos pedı́an calcular dicha probabilidad.
Ahora bien, otra pregunta puede ser: Dado que en una normal N(0;1) sabemos que p(Z ≤ k) =

0 9573, ¿quién es k?.
La resolución es bien sencilla. Basta buscar 0’9573 dentro de la tabla de la distribución normal, y
lo encontramos en el cruce de la fila 1’7 con la columna 2, y por lo tanto k debe ser 1’72.
Ejercicio: Calcular k si:
a) p(Z ≤ k) = 0 8078.
b) p(Z ≥ k) = 0 0028.
En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribución normal,
pueden ocurrir dos posibilidades:
a) Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente)
de cada uno de ellos, por ejemplo: p(Z ≤ k) = 0 7982. En este caso el valor buscado será la media
entre los valores extremos.
Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre los valores
0’7967 (que corresponde a 0’83) y 0’7996 (que corresponde a 0’84). Por tanto el valor de k será:
0 83 + 0 84
k= = 0 835
2
b) Si el valor está entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor,
por ejemplo: p(Z ≤ k) = 0 7970. El valor más cercano es 0’9767 (que corresponde a 0’83) y como el
valor buscado está muy cerca de él, entonces directamente k=0’83.
Si la distribución no es normal N(0;1), sino N (x; σ), tendremos que tipificar previamente.
Por ejemplo, si X sigue una normal N(6;3) y p(X ≤ k) = 0 9082, calcula k.
Tipificando:
X −6 k−6 k−6
p ≤ = 0 9082 −→ p Z ≤ = 0 9082
3 3 3
Y buscando en la tabla,
k−6
= 1 33 ⇒ k − 6 = 3 99 ⇒ k = 9 99
3
Ejercicios:
1. Calcular k si p(X ≤ k) = 0 6141 y X sigue una N(15,4).
2. De una variable normal N (x; σ) se sabe que p(X ≤ 7) = 0 9772 y p(X ≤ 6 5) = 0 8413. Calcular:
a) x y σ.
b) p(5 65 ≤ X ≤ 6 25)
c) El número k tal que p(X > k) = 0 3
3.4. Relación entre la distribución binomial y la distribución normal

Es un hecho comprobado que cuando tenemos una distribución Bin(n;p), a medida que n crece, es
difı́cil hacer uso de las fórmulas y/o tablas.
Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y 33 cin-
cos(inclusive).
1 5
Si éxito = obtener cinco entonces p = y fracaso = no obtener cinco y q = .
6 6
1
Tenemos una Bin 100; , y nos piden p(20 ≤ X ≤ 33).
6
Es inviable aplicar las tablas (pues repetimos el experimento 100 veces) y tampoco la fórmula pues
es inviable calcular, por ejemplo,
32 68
100 1 5
p(X = 32) = · ·
32 6 6
¿Cómo resolver el problema?. Del siguiente modo:
Teorema Central del Lı́mite:
La distribución binomial Bin(n;p) se aproxima a una curva normal de media x = n · p y desviación

√
tı́pica σ = n · p · q, cuando n tiende a ∞, es decir, cuando n se hace muy grande.
La aproximación se puede aplicar (es una buena aproximación) sólo si n es grande, en concreto n ≥ 30
y además n · p ≥ 5 y n · q ≥ 5. Si no se cumplen estas condiciones NO podemos aproximar la binomial
que tengamos por una distribución normal.
En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable
discreta (binomial) a una continua (normal), y por tanto son distribuciones diferentes. El “precio” que
hay que pagar por pasar de una a otra se denomina “corrección por continuidad” y consiste en hacer
determinados ajustes para que la aproximación realizada sea lo más precisa posible.
Ası́, si nos piden p(X=k) en una distribución binomial X, y aproximamos X por una distribución normal
Y, no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en
una distribución continua todas estas probabilidades valen 0. La corrección por continuidad consiste
en tomar un pequeño intervalo de longitud 1 alrededor del punto k.
De otro modo, si nos piden p(X=k) con X binomial, con la aproximación normal Y deberemos
calcular p(k − 0 5 ≤ Y ≤ k + 0 5).
Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos
ejemplos:
Si nos piden p(X < k) con X binomial, aproximando por Y normal calcularemos p(Y ≤ k −0 5). La
explicación de que haya que restar 0’5 y no sumarlo es que queremos que X sea menor estrictamente
que k, con lo cuál, si sumase 0’5 , el propio k aparecerı́a en la probabilidad a calcular y NO debe
aparecer.
Por contra, si debiésemos calcular p(X ≤ k), con X binomial, fijémonos que ahora k SÍ está incluido
en la probabilidad y por tanto al aproximar por la normal Y deberı́amos calcular p(Y ≤ k + 0 5).
Comprender estos dos hechos es fundamental para realizar bien la correción por continuidad al
aproximar una distribución binomial por una normal.

100 √ 500
En el caso anterior,x = n · p = = 16 67 y σ = n · p · q = = 3 73. De modo que, como
6 36
n ≥ 30, n · p = 16 67 ≥ 5 y nq̇ = 83 33 ≥ 5, se pude aproximar la binomial por la normal, es decir:

1
X −→ Bin 100; ≈ Y −→ N (16 67; 373)
6
Entonces:

19 5 − 16 67 Y − 16 67 33 5 − 16 67
≈ p(20 − 0 5 ≤ Y ≤ 33 + 0 5) = p
p(20 ≤ X ≤ 33) ≤ ≤ =
3 73 3 73 3 73
(∗)
= p(0 89 ≤ Z ≤ 4 51) = p(Z ≤ 4 51) − p(Z ≤ 0 89) ≈ 1 − 0 8133 = 0 1867
Notemos que en el paso señalado por (*) hemos cambiado X(binomial) por Y(normal) y se ha realizado
la corrección por continuidad.
Capı́tulo 2
PROBABILIDAD
La probabilidad y la estadı́stica son, sin duda, las ramas de las Matemáticas que están en mayor
auge en este siglo, y tienen una tremenda aplicabilidad en todos los aspectos y ciencias, especialmente
en las Ciencias Sociales, puesto que aquellas variables que influyen en dichas ciencias, económicas,
demográficas, suelen tener carácter aleatorio,es decir, no son deterministas, y se fundamentan en
predicciones a partir de datos conocidos. Todo aquello que implique predicción nos lleva al terreno de
la probabilidad.
2.1. Experimentos aleatorios

En todos los aspectos de la vida a veces nos encontramos con acontecimientos predeterminados, es
decir, tales que podemos decir el resultado de dichos acontecimientos antes de que finalice o incluso
de que comience. Tal es el caso de:
1. Tirar una piedra desde un edificio ( sabemos que se caerá).
2. Calentar un cazo de agua ( sabemos que la temperatura sube).
3. Golpear una pelota ( sabemos que se va a mover, e incluso conociendo fuerzas que actúan etc,
podemos conocer precisamente dónde caerá ).
Tales acontecimientos o experimentos de los que podemos predecir el resultado antes de que se
realicen se denominan experimentos deterministas.
Sin embargo, analicemos otro tipo de experimentos, mucho más interesantes desde el punto de
vista matemático:
Imaginemos que lanzamos un dado al aire (normal, de 6 caras y no trucado). ¿Podemos predecir
el resultado que vamos a obtener?. Evidentemente no. Este es un experimento que no es determinista.
A este tipo de experimentos, en los cuales no se puede predecir el resultado antes de realizar el
experimento se les denomina experimentos aleatorios.
Otros ejemplos de experimentos aleatorios pueden ser:
Tirar una moneda al aire y observar qué lado cae hacia arriba, rellenar una quiniela de fútbol,
jugar una partida de póker y, en general, cualquier juego en el que intervenga el azar.
2.2. Definiciones básicas

La teorı́a de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda
ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es
más probable que otro o relaciones parecidas. Con este fin, introduciremos algunas definiciones.
Si realizamos un experimento aleatorio, llamaremos espacio muestral del experimento al conjunto
de todos los posibles resultados de dicho experimento.
Al espacio muestral lo representaremos por E (o bien por la letra griega omega Ω ).
A cada elemento que forma parte del espacio muestral se le denomina suceso elemental.
15
CAPÍTULO 2. PROBABILIDAD 16
Ejemplo:
1. ¿Cuál es el espacio muestral asociado al experimento de lanzar un dado normal al aire y observar
la cara que queda hacia arriba?.
Evidentemente, en este caso hay 6 posibles resultados (6 sucesos elementales) y el espacio mues-
tral estará formado por: E={1,2,3,4,5,6}.
2. ¿Y en el caso del lanzamiento de una moneda?

Entonces E={C,X}
Ejercicios:
1. Escribir el espacio muestral asociado al experimento de sacar una carta de entre las diez del palo
de copas de una baraja española.
2. Escribir el espacio muestral asociado al experimento de lanzar dos dados de diferentes colores y
observar la pareja de números que se obtiene.
3. Escribir el espacio muestral asociado al experimento de lanzar dos dados de diferentes colores y
sumar los números que se obtienen.
Llamaremos suceso aleatorio a cualquier subconjunto del espacio muestral. El concepto de suceso
es fundamental en probabilidad. Dicho de forma simple, un suceso de un experimento aleatorio es
cualquier cosa que se nos ocurra afirmar sobre dicho experimento.
Ası́, si tiramos una moneda dos veces, serı́an sucesos todos los siguientes:
1. Sale al menos una cara.
2. Salen más caras que cruces.
3. La moneda cae de canto.
4. No sale ninguna cruz.
Llamaremos suceso imposible al que no tiene ningún elemento y lo representaremos por ∅ .

Llamaremos suceso seguro al formado por todos los posibles resultados (es decir, al espacio mues-
tral) .
Llamaremos espacio de sucesos y lo representaremos por S, al conjunto de todos los sucesos alea-
torios.
Ejemplo:
1. En el caso del lanzamiento de la moneda en el que el espacio muestral era E={C,X} , analicemos
quién es el espacio de sucesos:
- Sucesos con 0 elementos: ∅
- Sucesos con 1 elemento: {C},{X}
- Sucesos con 2 elementos:{C,X}
De modo que el espacio de sucesos es: S={∅,{C},{X},{C,X}}.
2. En el caso del lanzamiento de dos monedas, si haces el diagrama de árbol obtienes el siguiente
espacio muestral:
E = {(C, C), (C, X), (X, C), (X, X)}
El espacio de sucesos tiene ahora 16 elementos, que puedes intentar escribir, siguiendo el esquema
anterior, desde los sucesos con 0 elementos hasta aquellos que tienen 4 elementos. Si describimos
los sucesos que ponı́amos antes como ejemplos, obtenemos:
a) Sale al menos una cara={(C,C),(C,X),(X,C)}

b) Salen más caras que cruces={(C,C)}
c) La moneda cae de canto=∅
d ) No sale ninguna cruz={(C,C)}
3. En el caso del lanzamiento del dado el espacio de sucesos es mucho más amplio (64 elementos.
Serı́a interesante que intentases escribirlos todos o al menos te dieses cuenta de cómo son ,
aunque no los escribas todos)
En este mismo ejemplo, se puede considerar el suceso A= ”sacar un número par”. ¿De qué sucesos
elementales consta el suceso A?. Evidentemente, A={{2},{4},{6}}.
Otros sucesos pueden ser: B = ”Sacar un número mayor que 5-{{6}}.
C = ”Sacar un número par y menor que 5-{{2},{4}}.
Ejercicio: Una urna contiene dentro 4 bolas de las cuales 2 son blancas, 1 roja y otra azul. Se saca
una bola de la urna.
a) Escribir el espacio muestral.
b) Escribir los sucesos “no sacar bola azul” y “sacar bola roja o blanca”.
c) Escribir el espacio de sucesos.
Los sucesos admiten una representación gráfica que facilita su interpretación; del modo:
Figura 2.1: Representación en diagrama de Venn del suceso A
Por ejemplo, en el caso del dado:
Figura 2.2: Representación en diagrama de Venn para un dado
A = ”salir par y menor que 5”. Estos diagramas se denominan diagramas de Venn.
Propiedad:
Si el espacio muestral tiene n elementos, el espacio de sucesos tiene 2n elementos.
Ejemplo:
En el caso del dado, el espacio muestral tenı́a 6 elementos y el espacio de sucesos tiene 26 = 64
elementos.
En el caso de la moneda, el espacio muestral tenı́a dos elementos y el espacio de sucesos tiene
22 = 4 elementos.
2.3. Operaciones con sucesos

Si realizamos un experimento aleatorio y consideramos varios sucesos A, B, C, etc, asociados a
dicho experimento, podemos realizar varias operaciones entre ellos. Los más importantes son:
1. Igualdad de sucesos: Dos sucesos A y B son iguales si están compuestos por los mismos elementos.
Lo expresaremos por A = B.
2. Intersección de sucesos: Llamaremos suceso intersección de los sucesos A y B, y lo representare-

mos por A ∩ B, al suceso “ocurren A y B a la vez”.
Ejemplo: Si tiramos un dado, ya sabemos que el espacio muestral asociado es E={1,2,3,4,5,6}.
Sean los sucesos A=“sacar un nº par”={2,4,6}, y B=“sacar un número entre 2 y 4 (inclusi-
ve)”={2,3,4}.
El suceso A ∩ B es tal que ocurren A y B a la vez, es decir:
A ∩ B=“sacar un nº par y que esté entre 2 y 4 (inclusive)”={2,4}.
El suceso A ∩ B son los elementos comunes a los conjuntos A y B (elementos que están en los
dos conjuntos).
Representado en diagramas de Venn:
Figura 2.3: Intersección de sucesos: A ∩ B
En ocasiones podremos encontrarnos con sucesos que NO tengan elementos en común. En estos
casos se dice que los sucesos A y B son incompatibles, y su intersección se representa con el
conjunto vacı́o:
A∩B =∅
Evidentemente, si los sucesos sı́ tienen intersección, diremos que son compatibles.
3. Unión de sucesos: Llamaremos suceso unión de los sucesos A y B y se representa por A ∪ B al

suceso “ocurre A o bien ocurre B o bien ocurren ambos a la vez”(también podemos decir que
“ocurre alguno”).
Es decir A ∪ B son los elementos que están en ambos conjuntos (aunque no necesariamente en
los dos a la vez). Representado en diagrama de Venn:
Figura 2.4: Unión de sucesos: A ∪ B

Ejemplo: En el caso anterior:

A ∪ B=”sacar un nº par o un nº que esté entre 2 y 4 (inclusive)”={2,3,4,6}.
NOTA:
Observemos que la intersección de dos conjuntos siempre es ”menor”que la unión, de hecho es
“menor” que el propio conjunto.
Escrito matemáticamente:
A∩B ⊂ A∪B A∩B ⊂ A A∩B ⊂ B A ⊂ A∪B B ⊂ A∪B
(El sı́mbolo ⊂ significa “contenido”, o que el primer conjunto es un subconjunto del segundo)
4. Suceso contrario de otro: Dado un suceso A, denominaremos suceso contrario de A y se repre-

sentará por Ā (o bien A o bien Ac ) al suceso que tiene por elementos a todos aquellos que no
pertenecen a A.
Ejemplo: Si tiramos un dado, ya sabemos que el espacio muestral asociado es E={1,2,3,4,5,6}.
Como antes, los sucesos A=“sacar un nº par”={2,4,6}, por tanto Ā={1,3,5} y B= “sacar un
número entre 2 y 4 (inclusive)”={2,3,4}, de modo que B̄={1,5,6}.
En un diagrama de Venn:
Figura 2.5: La parte punteada es Ā.(Todo lo que no está incluido en A)
5. Diferencia de sucesos: Si A y B son dos sucesos, llamaremos diferencia entre A y B al suceso

B −A, que consta de los elementos que están en B pero no están en A.Por ejemplo, si A={2,4,6},
B={2,3,4}, tenemos que B − A={3}. Se cumple que B − A = B − A ∩ B, y también que
B − A = Ā ∩ B. Representado en un diagrama de Venn:
Figura 2.6: La parte rayada es B − A, todos los elementos de B que no estén en A
De todas formas, hemos de ser cuidadosos con esta operación: No se debe confundir con una
simple resta como operación numérica, sino que es una diferencia conjuntista, quitar los elementos
comunes a dos conjuntos.
Ejercicio: En una urna tenemos 9 bolas numeradas del 1 al 9. Sacamos una y anotamos su número.
Sean los sucesos: A=”sacar un nº primo”B=“sacar un nº cuadrado” (por ejemplo 4 es un número
cuadrado, porque 4=22 ). Se pide:
a) Describir el espacio muestral.
b) ¿Cuántos elementos tiene el espacio de sucesos?.
c) Calcula A ∩ B y A ∪ B.
d) ¿Son A y B compatibles o incompatibles?.
e) Calcula Ā y B̄.
f) Si C=“sale un número impar”, calcula A ∩ C, B ∩ C,C̄ , A ∪ C,Ā ∩ C̄.
Propiedades de las operaciones con sucesos:
Las operaciones con sucesos tienen las siguientes propiedades, la mayorı́a de ellas bien conocidas:
Intersección Unión
Conmutativa A∩B = B∩A A∪B = B∪A
Asociativa A ∩ (B ∩ C) = (A ∩ B) ∩ C A ∪ (B ∪ C) = (A ∪ B) ∪ C
Idempotente A∩A=A A∪A = A
Simplificación A ∩ (A ∪ B) = A A ∪ (A ∩ B) = A
Distributiva A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Elemento neutro A∩E =A A∪∅ = A
Absorción A∪∅ = A A∪E = A
Además de estas sencillas propiedades (que se demuestran fácilmente mediante un diagrama de

Venn), las operaciones con sucesos tienen otras dos propiedades muy importantes:
Leyes de De Morgan: Si A y B son dos sucesos, se verifican:
(A ∪ B) = Ā ∩ B̄
(A ∩ B) = Ā ∪ B̄
Demostración: Demostraremos la primera de las igualdades.
En primer lugar, representemos en un diagrama de Venn (A ∪ B). Para ello, primero representamos
A ∪ B, y luego su contrario (A ∪ B):
Figura 2.7: Imagen 1 corresponde a A ∪ B. Imagen 2 corresponde a A ∪ B
Ahora, representaremos en otro diagrama el otro miembro, es decir Ā ∩ B̄. En primer lugar,
representaremos Ā, luego B̄ y luego su intersección:
Figura 2.8: Imagen 1 corresponde a Ā. Imagen 2 corresponde a B̄. Imagen 3 corresponde a Ā ∩ B̄.
Observando los dos resultados, vemos que las partes rayadas son iguales, por lo que la igualdad es
cierta.
Ejercicio:
1. Mediante un procedimiento similar, demostrar la segunda ley de De Morgan.
2. Luisa y Marı́a interviene en un torneo de ajedrez. La primera que gane dos partidas seguidas o
tres alternas gana el torneo. Encuentra el espacio muestral con todos los resultados posibles (
suponemos que nunca hacen tablas).
(Indicación: Utiliza un diagrama de árbol).
3. Consideramos el fenómeno aleatorio extraer una carta de una baraja de 40 y anotarla . Sean los
sucesos A= “sacar oro”, B= “sacar rey”, C= “sacar el rey de bastos”.
Determina los sucesos:
A ∩ C̄, A ∩ B ∩ C, Ā ∪ B̄ ∪ C̄, Ā ∪ B̄
2.4. Asignación de probabilidades. Regla de Laplace

Hasta el momento hemos descrito lo que es un experimento aleatorio y hemos definido los con-
ceptos básicos asociados a este experimento. Nos falta responder a esta pregunta: ¿Cómo asignar
probabilidades a cada uno de los sucesos de un experimento aleatorio?.
Hay muchas maneras de asignar probabilidades. La más sencilla e intuitiva la dio el matemático
francés Pierre Simon Laplace (1749-1827), quién enunció la regla que lleva su nombre:
Regla de Laplace:
Si realizamos un experimento aleatorio en el que hay n sucesos elementales, todos igualmente
probables, entonces si A es un suceso, la probabilidad de que ocurra el suceso A es:
número de casos favorables al suceso A
p(A) =
número de casos posibles
Ejemplo: Lanzamos un dado normal al aire. Consideramos el suceso A= “sale par”. Calcular p(A).
Casos posibles hay 6, pues E={1,2,3,4,5,6}.
Casos favorables al suceso A={2,4,6}.
3 1
Por tanto p(A) = = = 0 5.
6 2
(Notemos que la probabilidad siempre es un número positivo y menor, o a lo sumo igual a 1).
El inconveniente que plantea la definición de Laplace es que necesariamente los sucesos elementales
tienen que tener la misma probabilidad de ocurrir.
Observemos un caso tan sencillo como el siguiente:
De una urna que contiene 8 bolas rojas, 5 amarillas y 7 verdes se extrae una bola al azar. Calcula
la probabilidad de que la bola extraı́da sea :
a) roja
b) verde
c) amarilla
El espacio muestral en este caso serı́a: E={R,V,A}, que consta sólo de tres elementos, pero serı́a un
poco ingenuo asignar las probabilidades mediante la regla de Laplace,
1 1 1
p(R) = p(V ) = p(A) =
3 3 3
porque ya intuitivamente se ve que hay más posibilidades, por ejemplo, de que salga una bola roja
que de que salga una bola amarilla, de modo que ¿cómo asignar probabilidades?.
Fue el matemático ruso Kolmogorov quién precisó este término:
Definición axiomática de probabilidad:
Una probabilidad p es una función que asocia a cada suceso A del espacio de sucesos S , un número
real p(A), es decir: p : S −→ R , y que cumple las propiedades:
1. 0 ≤ p(A) ≤ 1, (es decir, cualquier suceso tiene probabilidad positiva y menor o igual que 1).
2. p(E) = 1 (la probabilidad del suceso seguro es 1).
3. Si A y B son incompatibles, es decir A ∩ B = ∅, entonces p(A ∪ B) = p(A) + p(B). (es decir

la probabilidad de la unión es la suma de las probabilidades si los sucesos tienen intersección
vacı́a).
Ejemplo:
Sea un experimento aleatorio cualquiera y definamos en S (espacio de sucesos) la siguiente proba-
bilidad:
número de elementos del conjunto A
p(A) =
número total de elementos
Comprobemos que p es una probabilidad.
Para ello, comprobemos las tres propiedades:
a) Se ve que la probabilidad de cualquier suceso está entre cero y uno, puesto que cualquier conjunto
que tenga elementos ya tendrá probabilidad positiva, y el número de elementos de cualquier conjunto
no puede ser mayor que el número total de elementos existentes.
b) p(E) = 1, es evidente.
c) Tomemos dos sucesos A y B que no tengan elementos en común. Entonces:
elementos que forman parte de A o de B

p(A ∪ B) = =
número de elementos de A + número de elementos de B
= = p(A) + p(B)
puesto que si A y B no tienen elementos comunes, el número de elementos de la unión es la suma de
los elementos de cada conjunto por separado.
Por tanto se cumplen las 3 propiedades y p ası́ definida es una probabilidad. Esta será la definición
de probabilidad que utilicemos a partir de ahora.
Ejemplo:
En el ejemplo de las urnas anterior, lo lógico es definir la probabilidad ası́: Como en total hay 20
8 7 5
bolas y 8 son rojas, 7 verdes y 5 amarillas, p(R) = p(V ) = p(A) = .
20 20 20
Se puede comprobar que ası́ definida p es una probabilidad.
Sin embargo, comprobar las propiedades de la definición de Kolmogorov es una labor larga y engorrosa,
puesto que hay que verificar que se cumple para todos aquellos sucesos del espacio de sucesos S, que es
ciertamente amplio en muchas ocasiones. El siguiente resultado simplifica la tarea de decidir cuándo
una función p sobre el espacio de sucesos es una probabilidad, basándose sólo en los sucesos elementales,
es decir, aquellos que forman parte del espacio muestral. Lo enunciaremos sin demostración:
Propiedad
Si w1 , w2 , . . ., wn son los n sucesos elementales de un suceso aleatorio cualquiera,p una función
p : S −→ R de modo que cumple las propiedades:
1. 0 ≤ p(wi) ≤ 1 ∀ i ∈ {1, 2, . . . , n}
2. p(w1) + p(w2) + . . . + p(wn ) = 1
Entonces p es una probabilidad.
Ejemplo: Comprobar si las siguientes funciones definidas para los sucesos elementales son probabilidad,
siendo E={a,b,c,d} el espacio muestral del experimento aleatorio:
1 1 1 1
a) p(a) = , p(b) = , p(c) = , p(d) =
2 3 4 5
Es obvio que la primera propiedad se cumple, puesto que las 4 probabilidades son números positivos
menores que 1.
Para ver si se cumple la segunda, basta realizar la suma:
1 1 1 1 30 + 20 + 15 + 12 77
+ + + = =
2 3 4 5 60 60
que evidentemente NO es 1, luego p NO es probabilidad.
1 1 1
b) p(a) = , p(b) = , p(c) = 0, p(d) =
4 2 2
Es obvio que la primera propiedad se cumple, puesto que las 4 probabilidades son números positivos
o cero menores que 1.
Para ver si se cumple la segunda, basta realizar la suma:
1 1 1 1+2+1
+ + = =1
4 2 4 4
luego p SÍ es probabilidad.
Consecuencias de la definición de probabilidad:
1. p(Ā) = 1 − p(A)
En efecto, puesto que E = A ∪ Ā y además A y Ā son incompatibles, resulta por la propiedad
3) de la definición que
p(E) = p(A ∪ Ā) = p(A) + p(Ā)
Y por la propiedad 2), p(E)=1, luego 1 = p(A) + p(Ā) y por tanto p(Ā) = 1 − p(A).
2. p(∅) = 0
Como Ē = ∅, resulta que:
p(Ē) = p(∅) = 1 − p(E) = 1 − 1 = 0
3. Si A y B son dos sucesos cualesquiera,
p(A ∪ B) = p(A) + p(B) − p(A ∩ B)
4. Si A, B y C son tres sucesos cualesquiera,
p(A ∪ B ∪ C) = p(A) + p(B) + p(C) − p(A ∩ B) − p(A ∩ C) − p(B ∩ C) + p(A ∩ B ∩ C)

Ejemplo:
Se tira una moneda 3 veces. Calcular la probabilidad de obtener alguna cara.
Los problemas de este tipo, en los que se pide la probabilidad de obtener “alguna” cosa, se suelen
resolver muy bien por paso al complementario. En este caso concreto, A = “obtener alguna cara”.
Ā= “no obtener ninguna cara”= “obtener 3 cruces”.
1
Entonces, p(A) = , pues hay 8 casos posibles (2·2·2, ¡haz el diagrama de árbol!) y sólo uno
8
favorable (XXX, 3 cruces), por tanto:
1 7
p(A) = 1 − p(Ā) = 1 − =
8 8
Ejercicio:
Calcular la probabilidad de obtener al menos 1 seis si se lanza 4 veces un dado.
Ejemplo:
Se lanza un dado dos veces y se suman las dos caras. Sea A el suceso A= “la suma de resultados
es mayor o igual que 10” y B= “la suma de los resultados es múltiplo de 6”. Calcular p(A), p(B) y
p(A ∩ B).
Hay 36 posibles resultados al lanzar dos veces un dado. ¿Cuántos de ellos suman 10 o más?
Que sumen 10: (4,6), (5,5), (6,4)
Que sumen 11: (5,6), (6,5)
Que sumen 12: (6,6)
6 1
Por tanto, p(A) = = .
36 6
¿Cuántos hay que sumen múltiplo de 6?
Que sumen 6: (1,5), (2,4),(3,3), (4,2), (5,1)
Que sumen 12: (6,6)
6 1
Por tanto, p(B) = = .
36 6
1
En cuanto a A ∩ B = (6, 6), luego p(A ∩ B) = .
36
Ejercicios:
1. Se ha encargado la impresión de una encuesta a una imprenta, que imprime 12 folios defectuosos
de cada 1000. Hallar la probabilidad de que elegido un folio de la encuesta al azar:
a) Esté mal impreso.
b) Esté correctamente impreso.
2. Una bolsa contiene 8 bolas numeradas. Se extrae una bola y anota su número. Sean los sucesos
A= “salir par”, B= “salir impar”, C= “salir múltiplo de 4”.
Calcular las probabilidades de A ∪ B, A ∪ C, B ∪ C, A ∪ B ∪ C.
3. Extraemos una carta de una baraja española. Calcula:

a) La probabilidad de que sea un rey o un as.
b) La probabilidad de que sea un rey o una copa.
c) La probabilidad de que sea un rey y una copa.
4. En el banquete posterior a una boda se sientan en la presidencia 10 personas, entre los cuales se
encuentran los novios. Calcular la probabilidad de que los novios estén juntos en el centro de la
mesa.
2.5. Probabilidad condicionada

Hasta ahora nos hemos limitado a calcular probabilidades únicamente partiendo de un experimento
aleatorio, sin tener más información. Pero, ¿qué ocurre si conocemos alguna información adicional?.
Supongamos que estamos realizando el experimento aleatorio de lanzar un dado y obtener el
1
número que sale. Consideremos el suceso A= “sale un 4”. Evidentemente, p(A) = .
6
Ahora bien, ¿variarı́a esta probabilidad si al lanzar el dado alguien pasa por allı́ y nos dice que ha
salido un número par?.
Disponemos entonces de una información adicional, B={2,4,6}.
Hemos reducido nuestro espacio muestral, que ahora sólo consta de 3 elementos y tenemos que
cambiar las probabilidades asignadas.
1
Ahora el suceso A no tiene una posibilidad entre 6 de ocurrir, sino una entre tres, es decir, p(A) = .
3
Esta es la idea de la probabilidad condicionada: La información obtenida B, modifica la proba-
1
bilidad de A. Lo expresaremos ası́: p(A/B) = y se lee “probabilidad de A condicionada a B” o
3
“probabilidad de A conociendo B”.
El caso anterior es muy sencillo, pues directamente podemos calcular p(A/B), pero si el espacio
muestral se amplı́a, el problema es más complicado. La fórmula siguiente simplifica el problema.
Definición:
Sea A un suceso aleatorio asociado a un experimento aleatorio, y sea B otro suceso que sabemos
que se ha realizado.
Llamaremos probabilidad de A condicionada a B y lo expresaremos por p(A/B) a la expresión:
p(A ∩ B)
p(A/B) =
p(B)
(de idéntico modo se define p(B/A), escribe la fórmula).
Ejemplo: Para el caso anterior,

3 1
A={4},B={2,4,6} −→ p(B) = = .
6 2
1
A ∩ B = {4} −→ p(A ∩ B) = .
6
Luego:
1
p(A ∩ B) 2 1
p(A/B) = = 6 = =
p(B) 1 6 3
2
es lo mismo que obtenı́amos antes directamente.
Ejercicios:
1. Calcula la probabilidad de que la suma de las caras de dos dados sea mayor a igual que 10
sabiendo que en el primer dado ha salido un seis.
2. Se lanzan dos dados:¿cuál es la probabilidad de obtener una suma de puntos igual a siete?.
Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados haya
salido un 3?
2.6. Sucesos independientes

Si bien el conocer cierta información adicional modifica la probabilidad de algunos sucesos, puede
ocurrir que otros mantengan su probabilidad, pese a conocer dicha información.
Por ejemplo, en el lanzamiento de un dado, consideremos los sucesos: A= “sacar un número par”
y B= “sacar un número menor o igual que 2” Es claro que A= {2,4,6} y B= {1,2}.
Calculemos la probabilidad de A conociendo que se ha realizado el suceso B, es decir, p(A/B).
Utilizando la fórmula:
1
p(A ∩ B) 3 1
p(A/B) = = 6 = = = 0 5
p(B) 1 6 2
3
1 1
puesto que p(A ∩ B)=p(sacar par y menor o igual que 2)= y p(B)= .
6 3
Pero si no conociésemos la información B, ¿cuál serı́a la probabilidad de A?.
3
p(A)=p(sacar par)= = 0 5, es decir que p(A/B)=p(A), y por tanto el conocer la información B
6
no modifica la probabilidad de A.
Cuando esto ocurre es decir, cuando p(A/B) = p(A), diremos que los sucesos A y B son indepen-
dientes (el hecho de que ocurra B no modifica la probabilidad de A).
Propiedad:
A y B son sucesos independientes ⇐⇒ p(A ∩ B) = p(A) · (B).
Demostración: =⇒) Si A y B son independientes, p(A/B) = p(A), y por la fórmula de la probabilidad

p(A ∩ B) p(A ∩ B)
condicionada,p(A/B) = , luego = p(A), y por tanto p(A ∩ B) = p(A) · p(B).
p(B) p(B)
⇐=) Partiendo de p(A ∩ B) = p(A) · p(B), entonces
p(A ∩ B) p(A) · p(B)

p(A/B) = = = p(A)
p(B) p(B)
luego p(A/B) = p(A) y por tanto A y B son independientes.
Ejemplo:
1 1 1
En el caso anterior, p(A ∩ B) = , y por otra parte p(A) = y p(B) = ,luego se cumple que
6 2 3
1 1 1
p(A ∩ B) = = · = p(A) · p(B)
6 2 3
luego A y B son independientes.
Ejercicio:
2 1
De dos sucesos conocemos que p(A ∪ B) = y p(A) = , calcula p(A ∩ B) y p(B) para que A y
3 5
B sean independientes.
(Indicación: Utilizar la fórmula de la unión de dos sucesos y la de la independencia de sucesos).
7 7
(Solución: p(B) = 12 , p(A ∩ B) = 60 ).
NOTA IMPORTANTE:
No se deben confundir los conceptos de sucesos incompatibles y sucesos independientes. Dos sucesos
son incompatibles cuando no tienen elementos en común, es decir, A ∩ B = ∅, o con diagramas de
Venn:
Figura 2.9: A y B incompatibles, sin elementos en común.
Dos sucesos son independientes si p(A ∩ B) = p(A) · p(B). Son conceptos totalmente distintos. Uno
se refiere a CONJUNTOS y otro se refiere a PROBABILIDADES.
2.7. Experimentos compuestos. Teorema de la probabilidad total.

Un experimento compuesto es aquel que consta de dos o más experimentos aleatorios simples.
Es decir, si tiramos un dado, o una moneda, son experimentos aleatorios simples, pero si realizamos
el experimento de tirar un dado y posteriormente una moneda, estamos realizando un experimento
compuesto.
Propiedad:
De la fórmula para calcular la probabilidad condicionada se deduce inmediatamente que:
p(A ∩ B) = p(B) · p(A/B) y p(A ∩ B) = p(A) · p(B/A)
Ejemplo: Se extraen 2 cartas, sucesivamente, de una baraja de 40. Calcular la probabilidad de extraer
2 sotas.
Sea A = “sacar sota en la 1ª” y B = “sacar sota en la 2ª”.
Nos piden p(A ∩ B).
Según la fórmula anterior, p(A ∩ B) = p(A) · p(B/A).
4 1 3 1 1 1 1
Ahora bien , p(A) = = y p(B/A) = = , por lo que p(A) = · = .
40 10 39 13 10 13 130
La forma más sencilla de calcular probabilidades en experimentos compuestos es un digrama de
árbol, donde en cada rama situamos la probabilidad que le corresponde al suceso del final de dicha
rama. Estas probabilidades que se van poniendo en el árbol son probabilidades condicionadas, porque
dependen de los resultados anteriores.
En el caso del ejercicio anterior, el diagrama serı́a:
Figura 2.10: Diagrama de árbol para la extracción de sota(S) u otra carta (S̄)
Nota:
Este mismo resultado se podrı́a haber obtenido
sin usar la probabilidad condicionada, del modo:
40
Formas de elegir 2 cartas de entre 40= .
2
4
Formas de elegir 2 sotas entre 4= .
2
4
casos favorables 2 6 1
Por la regla de Laplace, p(obtener 2 sotas)= = = = .
casos posibles 40 780 130
2
Ejercicios:
1. Una urna contiene 9 bolas rojas y 5 negras. Se extraen sucesivamente 2 bolas. Calcula la proba-
bilidad de que:
a) la primera bola sea roja y la segunda negra.
b) una sea roja y la otra negra.
2. En una bolsa hay 4 canicas rojas, 4 azules y 2 verdes. Se extraen 3 canicas que resultan ser 2
rojas y una azul. Sin devolverlas a la bolsa se saca otra canica, ¿de qué color es más probable
que salga?.
Ejemplo:
Tenemos dos urnas, una con 7 bolas rojas y 2 azules, y otra con 3 bolas rojas y 8 azules. Tiramos
un dado. Si nos sale un 3 o un 5, sacamos una bola de la primera urna y en caso contrario, sacamos
una bola de la segunda urna. ¿Cuál es la probabilidad de que la bola extraı́da sea azul?.
Evidentemente estamos realizando un experimento compuesto. En primer lugar, se trata de elegir una
urna, para lo cuál lanzamos un dado. Si U1 = “elegir la urna 1” y U2 = “elegir la urna 2”, es claro que
2 1 4 2
p(U1 )= = y p(U2 )= = .
6 3 6 3
Por otra parte, luego realizamos otro experimento consistente en sacar una bola de la urna elegida.
Si A= “sacar una bola azul”, las probabilidades que conocemos son:
2
p(A/U1 ) =
9
y
8
p(A/U2 ) =
11
Lo que nos piden es p(A). Para calcular dicha probabilidad, si representamos el diagrama de árbol:
Figura 2.11: Diagrama de árbol para la extracción de bolas
Como la probabilidad de A depende de la urna en la que estemos, basta multiplicar las probabili-
dades de cada rama que llegue a la bola azul y luego sumar los 2 resultados, es decir:
2 2 4 8 4 32 166
p(A) = · + · = + = = 0 559
6 9 6 11 54 66 297
La justificación teórica para proceder ası́ la da el teorema de la probabilidad total.
Teorema de la probabilidad total: Si A1 , A2 , . . . , An son sucesos incompatibles 2 a 2, y cuya unión

es el espacio muestral (A1 ∪ A2 ∪ . . . ∪ An = E), y B es otro suceso, resulta que:
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
Nota: El conjunto A1 , A2 , . . . , An que verifica la incompatibilidad 2 a 2 y que la unión de todos ellos es

el espacio muestral se denomina sistema completo de sucesos y este sistema “divide el espacio muestral
en partes que no se solapan”. Mediante representación gráfica:
Figura 2.12: Sistema completo de sucesos: A1 , A2 , . . . , An
Ejemplo: Para el caso anterior, A1 = “sacar la bola de la urna 1”.

A2 = “sacar la bola de la urna 2”.
B= “sacar bola azul”.
Y aplicando el teorema:
2 2 4 8 4 32 166
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) = · + · = + = = 0 559
6 9 6 11 54 66 297
Ejemplo: En un colegio se imparten sólo los idiomas inglés y francés. El 80 % de los alumnos
estudian inglés y el resto francés. El 30 % de los alumnos de inglés son socios del club musical del
colegio y de los que estudian francés son socios de dicho club el 40 %. Se elige un alumno al azar.
Calcular la probabilidad de que pertenezca al club musical.
En estos problemas es importante elegir el sistema completo de sucesos. En este caso: A1 = “estudiar
inglés”
A2 = “estudiar francés”
B= “ser del club musical”
Nos piden p(B). Por el teorema anterior:
80 30 20 40 8
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) = · + · = = 0 32
100 100 100 100 25
Mediante el diagrama de árbol:
Figura 2.13: Diagrama de árbol para el problema de idiomas y club musical
Se obtiene el mismo resultado.

Ejercicio:
Se tienen dos urnas, la primera de las cuales tiene 6 bolas blancas, 4 negras y 2 rojas y la urna 2
tiene 3 bolas blancas y 7 negras.
Se lanza un dado al aire, y si sale múltiplo de 3 se saca de la primera urna y en otro caso se saca
una bola de la segunda urna.
Calcular la probabilidad de que sea:
a) bola blanca b) bola negra c) bola roja.
Solución: 11 26 1
30 45 18 .
, ,
2.8. Tablas de contingencia

Las tablas de contingencia están referidas a 2 caracterı́sticas que presentan cada una dos o más
sucesos.
Ejemplo: En un taller se sabe que acuden, por la mañana 3 automóviles con problemas de eléctricos,
8 con problemas mecánicos y 3 con problemas de chapa. Por la tarde hay 2 con problemas eléctricos,
3 con problemas mecánicos y 1 con problemas de chapa.
a) Calcular el porcentaje de los que acuden por la tarde.
b) Calcular el porcentaje de los que acuden con problemas mecánicos
c) Calcular la probabilidad de que un automóvil con problemas eléctricos acuda por la mañana.
Resumiendo los datos en una tabla de contingencia:
Pr. eléctricos Pr. Mecánicos Pr. de chapa Total

Mañana 3 8 3 14
Tarde 2 3 1 6
Total 5 11 4 20
a) En total acuden 20 y por la tarde acuden 6, luego:

6
p(acudir por la tarde)= = 0 3, es decir, el 30 %.
20
b) En total acuden 20 y con problemas mecánicos hay 11, luego:
11
p(problemas mecánicos)= = 0 55, es decir, el 55 %.
20
c) Aquı́ tenemos una información adicional (es un coche que tiene problemas eléctricos), luego se
trata de una probabilidad condicionada.Con problemas eléctricos hay 5 y de ellos 3 por la mañana,
luego:
3
p(acudir por la mañana/problemas eléctricos)= = 0 6, es decir, el 60 %.
5
En una tabla de contingencia puede que nos falten datos, pero se pueden hallar fácilmente con los
datos que son conocidos.
Ejemplo Para tratar de curar una enfermedad se aplica un tratamiento nuevo a 81 pacientes de un
hospital, mientras que en el mismo hospital hay otros 79 pacientes que siguen un tratamiento antiguo
contra la misma enfermedad. En total, con ambos tratamientos los curados son 103, de los cuales 60
lo son gracias al tratamiento nuevo. Si tratamos de construir la tabla, con los datos del problema se
obtiene:
Tratamiento antiguo Tratamiento nuevo Total
Curarse 60 103
No curarse
Total 79 81
Completa la tabla y responde a las cuestiones:

Si se elige un individuo al azar, calcula la probabilidad de que:
1. Se haya curado.
2. No se haya curado.
3. Se haya curado con el nuevo tratamiento.
4. No se haya curado con el nuevo tratamiento.
5. Se haya curado con el tratamiento antiguo.
6. No se haya curado con el tratamiento antiguo
2.9. El teorema de Bayes.

Como consecuencia del teorema de la probabilidad total y de las propiedades de la probabilidad
condicionada, resulta este importante teorema que permite calcular probabilidades condicionadas.
Teorema de Bayes:
Si A1 , A2 , . . . , An son sucesos incompatibles 2 a 2, y cuya unión es el espacio muestral
(A1 ∪ A2 ∪ . . . ∪ An = E), y B es otro suceso, resulta que:
p(Ai ) · p(B/Ai )
p(Ai /B) =
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
Demostración:
p(Ai ∩ B)
Por definición,p(Ai /B) = .
p(B)
Ai ∩ B
Ahora bien, recordando que p(Ai ∩ B) = p(Ai ) · p(B/Ai ), debido a que p(B/Ai ) = .
p(Ai )
Por tanto, combinando los dos hechos:
p(Ai ∩ B) p(Ai ) · p(B/Ai )

p(Ai /B) = =
p(B) p(B)
Como por el teorema de la probabilidad total es:
p(B) = p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
resulta que sustituyendo:
p(Ai ) · p(B/Ai ) p(Ai ) · p(B/Ai )

p(Ai/B) = =
p(B) p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
y el teorema queda demostrado.
Nota:
Las probabilidades p(Ai ) se denominan probabilidades a priori.
Las probabilidades p(Ai /B) se denominan probabilidades a posteriori.
Las probabilidades p(B/Ai ) se denominan verosimilitudes.
Ejemplo:
Dos clases de 2º de Bachillerato, una de 28 alumnos y otra de 35 alumnos hacen conjuntamente
un examen de Matemáticas. La probabilidad de aprobar de los alumnos de la primera clase es de 0’68
y los de la segunda del 0’73. Se toma un examen al azar y resulta que está aprobado. ¿Cuál es la
probabilidad de que sea de un alumno de la 1ª clase?.
Sea A1 = “el examen es de un alumno de la primera clase”
A2 = “el examen es de un alumno de la segunda clase”
B= “el examen está aprobado”
Nos piden p(A1 /B).
Hagamos antes que nada un diagrama de árbol:
Figura 2.14: Diagrama de árbol para el problema del examen
Por el teorema de Bayes:
p(A1 ) · p(B/A1 )
p(A1 /B) =
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 )
Sustituyendo:
28
· 0 68 0 302
p(A1 /B) = 63 = = 0 427
28 35 0 708
· 0 68 + · 0 73
63 63
p(A1 ) es la probabilidad “a priori”, es decir , antes de realizar el experimento y careciendo de
información.
28
En este caso p(A1 ) = = 0 444.
63
p(A1 /B) es la probabilidad “a posteriori”, después de realizarlo y conocer más información. En
este caso p(A1 /B) = 0 427 (es algo menor).
Ejercicio:
Se tienen dos urnas. En la primera hay 10 bolas blancas, 7 negras y 5 rojas. En la segunda 24
blancas, 4 negras y 9 rojas. Se elige una urna al azar y se saca una bola. Calcular:
a) Probabilidad de sacar bola blanca.
b) Sabiendo que la bola extraı́da es blanca, probabilidad de que provenga de la segunda urna.
Solución: 449 264
814 , 449 .
Capı́tulo 8
PROGRAMACIÓN LINEAL
8.1. Introducción
La programación lineal es una técnica matemática relativamente reciente (siglo XX), que consiste
en una serie de métodos y procedimientos que permiten resolver problemas de optimización en el
ámbito, sobre todo, de las Ciencias Sociales.
Nos centraremos en este tema en aquellos problemas simples de programación lineal, los que tienen
sólamente 2 variables, problemas bidimensionales.
Para sistemas de más variables, el procedimiento no es tan sencillo y se resuelven por el llamado
método Simplex (ideado por G.B.Danzig, matemático estadounidense en 1951).
Recientemente (1984) el matemático indio establecido en Estados Unidos, Narenda Karmarkar,
ha encontrado un algoritmo, llamado algoritmo de Karmarkar, que es más rápido que el método
simplex en ciertos casos. Los problemas de este tipo, en el que intervienen gran número de variables,
se implementan en ordenadores.
8.2. Inecuaciones lineales con 2 variables

Una inecuación lineal con 2 variables es una expresión de la forma:
ax + by ≤ c
(donde el sı́mbolo ≤ puede ser también ≥ , < o bien >), donde a, b y c son números reales y x e y las
incógnitas.
Para resolver estas inecuaciones, se recordará de otros cursos, hay que representar gráficamente en
el plano la recta dada por la correspondiente ecuación lineal y marcar una de las dos regiones en que
dicha recta divide al plano.
Ejemplo: Si queremos resolver la inecuación: 2x + 3y ≥ −3, representamos en primer lugar la recta

2x + 3y = −3:
127
CAPÍTULO 8. PROGRAMACIÓN LINEAL 128
La recta divide al plano en dos regiones, una de las cuales es la solución de la inecuación. Para
saber qué parte es, hay dos procedimientos:
1. Se despeja la y de la inecuación, poniendo cuidado en que si en una inecuación multiplicamos o

dividimos por un número negativo, la desigualdad cambia de sentido.
En este caso tendı́amos que:
−3 − 2x
y≥
3
Observando el dibujo vemos que la recta divide al eje de ordenadas (y) en dos partes.
La solución de la inecuación será aquella parte en la que la y sea mayor que la recta, es decir, la
parte superior.
Figura 8.1: Solución de la inecuación lineal
2. Se toma un punto cualquiera que no pertenezca a la recta, por ejemplo el (1,2).

Para que dicho punto sea solución, se tendrá que cumplir la desigualdad, por lo que sustituimos
en la inecuación inicial el (1,2):
2 · 1 + 3 · 2 ≥ −3, es decir, 8 ≥ −3.
Como esta última desigualdad es evidentemente cierta, concluimos que el (1,2) es solución y
por tanto el semiplano que contiene al (1,2) es la solución, es decir el semiplano superior, como
habı́amos obtenido antes.
Cualquiera de los procedimientos es válido si se realiza con corrección.
8.3. Sistemas de inecuaciones lineales con dos variables

Un sistema de inecuaciones lineales, por tanto, es un conjunto de inecuaciones del tipo anterior, y
resolverlo consistirá en resolver gráficamente cada inecuación (como en el caso anterior), representar
la solución en un mismo gráfico y la solución total será la parte común a todas las soluciones.
Ejemplo: Resolver el sistema de inecuaciones siguiente:


 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
Si representamos las rectas: 
 2x + 3y = −3 (recta r)
2x − y − 9 = 0 (recta s)

2x − 5y − 5 = 0 (recta t)
Figura 8.2: Solución del sistema de inecuaciones lineales
El triángulo rayado es la solución del sistema.

Además, para los problemas de programación lineal es necesario el cálculo de los vértices de la
región solución. Es sencillo su cálculo, pues se reduce a resolver sistemas de ecuaciones lineales son
dos incógnitas, que provienen de igualar las ecuaciones de las rectas correspondientes.
Por ejemplo, en este caso, si queremos el punto intersección de las rectas r y t tendremos que
resolver el sistema formado por:

2x + 3y = −3 −2x − 3y = 3
=⇒
2x − y − 9 = 0 2x − y − 9 = 0
Sumando −4y = 12 =⇒ y = −3.
Y sustituyendo que da 2x + 3(−3) = −3, es decir 2x − 9 = −3, y entonces x = 3.
Luego r y t se cortan en el punto (3,-3).
Ejercicios:
1. Calcular los otros dos vértices.
2. Resolver los sistemas de inecuaciones lineales siguientes encontrando los vértices de las regiones
que sean solución:


 x + 2y ≤ 12

3x + 6y ≥ 420 3x + 5y ≤ 150 2x + y ≥ 4
a) b) c)
4x + 2y ≥ 290 3x + 3y ≤ 120 
 x − 2y ≤ 6

x−y ≥0
Nota: Rectas horizontales y verticales.

En ocasiones, en estos sistemas, aparecen inecuaciones del tipo x ≥ k o bien y ≥ k, donde falta
alguna de las dos incógnitas.
Estas inecuaciones en realidad corresponden a rectas horizontales y verticales, y su representación
es bien sencilla.
Por ejemplo, la inecuación x ≤ −2 no es más que el conjunto de puntos a la izquierda de la recta
vertical que pasa por el punto x = −2, gráficamente:
Lo mismo ocurre con y ≤ 1, que será en este caso la parte inferior a la recta horizontal y = 1, es
decir:
En el caso particular de que sea x ≥ 0 o y ≥ 0, las rectas coincidirán con los ejes de coordenadas.
Ejercicios: Resolver los sistemas de inecuaciones lineales siguientes, encontrando los vértices de las
regiones que sean solución:

  x + 3y ≥ 50 
5x + 15y ≤ 150 
  2x + y ≤ 10

 
 9x − 8y ≥ 0 

6x + 8y ≤ 120 x + 3y ≤ 12
a) b) 3x + 4y ≥ 60 c)

 x ≥ 0 
 
 0≤x≤8
 
 x≥0 
y≥0  0≤y≤2
y≥0
Nota: Las dobles desigualdades como 0 ≤ x ≤ 8 se pueden desdobler en otras dos, x ≥ 0 y x ≤ 8.

8.4. Problemas de optimización de una función sujeta a restricciones

En un problema de programación lineal de dos variables x e y, se trata de optimizar (hacer máxima
o mı́nima, según los casos) una función (llamada función objetivo) de la forma:
F (x, y) = A · x + B · y
sujeta a una serie de restricciones dadas mediante un sistema de inecuaciones lineales del tipo:


 a1 x + b1 y ≤ c1

 a2 x + b2 y ≤ c2
 ..

 .

am x + bm y ≤ cm
Los puntos del plano que cumplen el sistema de desigualdades forman un recinto convexo acotado
(poligonal) o no acotado, llamado región factible del problema.
Todos los puntos de dicha región cumplen el sistema de desigualdades. Se trata de buscar, entre
todos esos puntos, aquel o aquellos que hagan el valor de F(x,y) máximo o mı́nimo, según sea el
problema.
Los puntos de la región factible se denominan soluciones factibles.
De todas esas soluciones factibles, aquellas que hacen óptima (máxima o mı́nima) la función obje-
tivo se llaman soluciones óptimas.
En general,un problema de programación lineal puede tener una, infinitas o ninguna solución.
Lo que si se verifica es la siguiente propiedad:
Propiedad:
Si hay una única solución óptima, ésta se encuentra en un vértice de la región factible, y si hay
infinitas soluciones óptimas, se encontrarán en un lado de la región factible.
Es posible que no haya solución óptima, pues cuando el recinto es no acotado, la función objetivo
puede crecer o decrecer indefinidamente.
Para resolver el problema, podemos abordarlo de dos formas, pero antes a aplicar cualquiera
de ellas siempre hay que dibujar la región factible, resolviendo el sistema de inecuaciones lineales
correspondiente, como se ha visto en los epı́grafes anteriores (la región factible puede estar acotada o
no), y se calculan los vértices de dicha región.
8.4.1. Forma geométrica

En este caso se representa el vector director de la recta que viene dada por la ecuación de la función
objetivo,F (x, y) = A · x + B · y , que hay que maximizar o minimizar.
El vector director de la recta A · x + B · y viene dado por v = (−B, A). Además, como lo único que
nos importa es la dirección del vector y no su módulo (longitud), podemos dividir a las coordenadas
del vector si los números son muy grandes, puesto que vectores con coordenadas proporcionales tienen
la misma dirección.
Posteriormente, se trazan rectas paralelas a este vector que pasen por los vértices de la región
factible (si es acotada) , o por todo el borde de la región factible (cuándo no es acotada) y se observa
en qué vértice la función F se hace máxima (o mı́nima) sin más que tener en cuenta cuál de las rectas
tiene mayor (o menor) ordenada en el origen, es decir, qué recta corta en un punto mayor o menor al
eje y.
Ejemplo: Maximizar la función F (x, y) = 2000x + 5000y sujeta a las restricciones:


 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
La región factible en este caso es:
Los vértices eran los puntos (0,-1), (5,1) y (3,-3).

Como la función es F (x, y) = 2000x + 5000y, el vector director es v = (−5000, 2000), que tiene la
misma dirección que el v = (−5, 2) y representándolo queda:
Figura 8.3: Región factible y vector de la función objetivo

Se trata ahora de trazar paralelas al vector que pasen por los vértices anteriores, es decir:
Figura 8.4: Solución gráfica. Paralelas al vector por los vértices.
Se observa gráficamente que de las tres paralelas trazadas, la que corta al eje y en un punto mayor
es la que pasa por el punto (5,1), que por tanto será la solución óptima al problema de máximos
planteado.
Para saber cuál es este valor ,máximo sustituimos en la función:
F (5, 1) = 2000 · 5 + 5000 · 1 = 10000 + 5000 = 15000
Luego la función tiene su solución óptima en (5,1) donde toma el valor 15000.
8.4.2. Forma algebraica

Consiste, simplemente, en susituir cada uno de los vértices de la región en la función objetivo. La
solución óptima vendrá dada por aquel que tome el mayor (o menor) valor.
Ejemplo: Maximizar la función F (x, y) = 2000x + 5000y sujeta a las restricciones:


 2x + 3y ≥ −3
2x − y − 9 ≤ 0

2x − 5y − 5 ≥ 0
Con la misma región factible que en el caso anterior.
Los vértices eran los puntos (0,-1), (5,1) y (3,-3).
De esta forma sustituyendo:
F (5, 1) = 2000 · 5 + 5000 · 1 = 10000 + 5000 = 15000

F (0, −1) = 2000 · 0 + 5000 · (−1) = 0 − 5000 = −5000
F (3, −3) = 2000 · 3 + 5000 · (−3) = 6000 − 15000 = −9000
Vemos que el valor máximo se alcanza para el vértice (5,1) y que dicho valor es 15. La misma solución
que se obtenı́a antes.
Ejercicio: Resolver los problemas de programación lineal:



 2x + y ≤ 10

x + 3y ≤ 12
1. Maximizar F (x, y) = 4x + 5y sujeto a: .

 0≤x≤8

0≤y≤2


 3x + 2y ≥ 12

4x + 5y ≥ 29
2. Minimizar F (x, y) = 12x + 10y sujeto a: .

 x≥0

y≥0


 4x + 2y ≤ 6

7x + 8y ≤ 28
3. Maximizar F (x, y) = 120x + 80y sujeto a: .

 x≥0

y≥0

4x + 5y ≥ 20
4. Minimizar F (x, y) = 12x + 8y sujeto a: 7x + 2y ≥ 14 .

x≤y
8.5. Algunos ejemplos de casos extremos

Puede ocurrir que la solución óptima no sea única, e incluso que no exista, como en los ejemplos
siguientes:
Ejemplo 1: 

 x + y ≥ 14

2x + 3y ≥ 36
Maximizar g(x, y) = 3x + 4y sujeta a las rectricciones: .

 4x + y ≥ 16

x − 3y ≥ 0
Si representamos la región factible:
Los vértices serán:

2 40
A= , , B = (6, 8), C = (12, 4)
3 3
Observemos que la región factible es NO acotada superiormente.
Si aplicamos el método geométrico, deberı́a trazar paralelas al vector director por los vértices, pero
como la región en no acotada, dichas rectas son cada vez mayores al trazarlas sobre los puntos de la
recta t, que son soluciones factibles. Por tanto el problema no tiene solución.
Figura 8.5: Las paralelas cortan cada vez en un punto mayor.
En general, un problema de máximos no tiene solución si la región factible no está acotada supe-
riormente, y un problema de mı́nimos no tiene solución si la región no está acotada inferiormente.
También puede tener el problema infinitas soluciones:
Ejemplo 2: 

 x+y ≥5


 ≤ x+3
y
Minimizar g(x, y) = 3x + 3y sujeta a las restricciones 3y − x ≥ −1 .



 y + 2x ≤ 16

4y − x ≤ 22
La región es, en este caso:
Los vértices respectivos son: A=(1,4), B=(2,5), C=(6,4), D=(7,2) y E=(4,1).

Si utilizamos el método gráfico, obtenemos:
Es decir, como buscamos el valor mı́nimo, todos los puntos comprendidos entre A y E sirven, es
decir, hay infinitas soluciones.
Si utilizamos el método algebraico: g(x, y) = 3x + 3y, luego:
A : g(1, 4) = 3 + 12 = 15
B : g(2, 5) = 6 + 15 = 21
C : g(6, 4) = 18 + 12 = 30
D : g(7, 2) = 21 + 6 = 27
E : g(4, 1) = 12 + 3 = 15
Observamos que el valor mı́nimo se toma en A y en E, y por tanto en todos los puntos comprendidos
entre ellos, es decir, hay infinitas soluciones.
8.6. Aplicación a problemas concretos

El verdadero valor de las técnicas de la programación lineal consiste en poder aplicarlas a problemas
reales.
Para resolver estos problemas se deben seguir los siguientes pasos, a la vez que vemos como se
aplicarı́a a un ejemplo concreto.
Ejemplo:
Una fábrica de muebles fabrica dos tipos de sillones, S1 y S2. La fábrica cuenta con dos secciones;
carpinterı́a y tapicerı́a.
Hacer un sillón de tipo S1 requiere 1 hora de carpinterı́a y 2 de tapicerı́a, mientras que uno de tipo
S2 requiere 3 horas de carpinterı́a y 1 de tapicerı́a.
El personal de tapicerı́a trabaja un total de 80 horas, y el de carpinterı́a 90.
Las ganancias por las ventas de S1 y S2 (unidad) son, respectivamente 60 y 30 euros. Calcular
cuántos sillones de cada tipo hay que hacer para maximizar las ganancias.
Este es un problema tı́pico en el que hay que usar las técnicas de programación lineal. Intentaremos
seguir el siguiente esquema:
1. Leer el enunciado , determinar la función objetivo y definir las variables.

En este caso, queremos hacer máximo el beneficio, es decir, queremos maximizar una función.
Como queremos determinar las cantidades de sillones S1 y S2 respectivamente, llamemos x=nº
de unidades de S1 e y=nº de unidades de S2.
La función beneficio a maximizar será: B(x, y) = 60 · x + 30 · y, que es la función objetivo.
2. Reordenar los datos del problema y escribir las inecuaciones correspondientes.

En este paso es conveniente el uso de tablas:
Tiempo(horas) Carpinterı́a Tapicerı́a

S1 1 2
S2 3 1
Disponible 90 80
Tiempo(horas) Cantidad Carpinterı́a Tapicerı́a
S1 x x 2x
S2 y 3y y
Necesario x + 3y 2x + y
Disponible 90 80
De aquı́ se deduce que:

x + 3y ≤ 90
2x + y ≤ 80
y además
x≥0
y≥0
pues el nº de unidades producidas no puede ser negativo.
Ya tenemos por tanto las restricciones.
3. Representar gráficamente la región factible, calcular sus vértices y el vector si usamos el método
geométrico.
En este caso, representando la región factible:
Siendo los vértices A=(0,0), B=(0,30), C=(30,20), D=(40,0).

60), equivalente a (−10,
El vector será (−30, 20).
Gráficamente se observa que la solución no es única, sino que se encuentran infinitas soluciones
en el lado correspondiente CD, sobre la recta 2x + y = 80, desde que x vale 30 hasta que vale
40, todas las soluciones son válidas.
4. Sustituir las coordenadas en la función objetivo y dar la solución correcta.

En este caso se obtiene:
B(0, 0) = 0
B(0, 30) = 900
B(30, 20) = 2400
B(40, 0) = 2400
con lo cuál hay infinitas soluciones y el beneficio que se obtiene es 2400 euros.
5. Analizar la solución obtenida en el contexto del problema: ¿tiene sentido?.

Debemos interpretar que en el contexto del problema no todas las soluciones son válidas, sino
que sólo sirven soluciones enteras, es decir, no se pueden fabricar, por ejemplo 3’8 sillones del
tipo S1. Las soluciones con sentido vendrı́an dadas por:
S1 30 31 32 33 34 35 36 37 38 39 40
S2 20 18 16 14 12 10 8 6 4 2 0
Encontramos por tanto sólo 11 soluciones que son las de la tabla

En cualquiera de estas soluciones el beneficio es de 2400 euros, que es el máximo bajo las
condiciones del problema.
8.7. El problema del transporte

Es uno de los problemas que dieron lugar a la programación lineal.
Un ejemplo tı́pico serı́a el siguiente:
Ejemplo:
Una empresa tiene 2 plantas de producción (P1 y P2) de cierto artı́culo que vende en 3 ciudades
(C1,C2 y C3). En P1 produce 5000 unidades, y en P2 7000 unidades. De estas 12000 unidades las
vende ası́: 3500 es C1, 4000 en C2 y 4500 en C3. Los costes de transporte, en euros por unidad de
producto, desde las plantas de producción a las ciudades son:
Envı́os Hasta C1 Hasta C2 Hasta C3
Desde P1 3 2’5 3’5
Desde P2 2’25 3’75 4
Determina el nº de artı́culos que debe enviar la empresa desde cada planta a cada ciudad para que los
costes de transporte sean mı́nimos.
Para problemas de este tipo necesitamos una nueva variable.

Sea x=unidades de P1 a C1, y=unidades de P1 a C2 y z=unidades de P1 a C3.
Tiene que verificarse entonces que x + y + z = 5000.
Si desde P1 a C1 se envı́an x unidades, como en C1 necesitan 3500, desde P2 se mandarán a C1
3500 − x. Razonando del mismo modo con y y z, se obtiene la tabla:
Desde P1 x y z = 5000 − x − y
Desde P2 3500 − x 4000 − y 4500 − z = 4500 − (5000 − x − y)
Hemos sustituido z por 5000 − y − x, porque x + y + z = 5000 y ası́ transformamos las 3 incógnitas
en sólo 2.
Para obtener las restricciones imponemos que cada cantidad ha de ser mayor o igual que cero, es
decir:
x≥0
3500 − x ≥ 0
y≥0
4000 − y ≥ 0
5000 − x − y ≥ 0
−500 + x + y ≥ 0
Por tanto el sistema de inecuaciones es:


 x≥0

 x ≤ 3500



y≥0

 y ≤ 4000


x + y ≤ 5000


x + y ≥ 500
Como se trata de minimizar costes, la función objetivo es:
C(x, y) = 3 · x + 2 5 · y + 3 5 · (5000 − x − y) + 2 25 · (3500 − x) + 3 75 · (4000 − y) + 4 · (−500 + x + y)
C(x, y) = 1 25 · x − 0 75 · y + 22625
Dibujando la región factible:
Resulta que A=(0,500), B=(0,4000), C=(1000,4000), D=(3500,1500), E= (3500,0) y F=(500,0).

Sustituyendo es:
C(0, 500) = 22250
C(0, 4000) = 19625
C(1000, 4000) = 20875
C(3500, 1500) = 25875
C(3500, 0) = 27000
C(500, 0) = 23250
El mı́nimo se da en B, cuando x = 0 e y = 4000.
Es decir, las unidades a distribuir son:

Desde P1 0 4000 1000
Desde P2 3500 0 3500
Ejercicio:
Dos fábricas de cemento, F1 y F2, producen respectivamente 3000 y 4000 sacos de cemento al dı́a.
Hay que enviar ese cemento a tres centros de ventas C1, C2 y C3 en cantidades de 3000, 2500 y
1500 sacos respectivamente.
Los costes de transporte de cada fábrica a los puntos de venta vienen dados, en euros por cada
saco, por:

Desde F1 2 2’5 2
Desde F2 1’5 3 1
Determina cómo hay que distribuir la producción para que el transporte resulte lo más económico
posible.
Capı́tulo 7
SISTEMAS DE ECUACIONES
LINEALES
7.1. Introducción
Se denomina ecuación lineal a aquella que tiene la forma de un polinomio de primer grado, es decir,
las incógnitas no están elevadas a potencias, ni multiplicadas entre sı́, ni en el denominador.
Por ejemplo, 3x + 2y + 6z = 6 es una ecuación lineal con tres incógnitas.
Como es bien sabido, las ecuaciones lineales con 2 incógnitas representan una recta en el plano.
Si la ecuación lineal tiene 3 incógnitas, su representación gráfica es un plano en el espacio.
Un ejemplo de ambas representaciones puede observarse en la figura:
Figura 7.1: Representación gráfica de la recta −x + 2y = 3 en el plano y del del plano x + y + z = 1

en el espacio
El objetivo del tema es el estudio de los sistemas de ecuaciones lineales, es decir, un conjunto de
varias ecuaciones lineales. Diremos que dos ecuaciones son equivalentes si tienen las mismas soluciones,
o geométricamente representan la misma recta o plano.
109
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 110
7.2. Sistemas de ecuaciones lineales

Un sistema de ecuaciones lineales es un conjunto de ecuaciones lineales de la forma:

a11 · x1 + a12 · x2 + a13 · x3 + · · · + a1n · xn = b1 


a21 · x1 + a22 · x2 + a23 · x3 + · · · + a2n · xn = b2 
..
. 



am1 · x1 + am2 · x2 + am3 · x3 + · · · + amn · xn = bm
En este caso tenemos m ecuaciones y n incógnitas.
Los números reales aij se denominan coeficientes y los xi se denominan incógnitas (o números a
determinar) y bj se denominan términos independientes.
En el caso de que las incógnitas sean 2 se suelen designar simplemente por x e y en vez de x1 y x2
, y en el caso de tres, x, y, z en lugar de x1 , x2 y x3 pero esto es indiferente a la hora de resolver el
sistema.
Resolver el sistema consiste en calcular las incógnitas para que se cumplan TODAS las ecuaciones
del sistema simultáneamente.
Diremos que dos sistemas son equivalentes cuando tienen las mismas soluciones.
7.3. Expresión matricial de un sistema

Cualquier sistema de ecuaciones lineales se puede expresar en forma matricial del modo:
     
a11 a12 a13 . . . a1n x1 b1
 a21 a22 a23 . . . a2n   x2   b2 
     
 .. .. .. . . ..  ·  ..  =  .. 
 . . . . .   .   . 
am1 am2 am3 . . . amn xn bm
mxn nx1 mx1
   
a11 a12 a13 ... a1n x1
 a21 a22 a23 ... a2n  x2 
   
La matriz A =  . .. .. .. ..  se llama matriz de coeficientes, la matriz X =  .. 
 .. . . . .   . 
am1 am2 am3 . . . amn xn
 
b1
 b2 
 
se llama matriz de incógnitas, y la matriz B =  .  se llama matriz de términos independientes.
 .. 
bm
La matriz formada por A y B conjuntamente, es decir:
 
a11 a12 a13 . . . a1n b1
 a21 a22 a23 . . . a2n b2 
 
(A|B) =  . .. .. .. .. .. 
 .. . . . . . 
am1 am2 am3 . . . amn bm
se llama matriz ampliada del sistema y se representará por (A|B) o bien por A∗ .

x+y−z = 5 
Ejemplo: El sistema: x+y =7 escrito matricialmente es:

2x + 2y − z = 12
     
1 1 −1 x 5
1 1 0  ·  y  =  7 
2 2 −1 z 12
y la matriz ampliada es:

 
1 1 −1 5
(A|B) = 1 1 0 7 
2 2 −1 12
7.4. Tipos de sistemas

En general,buscaremos las soluciones de los sistemas en los números reales R. Dependiendo del
posible número de tales soluciones reales que tenga un sistema, éstos de pueden clasificar en:

 * INCOMPATIBLES (No tienen solución) → S.I.
* DETERMINADOS (Solución única)→ S.C.D.
 * COMPATIBLES (Tienen solución)
* INDETERMINADOS (Infinitas soluciones)→ S.C.I.
7.5. Sistemas con dos incógnitas

Los sistemas más sencillos son aquellos en los que sólo hay dos incógnitas y 2 ecuaciones, y que ya
son conocidos de cursos pasados.
Hay varios sistemas para resolverlos, los más habituales:
* Reducción
* Igualación
* Sustitución
en los que ya no nos entretendremos.
Como cada ecuación lineal con 2 incógnitas se interpreta geométricamente como una recta, el estudio
de la solución del sistema se limita a estudiar la posición de 2 rectas en el plano.
Veamos algunos ejemplos con los tres casos que se pueden presentar. Resolver e interpretar el
x + 2y = −3
sistema: .
−2x + y = 1
Por reducción:
2x+4y=-6
-2x+ y=1
5y=-5
de donde y = -1 y sustituyendo x + 2·(-1) = -3, x = -1.

Es decir, la solución del sistema es única, x = -1, y = -1 lo que significa que el sistema es compatible
y determinado, y que las rectas se cortan en un punto, precisamente el (-1,-1):
Figura 7.2: Solución del sistema, punto (-1,-1)


x + 2y = −3
Resolver e interpretar el sistema: .
−2x − 4y = 5

x = −3 − 2y
Por igualación: 5 + 4y de donde:
x= 
−2
5 + 4y
−3 − 2y = =⇒ 4y + 6 = 5 + 4y =⇒ 0y = −1 =⇒ 0 = −1
−2
lo cuál es imposible y por tanto el sistema no tiene solución, es un sistema incompatible y por
tanto las rectas son paralelas. Geométricamente:
Figura 7.3: Sistema sin solución. Rectas paralelas

x + 2y = −3
Resolver e interpretar el sistema: .
3x + 6y = −9
Por sustitución, como x = −2y − 3 resulta 3(−2y − 3) + 6y = −9, es decir −6y − 9 + 6y = −9, por
tanto 0y = 0, 0 = 0.
Como 0 = 0 es una igualdad siempre cierta, quiere decir que el sistema tiene infinitas soluciones,
es compatible indeterminado, o que las rectas son la misma.
Figura 7.4: Infinitas soluciones. Las rectas coinciden
Lo expresaremos ası́. Como x = −2y − 3, dando valores a y se obtiene x.

Ası́ si le damos a y el valor arbitrario de λ (lambda), entonces expresaremos la solución como:

x = −2λ − 3
siendo λ ∈ R
y=λ
y como λ puede ser cualquier número real, hay infinitas soluciones.

Estos son los únicos casos que pueden darse con dos ecuaciones y dos incógnitas, y su interpretación
geométrica.
Ejercicio: Estudiar la solución de los siguientes sistemas e interpretarla geométricamente:

x+y = 5 2x + y = 1 x + 2y = 3
a) b) c)
2x − y = 7 3x + 2y = 4 x−y = 4
7.5.1. Discución de sistemas de 2 ecuaciones con 2 incógnitas

ax + 3y = 5
Si alguno de los coeficientes del sistema es desconocido, por ejemplo, , no estamos
2x − y = 6
ante un sólo sistema, sino ante infinitos, uno para cada valor de a, y cada sistema será distinto en
función del valor que tome dicha letra (llamada parámetro).
Para estudiarlo, se resuelve el sistema como habitualmente y se estudian los distintos casos que se
pueden dar. Por ejemplo , por reducción:
ax+3y=5
6x-3y=18
ax+6x =23
por tanto, x(6 + a) = 23. Entonces, si 6 + a = 0 no podremos despejar x, es decir si a = −6, obtenemos
una ecuación del tipo 0 = 23, es decir, imposible.
Por tanto, si a = −6 el sistema es incompatible.
23
En cualquier otro caso, podemos despejar x,x = , y se puede sacar y sustituyendo, por tanto,
6+a
si a = −6, el sistema es compatible determinado.
Ejercicio: Discutir los sistemas en función del parámetro desconocido:

1
x+y =5 ky + x =
a) b) 2
ax + 2y = 10 y − 3x = 5
7.6. Sistemas de 2 incógnitas y 3 ecuaciones

Podemos añadir a los clásicos sistemas de 2 ecuaciones y 2 incógnitas cuantas ecuaciones queramos
para obtener diferentes tipos de sistemas con 3, 4, 5 o más ecuaciones.
En cualquier caso, los tipos de sistemas a los que dan lugar son los mismos reseñados anteriormente.
Al aumentar el número de ecuaciones, la resolución del sistema por alguno de los tres métodos
clásicos se vuelve más farragoso, por lo que conviene aplicar ya el conocido método de Gauss para
determinar el tipo de sistema.
Para ello expresaremos el sistema en la forma matricial, analizando la matriz ampliada asociada,
que tendrá 2 columnas y tantas filas como ecuaciones tengamos.
Analizaremos tan sólo aquellos sistemas con 3 ecuaciones y 2 incógnitas.
La matriz ampliada genérica es:
 
a11 a12 b1
(A|B) = a21 a22 b2 
a31 a32 b3
Aplicar el método de Gauss consiste en realizar transformaciones elementales mediante las filas de la
matriz para obtener la matriz escalonada siguiente:
 
a11 a12 b1
(A|B) =  0 a∗22 b∗2 
0 0 b∗3
Recordemos que las operaciones elementales permitidas en las filas de la matriz (ecuaciones del sistema)
eran:
T1) Multiplicar o dividir una fila por un número real distinto de cero.
T2) Sumar o restar a una fila otra multiplicada por un número real no nulo.
T3) Intercambiar el lugar de dos filas entre sı́.
Utilizando estas transformaciones, los sucesivos sistemas que se obtienen son equivalentes al pri-
mero, es decir, tienen las mismas soluciones.
Debemos eliminar, en este orden, el elemento a21 utilizando la fila 1, el elemento a31 , utilizando
también la fila 1, y por último el elemento a32 utilizando la fila 2, de modo análogo al método de
Gauss-Jordan para la inversa.
Además, es conveniente en cada paso indicar la operación realizada con las filas, poniendo en
primer lugar aquella que se va a sustituir por otra.
Llegados a la matriz ampliada escalonada al final del proceso, pueden darse los casos siguientes:
1. a∗22 = 0. Entonces hay dos posibilidades:
a) b∗3 = 0. Sistema incompatible (hay una ecuación del tipo 0=k), sin solución.
Geométricamente, puede ocurrir que:
a) Dos rectas sean paralelas y la otra las corte.
b) Las rectas se corten dos a dos (formen un triángulo).
b) b∗3 = 0. Aparece una ecuación 0=0 que no influye en la resolución del sistema, que redu-
cido a las dos ecuaciones iniciales tiene solución única, es decir, el Sistema es Compatible
Determinado.
Geométricamente:
a) Dos rectas son coincidentes y la otra las corta.
b) Las tres rectas se cortan en un mismo punto.
2. a∗22 = 0. Entonces hay tres posibilidades:

a) Si b∗2 = b∗3 = 0, aparecen dos ecuaciones 0=0, que no influyen en la resolución del siste-
ma, que ahora tiene infinitas soluciones (1 ecuación y dos incógnitas). Sistema compatible
indeterminado.
Geométricamente, las tres rectas coinciden (son la misma):
b) Si b∗2 = 0, b∗3 = 0 o bien b∗2 = 0, b∗3 = 0, aparece una ecuación 0=0 (que no influye) y otra
0=k (que es imposible). El sistema es incompatible.
Geométricamente:
a) Dos rectas son paralelas y la otra las corta.
b) Dos rectas coinciden y la otra es paralela.
c) Si b∗2 = 0, b∗3 = 0, hay dos ecuaciones 0=k que son imposibles, el sistema es incompatible.
Geométricamente, las tres rectas son paralelas o dos son coincidentes y una paralela.
En cada uno de los casos, para determinar la posición concreta de las rectas, basta representarlas.
Ejemplo Estudiar el sistema siguiente, dando la interpretación geométrica:


−x + 2y = 5 
3x + y = 7

2x + 3y = 12
A partir de la matriz ampliada y aplicando el método de Gauss, obtenemos:

     
−1 2 5 −1 2 5 −1 2 5
F +3F1  F −F2 
(A|B) =  3 1 7  −−2−−−→ 0 7 22 −−3−−→ 0 7 22
F3 +2F1
2 3 12 0 7 22 0 00
En este caso aparece una ecuación 0=0 que no influye y el elemento a∗22 es no nulo. El sistema es
compatible determinado, tiene solución única.
Geométricamente, puede ocurrir que:
a) Dos rectas son coincidentes y la otra las corta.
b) Las tres rectas se cortan en un mismo punto.
Resolviendo y dibujando, obtenemos:

−x + 2y = 5
7y = 22
22 9
De donde y = y sustituyendo es x = (compruébalo).
7 7
Dibujando las rectas:

9 22
Figura 7.5: Solución del sistema. Las tres rectas se cortan en un punto: P= ,
7 7
se observa
que las rectas se cortan en un punto, precisamente el punto solución del sistema: P =
9 22
, .
7 7
Ejercicios
a) Resuelve e interpreta geométricamente los sistemas:
  
 x+y =0  x − y = −2  2x + y = 2
a) −x + y = 2 b) x + 2y = 1 c) −x + y = −3
  
x + 3y = −2 4x − 10y = −14 y = −2x
b) Discute y resuelve en función del parámetro:
 
 x−y = 1  2x + y = 3
a) x + 2y = −1 b) −x + 3y = 0
 
2x + my = 0 mx + 4y = 3
7.7. Sistemas de 3 ecuaciones y 3 incógnitas

Cuando los sistemas tienen más de dos ecuaciones y tres o más incógnitas se utilizará el ya conocido
método de Gauss.
Ahora partiremos de la matriz ampliada:
 
a11 a12 a13 b1
(A|B) = a21 a22 a23 b2 
a31 a32 a33 b3
para dejar dicha matriz escalonada, es decir, del tipo:

 
a11 a12 a13 b1
∗
 0 a∗22 a∗23 b 
2
0 0 a∗33 b∗
3
utilizando las transformaciones conocidas, y de la forma indicada en ocasiones anteriores.

Los tipos de sistema que pueden obtenerse dependiendo del número de soluciones son los reseñados
en apartados anteriores.
Al aplicar el método de Gauss podemos encontrarnos con distintos casos:
* Si se obtiene un sistema escalonado con coeficientes no nulos, el sistema es compatible determi-
nado, tiene solución única.
* Si se obtiene una o más filas en las que todos los elementos sean cero, el sistema tiene infinitas
soluciones, y hay que despejar una o varias incógnitas en función de otras, es un sistema compatible
indeterminado.
* Si se obtiene una o más filas de ceros, salvo el elemento correspondiente al término independiente,
que es distinto de cero, digamos k, entonces como la fila en cuestión corresponderı́a a una ecuación
del tipo 0 = k , lo que es imposible, el sistema no tiene solución y por tanto es incompatible.
Veamos un ejemplo:

 2x + y − z = 11
Ejemplo Resolver por el método de Gauss: x − 3y = −20 .

4x + 2y + 5z = 8
 
2 1 −1 11
La matriz ampliada es (A|B) = 1 −3 0 −20. Aplicando el método de Gauss:
4 2 5 8
    
2 1 −1 11 2 1 −1 11  2x + y − z = 11
2F2 −F1
1 −3 0 −20 − 
−−−−→ 0 −7 1 −51 =⇒  −7y + z = −51
F3 −2F1 
4 2 5 8 0 0 7 −14 7z = −14
obtenemos un sistema escalonado, que es compatible y determinado, pués podemos despejar z,

obteniendo z = −2, y luego −7y − 2 = −51, de donde −7y = −49 es decir y = 7 y sustituyendo en la
primera ecuación es 2x + 7 + 2 = 11, luego 2x = 2 , es decir x = 1.
La solución es (1, 7, −2).
Este proceso de resolución, que comienza calculando z y permite calcular las demás incógnitas
sustituyendo en las ecuaciones anteriores se denomina sustitución regresiva.
7.7.1. Interpretación geométrica de los sistemas con 3 ecuaciones y 3 incógnitas

Como cada ecuación lineal con 3 incógnitas corresponde a un plano en el espacio, la solución del
sistema correspoderá a la posición en que dichos planos estén en el espacio.
Lo más sencillo es saber que ocurre con los planos 2 a 2, pues en el espacio dos planos sólo pueden
estar en 3 posiciones:
* Son coincidentes: Lo cuál es fácil de saber porque sus correspondientes ecuaciones tienen coefi-
cientes de las incógnitas y los términos independientes proporcionales, es decir, si los planos son:

α ≡ Ax + By + Cz = D
β ≡ A x + B y + C z = D
entonces se verifica:
A B C D

= = =
A B C D
(siempre que se puedan realizar las divisiones).
Por ejemplo, los planos 2x + 3y − z = 5, y −10x − 15y + 5z = −15 son coincidentes.
* Son paralelos: También es sencillo de saber porque los coeficientes de las incógnitas son propor-
cionales, pero los términos independientes NO. Es decir, en este caso:

β ≡ A x + B y + C z = D
A B C D

= = =
A B C D
(siempre que se puedan realizar las divisiones).
Por ejemplo, los planos 2x + 3y − z = 5 y −10x − 15y + 5z = 7 son paralelos.
* Son secantes: Simplemente los coeficientes no son proporcionales, es decir:

β ≡ A x + B y + C z = D
A B C D

= = =
A B C D
(siempre que se puedan realizar las divisiones, y basta con que un par de ellas correspondientes a las
incógnitas sean diferentes).
Por ejemplo, los planos 7x + 3y − z = 5 y −10x − 15y + 5z = 7 son secantes.
Puesto que podemos determinar la posición de los planos 2 a 2, podemos determinar en qué posición
se encuentran los 3 a la vez, fijándonos en los casos:
1. Si el sistema es S.C.D. (Solución única), es que los tres planos se cortan en un punto, que es la
solución del sistema.
2. Si el sistema es S.C.I. (Infinitas soluciones), puede ocurrir que:
a) Los tres planos se corten en una recta.

b) Dos planos son coincidentes y el otro los corta en una recta.
c) Los tres planos son coincidentes.
Y determinaremos la opción correspondiente estudiándolos de dos en dos.
3. Si el sistema es S.I. (Sin solución), puede ocurrir que:
a) Los planos se cortan dos a dos.

b) Dos planos son paralelos y el otro los corta.
c) Los tres planos son paralelos.
d ) Dos planos son paralelos y el otro coincidente con uno de ellos.
Y determinaremos la opción correspondiente estudiándolos de dos en dos.
Ejemplo: Estudiar el sistema e interpretarlo geométricamente:


 2x + y − z = −6
3x − y + z = −5

4x + 2y − 2z = −1
 
2 1 −1 −6
Aplicando Gauss a (A|B) = 3 −1 1 −5, se obtiene:
4 2 −2 −1
    
2 1 −1 −6 2 1 −1 −6  2x + y − z = −6
3 −1 1 −5 − 2F2 −3F1  8  =⇒
− − −−→ 0 −5 5 −5y + 5z = 8
F3 −2F1 
4 2 −2 −1 0 0 0 11 0 = 11
Lo que indica que el sistema es incompatible y por tanto no tiene solución, los planos no tienen puntos
comunes.
Si estudiamos la posición de los planos 2 a 2, se obtiene que el primero y el segundo tienen

coeficientes que no son proporcionales, luego se cortan.
El primero y el tercero tienen coeficientes proporcionales pero no los términos independientes,
luego son paralelos.
Y el segundo y el tercero no tienen coeficientes proporcionales, por lo que se cortan.
Concluimos por tanto que los planos primero y tercero son paralelos y son cortados por el segundo
plano, ésta es la interpretación geométrica:
Ejercicios: Estudiar e interpretar geométricamente los sistemas:

   
 2x − y + 3z = −1  x+y+z = 2  x + y − z = −2  x+y+z = 8
a) 4x − 2y + 6z = −5 b) 2x + y + 3z = 1 c) 2x − y + 3z = −5 d) 7x + y + 6z = 7
   
−2x + y − 3z = −7 x + 2y + z = 4 3x + 2z = −7 x + 7y + z = 1
7.7.2. Discusión de sistemas de 3 ecuaciones y 3 incógnitas

Si aparece algún coeficiente desconocido,aplicaremos el método de Gauss e investigaremos según
los valores del parámetro la posibilidad de que aparezca o no una fila de ceros.

 x+y+z = m+1
Ejemplo: Discutir según los valores de m el sistema: mx + y + (m − 1)z = m

x + 7y + z = 1
Aplicando Gauss a la matriz ampliada:
   
1 1 1 m + 1 1 1 1 m + 1
F2 −mF1 F −F1
m 1 m − 1 m  − −−−−→ 0 1 − m −1 −m2  −−3−−→
(m=0)
1 m 1 1 1 7 1 1
   
1 1 1 m + 1 1 1 1 m + 1
F −F1 F3 +F2
−−3−−→ 0 1 − m −1 −m2  − −−−→ 0 1 − m −1 −m2 

0 m − 1 0 −m 0 0 −1 −m − m2
Debemos, llegados a este punto, fijarnos en dos aspectos:
a) El desarrollo anterior sólo es posible si m = 0, luego el caso m = 0 debe estudiarse por separado.
b) En el sistema escalonado final, hay problemas cuando el valor 1 − m = 0, es decir, cuando
m = 1. En cualquier otro caso, no hay problemas.
De modo que, resumiendo, si m = 0 y m = 1, el sistema es S.C.D.
Estudiemos ahora cada caso por separado:
Si m = 0, al aplicar Gauss, queda:
     
1 1 1 1 1 1 1 1 1 1 1 1
F3 −F1 F +F2
0 1 −1 0 − −−−→ 0 1 −1 0 −−3−−→ 0 1 −1 0

1 0 1 1 0 −1 0 0 0 0 −1 0
que vuelve a ser S.C.D.

Si m = 1, al aplicar Gauss queda:
 
1 1 1 1
0 0 −1 −1

0 0 −1 −2
Se obtienen dos valores distintos de z, lo que es absurdo y el sistema en este caso no tiene solución
(S.I.)
Conclusión:
* Si m = 1 S.I.
* Si m = 1 S.C.D.
Ejercicios:
1. Discutir en función del parámetro desconocido los sistemas siguientes e interpretar geométrica-
mente el resultado:
 
x + y + az = 1  x + y − 6z = 0
a) x + ay + z = 1 b) x − 2y + 6z = 0
 
ax + y + z = 1 3x + −y + mz = 0
 
 3x + y + 2z = 1 − a x + y + az = a2
c) (1 + a)x + 2y + z = a d) x + ay + z = a
 
ax − y + z = 1 − a ax + y + z = 1

 x + 2y − z = 8
2. Dado el sistema 2x − 3y + z = −1 , se pide:

3x − y + kz = 5
a) Hallar el valor de k que hace el sistema incompatible.
b) Hallar el valor de k que hace el sistema compatible y además z= -1.
c) Para el valor de k hallado en b), resolver el sistema.
7.8. Aplicación de las matrices y determinantes a la resolución de

sistemas. Regla de Cramer
7.8.1. Aplicación de las matrices
Si tenemos un sistema con el mismo número de ecuaciones que de incógnitas ( un sistema de ese
tipo de llama cuadrado), entonces la matriz A de coeficientes es cuadrada y podemos escribir el sistema
matricialmente ası́:
A·X =B
donde A,X y B son las matrices ya definidas de coeficientes, incógnitas y términos independientes
respectivamente.
Como el objetivo es calcular la matriz X de incógnitas, el problema estarı́a resuelto si conseguimos
despejar X de dicha ecuación.
Sabemos que eso se puede hacer sólo cuando la matriz A posee inversa, y en ese caso aplicarı́amos
que:
A · X = B =⇒ A−1 · A · X = A−1 · B =⇒ I · X = A−1 · B =⇒ X = A−1 · B
es decir podrı́amos calcular X, y el sistema tendrı́a solución única.
Si A no posee inversa, no podemos despejar X y el sistema no se puede resolver de esta manera.
Conclusión: En un sistema cuadrado y cuya matriz de coeficientes tenga inversa, la solución del
sistema viene dada por:
X = A−1 · B

 2x + y − z = 11
Ejemplo: Resolver, aplicando la inversa, el sistema: x − 3y = −20 .

4x + 2y + 5z = 8
 
2 1 −1
La matriz de coeficentes es 1 −3 0 .
4 2 5
Para poder aplicar lo anterior es necesario que A tenga inversa, lo que por ejemplo comprobamos
haciendo det (A).
Como det(A) = −49, no nulo, A tiene inversa. Por tanto y según lo dicho,X = A−1 · B , es decir:
   −1  
x 2 1 −1 11
y  = 1 −3 0  · −20
z 4 2 5 8
Si hacemos la inversa de A (¡compruébalo!), resulta:

 15 1 3

49 7 49
A−1 =  5 −2 1 
49 7 49
−2 1
49 0 7
y por tanto,    15     
1 3
x 49 7 49 11 1
y  =  5 −2 1 
· −20 = 2
49 7 49
−2 1
z 49 0 7 8 7
es decir x=1, y=7 , z=-2 , solución que ya habı́amos obtenido utilizando el método de Gauss.
7.8.2. Regla de Cramer

En el caso de sistemas que cumplan las mismas condiciones que los del anterior apartado, es decir,
que sean cuadrados y tales que su matriz de coeficientes tenga inversa (los sistemas que cumplen estas
dos condiciones se llaman sistemas de Cramer ), se puede aplicar una regla muy sencilla para calular
la solución y que se basa en los determinantes, conocida como regla de Cramer.
Si det(A) es cero, evidentemente la regla no se puede aplicar.
La regla de Cramer:
Para un sistema de Cramer (cuadrado y con matriz regular) se verifica que la incónita número k
se calcula dividiendo entre el determinante de A el determinante que resulta de sustituir la columna
k (correspodiente al lugar que ocupe la incógnita que se está calculando) por la columna de términos
independientes.

 2x + y − z = 11
Ejemplo: Resolver el sistema x − 3y = −20 .

4x + 2y + 5z = 8
Como el sistema es de Cramer puesto que det(A) = −49, aplicamos la regla de Cramer:
Para x sustituimos la primera columna por la de términos independientes pues x es la primera
incógnita:
11 1 −1

−20 −3 0

8 2 5 −49
x= = =1
−49 −49
Para y sustituimos la segunda columna por la de términos independientes pues y es la segunda incógni-
ta.
2 11 −1

1 −20 0

4 8 5 −343
y= = =7
−49 −49
Para z sustituimos la tercera columna por la de términos independientes pues z es la tercera incógnita).

2 1 11

1 −3 −20

4 2 8 98
x= = = −2
−49 −49
Y obtenemos la solución como antes.
Recordemos que esto sólo se puede aplicar para sistemas de Cramer.
Ejercicio: Resolver, mediante estos dos métodos, los sistemas:

  
3x − 2y + z = −1 x+y+z = 6  3x + y + z = 2
a) 2x + y − z = 2 b) x − y + 2z = 5 c) 2x + 2y + z = 5
  
x − 3y + z = 0 x+y−z = 0 x−y +z = 0
7.9. Estudio de sistemas cualesquiera mediante el cálculo del rango.

Teorema de Rouché-Frobenius
Saber si un sistema tiene o no solución (si es compatible), y cuántas soluciones tiene (si es deter-
minado o indeterminado), se reduce para cualquier tipo de sistemas a estudiar rangos. El resultado
fundamental es el:
Teorema de Rouché-Frobenius:
Un sistema cualquiera de matriz A y matriz ampliada (A|B) tiene solución (es compatible) si y
solamente si Rg(A) = Rg(A|B).
Por tanto si los dos rangos son distintos el sistema no tiene solución (S.I.).
Además, si dicho rango coincide con el número de incógnitas del sistema, la solución es única
(S.C.D.), y si dicho rango es menor que el número de incógnitas, hay infinitas soluciones (S.C.I.).
Es importante darse cuenta de que Rg(A) ≤ Rg(A|B), puesto que la matriz de coeficientes forma
parte de la ampliada, es decir, la matriz A no puede tener rango mayor que la ampliada.
Aún siendo importante, el único problema que plantea este teorema es que NO ofrece ningún método
para calcular la solución, sólamente dice si hay solución o no.
Ejercicio: Aplicar el teorema de Rouché para determinar el tipo de sistema que es:
  
 x+y−z+t = 4  2x − y = 1  x + 3y = 3
3x + 3y − z = −1
a) 2x − y + 3z + 2t = −1 b) x + 3y = −2 c) 3x + 5y = 7 d)
   x + y − 5z = 2
−4x + 5y − 11z − 4t = 11 5x − 4y = 7 2x + 4y = 5
7.10. Sistemas homogéneos

Un sistema homogéneo es aquél que tiene todos los términos independientes nulos.
Cualquier sistema homogeneo es evidente que es compatible, pues dando a cada incógnita el valor
0, se cumplen las ecuaciones. Esta solución (que todas las incógnitas sean nulas) se llama solución
trivial.
El problema entonces está en determinar si dichos sistemas son compatibles determinados o inde-
terminados.
Aplicando el teorema de Rouché sólo podemos tener dos casos:
a) Rg (A) = nº incógnitas. En este caso el sistema es compatible determinado, y por tanto tiene
solución única que es la trivial (todas las incógnitas valen cero)
b) Rg(A) < nº incógnitas. En este caso el sistema es compatible indeterminado y tiene infinitas
soluciones que se determinan de la manera conocida.
Ejercicios:
1. Estudiar la solución de los sistemas homogéneos siguientes:


x+y−z = 0
x+y = 0 x+y+z = 0
a) b) c) 2x − y + z = 0
x−y = 0 2x − y + z = 0 
4x + y − z = 0

 6x + 18y − bz = 0
2. Discutir el sistema homogéneo: 7x − 2y − 4z = 0 .

4x + 10y − 6z = 0
Capı́tulo 5
TEST DE HIPÓTESIS
5.1. Introducción
En este tema trataremos el importante aspecto de la toma de decisiones, referida a decidir si un
valor obtenido a partir de la muestra es probable que pertenezca a la población.
En general, la media (o proporción) en una muestra suele ser distinta a la media de la población,
de la cuál se extrae la muestra. Lo normal suele ser que tal diferencia entre la media muestral y
poblacional sea pequeña y debida al azar, pero podrı́a suceder que dicha diferencia no esté justificada
por el azar y se deba a un cambio en la población, y debamos modificar los datos que conocemos
previamente.
Ejemplos:
a) Hace algunos años, la media de estatura de los españoles adultos varones era de 170 cm y su
desviación tı́pica 9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una medida de 172
cm. ¿Puede afirmarse que esa diferencia de 2 cm es debida al azar o realmente la estatura media ha
aumentado?.
b) Supongamos que, respecto a una determinada ley, el 52 % de los ciudadanos está en contra.
Pasado el tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han
descendido hasta el 49 %.¿Ha cambiado realmente la opinión pública o tal resultado es debido al
azar?.
c) El porcentaje de aprobados en las PAU en un determinado distritouniversitario ha sido del 82 %.
En una ciudad de ese distrito, el porcentaje de aprobados fue del 86 %. ¿Puede afirmarse con un nivel
de confianza del 90 % que los resultados en esa ciudad son superiores a la media?.
Los métodos de decisión estadı́stica están ligados a los de estimación de parámetros mediante los
intervalos de confianza, aunque también aparecerán otros nuevos conceptos.
5.2. Hipótesis estadı́sticas

Trataremos de utilizar los datos obtenidos en una muestra para tomar decisiones sobre la población.
Para ello, debemos realizar ciertos supuestos o conjeturas sobre las poblaciones. Estos supuestos, que
pueden ser o no ciertos,se llaman hipótesis estadı́sticas.
Podemos, entonces, definir el test de hipótesis o contraste de hipótesis como el procedimiento
estadı́stico mediante el cuál se investiga la verdad o falsedad de una hipótesis acerca de una población
o poblaciones.
Dichas hipótesis se formularán sobre la media poblacional µ o la proporción poblacional p.
Llamaremos hipótesis nula, y se representa por H0 , a la hipótesis que se formula y por tanto se quiere
contrastar o rechazar, e hipótesis alternativa, y se representa por H1 , a cualquier otra hipótesis que
sea diferente de la formulada, y que sea contraria a H0 , de forma que la aceptación de la hipótesis nula
H0 implica el rechazo de la alternativa H1 y viceversa, el rechazo de H0 implica la aceptación de H1 .
72
CAPÍTULO 5. TEST DE HIPÓTESIS 73
En un problema de contraste de hipótesis, pues, siempre tiene que formularse una hipótesis nula H0 ,
y ha de ir acompañada de una alternativa, H0 que es la que aspira a desplazar a la nula.
Ejemplo: Un investigador afirma que la temperatura del cuerpo humano en un adulto sano se distri-
buye según una normal de media µ = 37º C y desviación tı́pica σ = 0 9º C. Formular la hipótesis
nula y la hipótesis alternativa
A la vista de los datos, el investigador afirma que la temperatura media del cuerpo humano es 37º,
es decir la hipótesis o conjetura que formula es:
H0 = 37 (hipótesis nula)
Como hipótesis alternativa, hemos de tomar aquella contraria a esta, que la media sea distinta de 37º
C, es decir:
H1 = 37 (hipótesis alternativa)
Si la hipótesis nula fuese del tipo µ ≥ k la hipótesis alternativas serı́a:µ < k.
5.3. Errores
Hay ocasiones en que la hipótesis nula, H0 , es cierta, pero a la vista de la muestra tengamos que
rechazarla. En tal caso, estamos cometiendo un error.
El error que consiste en rechazar la hipótesis nula cuando ésta es verdadera, se denomina error de
tipo I.
Otro tipo de error puede ocurrir cuando, siendo H0 falsa, las evidencias de la muestra, sin embargo,
nos lleven a aceptarla.
Este error, cometido al aceptar cuando ésta es falsa, se denomina error de tipo II. Resumiendo:
Situación
H0 verdadera H1 verdadera (H0 falsa)
Mantener H0 Decisión correcta Decisión incorrecta:
Probabilidad=1 − α ERROR DE TIPO II
Decisión Probabilidad=β
Rechazar H0 Decisión incorrecta: Decisión correcta

ERROR DE TIPO I Probabilidad=1 − β
Probabilidad=α
donde α es el nivel de significación y 1 − α es el nivel de confianza.
Con esta notación y utilizando probabilidades condicionadas:
α = p (Rechazar H0 /H0 es cierta) = p(Error de tipo I)
y
α = p (Aceptar H0 /H0 es cierta)
Por otra parte:
β = p (Aceptar H0 /H0 es falsa) = p(Error de tipo II)
y
1 − β = p (Rechazar H0 /H0 es falsa)
A la probabilidad 1 − β se le denomina potencia del contraste.
5.4. Región crı́tica y región de aceptación

Sabemos ya formular la hipótesis nula y la hipótesis alternativa. Lo que necesitamos ahora es
un criterio para saber si debemos aceptar una u otra, es decir, ¿con cuál de las dos hipótesis nos
quedamos?.
Al tener ya formulada la hipótesis nula, es necesario que las evidencias sean muy fuertes para
rechazarla; es decir, puede que haya cambios debidos al azar, en cuyo caso el cambio no es significativo,
y no cambiamos , pero puede que los cambios sean debidos a otras causas. En este último caso es cuando
el cambio es significativo y rechazaremos.
Por lo tanto, lo primero que debemos hacer es fijar un cierto intervalo dentro del cuál es normal
que haya cambios, es decir, una región tal que si el parámetro se mantiene en dicho intervalo, nos
seguimos quedando con H0 , pues esas pequeñas variaciones son debidas al azar. Ese intervalo o región
se denomina región de aceptación, y será mayor o menor dependiendo del nivel de confianza que
precisemos, 1 − α.
La región que quede fuera de la región de aceptación indica que en este caso los cambios no se
pueden atribuir al azar, y por tanto hemos de rechazar H0 y aceptar H1 . Tal región se llama región
crı́tica o de rechazo.
Llegados a este punto, hemos de distinguir entre dos tipos de contraste o test, que determinan la
región de aceptación y la región de rechazo.
1. Contraste bilateral (o de dos colas): En este caso la región de rechazo o región crı́tica
está formada por dos conjuntos de puntos disjuntos. Dicho caso se presenta cuando la hipótesis
nula es del tipo H0 : µ = k (o bien H0 : p = k) y la hipótesis alternativa, por tanto, es del tipo
H1 : µ = k (o bien H1 : p = k).
La región crı́tica para un cierto nivel α serı́a, en la N(0;1):
Figura 5.1: El intervalo (−z α2 , z α2 ) es la Región de Aceptación. La región no sombreada es la Región

crı́tica, formada por dos partes o colas.
Fijémonos en que el nivel de significación α se concentra en dos partes (o colas) simétricas

respecto de la media.
La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad
para x o p̂, es decir:
σ σ
µ − z α2 · √ , µ + z α2 · √
n n
o bien:
p·q p·q
p − z α2 · , p + z α2 ·
n n
Las correspondientes regiones crı́ticas serán:

σ σ
−∞, µ − z α2 · √ ∪ µ + z α2 · √ , ∞
n n
o bien
p·q p·q
−∞, p − z α2 · ∪ p + z α2 · ,∞
n n
2. Contraste unilateral (o de una cola): En este caso la región crı́tica está formada por un
sólo conjunto de puntos.
Como se observa en las figuras, el nivel de significación α se concentra sólo en una parte o cola.
Este caso se presenta cuando la hipótesis nula es del tipo H0 : µ ≥ k (o bien H0 : p ≥ k) y la
hipótesis alternativa, por tanto, es del tipo H1 : µ < k (o bien H1 : p < k).(También si aparece
≤)
A nivel de confianza 1 − α, las regiones serı́an, en la N(0;1):
a) Unilateral por la derecha:
Figura 5.2: El intervalo (−∞, zα ) es la Región de Aceptación. La región no sombreada es la Región

crı́tica, formada por una partes o cola. El nivel α se concentra ahı́.
La región de aceptación en este caso será:

σ
−∞, µ + zα · √
n
o bien:
p·q
−∞, p + zα ·
n

σ
µ + zα · √ , ∞
n
o bien
p·q
p + zα · ,∞
n
b) Unilateral por la izquierda:
Figura 5.3: El intervalo (zα , ∞) es la Región de Aceptación. La región no sombreada es la Región

crı́tica, formada por una partes o cola. El nivel α se concentra ahı́.
La región de aceptación en este caso será:

σ
µ − zα · √ , ∞
n
o bien
p·q
p − zα · ,∞
n

σ
−∞, µ − zα · √
n
o bien:
p·q
−∞, p − zα ·
n
En todos los casos, conociendo el nivel de confianza 1 − α, tendremos que determinar el valor z α2
(para contrastes bilaterales) o bien zα (para contrastes unilaterales), que separa las regiones de rechazo
y aceptación.
Algunos de estos valores más comunes se dan en la tabla adjunta, que en los bilaterales son los
mismos que para intervalos de confianza o probabilidad, ya vistos con anterioridad:
Figura 5.4: Valores más comunes para contrastes bilaterales y unilaterales derechos. Los correspon-
dientes para los unilaterales izquierdos son negativos.
5.5. Etapas de la prueba de hipótesis

Los procedimientos seguidos en las pruebas de hipótesis correspondientes a las situaciones de
decisión estadı́stica se encuentran totalmente prefijados y se llevan a cabo en una serie de etapas que
facilitan su comprensión, y que son:
1. Enunciar la hipótesis nula H0 y la alternativa H1 .

Deben ser excluyentes entre sı́. Analizar, una vez enunciadas, si el contraste es bilateral o unila-
teral (Es bilateral si la hipótesis alternativa es del tipo = y unilateral si es del tipo > o <).
2. Determinar el valor z α2 (para contrastes bilaterales) o bien zα (para contrastes unilaterales),

que separa las regiones de rechazo y aceptación, a partir del nivel de confianza 1 − α o el de
significación α.
3. Determinar la distribución que sigue el parámetro muestral (x o p̂) y en base a ella y al valor
obtenido en la etapa anterior, escribir las correspondientes regiones de aceptación y rechazo.
4. Calcular el estadı́stico usado en la prueba (en nuestro caso, calcular media muestral x o propor-
ción muestral p̂, a partir de la muestra).
5. Aplicar el test,es decir, dependiendo de si el estadı́stico cae en la región de aceptación o de
rechazo, tomar la decisión de aceptar una de las dos hipótesis.
A continuación se ofrecen algunos ejemplos de problemas de test de hipótesis:
1. La vida media de una muestra de 100 tubos fluorescentes producidos por una empresa es de
1570 horas, una desviación tı́pica de 120 horas. Si es la vida media media de los tubos de dicha
empresa, ¿se puede afirmar a nivel de significación 0’05 que la duración media de los tubos es
de 1600 horas?.
Determinar los errores de tipo I y II
Etapa 1: Queremos saber si la duración media de los tubos es de 1600 horas, es decir, que nuestra
hipótesis nula es H0 : µ = 1600.
Por lo tanto, la hipótesis alternativa será que la duración no sea de 1600 horas, es decir, la
hipótesis alternativa es H1 : µ = 1600.
Por tanto estamos ante un contraste bilateral.
Etapa 2: A nivel de significación α = 0 05 =⇒ 1 − α = 0 95, y realizando el dibujo habitual
(hacer como ejercicio), obtenemos que z α2 = z0 025 = 1 96.
Etapa 3: Determinemos la distribución de la media muestral, x, teniendo en cuente que como la
desviación tı́pica de la población no la conocemos, tomamos la muestral, que es s = 120, y por
tanto sabemos que la media muestral sigue una normal:

120
N 1600; √ = N (1600; 12)
100
Por tanto la región de aceptación será el intervalo de probabilidad:

120 120
1600 − √ , 1600 + √ = (1600 − 1 96 · 12, 1600 + 1 96 · 12) = (157648, 162352)
100 100
De modo que, Región de Aceptación:(1576’48,1623’52)
Región de Rechazo: (−∞, 157648) ∪ (162352, ∞)
Etapa 4: En la muestra se ha obtenido que x = 1570.
Etapa 5: Para aplicar el test, simplemente hemos de comprobar si el valor de está dentro de la
región de aceptación o de la de rehazo.
Como en este caso se observa que
/ (157648, 162352)
1570 ∈
es decir, 1570 no está en la región de aceptación, sino en la de rechazo.
Por tanto, hemos de rechazar que la media es 1600 (hipótesis nula) y aceptar la alternativa.
A este nivel de confianza no se puede afirmar que la duración media de los tubos sea de 1600
horas.
En cuanto a los errores:
Error de tipo I es afirmar que la duración media no es de 1600 horas cuando en realidad sı́ lo es.
Error de tipo II es afirmar que la duración media es de 1600 horas cuando en realidad no lo es.
2. Una encuesta, realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de duración
de un empleo en la misma era de 6’5 años con una desviación tı́pica de 4. ¿Sirve esta afirmación
para aceptar, con un nivel de significación del 5 %, que el tiempo medio de empleo en esa fábrica
es menor o igual que 6? Justificar adecuadamente la respuesta.
El enunciado no puede ser más claro a la hora de determinar las hipótesis nula y alternativa.
Queremos comprobar si el tiempo medio de empleo en esa fábrica es menor o igual que 6, luego
la hipótesis alternativa será que dicho tiempo medio de empleo sea MAYOR que 6, es decir:
H0 : µ ≤ 6
o simplemente H0 : µ = 6 (lo que queremos comprobar) frente a:
H1 : µ > 6
Es claramente un contraste unilateral. La región de aceptación será

s
−∞, µ + zα √
n
puesto que aceptamos todos los valores menores que un cierto tope. Notemos que concemos el
valor de s (en la muestra) y no el de σ, pero eso no inluye en la fórmula. La región de rechazo,
por tanto, es:
s
µ + zα √ , ∞
n
Para calcular el nivel zα = z0 05 , y por tanto z0 05 = 1 645. Ası́ pues, la región de aceptación es,
puesto que µ = 6 , s = 4 y n = 64, resulta ser, aproximadamente:
(−∞, 6 8225)
Y la región crı́tica:
(6 8225, ∞)
Como en la muestra resulta que x = 6 5, que pertenece a la región de aceptación, es decir,

aceptamos la hipótesis nula, la media es de 6 años, al 95 % de confianza.
3. Un investigador, utilizando información de anteriores comicios, sostiene que, en una determinada

zona, el nivel de abstención en las próximas elecciones es del 40 % como mı́nimo. Se elige una
muestra aleatoria de 200 individuos para los que se concluye que 75 estarı́an dispuestos a votar.
Determinar, con un nivel de significación del 1 %, si se puede admitir como cierta la afirmación
del investigador.
Se trata ahora de un contraste de proporciones. La hipótesis a contrastar está muy clara: El
investigador dice que el nivel de abstención es de un 40 % por lo menos, es decir, sólo rechazaremos
su hipótesis cuando la proporción sea menor que este valor, es decir:
H0 : p ≥ 0 4
o simplemente H0 : p = 0 4 (lo que dice el investigador) frente a:
H1 : p < 0 4
(la proporción de abstención es menor)

Ası́ pues la región de aceptación es:

pq
p − zα ,∞
n
Y la de rechazo:
pq
−∞, p − zα
n
Para calcular el nivel zα = z0 01 , y por tanto z0 01 = 2 33. Ası́ pues, la región de aceptación es,
puesto que p = 0 4 , q = 0 6 y n = 200, resulta ser, aproximadamente:
(0 3192, ∞)
Y la región crı́tica:
(−∞, 0 3192)
Como en la muestra resulta que

125
p̂ = = 0 625
200
, los 125 que no votan de los 200 a los que se pregunta. Al 99 % de confianza entonces, resulta
que dicho valor en la muestra pertenece a la región de aceptación, es decir,aceptamos la hipótesis
nula y el investigador tiene razón, la abstención será, al menos del 40 %.

Matematicas Bachiller

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Matematicas Bachiller

Caricato da

Copyright:

Formati disponibili

Capı́tulo 1

1.1. Conceptos fundamentales

1. Población: Es el conjunto de elementos que estamos estudiando. Llamaremos tamaño de la

Los diferentes tipos de muestra vienen determinados por dos aspectos:

b) La posibilidad de repetición o no de los elementos.

El objetivo de la Combinatoria es calcular cuántos tipos de muestras de un determinado tamaño

Aplicando el principio anterior, en el primer lanzamiento obtenemos 2 resultados (Cara o cruz), en el

Figura 1.1: Diagrama de árbol

1.2. Muestras ordenadas

Por tanto, y aplicando el principio de multiplicación en total hay :

muestras de tamaño k ordenadas y sin repetición.

El producto de todos los números enteros desde el 1 hasta el n se denomina factorial de n y se

(−4) · (−3) · (−2) · (−1) · 0 · 1 = 0

1.2.3. Permutaciones con elementos repetidos

1.2.4. Muestras ordenadas con repetición

1.3. Muestras no ordenadas

Resumiendo, el número de muestras no ordenadas y sin repetición de tamaño k que se extraen de

son las maneras que habı́amos calculado en el ejemplo de la introducción.

Números combinatorios y factoriales en la calculadora

10.2. Introducción al concepto de derivada. Tasas de variación me-

10.3. Deﬁnición de derivada. Reglas de derivación. Interpretación

El problema que nos podemos encontrar es el siguiente.

f (−3 + h) − f (−3) 2(−3 + h)2 + 1 − (2(−3)2 + 1)

10.3.1. Propiedades de las derivadas. Reglas de derivación

2. Derivada de la suma (o diferencia de funciones):

(f ± g)(x) = f (x) ± g (x)

3. Derivada del producto de una función por una constante:

4. Derivada del producto de funciones:

(f · g) (x) = f (x) · g(x) + f (x) · g (x)

5. Derivada del cociente de funciones:

6. Derivada de la composición de funciones (Regla de la cadena):

(f ◦ g) (x) = f (g(x)) · g (x)

10.3.2. Derivadas elementales

1.- f (x) = xk , k ∈ R f (x) = k · xk−1

2.- f (x) = ex f (x) = ex

3.- f (x) = ax , a ∈ R+ f (x) = ax · ln a

6.- f (x) = sen x f (x) = cos x

7.- f (x) = cos x f (x) = −sen x

9.- f (x) = csc x f (x) = − cot x · csc x

10.- f (x) = sec x f (x) = tan x · sec x

f (x) = 2x2 + 1 =⇒ f (x) = 4x

y ahora, conocida la función derivada podemos calcular la derivada en cualquier punto: En x = 2,

10.3.3. Interpretación geométrica de la derivada

Figura 10.2: La pendiente de la recta tangente es f (a).

Figura 10.3: La pendiente de la recta tangente es m = tan α

Como a = −1, en primer lugar calculamos:

Para calcular f (−1), derivamos:

Con estos datos, la ecuación de la recta tangente es:

y − f (−1) = f (−1) · (x − (−1)) =⇒ y − 1 = 2(x + 1) =⇒ y = 2x + 3

Graﬁcamente la función y la recta tangente son:

Figura 10.4: Curva f (x) = e2x+2 y tangente en x = −1, y = 2x + 3.

10.4. Aplicaciones de las derivadas a la Fı́sica y la Economı́a

a(t) = v (t) = e (t)

e(6) = 108 − 6 + 1 = 103, e(2) = 12 − 2 + 1 = 11

10.4.2. Aplicación a la Economı́a

no es el valor que obtenı́amos con la derivada, pero es una buena aproximación.

10.5. Derivabilidad y continuidad

lı́m f (x) = lı́m f (x) = f (a)

f+ (a) = f− (a)

Ejemplo: Estudiar la continuidad y derivabilidad de la función:

Calculando los lı́mites laterales:

lı́m f (x) = lı́m −x = 0

Por tanto la función no es derivable en x = 0.