Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
COMBINATORIA
Previamente al estudio de la probabilidad en sı́, conviene dedicar algún tiempo al repaso de las
técnicas combinatorias.
Recordemos que la Combinatoria es la parte de las Matemáticas que se ocupa de la resolución de
problemas de elección y disposición de los elementos de cierto conjunto, de acuerdo con ciertas reglas.
Es decir, dentro de la Combinatoria es dónde tienen sentido preguntas del tipo:
1. ¿Cuántas quinielas distintas pueden hacerse?.
2. ¿Cuántas posibles combinaciones pueden darse en la loterı́a primitiva?.
3. ¿Qué posibilidades hay de que me toquen los cuatro ases en una mano de tute?.
4. ¿De cuántas formas se pueden sentar 5 personas en 5 asientos de un cine?.
Trataremos de dar respuesta a estas cuestiones y algunas más.
a) El orden, es decir, si es importante que los elementos de la muestra aparezcan ordenados o no.
Ejemplo: Veamos con qué tipo de poblaciones y muestras trabajamos en los ejemplos anteriores:
1. La población en este caso es {1,X,2}, que tiene tamaño 3 (no hay otras posibilidades en una
quiniela).
Una quiniela (teniendo en cuenta el ”pleno al 15”) es una muestra de tamaño 15 de la población
anterior (por ejemplo : 1XX121XXX212111).
Es evidente que el orden en esta muestra es importante (no es lo mismo una X en la segunda
casilla que en la quinta) y que se permiten elementos repetidos ( los unos , equis o doses se
pueden repetir).
Es por tanto una muestra ordenada y con repetición.
5
CAPÍTULO 1. COMBINATORIA 6
2. En este caso la población es mayor, pués son todos los números desde el 1 al 49, es decir
{1,2,3. . . .,49}.
Por tanto, y si nos olvidamos del complementario, una apuesta de loterı́a primitiva es una muestra
de tamaño 6 de dicha población (por ejemplo 3, 18, 40, 41, 43, 45 ).
Aquı́ el orden no influye y los elementos no se pueden repetir (no puede salir un número más de
una vez). Son muestras no ordenadas y sin repetición.
3. La población ahora está formada por las 40 cartas que componen una baraja española, es decir
{1 oros, 2 oros,. . . .,Rey bastos} , y para el caso de 4 jugadores, tenemos una muestra de 10
cartas, que evidentemente no se pueden repetir y además el orden no importa.
Muestras no ordenadas y sin repetición.
4. La población son las 5 personas a elegir, y la muestra tiene el mismo tamaño, 5, pues elegimos a
las 5 personas. Eso sı́, ahora el orden sı́ que es importante y además las personas no se pueden
repetir.
Son muestras ordenadas y sin repetición.
5. Un ejemplo de muestra no ordenada y con repetición podrı́a ser una mano de cartas pero teniendo
en cuenta que jugamos con 2 barajas idénticas mezcladas (80 cartas).
Si se reparten 10 a cada uno de 4 jugadores, tenemos una muestra de tamaño 10 en la que
es evidente que el orden no importa y que podemos tener cartas repetidas (por ejemplo, dos
caballos de oros).
Principio de multiplicación:
Si un procedimiento se puede separar en r etapas, de modo que el resultado de una de ellas no influye
en el resultado de las otras, y en cada una de estas etapas se obtienen respectivamente n1 , n2 , n3 , . . ., nr
resultados, entonces el procedimiento global conduce a n1 · n2 · n3 · . . . · nr resultados.
Ejemplo: ¿Cuántos resultados podemos obtener al lanzar una moneda tres veces?.
n · (n − 1) · . . . · (n − k + 1)
Ejemplos:
1. ¿De cuántas formas se pueden elegir 2 cartas, extraı́das sucesivamente y sin repetir, de una
baraja española?
La primera se puede elegir de 40 formas.
La segunda, al no poder repetir, sólo se puede elegir de 39 maneras.
Por tanto, en total hay 40·39 = 1560 posibilidades.
2. Seis ciclistas llegan al sprint en una prueba de la Olimpiadas, ¿De cuántas maneras se pueden
colocar los tres primeros puestos?.
Para el primer puesto hay 6 posibilidades.
Para el segundo, sólo 5 posibilidades.
Para el tercero, quedan 4 opciones.
Por tanto hay en total 6·5·4 = 120 maneras.
Las muestras ordenadas y sin repetición se denominan Variaciones sin repetición. Por tanto,
si el tamaño de la población es n y el de la muestra k, el número de variaciones sin repetición lo
expresaremos por:
Vnk = n · (n − 1) · . . . · (n − k + 1)
(notemos que k, tamaño de la muestra indica el número de factores que hay que multiplicar, por
ejemplo, en los ejemplos anteriores, en el primero las muestra eran de tamaño 2 y multiplicábamos 2
factores, y en el segundo eran muestras de tamaño tres y multiplicábamos tres factores).
Ejercicio: ¿Cuántos números de cuatro cifras no repetidas se pueden formar con las cifras del 1 al 9
(ambas inclusive)?
1.2.2. Permutaciones
En el caso particular de que se tome una muestra de tamaño igual al tamaño de la población, es
decir, k = n, las variaciones se denominan permutaciones y se obtendrı́a:
Vnn = n · (n − 1) · . . . · (n − n + 1) = n · (n − 1) · . . . · 1
CAPÍTULO 1. COMBINATORIA 8
, es decir, el 0 siempre aparecerı́a en un factorial de un entero negativo, y dicho factorial serı́a siempre
0. No tiene sentido, por tanto, calcular el factorial en este caso).
Por tanto este caso particular de variaciones sin repetición se denomina permutaciones sin repeti-
ción de n elementos y se expresa:
Pn = n!
Ejemplo: ¿De cuántas maneras se pueden sentar 5 personas en 5 asientos en un cine?.
La primera persona se puede sentar en 5 sitios.
La segunda sólo en 4, la tercera en 3, la cuarta en 2 y la quinta en 1.
De modo que hay 5·4·3·2·1 = 120 posibilidades, es decir, P5 = 5! = 120.
Ejercicio: ¿Cuántas palabras de 8 letras (con o sin sentido) se pueden formar con las letras A B C
D E F G H?.
1. ¿De cuántas maneras se pueden elegir 2 cartas (no necesariamente distintas de una baraja de 40
cartas?.
La primera se puede elegir de 40 maneras.
La segunda, al poder repetir, también se puede elegir de 40 maneras.
En total hay 40·40 = 1600 formas.
CAPÍTULO 1. COMBINATORIA 9
2. ¿De cuántas formas se puede entregar el Premios al primer clasificado, al segundo, al tercero, y
al cuarto entre 5 pelı́culas diferentes en un festival de cine?
El primer Premio se puede dar de 5 maneras, el segundo también, el tercero también y el cuarto
también.
Por tanto hay 54 = 625 posibilidades.
Las muestras ordenadas y con repetición se denominan Variaciones con repetición y lo expresare-
mos:
V Rkn = nk
Ejercicio: ¿Cuántos números de tres cifras (no necesariamente distintas) pueden formarse con los
dı́gitos 1,6,7,8,9?.
1, 2 1, 3 1, 4 1, 5
2, 1 2, 3 2, 4 2, 5
3, 1 3, 2 3, 4 3, 5
4, 1 4, 2 4, 3 4, 5
5, 1 5, 2 5, 3 5, 4
Ahora bien, como no nos importa el orden, para nosotros las parejas 2,1 y 1,2 que son 2, en realidad
sólo deberı́an contar como una, y lo mismo ocurre con el resto de parejas.
Estamos contando cada pareja 2 veces. Por tanto, para obtener el número de parejas que buscamos
tenemos que dividir entre 2. Ası́ resulta que el número de muestras no ordenadas y sin repetición que
20
tenemos es de: = 10 , sólo 10 posibilidades que son:
2
{1, 2}, {1, 3}, {1, 4}, {1, 5}, {2, 3}, {2, 4}, {2, 5}, {3, 4}, {3, 5}, {4, 5}
donde las llaves indican que el orden no importa.
Si sacásemos 3 bolas en lugar de 2, tendrı́amos los trı́os: 1,2,3 1,2,4 1,2,5 etc. . . en total 5·4·3 =
60 posibilidades (V53 = 5 · 4 · 3).
Razonando de igual manera al caso anterior, todos aquellos trı́os en los que estuviesen por ejemplo,
el 1, el 2 y el 3 estarı́an repetidos. Ahora bien, ¿cuántas veces se repite cada trı́o?. Veamos, tomando
como ejemplo los trı́os con 1,2 y 3 obtenemos: 1,2,3 1,3,2 2,1,3 2,3,1 3,1,2 3,2,1 6 posibilidades
(P3 = 3!) que en realidad representan lo mismo pues no nos importa el orden. Lo mismo ocurre con
cada trı́o, de modo que cada uno de ellos se repite 6 veces, ası́ pués si no tenemos en cuenta el orden,
60
el número de muestras no son 60 sino: = 10 maneras (no ordenadas y sin repetición).
6
Ejercicio: Escribir los 10 trı́os del ejemplo anterior.
Formalizando lo anterior, si la población es de tamaño n y se extraen muestras de tamaño k, si
fuesen ordenadas serı́an
Vnk = n · (n − 1) · . . . · (n − k + 1)
pero como son no ordenadas tenemos que dividir por el número de maneras de ordenar esas muestras
de tamaño k, es decir hay que dividir por
Pk = k!
CAPÍTULO 1. COMBINATORIA 10
Ejemplos:
1. ¿De cuántas maneras se pueden sacar 3 bolas numeradas en cualquier orden, de una bolsa que
contiene 5 bolas?.
Serı́an combinaciones de 5 elementos de los que sacamos 3, es decir, tenemos que calcular:
5 5!
C53 = = = 10
3 3! · 2!
2. ¿De cuántas formas se puede formar un grupo de trabajo de 6 alumnos de entre una clase de
27?.
En este caso son combinaciones (no importa el orden ) de 27 elementos de los que se escogen 6
, es decir:
6 27 27! 27!
C27 = = = = 296010
6 6! · (27 − 6)! 6! · 21!
(¡Compruébalo!).
Ejercicio: ¿De cuántas maneras se pueden extraer 6 bolas de un bombo que contiene 49 bolas?
(Loterı́a Primitiva)
Hay algunos tipos más de muestras, en concreto las muestras no ordenadas con repetición, pero
no se estudiarán en este momento.
Las calculadoras cientı́ficas poseen algunas teclas útiles para el cálculo de factoriales y números com-
binatorios.
Para el factorial, se utiliza la tecla !, que suele encontrarse sobre alguna otra tecla, por lo que al
utilizarla habrá que presionar antes la tecla SHIFT (o INV).
Dado que los factoriales crecen a una velocidad enorme, un calculadora normal sólo puede calcular
hasta el factorial de 69, y ya si pretendemos calcular 70!, se produce un mensaje de error.
Observemos que un número tan inofensivo como 13! ya tiene un valor de 6.227.020.800
CAPÍTULO 1. COMBINATORIA 11
Para el caso de los números combinatorios, algunas calculadoras poseen una función para calcu-
larlos. Suele estar situada sobre la tecla de la división (depende mucho del modelo de calculadora).
Dicha función es
nCr
n 5
y calcula el número combinatorio , de modo que si queremos calcular , basta con introducir
r 3
el 5, luego SHIFT (o INV) , posteriormente el 3 y luego presionar la tecla de = para obtener 10. (Ya
lo habı́amos calculado antes).
Evidentemente si alguna de estas funciones tiene una tecla propia en la calculadora, es decir, no
está encima de otra, no es necesario presionar la tecla SHIFT (o INV) para operar con ella.
Capı́tulo 10
DIFERENCIABILIDAD DE
FUNCIONES. OPTIMIZACIÓN
10.1. Introducción
Sin duda uno de los pilares básicos de las matemáticas lo constituye el cálculo diferencial (o cálculo
de derivadas). Las aplicaciones de las derivadas son múltiples y se dan en muchos y muy diversos
campos.
El cálculo diferencial tuvo su gérmen en los trabajos del ilustres matemáticos como I.Newton y
G.W. Leibnitz, quienes, independientemente uno del otro, llegaron a resultados similares en el siglo
XVII.
En este tema se añalizarán algunas de las principales aplicaciones de las derivadas de funciones,
que posibilitan el cálculo de extremos relativos, concavidad y puntos de inflexión, facilitan el trazado
de curvas y sirven de herramienta para la resolución de los llamados problemas de optimización, en
los cuales se trata de encontrar la solución óptima (máxima o mı́nima) a cierto problema.
Es evidente que la función es creciente a partir del punto de abscisa x = 2. Ahora bien, ¿siempre
crece de igual modo?.
168
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 169
Evidentemente no.
Tomemos un intervalo, por ejemplo el intervalo [3, 4].
¿Cuánto ha crecido la función en ese intervalo?. Como:
−3
f (3) = = −3
1
y
−4
f (4) = = −2
2
la función ha crecido en realidad:
f (4) − f (3) = 1
1 unidad.
Si nos fijamos en otro intervalo donde la función también sea creciente, el [4, 6], veamos como crece
la función.
Como f (4) = −2 y
−6 −3
f (6) = =
4 2
el crecimiento total es de
−3 1
f (6) − f (4) = − (−2) =
2 2
tan sólo media unidad, aunque el intervalo es dos veces mayor que el primero.
Podemos inferir entonces que la función es mucho más creciente, o que crece más rápidamente en
el intervalo [3, 4] que en el [4, 6].
La formalización de estas ideas la da la Tasa de Variación Media de una función.
Definición: Se llama Tasa de Variación Media en un intervalo [a, b] de una función f (x), y se expresa
por T V M [a, b], al cociente:
f (b) − f (a)
T V M [a, b] =
b−a
La T V M no es más que la diferencia entre los valores de la función en los extremos del intervalo
dividida entre la longitud del intervalo.
Por tanto, de esta primera definición podemos deducir algunas propiedades:
* Si la T V M en el intervalo es positiva, significa que la función crece, globalmente en el intervalo.
(Entiéndase globalmente en el sentido de que no es necesariamente creciente en todo el intervalo, pero
en definitiva hay un crecimiento de la función en dicho intervalo).
* Si la T V M en el intervalo es negativa, la función decrecerá.
* La magnitud del crecimiento o el decrecimiento dependerá de la magnitud de la T V M .
Ası́ pues la T V M nos da una idea de cómo crece o decrece la función y con qué rapidez lo hace.
Sin embargo, la T V M no resuelve todos los problemas, puesto que nos podemos plantear si la
función es creciente o no en un punto concreto, no en un intervalo.
La T V M y el concepto de lı́mite solucionan el problema:
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 170
Si queremos saber si la función tiene una tendencia creciente o decreciente en un punto a, utiliza-
remos el concepto de T V M como antes en un intervalo [a, a + h]:
f (a + h) − f (a) f (a + h) − f (a)
T V M [a, a + h] = =
a+h−a h
A medida que nos acercamos al punto a, es decir, a medida que h se acerca a 0, la tasa de variación
media en ese intervalo se acerca al dato buscado, la tasa de variación en ese punto concreto. Más
concretamente:
Definición: Se llama Tasa de Variación Instantánea en un punto a de una función f (x) al valor,
denotado por T V I(a):
f (a + h) − f (a)
T V I(a) = lı́m
h→0 h
x
Ejemplo: Calcular la tasa de variación instantánea de la función f (x) = en el punto 2.
x−1
Aplicando la definición:
2+h 2 2+h
f (2 + h) − f (2) − 2−1
2+h−1 −2
T V I(2) = lı́m = lı́m = lı́m 1+h =
h→0 h h→0 h h→0 h
2+h−2−2h −h
1+h −h −1
= lı́m = lı́m 1+h = lı́m = lı́m =1
h→0 h h→0 h h→0 h(h + 1) h→0 h + 1
Ejercicio: Calcula la Tasa de Variación Instantánea para las siguientes funciones en los puntos indi-
cados:
2x − 1
a) f (x) = en x = 0 y x = −1.
x+1
b) g(x) = √x3 − x + 3 en x = 1 y x = −2.
c) h(x) = x + 3 en x = 6 y x = −2.
Definición: Dada una función f (x) y un punto a, se llama derivada de la función f (x) en el punto
a, y se representa por f (a) a:
f (a + h) − f (a)
f (a) = lı́m
h→0 h
es decir la derivada en un punto es la tasa de variación instantánea en ese punto.
Ahora bien, si queremos calcular la derivada en el punto 2 de la misma función, tenemos que volver a
calcular ese lı́mite, lo cuál es un trabajo engorroso.
Conviene, por tanto calcular la función derivada de f (x), es decir f (x).
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 171
Esta función derivada permite calcular la derivada en cualquier punto sin más que sustituir en el
punto concreto. Por ello es conveniente dominar las llamadas reglas de derivación para las funciones
más habituales.
Por otra parte, es posible calcular las derivadas sucesivas de una función.
La derivada segunda será la derivada de la función derivada, y se representará por f (x), y ası́ su-
cesivamente las funciones derivadas tercera (f (x)), cuarta, etc.
f (x) = k =⇒ f (x) = 0
donde k ∈ R.
(k · f ) (x) = k · f (x)
donde k ∈ R.
1 1
4.- f (x) = logax, a ∈ R+ f (x) = ·
x ln a
1
5.- f (x) = ln x f (x) =
x
1
8.- f (x) = tan x f (x) = 1 + tan2 x = sec2 x =
cos2 x
−1
11.- f (x) = cot x f (x) = = − csc2 x
sen 2 x
1
12.- f (x) = arc sen x f (x) = √
1 − x2
−1
13.- f (x) = arc cos x f (x) = √
1 − x2
1
14.- f (x) = arctan x f (x) =
1 + x2
√ 1
15.- f (x) = x f (x) = √
2· x
√ 1
16.- f (x) = n
x f (x) = √
n
n · xn−1
Con todas estas propiedades es mucho más fácil derivar, por ejemplo, para la función y el punto
anterior, calculamos la función derivada:
f (2) = 4 · 2 = 8
En x = −3,
f (−3) = 4 · (−3) = −12
Es mucho más cómodo y no tenemos que recurrir a la definición.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 173
f (a + h) − f (a)
T V M [a, a + h] =
h
este cociente corresponde a la pendiente (o inclinación) de la recta que une los puntos (a, f (a)) y
(a + h, f (a + h)):
f (a + h) − f (a)
Figura 10.1: La pendiente de la recta secante es .
h
Por tanto cuando nos acercamos al punto a, es decir, cuando calculamos el valor de la tasa de
variación instantánea o derivada en el punto a, dicho valor es precisamente la pendiente de la recta
tangente en el punto a, es decir, aquella recta que sólo corta (en las cercanı́as del punto) a la función
f (x) en el punto a.
Recordemos que la pendiente de una recta es, en cierta forma, la inclinación de la recta.
Si α es al ángulo que forma la recta con el eje x y m es la pendiente de la recta, se cumple que:
m = tan α
Ası́, si f (x) es la función y queremos calcular la tangente en el punto (a, f (a)), sabemos que la
pendiente de la recta tangente es m = f (a), y utilizando la ecuación de la recta en la forma punto-
pendiente, sabemos que la ecuación de dicha recta tangente es:
y − f (a) = f (a) · (x − a)
Ejemplo: Calcula la ecuación de la recta tangente a la curva f (x) = e2x+2 en el punto −1.
f (−1) = e−2+2 = e0 = 1
f (−1) = 2 · e−2+2 = 2 · e0 = 2
Ejemplo: El espacio recorrido por un móvil viene dado por la función e(t) = 3t2 − t + 1.
a) Calcular la tasa de variación en el intervalo [2, 6].
b) Hallar la velocidad en el instante t = 0.
c) Hallar la velocidad y aceleración en el instante t = 2.
a) Aplicando la fórmula:
luego:
e(6) − e(2) 103 − 11 92
T V M [2, 6] = = = = 23 m/s
6−2 4 4
b) La velocidad será:
v(t) = e (t) = 6t − 1 =⇒ v(0) = −1 m/s
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 176
c) En el instante 2:
v(2) = 11 m/s
Y la aceleración en ese mismo instante;
a(t) = v (t) = 6
Por tanto,
a(2) = 6 m/s2
la aceleración es constante, es un movimiento uniformemente acelerado.
c(3) = 30 + 150 − 9 = 171, c(2) = 30 + 100 − 4 = 126 =⇒ c(3) − c(2) = 171 − 126 = 45
Ejercicios:
1. El desplazamiento de un móvil que se mueve a lo largo de una linea recta viene dado por la
2
función e(t) = et − 1.
Halla la velocidad y la aceleración del movimiento. En el instante inicial, ¿cuáles son éstas?.
2. Las funciones de ingresos y gastos correspondientes a cierto producto de consumo son, respecti-
vamente:
I(x) = 80x − 0 1x2 , C(x) = 500 + 20x
. Halla la función beneficio y el beneficio marginal. ¿Para qué valores de x están definidas estas
funciones?.
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 177
La condición para que una función sea derivable es más fuerte, más restrictiva. Para ello es necesario
definir las derivadas laterales.
Definición: Dado un punto a y una función f (x), se define la derivada lateral por la derecha de la
función f (x) y se expresa por f+ (a), como:
f (a + h) − f (a)
f+ (a) = lı́m
h→0+ h
Dado un punto a y una función f (x), se define la derivada lateral por la izquierda de la función f (x)
y se expresa porpor f− (a), como:
f (a + h) − f (a)
f− (a) = lı́m
h→0− h
Definición: Diremos que una función es derivable en un punto a cuando existen y son finitas las
derivadas laterales y son iguales, es decir:
Además f (0) = 0, por tanto la función es continua en el punto x = 0 que es el único punto conflictivo.
Analicemos la derivabilidad en x = 0:
f (0 + h) − f (0) −h − 0 −h
f− (0) = lı́m = lı́m = lı́m = lı́m −1 = −1
h→0− h h→0 h h→0 h h→0
f (0 + h) − f (0) h−0 h
f+ (0) = lı́m = lı́m = lı́m = lı́m 1 = 1
h→0+ h h→0 h h→0 h h→0
La función es continua pues se puede dibujar sin levantar el lápiz del papel, pero no es derivable
en el cero porque en dicho punto hay un punto anguloso, una “esquina”. En puntos como estos, la
función no es derivable.
Por tanto, se verifica que aunque una función puede ser continua en un punto y sin embargo no
ser derivable en ese mismo punto.
Sin embargo, la posibilidad contraria no es posible. Resumiendo:
Propiedad:
Si una función es derivable en un punto, entonces es continua en dicho punto.
Sin embargo, el recı́proco no es cierto, si una función es continua en un punto, la función puede ser o
no derivable en dicho punto.
Ejercicios:
Figura 10.5: La pendiente de las tangentes (la derivada) es positiva si la función crece.
Si trazamos las correspondientes tangentes en diversos puntos, todos ellos donde la función es
creciente, obsevamos como la recta tangente está cada vez menos inclinada, lo que quiere decir (ya
que la inclinación de una recta se mide a través de su pendientes y sabemos que esta coincide con la
derivada ) que la derivada es cada vez menor.
Más aún, como las rectas tangentes tienen inclinación positiva (son rectas crecientes), las pendientes
son cada vez menores y positivas, es decir, la derivada es positiva en aquellos intervalos en los que la
función es creciente.
Si seguimos trazando tangentes, llegamos al punto 3, donde la tangente es totalmente horizontal,
es decir:
Figura 10.6: La pendiente de las tangentes (la derivada) es nula si la función tiene un extremo (un
valor máximo o mı́nimo).
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 180
Decı́amos que la pendiente era decreciente, hasta que llega al máximo de la función, donde se ha
alcanzado el valor extremo de la pendiente. La recta es horizontal, no está inclinada y su pendiente es
cero.
Si seguimos trazando las tangentes, vemos ahora lo siguiente:
Figura 10.7: La pendiente de las tangentes (la derivada) es negativa si la función decrece.
Y ahora observamos que la pendiente de la recta (la derivada) es negativa, y cada vez menor, por
tanto si la función de decreciente, afirmamos que la función derivada es negativa.
Todo lo observado anteriormente lo podemos resumir en la siguiente propiedad.
La manera práctica de proceder, por tanto, para determinar los extremos de una función, ası́ como
aquellos intervalos en los que la función crece o decrece es la siguiente:
* Calculamos la derivada de la función, f (x), y la igualamos a cero, resolvemos la ecuación resul-
tante, cuyas soluciones son los posibles extremos de la función.
* Realizamos una tabla en la que tenemos que poner los puntos obtenidos anteriormente y además
los puntos conflictivos de la función (aquellos donde la función no está definida, o donde no es deriva-
ble....). Todos estos puntos se denominan puntos crı́ticos.
* En dicha tabla, estudiamos el signo de la derivada primera, f (x).
Si dicha derivada es positiva, nos indicará el crecimiento de la función, y si es negativa, será un signo
de su decrecimiento. El paso de un intervalo creciente a otro decreciente o viceversa nos indicará la
existencia de un máximo o un mı́nimo relativo de la función f (x).
Ejemplo: Estudiar los intervalos de crecimiento y los extremos de la función: f (x) = x3 − 3x.
obtenemos dos puntos crı́ticos, y no hay más pues la función es polinómica y por tanto, su dominio
son todos los números reales y no presenta problemas. Hacemos una tabla como la siguiente:
−∞ −1 1 +∞
f (x) + − +
f (x)
Para obtener los signos de f (x) basta tomar, por ejemplo, un punto en cada intervalo y sustituir en
la expresión de la derivada.
Entre −∞ y −1 tomamos el −2, con lo que:
f (−2) = 12 − 3 = 9 > 0
f (0) = −3 < 0
f (2) = 12 − 3 = 9 > 0
positivo.
2x2 − 3x
f (x) =
ex
Derivando:
(4x − 3)ex − ex (2x2 − 3x) ex (−2x2 + 7x − 3) −2x2 + 7x − 3
f (x) = = =
(ex )2 (ex )2 ex
E igualando a cero:
−2x2 + 7x − 3 1
x
= 0 =⇒ −2x2 + 7x − 3 = 0 =⇒ x = 3, x =
e 2
No hay más puntos conflictivos, pues aunque hay denominador, nunca se hace cero, pues ex , la función
exponencial es siempre positiva, de modo que Dom f (x) = R.
Ası́ pues los únicos puntos crı́ticos son x = 3, x = 12 .
Hacemos la tabla:
1
−∞ 32 +∞
f (x) − + −
f (x)
1 1
Con lo que f (x) es creciente en , 3 , decreciente en −∞, ∪ (3, ∞).
2 2
Por tanto f (x) presenta un máximo relativo en:
9
(3, f (3)) = 3, 3 ≈ (3, 045)
e
y un mı́nimo relativo en
1 1 1 −1
,f = , ≈ (0 5, −061)
2 2 2 e 12
Gráficamente:
2x2 − 3x
Figura 10.9: Gráfica de f (x) = . Intervalos de crecimiento y extremos.
ex
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 183
Figura 10.10: La pendiente de las tangentes pasa de positiva a negativa (es decir, decrece) si la función
es cóncava hacia abajo
Al trazar las tangentes, nos fijamos en que cada vez son menores.
Empiezan siendo positivas y muy grandes, van decreciendo hasta que valen cero, y luego comienzan
a ser negativas y cada vez menores. Es decir, que la función derivada es decreciente, f (x) decreciente.
Si f (x) es decreciente, es que su derivada es negativa, es decir, f (x) < 0.
Por tanto se deduce que si la derivada segunda de la función es negativa, la función es cóncava
hacia abajo.
De igual modo si nos fijamos en una función cóncava (o cóncava hacia arriba):
Figura 10.11: La pendiente de las tangentes pasa de negativa a positiva (es decir, crece) si la función
es cóncava hacia arriba
CAPÍTULO 10. DIFERENCIABILIDAD DE FUNCIONES. OPTIMIZACIÓN 184
En este caso la derivada es creciente, y por tanto la derivada segunda será positiva. Es decir, si la
derivada segunda es positiva, la función es cóncava hacia arriba.
f (x) = x3 − 3x
Ası́ pues la función es cóncava hacia arriba en (0, ∞) y cóncava hacia abajo en (−∞, 0).
Hay un punto de inflexión es (0, f (0)) = (0, 0).
Se observa gráficamente:
Además la derivada segunda permite discernir si un punto crı́tico es un máximo o un mı́nimo, en base
al siguiente resultado:
Propiedad: Si a es un punto tal que f (a) = 0 (un posible extremo relativo), entonces:
* Si f (a) > 0, entonces a es un mı́nimo de la función.
* Si f (a) < 0, entonces a es un máximo de la función.
* Si f (a) = 0 no podemos asegurar nada. (Aunque en realidad si se puede saber pero excede los
contenidos del curso).
f (x) = x3 − 3x
1. Dominio de definición.
3. Simetrı́as.
Par si f (−x) = f (x).
Impar si f (−x) = −f (x).
No tiene simetrı́a si no se da ninguna de esas condiciones.
3. Simetrı́as
3(−x) − 1 −3x − 1 3x − 1
f (−x) = 2
= 2
= 2 = f (x)
3(−x) + 1 3x + 1 3x + 1
f no es par.
3(−x) − 1 −3x − 1 3x − 1
f (−x) = = = − 2 = −f (x)
3(−x)2 + 1 3x2 + 1 3x + 1
f no es impar, luego f no tiene simetrı́as.
4. Ası́ntotas
Verticales: No tiene puesto que Dom f (x) = R.
Horizontales:
3x − 1
lı́m=0
3x2 + 1
x→∞
3x − 1 3(−x) − 1 −3x − 1
lı́m = lı́m = lı́m =0
x→−∞ 3x2 + 1 x→∞ 3(−x)2 + 1 x→∞ 3x2 + 1
5. Crecimiento
Derivando:
Con los datos que tenemos, podemos hacer un esbozo de la gráfica de la función:
3x − 1
Figura 10.13: Gráfica de f (x) = .
3x2 + 1
Igualando a cero,
72
4x − 72 = 0 =⇒ x = = 18
4
Además calculando la derivada segunda:
f (x) = 4
con lo que sustituyendo:
f (18) = 4 > 0
es positivo luego el punto x = 18 es un mı́nimo.
La solución es, por tanto, un número x = 18 y el otro y = 36 − 18 = 18.
Los dos números son iguales a 18.
Ejercicios:
1. Descompón el número 48 en dos sumandos tales que el quı́ntuplo del cuadrado del primero más
el séxtuplo del cuadrado del segundo sea mı́nimo.
2. Halla un número positivo cuya suma con 4 veces su recı́proco sea mı́nima.
3. Halla las dimensiones del rectángulo de área máxima inscrito en una circunferencia de 20 cm de
radio.
4. La suma de tres números es 60. El primero más el doble del segundo más el triple del tercero
suman 120. Halla los números que verifican estas condiciones y cuyo producto es máximo.
5. Un depósito abierto de chapa y de base cuadrada debe tener capacidad para 13500 litros. ¿Cuáles
han de ser sus dimensiones para que se precise la menor cantidad de chapa?
6. Una ventana normanda consiste en un rectángulo coronado con un semicı́rculo. Encontrar las
dimensiones de la ventana de área máxima si su perı́metro es 10 metros.
7. Una hoja de papel debe contener 18 cm2 de texto impreso. Los márgenes superior e inferior
deben tener 2 cm cada uno y los laterales 1 cm. Calcular las dimensiones de la hoja para que el
gasto de papel sea mı́nimo.
Capı́tulo 11
INTEGRACIÓN. CÁLCULO DE
ÁREAS
11.1. Introducción
Si el problema del cálculo de la recta tangente llevó a los matemáticos del siglo XVII al desarrollo de
las técnicas de la derivación, otro problema, el del cálculo del área encerrada por una curva, propició el
desrrollo de las técnicas de integración.
Se trataba, por ejemplo, de hallar el área encerrada bajo la curva f (x) entre los puntos a y b:
193
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 194
F (x) = x2
F (x) = x2 + C
Una función F (x) como la que hemos encontrado se llama primitiva de f (x), y hemos visto que si una
función tiene una primitiva, entonces tiene infinitas.
Definición: Dada una función f (x), se llama primitiva de f (x) a otra función F (x) tal que:
F (x) = f (x)
Se denomina integral indefinida de f (x) al conjunto de todas las primitivas (hay infinitas) de f (x), y
se representa por:
f (x) dx = F (x) + C, C ∈ R
Ası́, el problema de calcular una primitiva de una función es inverso al de calcular una derivada; como
son operaciones inversas la suma y la resta, el producto y el cociente, la potenciación y la radicación.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 195
xn+1
2. − xn dx = + C, C ∈ R, , n ∈ R, n = −1
n+1
1
3. − x−1 dx = dx = ln x + C, C∈R
x
ax
4. − ax dx = + C, C∈R
ln a
5. − ex dx = ex + C, C∈R
6. − sen x dx = − cos x + C, C∈R
7. − cos x dx = sen x + C, C∈R
1
8. − dx = arctan x, C∈R
1 + x2
1
9. − √ dx = arc sen x + C, C∈R
1 − x2
−1
10. − √ dx = arc cos x + C, C ∈ R
1 − x2
Estas primitivas permiten calcular algunas integrales sencillas.
Además es conveniente la utilización de las dos propiedades siguientes:
1.
k · f (x) dx = k · f (x) dx, k∈R
Esta propiedad indica que si hay un número multiplicando a toda la integral, entonces se puede
sacar fuera de la integral.
2.
(f (x) ± g(x)) dx = f (x) dx ± g(x) dx
Lo que indica esta propiedad es que si tenemos una suma (o resta) de dos funciones, entonces
podemos separar la integral en la suma (o resta) de dos integrales.
Utilizando estas propiedades de manera combinada, se calculan las primeras integrales sencillas.
Veamos algunos ejemplos:
Para la primera integral , expresamos la raı́z en forma de potencia y utlizamos la integral inmediata
2: 1 3 3 √ √
√ 1 x 2 +1 x2 2x 2 2 x3 2x x
x dx = x dx = 1
2 = 3 = = = + C, C ∈ R
2 +1 2
3 3 3
En la segunda, separamos las sucesivas sumas y restas y sacamos los números fuera de las integrales,
aplicando las propiedades de la integral para luego aplicar la integral inmediata 2 de nuevo:
4 3 2 4 3 2
(15x + 10x − 12x − 8x + 5) dx = 15x dx + 10x dx − 12x dx − 8x dx + 5 dx =
4 3 2 15x5 10x4 12x3 8x2
= 15 x dx + 10 x dx − 12 x dx − 8 x dx + 5 dx = + − − + 5x =
5 4 3 2
5x4
= 3x5 + − 4x3 − 4x2 + 5x + C, C ∈ R
2
Por último, volvemos a separar las integrales y los números y aplicamos la tabla de integrales inme-
diatas:
2 x 2
+ e − 3 cos x dx = dx + ex dx − 3 cos x dx =
x x
1
=2 dx + ex dx − 3 cos x dx = 2 ln x + ex − 3 · sen x + C, C ∈ R
x
pues es inmediata.
Sin embargo otra integral tan parecida y de aspecto simple como:
sen (2x + 6) dx
t = 2x + 6
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 197
Ahora bien, se nos plantea otro problema. En la integral aparece el término dx (léase diferencial de x).
Lo lógico es que si la integral tiene una nueva variable t, en vez de aparecer diferencial de x, aparezca
diferencial de t, para no mezclar las variables.
Aunque pueda parecer una forma un poco artificial, daremos aquı́ la forma para calcular dt.
Simplemente se deriva en la expresión del cambio de variable:
Derivando t = 2x + 6, se obtiene, 1 · dt = 2 · dx, es decir que:
dt
dx =
2
Una vez calculado esto, ya podemos calcular la integral:
dt 1 1
sen (2x + 6) dx = sen t · = sen t · dt = (− cos t) =
cambio 2 2 2
−1
= cos (2x + 6) + C, C ∈ R
deshacer el cambio 2
El método del cambio de variable permite resolver de manera simple integrales que de otro modo no
se podrı́an abordar.
Ejemplo:
3 −5
e2x x2 dx
Razonando como antes, se observa que la parte problemática de la integral está en el exponente de
dicha integral.
Hacemos entonces el cambio:
t = 2x3 − 5
y calculando el diferencial:
dt = 6x2 dx
de donde despejamos la parte que aparece en la integral:
dt
x2 dx =
6
y por tanto la integral queda reducida a:
3 dt 1 1 1 2x3 −5
e2x −5 x2 dx = et = et dt = et = e + C, C ∈ R
cambio 6 6 6 deshacer el cambio 6
Ejemplo:
(6x2 + 15x + 3)178 (12x + 15) dx
Ejercicios: Calcula mediante integración por cambio de variable las siguientes integrales:
3x2 − 2x 3 2 2
a) dx Cambio:t = x − x + 3 b) cos (x + 1) 2x dx c) 5sen (3x + 1) dx
x3 − x2 + 3
2x + 1 5 1
d) cos dx e) ex+2 dx f ) (x − 4) 7 dx g) dx
3 1+x
1 + cos x x2 1
h) dx i) xe dx j) dx
x + sen x (x + 2)3
f (x) = x3 − 2x + 5
Calculamos en primer lugar todas las primitivas de f (x), es decir la integral indefinida:
x4 x2 x4
x3 − 2x + 5 dx = − 2 + 5x = − x2 + 5x + C, C ∈ R
4 2 4
De todas estas primitivas, la única que cumple que pasa por el (1, 3), es aquella tal que:
14
− 12 + 5 · 1 + C = 3
4
es decir
1 17 −5
− 1 + 5 + C = 3 =⇒ + C = 3 =⇒ C =
4 4 4
y por tanto la primitiva buscada es:
x4 5
F (x) = − x2 + 5x −
4 4
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 199
Una aproximación para calcular el área consiste en dividir el intervalo en otros más pequeños y
calcular el área de los rectángulos que se forman bien al tomar el valor de la función en un extremo
del intervalo, bien en otro entremo, es decir:
Figura 11.1: Aproximación del área mediante rectángulos más pequeños que la función
En este caso, hemos dividido el intervalo mayor en 4 subintevalos más pequeños y hemos tomado
como altura de los rectángulos el valor de la función en el extremo superior del intervalo.
Ası́ la suma de las áreas de los rectángulos son más pequeñas que el área buscada.
Área suma rectángulos< Área de la función
Esta suma, en la que la suma de las áreas de los rectángulos es menor que el área total se denomina
suma inferior de la función en el intervalo.
Pero podrı́amos haber tomado estos otros rectángulos:
Figura 11.2: Aproximación del área mediante rectángulos más grandes que la función
Ahora la suma del área de los rectángulos es mayor que el área total, es decir:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 200
Esta suma, en la que la suma de las áreas de los rectángulos es mayor que el área total se denomina
suma superior de la función en el intervalo.
Por tanto, el área buscada está entre la suma superior y la suma inferior de la función:
Además, obervemos lo que ocurre cuando los subintervalos que tomamos son cada vez menores:
Vemos que las sumas inferiores son cada vez mayores y cada vez más cercanas al área buscada, a
medida que los intervalos son más pequeños.
Por contra, las sumas superiores son cada vez más pequeñas y también cada vez más cercanas al
área buscada, a medida que los intervalos son más pequeños.
A medida que los subintervalos son menores, las sumas superiores e inferiores se acercan al área
buscada. Para llegar a calcular dicha área, necesitamos calcular una suma infinita (la de los infinitos
rectángulos a medida que estos son más pequeños), cosa que en matemáticas se denomina sumar una
serie.
Esto excede con mucho los contenidos del curso. Lo que se necesita saber es que tanto las sumas
superiores como las sumas inferiores convergen (se acercan) al área buscada, y dicha suma se representa,
si la función es f (x) y el intervalo es [a, b], por la integral:
b
f (x) dx
a
Ahora bien, el siguiente problema es cómo se calcula esta integral, pues en las integrales indefinidas
no habı́amos incluido ningún intervalo.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 201
2.
b b b
(f (x) ± g(x)) dx = f (x) dx ± g(x) dx
a a a
La integral definida, puesto que representa, si la función es positiva, el área que encierra la función
con el eje x, tiene algunas propiedades tales como:
1. Si c es un punto que está dentro del intervalo [a, b], entonces:
b c b
f (x) dx = f (x) dx + f (x) dx
a a c
En otras palabras, el área de la función desde a hasta b es la suma de las áreas de la función
desde a hasta c y desde c hasta b, si la función es positiva.
Pero sin duda la propiedad más importante, y que permite calcular integrales definidas es la llamada
Regla de Barrow.
Regla de Barrow: Si f (x) es una función que tiene primitiva F (x), y queremos calcular su integral
definida en un intervalo [a, b], se cumple que:
b
f (x) dx = F (x)]x=b
x=a = F (b) − F (a)
a
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 202
Ejercicio: Utilizando la regla de Barrow, calcula el valor de las siguientes integrales definidas:
3 4 4 1
3 2 2 4 2
a) (2x −4x +5x−2) dx b) (3x+1) dx c) (2x −3x −7) dx d) (x+1)(x−2) dx
1 −1 2 −2
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 203
2. La función se siempre negativa dentro del intervalo: En este caso el área viene dada por:
b
Área = f (x) dx
a
Geométricamente:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 204
3. Si la función es a veces positiva y a veces negativa en el intervalo, se calculan los puntos de corte
y se calculan las integrales sucesivas, utilizando los apartados anteriores:
En la figura, serı́a: b
c d
Área = f (x) dx + f (x) dx + f (x) dx
a c d
En cualquier caso, y cuando calculemos áreas, siempre es conveniente comenzar por calcular los puntos
de corte de la función con el eje x para saber si es positiva o negativa y calcular las integrales
correspondientes, o bien utilizar siempre el valor absoluto para asegurarnos de que el resultado es
positivo.
f (1) = 13 − 7 · 12 + 10 · 1 = 1 − 7 + 10 = 4
como 4 es positivo, significa que la función es positiva en ese intervalo, luego el área será:
2 x=2
3 x42 x3 x2
Área = x − 7x + 10x dx = − 7 + 10 =
0 4 3 2 x=0
4 4
2 23 22 0 03 02 56 16 2
= − 7 + 10 − − 7 + 10 = 4− + 20 = u
4 3 2 4 3 2 3 3
En el otro intervalo, entre el 2 y el 5, tomamos otro valor para saber si la función es positiva o negativa:
f (3) = 33 − 7 · 32 + 10 · 3 = 27 − 63 + 30 = −6
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 205
Observa lo importante que es diferenciar los dos intervalos, pues si simplemente hubiésemos calcu-
lado, sin más: 5
x3 − 7x2 + 10x dx
0
sin separar, el resultado serı́a: 5
x3 − 7x2 + 10x dx = −10 42
0
(Compruébala) que no es el área buscada, sino la diferencia entre las áreas.
Desde luego, si es posible, es mejor hacer un dibujo para saber como va la gráfica y determinar el
área a calcular.
Ejercicio: Calcula las áreas encerradas por el eje x y las funciones siguientes:
a) f (x) = x − x3
b) g(x) = −x2 + 9
c) h(x) = x2 − 2x − 3 entre x=1 y x=5.
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 206
Si las curvas son f (x) y g(x) se cumple que el área limitada por las dos curvas en el intervalo [a, b]
es: b
(f (x) − g(x)) dx
a
siempre que f (x) esté por encima de g(x) en el intervalo [a, b].
Si las curvas se cortan en el intervalo, se subdivide el intervalo en otros menores, en cada uno de los
cuales se aplican la integral anterior, determinando qué curva está por encima, y se suma el resultado.
En todo caso siempre es necesario hallar los puntos de corte entre las curvas, que se calculan
igualando las expresiones algebraicas de ambas funciones:
f (x) = g(x)
f (x) = g(x) =⇒ x2 − 1 = 4x − 4 =⇒ x2 − 4x + 3 = 0 =⇒ x = 1, x = 3
f (2) = 22 − 1 = 3 g(2) = 8 − 4 = 4
Como el valor de g(x) es mayor, significa que g(x) está por encima de f (x) en el intervalo, de modo
que el valor del área será el dado por la integral definida:
3 3 3
2
Área = (g(x) − f (x)) dx = (4x − 4 − (x − 1)) dx = 4x − 3 − x2 dx =
1 1 1
x=3
x3 1 4 2
2
= 2x − 3x − = (18 − 9 − 9) − 2 − 3 − = u ≈ 1 33 u2
3 x=1 3 3
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 207
Si se hace un dibujo, lo cuál es sencillo porque se trata de una recta y una parábola:
Ejemplo: El ritmo de crecimiento de la población de palomas en una ciudad viene dado por la función:
f (x) = 2x − 0 5x2
a) Como conocemos la función de crecimiento, la función que da el número total de palomas será una
primitiva de ésta:
1
F (x) = f (x) dx = 2x − 0 5x2 dx = x2 − x3 + C, C ∈ R
6
Para determinar C, sabemos que la población de palomas ahora mismo es de 2500, es decir:
F (0) = 2 5
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 208
luego sustituyendo:
1 3
02 − · 0 + C = 2 5 =⇒ C = 2 5
6
La población de palomas sigue una función:
1
F (x) = x2 − x3 + 2 5
6
b) El segundo semestre, x va desde 0 5 hasta 1, y el aumento de palomas será:
20 131 29
F (1) − F (0 5) = − = = 0 604
6 48 49
es decir, 604 palomas (recuerda que la función viene dada en miles de palomas).
c) Calculamos los máximos y mimimos de F (x).
Como:
F (x) = f (x)
resulta que igualamos f (x) = 0, y queda:
F (x) = 2 − x
luego:
F (0) = 2
x = 0 es un mı́nimo y:
F (4) = −2
x = 4 es un máximo, luego a lo sumo, la población de palomas se dará a los 4 años a partir de ahora,
es decir:
1 64
F (4) = 42 − 43 + 2 5 = 16 − + 2 5 = 7 833
6 6
aproximadamente 7833 palomas.
La gráfica de F(x) es:
CAPÍTULO 11. INTEGRACIÓN. CÁLCULO DE ÁREAS 209
Ejercicios:
√
1. Supongamos que dentro de x meses la población de tu ciudad crecerá a razón de 5+4 x personas
por mes.
Si la población actual es de 7500 personas.
a) ¿Cuál será la población dentro de un año?
b) ¿En cuántos habitantes aumentará durante el segundo año?
c) ¿Llegará a algún máximo su número de habitantes?.
2. Halla la función de beneficio de una empresa, B(x), sabiendo que los costes e ingresos marginales
, c(x) e i(x), vienen dados respectivamente por las funciones:
LÍMITES Y CONTINUIDAD DE
FUNCIONES
9.1. Introducción
El concepto de lı́mite en Matemáticas tiene el sentido de “lugar” hacia el que se dirige una función
en un determinado punto o en el infinito.
Veamos un ejemplo: Consideremos la función dada por la gráfica de la figura y fijémonos en el
punto x = 2 situado en el eje de abscisas:
¿Qué ocurre cuando nos acercamos al punto 2 moviéndonos sobre el eje x? Tomemos algunos
valores como 2’1, 2’01, 2’001.
Vemos en la figura que en este caso las imágenes de dichos puntos sobre la curva, f(2’1), f(2’01),
f(2’001) se acercan a su vez a un valor situado en el eje y, el valor y = 3.
Si nos acercamos a 2 por la otra parte, es decir, con valores como 1’9, 1’99, 1’999 en este caso las
imágenes f(1’9), f(1’99), f(1’999) se acercan también al mismo valor, y = 3.
Concluimos que el lı́mite de la función f(x) cuando nos acercamos a x = 2 es 3, lo cuál expresamos
como:
lı́m f (x) = 3
x→2
Intuitivamente, por tanto, podemos decir que el lı́mite de una función en un punto es el valor en el
eje Oy al que se acerca la función, f (x), cuando la x se acerca, en el eje Ox a dicho punto.
145
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 146
Definición: Dada una función f (x) y un punto x = a, se dice que el lı́mite de f (x) cuando x se acerca
a a es L, y se expresa como:
lı́m f (x) = L
x→a
cuando:
Dado > 0, existe δ > 0 tal que siempre que |x − a| < δ, entonces |f (x) − L| <
Lo que viene a expresar esta formulación matemática es que si x está “suficientemente cerca” de
a, entonces su imagen f(x) también está muy próxima a L.
En la práctica en muchas ocasiones es necesario calcular los llamados lı́mites laterales, que como
recordaremos se definen de la siguiente forma:
Definición:
Se define el lı́mite lateral por la derecha de a de la función f (x), y se expresa como:
lı́m f (x)
x→a+
al lı́mite al que se acerca f (x) cuando x se acerca a a y toma valores mayores que a.
De igual modo, el lı́mite lateral por la izquierda de a de la función f (x) se expresa como:
lı́m f (x)
x→a−
y se define como el lı́mite al que se acerca f (x) cuando x se acerca a a y toma valores menores que a.
Propiedad: Para que una función f (x) tenga lı́mite en x = a es necesario y suficiente que existan
ambos lı́mites laterales y coincidan, es decir:
1. Lı́mites infinitos en un punto finito: En la situación del dibujo, se dice que el lı́mite cuando x
se acerca por la derecha de a es +∞, pués a medida que la x se acerca a a, la función se hace
cada vez mayor:
lı́m f (x) = +∞
x→a+
(de igual forma se puede definir cuando nos acercamos por la izquierda. Intenta hacer el dibujo).
De igual modo se define el lı́mite −∞ cuando nos acercamos a a (por la derecha o por la
izquierda).(Dibuja el que falta)
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 148
Puede ocurrir que uno de los lı́mites laterales sea finito y otro infinito, o cualquier combinación
entre ellos, por ejemplo:
2. Lı́mites finitos en el infinito: Se dice que una función tiene lı́mite b cuando x tiende a +∞
cuando la función se acerca a b cuando la x se hace cada vez mayor, es decir:
lı́m f (x) = b
x→∞
Gráficamente:
3. Lı́mites infinitos en el infinito: Aparece este caso cuando si x tiende a +∞ la función se hace
cada vez mayor o menor (lo mismo si x tiende a −∞).
Un ejemplo gráfico de este tipo de lı́mites serı́a:
En este caso:
lı́m f (x) = −∞
x→∞
(Intenta dibujar otros casos diferentes).
Ejemplos: a)
x3 − 5x2 + 6 ∞
lı́m = = −∞
x→∞ −x2 + 4 ∞
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 150
porque el grado del numerador es mayor, pero los respectivos coeficientes de mayor grado tienen
signo diferente.
b)
x2 − 5 ∞
lı́m = =0
x→∞ x6 − x4 − 3x2 + 4 ∞
porque el grado del denominador es mayor.
c)
7x3 + 2x − 6 ∞ 7
lı́m = =−
x→∞ −3x3 + 6 ∞ 3
porque los grados son iguales.
Nota: La resolución de lı́mites cuando x tiende a −∞ se reduce a estos casos, puesto que:
es decir:
x3 − 5x2 + 4 (−x)3 − 5(−x)2 + 4 −x3 − 5x2 + 4 ∞
lı́m = lı́m = lı́m = =∞
x→−∞ −x2 + 5x x→∞ −(−x)2 + 5(−x) x→∞ −x2 − 5x ∞
La misma regla anterior sirve en el caso de que aparezcan raı́ces, siempre que tengan sentido los
lı́mites:
d) √
3+ x3 − 5x ∞
lı́m = =0
x→∞ x2 + 4 ∞
3
puesto que el grado del denominador es 2 y en el numerador la mayor potencia de x es , que
2
es menor que 2.
e) √
−x + 1 + x3
lı́m =
x→∞ 1 + x + 3x3
puesto que aunque los grados de numerador y denominador son iguales, cuando x tiende a +∞
(es positivo y muy grande) resulta que −x + 1 es negativo y como es bien conocido, la raı́z
cuadrada de un número negativo no existe en el cuerpo de los números reales, por tanto el lı́mite
anterior no tiene sentido.
f)
√ √ ∞ 1
−x + 1 + x3 −(−x) + 1 + (−x)3 x + 1 − x3
lı́m = lı́m = lı́m = =
x→−∞ 1 + x + 3x3 x→∞ 1 + (−x) + 3(−x)3 x→∞ 1 − x − 3x3 ∞ 3
pues en este caso la raı́z si tiene sentido y los grados son iguales, quedando el lı́mite el cociente
de los coeficientes de los monomios de mayor grado.
En caso de que aparezca una raı́z, el proceso es multiplicar y dividir por el conjugado de la
expresión radical:
√
√
√ (2x − 1) − x + 1 · (2x − 1) + x + 1
lı́m (2x − 1) − x + 1 = (∞ − ∞) = lı́m √ =
x→∞ x→∞ (2x − 1) + x + 1
√
(2x − 1)2 − ( x + 1)2 4x2 − 4x + 1 − x − 1
= lı́m √ = lı́m √ =
x→∞ (2x − 1) + x + 1 x→∞ (2x − 1) + x + 1
4x2 − 5x ∞
= lı́m √ = = +∞
x→∞ (2x − 1) + x + 1 ∞
2x2 − 3x + 1 2 · 9 − 3 · (−3) + 1
lı́m = = −28
x→−3 x+2 −3 + 2
El problema que nos podemos encontrar en este caso es que el denominador se haga 0 al sustituir x
por el valor que corresponda.
Nos podemos encontrar, por tanto, varios tipos de indeterminación.
k
1. Indeterminación , (k = 0): Se presenta cuando en el numerador aparece un número cualquiera
0
no nulo y el denominador es 0.
En este caso el lı́mite el siempre ∞, pero para determinar su signo, se calculan los lı́mites
laterales:
a)
1 − 2x 1 − 2 · 1 0001 −1
lı́m = = − = +∞
1 − 2x 1−2 −1 x→1+ 1 − x2 1 − (1 0001)2 0
lı́m = = =
x→1 1 − x2 1−1 0
1 − 2x 1 − 2 · 0 9999 −1
lı́m = = + = −∞
x→1− 1−x 2 1 − (0 9999)2 0
b)
−7 −7 −7
lı́m = = + = −∞
−7 −7 x→0+ x 0 0001 0
lı́m = =
x→0 x 0
−7 −7 −7
lı́m = = − = +∞
x→0− x −0 0001 0
c)
−2 −2 −2
lı́m = = + = −∞
x→−1+ (x + 1) 2
(−0 9999 + 1) 2 0
−2 −2
lı́m 2
= =
x→−1 (x + 1) 0
−2 −2 −2
lı́m = = + = −∞
x→−1− (x + 1) 2
(−1 0001 + 1) 2 0
0
2. Indeterminación : En este caso tanto numerador como denominador se hacen 0.
0
Si tanto en el numerador como en el denominador tenemos polinomios, la forma de resolver la
indeterminación es descomponer los polinomios en factores (mediante, por ejemplo, la regla de
Ruffini) y simplificar para posteriormente volver a sustituir.
x2 − 5x + 6 4 − 10 + 6 0 (x − 2)(x − 3) (x − 3) −1
lı́m = = = lı́m = lı́m =
x→2 x2 − 4 4−4 0 x→2 (x − 2)(x + 2) x→2 (x − 2) 4
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 152
En caso de que también aparezcan raı́ces cuadradas, el proceso es multiplicar y dividir por la
expresión radical conjugada con el fin de simplificar y luego sustituir:
√ √ √
x+4−1 0 ( x + 4 − 1) · ( x + 4 + 1)
lı́m 2 = = lı́m √ =
x→−3 x + 2x − 3 0 x→−3 (x2 + 2x − 3) · ( x + 4 + 1)
√
( x + 4)2 − 12 x+3
= lı́m √ = lı́m √ =
x→−3 (x2 + 2x − 3) · ( x + 4 + 1) x→−3 (x2 + 2x − 3) · ( x + 4 + 1)
(x + 3) 1 1 −1
= lı́m √ = lı́m √ = =
x→−3 (x + 3) · (x − 1) · ( x + 4 + 1) x→−3 (x − 1) · ( x + 4 + 1) (−4) · (1 + 1) 8
o bien
lı́m (f (x))g(x)
x→∞
1. La base tiende a un número cualquiera no nulo y el exponente a otro número. En este caso el
lı́mite es el número que resulta de realizar la operación correspondiente:
1
lı́m (x + 1)2x−3 = 2−1 =
x→1 2
2. La base tiende a un número positivo mayor que 1 y el exponente a +∞. En este caso el lı́mite
es también +∞.
2x + 1 2x−3
lı́m = 2∞ = +∞
x→∞ 1+x
3. La base tiene a un número no nulo comprendido entre -1 y 1 y el exponente a +∞. En este caso
el lı́mite es 0. ∞
1 + x 2x−3 1
lı́m = =0
x→∞ 2x + 1 2
4. La base tiende a un número negativo menor o igual que -1 y el exponente a +∞. En este caso
el lı́mite no existe, pues los productos son alternativamente de signo contrario:
2x−3
−3x + 1
lı́m = (−3)∞ =
x→∞ 1+x
O bien realizando los pasos para resolver tales lı́mites que recordamos:
2x+3 2x+3
1+x x 3
∞ 1+x x
lı́m = (1) = (1 )
0 = lı́m 1 + −1 =
x→0 2x + 1 se suma y se resta 1 a la base x→0 2x + 1 se hace la resta
2x+3 2x+3
1 + x − 2x − 1 x −x x
= lı́m 1 + = lı́m 1 + =
x→0 2x + 1 x→0 2x + 1 se baja el numerador dividiendo al denominador
9.4. Ası́ntotas
Una primera aplicación del cálculo de lı́mites consiste en el cálculo de las ası́ntotas de una función.
Hay tres tipos de ası́ntotas:
Verticales, Horizontales y Oblicuas (aunque de hecho las ası́ntotas horizontales son un caso par-
ticular de éstas).
o bien
lı́m f (x) = ±∞
x→k−
Las posibles ası́ntotas verticales de una función se encuentran entre los puntos que no están en el
dominio de la función, aquellos que anulan el dominador en las funciones racionales, etc...
Para determinar si un punto constituye una ası́ntota vertical de la función, se tiene que cumplir
que alguno de los lı́mites laterales de la función en el punto sea ±∞.
En tal caso, se dirá que la función posee una ası́ntota vertical en dicho punto por el lado en el cuál
dicho lı́mite sea ±∞.
Como ambos lı́mites laterales son infinitos, existe una ası́ntota vertical de la función en x = 1, y es
más, conociendo el valor de los lı́mites podemos asegurar que en las cercanı́as de la ası́ntota la función
se comportará como en el dibujo:
1 √
b) En cuanto a esta función,g(x) = √ , notemos que el denominador se anula cuando x = 0 =⇒
x
x = 0, es decir la posible ası́ntota vertical estará en x = 0. Analizando obtenemos:
1 1 1
lı́m √ = √ = + = +∞
1 x→0 x 0 0001 0
+
1
lı́m √ = =
x→0 x 0 1 1
lı́m √ = √ =
x→0 − x −0 0001
puesto que no hay raı́ces cuadradas de números negativos.
De modo que hay una ası́ntota vertical en x = 0 pero sólo por la derecha, es decir, la gráfica será:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 155
o bien
lı́m f (x) = k
x→−∞
x2 + 1 1
f (x) = g(x) = √
x+1 x
x2 + 1
lı́m = +∞
x→∞ x + 1
x2 + 1 (−x)2 + 1 x2 + 1
lı́m = lı́m = lı́m = −∞
x→−∞ x + 1 x→∞ (−x) + 1 x→∞ −x + 1
1
lı́m √ = 0
x→∞ x
1
lı́m √ =
x→−∞ x
De modo que g(x) posee una ası́ntota horizontal en y = 0 cuando x tiende a ∞. De forma gráfica:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 156
x2
Ejemplo: Estudiar las ası́ntotas oblicuas de f (x) = .
x+1
Calculemos m y n:
x2
f (x) x+1 x2
m = lı́m = lı́m = lı́m =1
x→∞ x x→∞ x x→∞ x2 + x
2
x2 x
n = lı́m (f (x) − m · x) = lı́m − 1 · x = lı́m −x =
x→∞ x→∞ x + 1 x→∞ x + 1
2
x − x2 − x −x
lı́m = lı́m = −1
x→∞ x+1 x→∞ x + 1
Por tanto f (x) tiene una ası́ntota oblicua en y = x − 1 cuando x tiende a +∞.
Se puede comprobar que cuando x tiende a −∞, f (x) tiene esta misma ası́ntota. (Inténtalo).
Gráficamente se obtiene:
Ejercicios:
1. Calcula las ası́ntotas de las funciones:
x x2 x2 − 4
f (x) = 2
g(x) = h(x) =
x −1 x+2 x2 + 4
1
2. Estudia las ası́ntotas de la función:f (x) = e x−2 .
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 157
9.5. Continuidad
La idea intuitiva de función continua en un punto es bien sencilla.
Una función continua en un punto es aquella que no “da saltos”, aquella que se puede dibujar sin
levantar el lápiz del papel.
Matemáticamente la definición de función continua es un poco más compleja. Dice ası́:
Dado > 0, existe δ > 0 tal que siempre que |x − a| < δ, entonces |f (x) − f (a)| <
Dicho de otra forma, si nos acercamos al punto a, entonces las imágenes se acercan a la imagen de a,
f (a).
Si f (x) no es continua en x = a se dice que f (x) es discontinua en a o que tiene una discontinuidad
en x = a.
Propiedad: Para que una función sea continua en un punto a es necesario y suficiente que:
a) Exista el valor de la función en el punto, f (a).
b) Existan los lı́mites laterales,
lı́m f (x)
x→a+
y
lı́m f (x)
x→a−
Esta última propiedad proporciona una forma muy sencilla de saber si una función es continua o no
en un punto.
Como los lı́mites laterales existen pero son diferentes, concluimos que f (x) es discontinua en x = 2.
Continuidad en x = 0:
f (0) =
quedarı́a un cero en el denominador.
Con esto ya sabemos que la función no puede ser continua en x = 0. De todos modos calculamos
los lı́mites laterales.
Observemos que cuando nos acercamos a 0, da igual por la derecha que por la izquierda, estamos
siempre en la parte inferior de la función, luego:
1 1
lı́m f (x) = lı́m = − = −∞
x→0− x→0− x 0
Por otra parte:
1 1
lı́m f (x) = lı́m = + = +∞
x→0+ x→0+ x 0
Y f (x) también es discontinua en x = 0.
Por tanto f (x) es continua en todos los números reales salvo en x = 0 y x = 2.
1. Existe f (a) y los lı́mites laterales, que son iguales y finitos, pero distintos del valor de f (a). Una
discontinuidad de este tipo se denomina discontinuidad evitable. Gráficamente:
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 159
Observamos que los lı́mites por la derecha y por la izquierda valen 1, ambos, mientras que
f (0) = 0. Hay una discontinuidad evitable en x = 0.
2. Existe f (a) y los lı́mites laterales existen y son finitos, aunque distintos. Estamos ante una
discontinuidad de salto finito. Gráficamente:
−1
En este caso el lı́mite por la derecha es 1, el izquierdo es 0 y f (0) = , hay una discontinuidad
2
evitable en x = 0.
3. Existe f (a) y alguno de los lı́mites laterales es infinito. En este caso hay una discontinuidad de
salto infinito. Gráficamente:
Ahora f (0) = 1, el lı́mite por la izquierda vale 1 también y el lı́mite lateral por la derecha vale
+∞. Discontinuidad de salto infinito en x = 0.
CAPÍTULO 9. LÍMITES Y CONTINUIDAD DE FUNCIONES 160
4. No existe f (a) o alguno de los lı́mites laterales. Se trata de una discontinuidad esencial. De forma
gráfica:
Los lı́mites laterales, ambos, son +∞, pero f (0) no existe. Hay una discontinuidad esencial en
x = 0.
Capı́tulo 6
MATRICES Y DETERMINANTES
6.1. Introducción
Las matrices y los determinantes son herramientas del álgebra que facilitan el ordenamiento de
datos, ası́ como su manejo.
Los conceptos de matriz y todos los relacionados fueron desarrollados básicamente en el siglo XIX
por matemáticos como los ingleses J.J. Sylvester y Arthur Cayley y el irlandés William Hamilton.
Las matrices se encuentran en aquellos ámbitos en los que se trabaja con datos regularmente
ordenados y aparecen en situaciones propias de las Ciencias Sociales , Económicas y Biológicas.
Columnas de la matriz A
Abreviadamente se puede expresar A = (aij ). Cada elemento de la matriz lleva dos subı́ndices. El
primero de ellos “i”, indica la fila en la que se encuentra el elemento, y el segundo, “j”, la columna.
Ası́ el elemento a23 está en la fila 2 y columna 3. Las matrices siempre se representarán con letras
mayúsculas.
Ejemplos: Son ejemplos de matrices los siguientes:
√ 3 1 0
2 1 6 −4 0 2 −4 0
A= B= C = −1 1
√
3 4 1 2 1 5 2
1 0 0
82
CAPÍTULO 6. MATRICES Y DETERMINANTES 83
Si una matriz es a la vez triangular superior e inferior, sólo tiene elementos en la diagonal principal.
Una matriz de este tipo se denomina matriz diagonal.
Un ejemplo de matriz diagonal serı́a:
1 0 0 0
0 −45 0 0
G= 0
0 3 0
0 0 0 0
Por último, si una matriz diagonal tiene en su diagonal principal sólo unos, se denomina matriz unidad
o identidad. Se suelen representar por In , donde n es el orden o tamaño de la matriz. Algunas matrices
identidad son:
1 0 0 0
1 0 0
1 0 0 1 0 0
I2 = I3 = 0 1 0 I4 =
0 0 1 0
0 1
0 0 1
0 0 0 1
Color N Color F
2 unid. 700000 50000
5 unid. 600000 40000
10 unid. 500000 500000
Resumir la información anterior en 2 matrices A y B, de tamaño respectivo 2x3 y 3x2 que recojan las
ventas en un año (A) y los precios (B).
Nos piden que organicemos la información anterior en dos matrices de tamaño concreto. Si nos fijamos
en las tablas, es sencillo obtener las matrices:
N F
2 ud 5 ud 10 ud
0 04 0 03 2 ud
700000 600000 500000 N
A= B = 0 08 0 05 5 ud
50000 40000 500000 F
0 12 0 08 10 ud
Estas matrices se denominan matrices de información, y simplemente recogen los datos numéricos del
problema en cuestión.
Otras matrices son las llamadas matrices de relación, que indican si ciertos elementos están o no
relacionados entre sı́. En general, la existencia de relación se expresa con un 1 en la matriz y la ausencia
de dicha relación de expresa con un 0.
Estas matrices se utilizan cuando queremos trasladar la información dada por un grafo y expresarla
numéricamente.
CAPÍTULO 6. MATRICES Y DETERMINANTES 85
Relacionadas con los grafos se pueden definir algunas matrices. Entre todas ellas, nosotros nos
fijaremos en la llamada matriz de adyacencia, que es aquella formada por ceros y unos exclusivamente,
de tal forma que:
* un 1 en el lugar (i,j) expresa la posibilidad de ir desde el punto de la fila i hasta el punto de la
columna j mediante una linea que los una directamente.
* un 0 en el lugar (i,j) expresa la imposibilidad de ir del primer punto al segundo mediante una
linea que los una directamente.
A B C D
A 0 1 0 1
B0 0 1 0
C 1 0 0 0
D 0 0 0 0
Ejercicio
1) Escribe las correspondientes matrices de adyacencia de los grafos:
A B C D
A B C
A 0 1 1 1
A 0 1 0
B0 0 0 1
B 1 0 1
C 1 0 0 0
C 0 0 0
D 0 1 1 0
CAPÍTULO 6. MATRICES Y DETERMINANTES 86
Si las matrices tienen diferente tamaño, no se pueden sumar o restar entre sı́.
Ejercicios:
X Y Z X Y Z
A 11 6 7 0 5 A 13 3
7 1
A2000 = B 14 5 10 1 2 A2001 = B 15 7 11 1 3 2
C 20 9 3 2 2 3 C 21 0 2 4 3
Calcula y expresa en forma de matriz el total de exportaciones para el conjunto de los dos años.
¿Cuántos millones ha exportado el paı́s B al Z en total?
Calcula el incremento de las exportaciones del año 2000 al 2001 con los datos del ejemplo anterior.
2. Calcula x, y, z en la suma:
x − y −1 2 y 0 z −1 −1 3
1 y −x + −z 2 3 = 0 4 4
0 z 2 −2 3 x −2 4 1
Ejercicios:
1 1 −1 0
1. Si A = yB= , halla una matriz X que verifique la ecuación:
0 1 0 2
2·X −4·A = B
7 1
Propiedades:
a) (At )t = A, es decir, la traspuesta de la traspuesta es la matriz inicial.
b) (A + B)t = At + B t
c) (k · A)t = k · At
En base a esta nueva operación, podemos definir otras dos clases de matrices, que son:
Matriz simétrica, que es aquella para la que se cumple que At = A, por ejemplo la matriz:
2 1 3
A= 1 0 −2
√
3 −2 7
CAPÍTULO 6. MATRICES Y DETERMINANTES 88
es simétrica (compruébalo).
En una matriz simétrica, los elementos son simétricos respecto a la diagonal principal.
Ejercicio: ¿Puede ser simétrica una matriz que no sea cuadrada?¿Por qué?.
Ejercicios:
1 3 3 1 1 2
1. Dadas las matrices A = 1 4 3 y B = 2 0 −1 calcula 3At − B t .
1 3 4 −6 −1 0
2. Obtener las matrices X e Y que verifiquen los sistemas:
1 5
2 1
3 1
2X − 3Y = X + Y = 2X + Y =
a) 4 2
b) 3 0 c) 0 −2
−1 0
6 2
1 0
X − Y = X − Y = X + 2Y =
3 6 0 1 −2 4
“Para multiplicar dos matrices A y B, en este orden, A·B , es condición indispensable que el número
de columnas de A sea igual al número de filas de B”
Si no se cumple esta condición, el producto A·B no puede realizarse, de modo que esta es una
condición que debemos comprobar previamente a la propia multiplicación.
Una vez comprobado que el producto A·B se puede realizar, si A es una matriz m x n y B es una
matriz n x p (observemos que el nº de columnas de A = n = nº de filas de B), entonces el producto
A·B da como resultado una matriz C de tamaño n x p del siguiente modo:
“El elemento que se encuentra en la fila i y la columna j de la matriz C=A·B, se obtiene multiplicando
los elementos de la fila i de A por la columna j de B y sumando los resultados”
filas y 3 columnas:
0 −4 1
−3 2 1 4 1 −2 1
· =
2 5 3 −2 2 0 2
2x4 3 2 1 2x3
4x3
Sólo nos falta completar los elementos de la matriz producto. Para ello, seguimos la regla anterior:
El elemento de la fila 1 y columna 1 de A·B proviene de multiplicar elemento a elemento la fila 1
de A por la columna 1 de B y sumar, es decir:
(−3) · 0 + 2 · 1 + 1 · 2 + 4 · 3 = 0 + 2 + 2 + 12 = 16
(−3) · 1 + 2 · 1 + 1 · 2 + 4 · 1 = −3 + 2 + 2 + 4 = 5
Ejercicios:
Además, calcula A2 y A3 .
calcula:
A + B, 3A − 4B, A · B, A · D, B · C, C · D, At · C, Dt · At , B t · A, Dt · D, D · Dt
CAPÍTULO 6. MATRICES Y DETERMINANTES 90
A · (B + C) = A · B + A · C
(B + C) · A = B · A + C · A
c) Elemento neutro, la matriz identidad correpondiente, si A es m x n:
A · In = A
Im · A = A
d) En general el producto de matrices no es conmutativo
A · B = B · A
Pueden verse ejemplos en los ejercicios anteriores. Esta es una propiedad muy importante.
e) El producto de dos matrices no nulas A y B puede dar lugar a una matriz nula:
5
2 1 3 0
· 2 =
0 2 1 0
2x3
−4 2x1
3x1
Se dice que el conjunto de las matrices con la operación producto tiene divisores de cero, es decir, hay
matrices no nulas cuyo producto es nulo.
Ejercicios:
1. Si A y B son dos matrices cuadradas del mismo orden, ¿son ciertas las propiedades siguientes,
que son ciertas para las operaciones con números reales?:
a) (A + B)2 = A2 + B 2 + 2 · A · B
b) (A − B)2 = A2 + B 2 − 2 · A · B
c) (A + B) · (A − B) = A2 − B 2
2 −1
2. Determina los valores de a y b de la matriz A = para que A2 = A.
a b
1 2
3. ¿Qué matrices conmutan con la matriz ?.
0 1
Si tenemos un número real, por ejemplo el 2, podemos interesarnos en buscar el inverso del 2 para
el producto, es decir un número real x tal que 2·x = 1, el producto de 2 por x sea igual al elemento
neutro, el 1.
Evidentemente, en el caso de los números reales es bien fácil despejar x para obtener, en nuestro
1
caso, que x = , es decir, el inverso de un número real es otro número que multiplicado por él da el
2
elemento neutro, el 1.
Todo número real, salvo el 0, tiene inverso.
Trasladando esto a las matrices, nos podemos plantear si dada una matriz cuadrada A de orden n,
cualquiera, existe su inversa X para el producto de matrices,tal que
A · X = In
es decir, el producto de A por su inversa produce el elemento neutro matricial, la matriz identidad In .
Sin embargo, hay algunas diferencias con respecto al caso de los números reales:
In
1) No podemos “despejar” la matriz X del modo X = , porque no hemos definido la división de
A
matrices.
2) No todas las matrices cuadradas no nulas tienen matriz “inversa” (sea lo que sea, por analogı́a
con los números).
Definamos, en primer lugar, el término de matriz inversa:
Dada una matriz cuadrada de orden n , A, se dice que A es invertible (o que posee inversa o que es
no singular o que es regular ), si existe otra matriz del mismo orden, denominada matriz inversa de A
y representada por A−1 y tal que:
A · A−1 = In
y
A−1 · A = In
Si A no tiene inversa, se dice que es singular o no invertible.
Si una matriz tiene inversa, dicha matriz inversa es única (sólo hay una). Para calcular dicha matriz
inversa, podemos utilizar dos vı́as:
Se puede comprobar que también se cumple que A−1 · A = I2 , luego A es invertible, tiene inversa. Si
el sistema no tiene solución, la matriz no
tiene inversa.
1 1
Por ejemplo, en el caso en que A = , del mismo modo :
2 2
−1 1 1 x y 1 0 x+z y+t 1 0
A·A = I2 =⇒ · = =⇒ =
2 2 z t 0 1 2x + 2z 2y + 2t 0 1
x+z = 1
y+t = 0
2x + 2z = 0
2y + 2t = 1
Y por ejemplo de 2x+2z=0 se obtiene x = -z, si se sustituye en la primera ecuación es -z+z=1, es
decir 0 = 1 (imposible). El sistema no tiene solución.
Por tanto A no es invertible, es singular.
Este método directo sólo se suele utilizar para matrices cuadradas de tamaño 2, puesto que para
las de tamaño 3 obtenemos un sistemas de ¡9 ecuaciones con 9 incógnitas! que realmente es difı́cil de
resolver.
ii) Se hace la matriz triangular superior (es decir, hacemos ceros por debajo de la diagonal principal)
usando transformaciones elementales en filas.
La mejor forma de realizar esto es hacer cero los elementos por debajo de la diagonal en la primera
columna usando la fila 1. Luego, hacer cero los elementos por debajo de la diagonal en la segunda
columna usando la fila 2, y ası́ sucesivamente.
En nuestro caso, basta sumar la fila 2 con la fila 1, y se obtiene:
1 2 1 0 F2 +F1 1 2 1 0
(A|I2 ) = −−−−→
−1 1 0 1 0 3 1 1
iii) Una vez hecha la matriz triangular superior, se hace la matriz triangular inferior, haciendo
ceros a los elementos por encima de la diagonal. El proceso es parecido al anterior:
CAPÍTULO 6. MATRICES Y DETERMINANTES 93
Hacer cero los elementos por encima de la diagonal en la última columna usando la última fila. Lue-
go, hacer cero los elementos por encima de la diagonal en la penúltima columna usando la penúmtima
fila, y ası́ sucesivamente. En nuestro caso:
1 2 1 0 3·F1 −2·F2 3 0 1 −2
−−−−−−→
0 3 1 1 0 3 1 1
iv) Ya tenemos una matriz diagonal. Lo único que falta es dividir a cada fila entre el número
adecuado para obtener unos en la diagonal principal, es decir, para obtener la matriz identidad en la
parte izquierda:
F1 F2
3 0 1 −2 3
, 3 1 0 13 −23
−
− −−→
0 3 1 1 0 1 31 13
v) Una vez se tiene la matriz identidad en la parte de la izquierda, la parte derecha es la matriz inversa,
es decir, llegamos a:
1 −2
1 0 13 −2 1 1 −2
(I2 , A−1 ) = 3 =⇒ A−1
= 3 3 = ·
0 1 31 13 1
3
1
3 3 1 1
matriz que habı́amos obtenido antes por el método directo.
Si al realizar el método de Gauss-Jordan en algún momento alguna fila es de ceros, la matriz no
tiene inversa.
Cuanto mayor sea el orden de la matriz, mejor es este método frente al directo.
Veamos otro ejemplo:
1 1 0
Calcular la inversa de la matriz B = −1 1 2 por el método de Gauss-Jordan.
1 0 1
Siguiendo los pasos anteriores:
1 1 0 1 0 0 1 1 0 1 0 0 1 1 0 1 0 0
F +F F −F
(B|I3 ) = −1 1 2 0 1 0 −−2−−→ 1
0 2 2 1 1 0 −−3−−→ 1
0 2 2 1 1 0
1 0 1 0 0 1 1 0 1 0 0 1 0 −1 1 −1 0 1
1 1 0 1 0 0 1 1 0 1 0 0
2·F +F2 2·F2 −F3 4·F −F2
−−−3−−→ 0 2 2 1 1 0 − −−−−→ 0 4 0 3 1 −2 −−−1−−→
0 0 4 −1 1 2 0 0 4 −1 1 2
4 0 0 1 −1 2 F1 F2 F3
, ,
1 0 0 14 −14
2
4
4·F −F2
−−−1−−→ 0 4 0 3 1 −2 −− 4
−−4
−−4→ 0 1 0 43 1 −2
= (I3 |B −1 )
4 4
0 0 4 −1 1 2 0 0 1 −1 14 2
1 −1 1 4 4
4 4 2
=⇒ B −1 = 3
4
1
4
−1
2
−1 1 1
4 4 2
También se puede expresar, sacando factor común:
1 −1 2
1
B −1 = · 3 1 −2
4
−1 1 2
es la inversa de B.
1 1
Si calculamos por este método la inversa de A = resulta:
2 2
1 1 1 0 F2 −2·F1 1 1 1 0
(A|I2 ) = −−−−−→
2 2 0 1 0 0 −2 1
Como aparece una fila de ceros, la matriz A no tiene inversa.
Ejercicios:
CAPÍTULO 6. MATRICES Y DETERMINANTES 94
1 ≤ Rg(A) ≤ min{m, n}
Aplicando Gauss,
1 1 2 F2 −3·F11 1 2
A= −−−−−→
3 3 k 0 0 k−6
Ahora es evidente que si k-6=0, la última fila es nula. Por tanto, si k=6, la última fila es nula y el
rango de A es 1, Rg(A)=1, mientras que si k-6 es distinto de cero, es decir si k es distinto de 6, hay 2
filas no nulas y el rango de A es 2, Rg(A)=2. Resumiendo:
Si k = 6, entonces Rg(A)=2
Si k=6, entonces Rg(A)=1
La siguiente propiedad permite relacionar el concepto de rango con el de matriz inversa visto
anteriormente:
Propiedad:
Una matriz cuadrada A tiene inversa ⇐⇒ Rg(A) es máximo.
Ejercicios:
1 −2 1
1. Calcula el rango de A según los valores de k: A = 1 1 3.¿Para qué valores de k tiene A
5 −1 k
inversa?.
6.8. Determinantes
Introduciremos a continuación el concepto de determinante asociado a una matriz cuadrada. Este
concepto permite simplificar operaciones matriciales tales como el cálculo del rango o de la matriz
inversa.
Definición:
Si es una matriz 2 x 2 se define el determinante de la matriz A, y se expresa como det(A) o bien
|A|, como el número:
a11 a12
det(A) = |A| = = a11 · a22 − a12 · a21
a21 a22
Ejemplos: El cálculo de los determinantes de orden 2 es bien sencillo, por ejemplo:
CAPÍTULO 6. MATRICES Y DETERMINANTES 96
1 3
a) =1·4-(-1)·3=4+3=7.
−1 4
−2 −3
b) =-10+6=-4.
2 5
Para definir determinantes de matrices de orden mayor que 2 es necesario introducir previamente
algunos conceptos.
Dada una matriz cuadrada A de orden n, definimos el menor complementario de un elemento de
A,aij , como el determinante de la matriz que se obtiene al suprimir la fila i y la columna j en la que
se encuentra dicho elemento aij . Se representa por Mij .
−2 4 5
Ejemplo: En la matriz A = 6 7 −3 , los menores complementarios de cada uno de los
3 0 2
elementos de la primera fila son:
7 −3
Menor complementario de -2:M11 = =14-0=14.
0 2
6 −3
Menor complementario de 4:M12 = =12+9=21.
3 2
6 7
Menor complementario de 5:M13 = =0-21=-21.
3 0
Y ası́ sucesivamente.
En general puede saberse si el signo del menor complementario y del adjunto coinciden o no utilizando
una sencilla regla gráfica, por ejemplo, para matrices 3 x 3 y 4 x 4 basta fijarse en las matrices:
+ − + −
+ − + − + − +
− + −
+ − + −
+ − +
− + − +
donde el + significa que el adjunto coincide con el menor complementario y el - indica que tienen signo
contrario.
Definición: Dada una matriz cuadrada A de tamaño n se define su determinante como la suma
CAPÍTULO 6. MATRICES Y DETERMINANTES 97
del producto de los elementos de una linea cualquiera de la matriz (fila o columna) elegida, por sus
correpondientes adjuntos.
Se puede demostrar, aunque dicha demostración excede los contenidos del curso, que el valor del
determinante no depende de la fila o columna elegida para calcularlo.
−2 4 5
Ejemplo: Para la matriz A = 6 7 −3 ,aplicando la definición, si elegimos la fila tercera queda:
3 0 2
4 5 −2 5 −2 4
det(A) = 3 ·
+ 0 · −
+2· =
7 −3 6 −3 6 7
= 3 · (−12 − 35) + 0 · (−(6 − 30)) + 2 · (−14 − 24) = −141 + 0 − 76 = −217
6 −3 −2 5 −2 5
det(A) = 4 · − +7·
3 2 + 0 · − 6 −3 =
3 2
= 4 · (−(12 + 9)) + 7 · (−4 − 15) + 0 · (−(6 − 30)) = −84 − 133 + 0 = −217
Ejercicio: Calcula, desarrollando por la fila que tú elijas los determinantes de las matrices:
1 8 1 3 4 −6 7 8 0 0 3 1
1 7 0 2 −1 1 0 −7 3 −2 0 2
1 6 −1 5 3 −5 1 0 1 3 4 0
1 1 1 0 1 2 3 4 1 0 −1 2
1 1 0 1 2 1 3 1 2 3 2 −2
1 0 1 1 3 1 4 3 2 4 2 1
0 1 1 1 3 4 1 2 3 1 5 −3
Gráficamente:
3. Si permutamos dos lineas paralelas de una matriz cuadrada, su determinante cambia de signo,
por ejemplo:
0 1 2 −3 0 1 2 −3
1 3 2 −5 1 3 2 −5
2 4 1
= 91 =⇒ = −91
3 3 −2 −8 1
3 −2 −8 1 2 4 3 1
4. Si multiplicamos todos los elementos de una linea de un determinante por un número, el deter-
minante queda multiplicado por ese número. Por ejemplo:
0 1 2 −3 0 1 2 −3
1 3 2 −5 2 6 4 −10
= 91 =⇒ = 182
2 4 3
1 1
2 4 3
3 −2 −8 1 3 −2 −8 1
0 2 4 −6
2 6 4 −10
pero = 16 · 91 = 1456
4 8 6 2
6 −4 −16 2
5. Si a una linea de una matriz se le suma otra linea multiplicada por un número, el determinante
no cambia.
Esta propiedad permite utilizar un método más sencillo para calcular determinantes de orden
mayor que 3.
|A| = |At|
Una estrategia a tener en cuenta en este caso de determinantes de orden 4 o superior, o incluso de
orden 3 si la matriz es compleja, es el método de “hacer ceros”, puesto que el valor del determinante
no varı́a al realizar a la matriz ciertas transformaciones elementales en filas,como indica la propiedad
5 anterior, si bien hemos de ser cuidadosos al aplicar dicha propiedad.
Ası́ pues la mejor forma de calcular un determinante es hacer ceros en una fila o columna y
desarrollar por dicha fila o columna, porque entonces sólo tendremos que calcular un adjunto. Por
ejemplo, si calculamos:
0 1 2 −3 0 1 2 −3 0 1 2 −3
1 3 2 −5 F3 −2·F2 1 3 2 −5 F4 −3·F2 1 3 2 −5
= =
2 4 =
3 1 0 −2 −1 11 0 −2 −1 11
3 −2 −8 1 3 −2 −8 1 0 −11 −14 16
Desarrollando por la columna 1
1 2 −3
= 1 · − −2 −1 11 =
−11 −14 16
= −(−16 − 242 − 84 − (−33 − 154 − 64)) = 91
CAPÍTULO 6. MATRICES Y DETERMINANTES 100
Como hemos dicho, hemos de tener especial cuidado al aplicar esta regla con determinantes, puesto
que no podemos hacer las mismas operaciones que con las matrices, lo que puede confundir.
Por ejemplo, si queremos calcular el determinante:
1 2 3
C = 0 1 2
4 1 5
lo que es correcto. Sin embargo, si queremos hacer cero el 1 de la primera columna serı́a un error
hacer:
1 2 3
4·F1 −F3 0 7 7
0 1 2 −→ 0 1 2 = 4 · 7 7 = 4 · (14 − 7) = 28.
1 2
4 1 5 4 1 5
no obtenemos lo mismo, porque hemos multiplicado la fila sustituida por un número y eso altera el
valor del determinante. Luego la fila a sustituir conviene no multiplicarla, como en el primer ejemplo,
puesto que si no nos damos cuenta, podemos variar el valor del determinante.
(Adj(A)t
A−1 =
|A|
donde Adj(A) denota la matriz adjunta de A, es decir, aquella que se obtiene de sustituir cada elemento
de A por su adjunto.
1 0 −1
Ejemplo: Calcular, si es posible, la inversa de la matriz A = 0 1 −3.
−1 1 0
1 0 −1
En primer lugar,|A| = 0 1 −3 = 0 + 0 + 0 − (1 − 3 + 0) = 2 y por tanto A tiene inversa.
−1 1 0
Calculando Adj(A), se obtiene:
1 −3 − 0 −3 0 1
1 0 −1 0 −1 1
3 3 1
0 −1 1 −1 1 0
Adj(A) =
− 1 0 −1 0 − −1 1 = −1 −1 −1
1 3 1
0 −1 1 −1 1 0
−
1 −3 0 −3 0 1
CAPÍTULO 6. MATRICES Y DETERMINANTES 101
Por tanto,
3 −1 1
(Adj(A)t) = 3 −1 3
1 −1 1
Y entonces, se obtiene: 3
−1 1
2 2 2
A−1 = 3
2
−1
2
3
2
1 −1 1
2 2 2
Ejercicio: Calcular la inversa anterior por el método de Gauss.
Como es nulo, el rango de la matriz NO es 2. Menores de orden 1 hay 4, por ejemplo |1| = 1, que es
no nulo,luego el rango de la matriz es Rg(A)=1 (el tamaño de dicho menor complementario).
b) Sólo hay un menor de orden 2, que es:
0 3
1 1 = 0 − 3 = −3
Como no es nulo, el rango de la matriz es Rg(B)=2 (el tamaño de dicho menor complementario).
c) Sólo hay un menor de orden 3, que es:
1 1 0
2 1 1 = −2 − 1 + 0 − (0 + 1 − 4) = −3 + 3 = 0
−1 1 −2
resulta que es no nulo, luego el rango es Rg(C)=2 (el tamaño de dicho menor complementario).
d) El menor más grande que podemos formar es de orden 2. Hay 3 de ellos:
2 4 2 6 4 6
−1 −2 = −4 + 4 = 0 −1 −3 = −6 + 6 = 0 −2 −3 = −12 + 12 = 0
CAPÍTULO 6. MATRICES Y DETERMINANTES 102
Son todos nulos, luego el rango NO es 2. Menores de orden 1 hay 6, y por ejemplo |6| = 6 = 0, es no
nulo, luego el rango es Rg(D)=1.
DISTRIBUCIÓN BINOMIAL Y
DISTRIBUCIÓN NORMAL
3.1. Introducción
Estudiaremos en este tema dos de las distribuciones de probabilidad más importantes y que son
imprescindibles a la hora de adentrarnos en el estudio de la inferencia estadı́stica. La distribución
binomial es uno de los primeros ejemplos de las llamadas distribuciones discretas (que sólo pueden
tomar un número finito, o infinito numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza,
1654-1705), quién escribió el primer tratado importante sobre probabilidad, “Ars conjectandi” (El
arte de pronosticar). Los Bernoulli formaron una de las sagas de matemáticos más importantes de la
historia. La distribución normal es un ejemplo de las distribuciones continuas, y aparece en multitud
de fenómenos sociales. Fue estudiada, entre otros, por J.K.F. Gauss (Alemania, 1777-1855), uno de los
más famosos matemáticos de la historia. La gráfica de la distribución normal en forma de campana se
denomina Campana de Gauss.
38
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 39
maneras se pueden ordenar 4 fracasos y 3 éxitos. Recordando las técnicas combinatorias, este problema
se reduce a calcular las permutaciones con elementos repetidos:
7! 7·6·5
P73,4 = = = 35formas
3! · 4! 3·2·1
1 5
Y por tanto, como p(E) = y tengo 3 éxitos y p(F ) = y tengo 4 fracasos:
6 6
1 1 1 5 5 5 5
p(tener 3 éxitos y 4 fracasos) = 35 · · · · · · · = 0 0781
6 6 6 6 6 6 6
1
Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de éxito ,
6
la probabilidad de obtener 3 éxitos es 0’0781, y lo expresarı́amos:
1
Bin 7; , entonces p(X = 3) = 0 0781
6
Como repetir este proceso serı́a bastante penoso en la mayorı́a de los casos, lo mejor es recurrir a la
siguiente fórmula que expresa la probabilidad de obtener cierto número de éxitos en una distribución
binomial:
Ejemplo:
1
Antes tenı́amos Bin 7; , y querı́amos calcular p(X=3) (obtener 3 éxitos). Aplicando la fórmula:
6
3 4
7 1 5
p(X = 3) = · · = 0 0781
3 6 6
Ejemplo:
Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la
probabilidad de que una familia con 6 descendientes tenga 2 hijos.
En este caso Éxito = E = “tener hijo” y p(E) = 0’5.
Fracaso = F = “tener hija” y p(F) = 0’5.
Estamos por tanto ante una binomial Bin(6;0’5) y nos piden p(X=2).
Si aplicamos la fórmula es:
6
p(X = 2) = · (0 5)2 · (0 5)4 = 0 2344
2
Nota:
La elección de éxito o fracaso es subjetiva y queda a elección de la persona que resuelve el problema,
pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo
anterior, si:
Éxito = “tener hija”, como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos,
si el éxito es tener hija hemos de plantearnos cuál es la probabilidad de tener 4 éxitos (4 hijas), es
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 40
decir:
6
p(X = 4) = · (0 5)4 · (0 5)2 = 0 2344
4
Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el éxito y el fracaso y
la pregunta que nos hagan.
Ejemplo:
La probabilidad de que un alumno de 2º de Bachillerato apruebe las Matemáticas es de 0’7. Si
consideramos un grupo de 8 alumnos, ¿cuál es la probabilidad de que cinco de ellos aprueben las
Matemáticas?.
Si éxito = “aprobar” y fracaso = “suspender”, entonces p = 0’7 y q = 0’3.
Tenemos, por tanto, una Bin(8;0’7).
Nos piden calcular p(X=5), que no se puede calcular mediante las tablas porque p = 0’7 y sólo
tenemos hasta p = 0’5. Por tanto si intercambiamos éxito = “suspender” y fracaso =“aprobar” entonces
p = 0’3, q = 0’7, es decir la nueva binomial es Bin(8;0’3) y nos piden que aprueben 5 de 8, es decir
que suspendan 3 de 8 o lo que es lo mismo, que tengamos 3 éxitos, p(X=3), y buscando en la tabla es
p(X=3) = 0’2541.
También, desde luego podrı́amos haber utilizado la fórmula desde el principio, utilizar la Bin(8;0’7)
y olvidarnos de tablas para hacer:
8
p(X = 5) = · (0 7)5 · (0 3)3 = 0 254
5
Hemos de tener en cuenta que para la distribución binomial, en las tablas sólo se admiten valores
hasta n=10 (10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de
utilizar la fórmula.
Ejemplo:
Los alumnos de cierta clase se encuentran en una proporción del 67 % que estudian inglés y el resto
francés.
Tomamos una muestra de 15 alumnos de la clase, calcular:
a) Probabilidad de que al menos encontremos tres alumnos de inglés.
b) Probabilidad de que los 15 alumnos estudien inglés.
c) Probabilidad de que estudien inglés entre 7 y 10 alumnos.
Si éxito = estudiar inglés, p = 0’67 y fracaso = estudiar francés, q = 1-0’67 = 0’33. Manejamos
por tanto una Bin(15;0’67)
a) p(X ≥ 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + . . . + p(X = 15).
Una opción es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la fórmula para
calcular cada una, la tarea se puede hacer bastante larga. Otra opción, más sencilla, es pasar al
complementario. El complementario de encontrar al menos 3 alumnos de inglés es encontrar como
mucho 2 alumnos de inglés, p(X ≤ 2).
Es decir,
y sólo tenemos que calcular 3 probabilidades: p(X = 0) ≈ 0 , p(X=1) = 0’000001, p(X=2) = 0’000026
(¡compruébalo!).
Por lo cual,
Las gráficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento
paulatino hasta llegar a la parte central del recorrido, donde está la mayorı́a de ellos.
Definición: Diremos que una distribución de probabilidad sigue una distribución normal de media x
y desviación tı́pica σ, y lo representaremos por N (x; σ) cuando la representación gráfica de su función
de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y
que tiene 2 puntos de inflexión , situados a ambos lados de la media (x − σ y x + σ respectivamente)
y a distancia de σ ella, es decir de la forma:
1
Figura 3.2: Distribución normal N (x; σ). El máximo está en (x, √ )
2·π·σ2
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 43
Dependiendo de los valores que tomen x y σ, la gráfica de esta función puede ser más o menos
alargada, achatada, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetrı́a,
continuidad, etc reseñadas anteriormente.
El concepto de función de densidad introducido anteriormente no se estudiará con profundidad.
Baste decir que la función de densidad determina la forma de cada distribución de probabilidad. En
el caso de la distribución normal de parámetros x y σ, dicha función viene dada por:
1 (x−x)2
f (x) = √ · e− 2·σ 2
2 · π · σ2
Propiedad:
El área encerrada bajo la curva normal N (x; σ) siempre es 1.
La demostración de este resultado no es nada sencilla e implica el uso de resultados matemáticos que
exceden el nivel de este curso.
De entre todas las curvas normales N (x; σ), la más sencilla, usada y conocida es aquella que tiene
por media 0 y por desviación tı́pica 1, N(0, 1).
Esta normal estándar se suele representar por Z.
La gráfica de esta curva se denomina campana de Gauss y se puede observar en la figura:
1
Figura 3.3: Distribución normal N (0; 1). El máximo está en (0, √2·π )
Para un valor cualquiera k, definimos la probabilidad de que la distribución Z, N(0;1) , sea menor o
igual que k como:
p(Z ≤ k)= “Área encerrada bajo la curva normal N(0,1) desde −∞ hasta k”
(es decir la parte rayada de la figura siguiente).
Ahora bien, ¿cómo calcular dicha área?. Fácil: Dichas áreas o probabilidades se encuentran tabu-
ladas.
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 44
Por otra parte, fijémonos en que en este tipo de distribuciones no tiene sentido plantearse probabili-
dades del tipo p(Z=k), ya que siempre valen 0, al no encerrar ningún área. Por tanto, si nos pidiesen
p(Z=3’2), basta decir que p(Z=3’2)=0.
Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se de-
moniman distribuciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por
ejemplo la binomial, que es una distribución discreta.
Ası́, al pasar al complementario, si tenemos Z ≥ k, su complementario será Z < k, pero como incluir
k no influye en la probabilidad,al calcular probabilidades podemos escribir:
p(Z ≥ k) = 1 − p(Z < k) = 1 − p(Z ≤ k)
Sólo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer
y hay que ser cuidadosos con el paso al complementario.
2. Si k es positivo y queremos calcular p(Z ≤ −k), es decir el área: por simetrı́a, p(Z ≤ −k) =
p(Z ≥ k) y ésta se calcula como en el caso anterior. Se puede observar la igualdad de áreas en
la figura:
Figura 3.7: p(Z ≤ −k) = p(Z ≥ k). La simetrı́a permite reducir este caso al anterior
Figura 3.9: p(Z ≥ −k) = p(Z ≤ k).La simetrı́a permite reducir este caso al que ya está tabulado
Ejercicio: Calcular p(Z=2), p(Z ≤ 2), p(Z ≥ 2), p(Z ≤ −2), p(Z ≥ −2), p(−2 ≤ Z ≤ 2),
p(0 81 ≤ Z ≤ 1 33).
Propiedad:
X−x
Si X sigue una distribución N (x; σ) , entonces la variable Z = sigue una distribución N(0,1).
σ
(El paso de la variable X −→ N (x; σ) a la Z −→ N(0;1) se denomina tipificación de la variable X).
Ejemplo:
Las estaturas de 600 soldados se distribuyen de acuerdo a una distribución normal de media 168
y desviación tı́pica 8 cm. ¿Cuántos soldados miden entre 166 y 170 cm?.
Sea X la distribución de los soldados , X es una N(168,8). Nos piden p(166 ≤ X ≤ 170).
Utilizando el resultado anterior, primero restamos x=168 en la desigualdad:
X − 168
Llamando a = Z, ésta ya es normal N(0,1) y se encuentra en las tablas:
8
(pues p(Z ≤ −0 25) = p(Z ≥ 0 25) = 1 − p(Z ≤ 0 25) = 1 − 0 5987 = 0 4013).
Ejercicios: 1) En una distribución N(22,5), calcula: p(X ≤ 27),p(X ≥ 27),p(X ≥ 125), p(15 ≤
X ≤ 20), p(17 ≤ X ≤ 30).
2) Los pesos de 60 soldados siguen una distribución N(67,5). Calcula la probabilidad de que el
peso sea:
a) mayor de 80 kg.
b) 50 kg. o menos
c) menos de 60 kg.
d) 70 kg.
e) Entre 60 y 70 kg inclusive.
En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribución normal,
pueden ocurrir dos posibilidades:
a) Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente)
de cada uno de ellos, por ejemplo: p(Z ≤ k) = 0 7982. En este caso el valor buscado será la media
entre los valores extremos.
Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre los valores
0’7967 (que corresponde a 0’83) y 0’7996 (que corresponde a 0’84). Por tanto el valor de k será:
0 83 + 0 84
k= = 0 835
2
b) Si el valor está entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor,
por ejemplo: p(Z ≤ k) = 0 7970. El valor más cercano es 0’9767 (que corresponde a 0’83) y como el
valor buscado está muy cerca de él, entonces directamente k=0’83.
Si la distribución no es normal N(0;1), sino N (x; σ), tendremos que tipificar previamente.
Por ejemplo, si X sigue una normal N(6;3) y p(X ≤ k) = 0 9082, calcula k.
Tipificando:
X −6 k−6 k−6
p ≤ = 0 9082 −→ p Z ≤ = 0 9082
3 3 3
Y buscando en la tabla,
k−6
= 1 33 ⇒ k − 6 = 3 99 ⇒ k = 9 99
3
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 48
Ejercicios:
2. De una variable normal N (x; σ) se sabe que p(X ≤ 7) = 0 9772 y p(X ≤ 6 5) = 0 8413. Calcular:
a) x y σ.
b) p(5 65 ≤ X ≤ 6 25)
c) El número k tal que p(X > k) = 0 3
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 49
La aproximación se puede aplicar (es una buena aproximación) sólo si n es grande, en concreto n ≥ 30
y además n · p ≥ 5 y n · q ≥ 5. Si no se cumplen estas condiciones NO podemos aproximar la binomial
que tengamos por una distribución normal.
En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable
discreta (binomial) a una continua (normal), y por tanto son distribuciones diferentes. El “precio” que
hay que pagar por pasar de una a otra se denomina “corrección por continuidad” y consiste en hacer
determinados ajustes para que la aproximación realizada sea lo más precisa posible.
Ası́, si nos piden p(X=k) en una distribución binomial X, y aproximamos X por una distribución normal
Y, no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en
una distribución continua todas estas probabilidades valen 0. La corrección por continuidad consiste
en tomar un pequeño intervalo de longitud 1 alrededor del punto k.
De otro modo, si nos piden p(X=k) con X binomial, con la aproximación normal Y deberemos
calcular p(k − 0 5 ≤ Y ≤ k + 0 5).
Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos
ejemplos:
Si nos piden p(X < k) con X binomial, aproximando por Y normal calcularemos p(Y ≤ k −0 5). La
explicación de que haya que restar 0’5 y no sumarlo es que queremos que X sea menor estrictamente
que k, con lo cuál, si sumase 0’5 , el propio k aparecerı́a en la probabilidad a calcular y NO debe
aparecer.
Por contra, si debiésemos calcular p(X ≤ k), con X binomial, fijémonos que ahora k SÍ está incluido
en la probabilidad y por tanto al aproximar por la normal Y deberı́amos calcular p(Y ≤ k + 0 5).
Comprender estos dos hechos es fundamental para realizar bien la correción por continuidad al
aproximar una distribución binomial por una normal.
100 √ 500
En el caso anterior,x = n · p = = 16 67 y σ = n · p · q = = 3 73. De modo que, como
6 36
n ≥ 30, n · p = 16 67 ≥ 5 y nq̇ = 83 33 ≥ 5, se pude aproximar la binomial por la normal, es decir:
1
X −→ Bin 100; ≈ Y −→ N (16 67; 373)
6
CAPÍTULO 3. DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL 50
Entonces:
19 5 − 16 67 Y − 16 67 33 5 − 16 67
≈ p(20 − 0 5 ≤ Y ≤ 33 + 0 5) = p
p(20 ≤ X ≤ 33) ≤ ≤ =
3 73 3 73 3 73
(∗)
Notemos que en el paso señalado por (*) hemos cambiado X(binomial) por Y(normal) y se ha realizado
la corrección por continuidad.
Capı́tulo 2
PROBABILIDAD
La probabilidad y la estadı́stica son, sin duda, las ramas de las Matemáticas que están en mayor
auge en este siglo, y tienen una tremenda aplicabilidad en todos los aspectos y ciencias, especialmente
en las Ciencias Sociales, puesto que aquellas variables que influyen en dichas ciencias, económicas,
demográficas, suelen tener carácter aleatorio,es decir, no son deterministas, y se fundamentan en
predicciones a partir de datos conocidos. Todo aquello que implique predicción nos lleva al terreno de
la probabilidad.
15
CAPÍTULO 2. PROBABILIDAD 16
Ejemplo:
1. ¿Cuál es el espacio muestral asociado al experimento de lanzar un dado normal al aire y observar
la cara que queda hacia arriba?.
Evidentemente, en este caso hay 6 posibles resultados (6 sucesos elementales) y el espacio mues-
tral estará formado por: E={1,2,3,4,5,6}.
Ejercicios:
1. Escribir el espacio muestral asociado al experimento de sacar una carta de entre las diez del palo
de copas de una baraja española.
2. Escribir el espacio muestral asociado al experimento de lanzar dos dados de diferentes colores y
observar la pareja de números que se obtiene.
3. Escribir el espacio muestral asociado al experimento de lanzar dos dados de diferentes colores y
sumar los números que se obtienen.
Llamaremos suceso aleatorio a cualquier subconjunto del espacio muestral. El concepto de suceso
es fundamental en probabilidad. Dicho de forma simple, un suceso de un experimento aleatorio es
cualquier cosa que se nos ocurra afirmar sobre dicho experimento.
Ası́, si tiramos una moneda dos veces, serı́an sucesos todos los siguientes:
1. En el caso del lanzamiento de la moneda en el que el espacio muestral era E={C,X} , analicemos
quién es el espacio de sucesos:
- Sucesos con 0 elementos: ∅
- Sucesos con 1 elemento: {C},{X}
- Sucesos con 2 elementos:{C,X}
De modo que el espacio de sucesos es: S={∅,{C},{X},{C,X}}.
2. En el caso del lanzamiento de dos monedas, si haces el diagrama de árbol obtienes el siguiente
espacio muestral:
E = {(C, C), (C, X), (X, C), (X, X)}
El espacio de sucesos tiene ahora 16 elementos, que puedes intentar escribir, siguiendo el esquema
anterior, desde los sucesos con 0 elementos hasta aquellos que tienen 4 elementos. Si describimos
los sucesos que ponı́amos antes como ejemplos, obtenemos:
CAPÍTULO 2. PROBABILIDAD 17
3. En el caso del lanzamiento del dado el espacio de sucesos es mucho más amplio (64 elementos.
Serı́a interesante que intentases escribirlos todos o al menos te dieses cuenta de cómo son ,
aunque no los escribas todos)
En este mismo ejemplo, se puede considerar el suceso A= ”sacar un número par”. ¿De qué sucesos
elementales consta el suceso A?. Evidentemente, A={{2},{4},{6}}.
Otros sucesos pueden ser: B = ”Sacar un número mayor que 5-{{6}}.
C = ”Sacar un número par y menor que 5-{{2},{4}}.
Ejercicio: Una urna contiene dentro 4 bolas de las cuales 2 son blancas, 1 roja y otra azul. Se saca
una bola de la urna.
a) Escribir el espacio muestral.
b) Escribir los sucesos “no sacar bola azul” y “sacar bola roja o blanca”.
c) Escribir el espacio de sucesos.
Los sucesos admiten una representación gráfica que facilita su interpretación; del modo:
A = ”salir par y menor que 5”. Estos diagramas se denominan diagramas de Venn.
Propiedad:
Si el espacio muestral tiene n elementos, el espacio de sucesos tiene 2n elementos.
Ejemplo:
En el caso del dado, el espacio muestral tenı́a 6 elementos y el espacio de sucesos tiene 26 = 64
elementos.
En el caso de la moneda, el espacio muestral tenı́a dos elementos y el espacio de sucesos tiene
22 = 4 elementos.
CAPÍTULO 2. PROBABILIDAD 18
1. Igualdad de sucesos: Dos sucesos A y B son iguales si están compuestos por los mismos elementos.
Lo expresaremos por A = B.
En ocasiones podremos encontrarnos con sucesos que NO tengan elementos en común. En estos
casos se dice que los sucesos A y B son incompatibles, y su intersección se representa con el
conjunto vacı́o:
A∩B =∅
Evidentemente, si los sucesos sı́ tienen intersección, diremos que son compatibles.
(El sı́mbolo ⊂ significa “contenido”, o que el primer conjunto es un subconjunto del segundo)
De todas formas, hemos de ser cuidadosos con esta operación: No se debe confundir con una
simple resta como operación numérica, sino que es una diferencia conjuntista, quitar los elementos
comunes a dos conjuntos.
Ejercicio: En una urna tenemos 9 bolas numeradas del 1 al 9. Sacamos una y anotamos su número.
Sean los sucesos: A=”sacar un nº primo”B=“sacar un nº cuadrado” (por ejemplo 4 es un número
cuadrado, porque 4=22 ). Se pide:
a) Describir el espacio muestral.
b) ¿Cuántos elementos tiene el espacio de sucesos?.
CAPÍTULO 2. PROBABILIDAD 20
c) Calcula A ∩ B y A ∪ B.
d) ¿Son A y B compatibles o incompatibles?.
e) Calcula Ā y B̄.
f) Si C=“sale un número impar”, calcula A ∩ C, B ∩ C,C̄ , A ∪ C,Ā ∩ C̄.
Propiedades de las operaciones con sucesos:
Las operaciones con sucesos tienen las siguientes propiedades, la mayorı́a de ellas bien conocidas:
Intersección Unión
Conmutativa A∩B = B∩A A∪B = B∪A
Asociativa A ∩ (B ∩ C) = (A ∩ B) ∩ C A ∪ (B ∪ C) = (A ∪ B) ∪ C
Idempotente A∩A=A A∪A = A
Simplificación A ∩ (A ∪ B) = A A ∪ (A ∩ B) = A
Distributiva A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Elemento neutro A∩E =A A∪∅ = A
Absorción A∪∅ = A A∪E = A
(A ∪ B) = Ā ∩ B̄
(A ∩ B) = Ā ∪ B̄
Demostración: Demostraremos la primera de las igualdades.
En primer lugar, representemos en un diagrama de Venn (A ∪ B). Para ello, primero representamos
A ∪ B, y luego su contrario (A ∪ B):
Ahora, representaremos en otro diagrama el otro miembro, es decir Ā ∩ B̄. En primer lugar,
representaremos Ā, luego B̄ y luego su intersección:
Figura 2.8: Imagen 1 corresponde a Ā. Imagen 2 corresponde a B̄. Imagen 3 corresponde a Ā ∩ B̄.
Observando los dos resultados, vemos que las partes rayadas son iguales, por lo que la igualdad es
cierta.
CAPÍTULO 2. PROBABILIDAD 21
Ejercicio:
2. Luisa y Marı́a interviene en un torneo de ajedrez. La primera que gane dos partidas seguidas o
tres alternas gana el torneo. Encuentra el espacio muestral con todos los resultados posibles (
suponemos que nunca hacen tablas).
(Indicación: Utiliza un diagrama de árbol).
3. Consideramos el fenómeno aleatorio extraer una carta de una baraja de 40 y anotarla . Sean los
sucesos A= “sacar oro”, B= “sacar rey”, C= “sacar el rey de bastos”.
Determina los sucesos:
A ∩ C̄, A ∩ B ∩ C, Ā ∪ B̄ ∪ C̄, Ā ∪ B̄
Regla de Laplace:
Si realizamos un experimento aleatorio en el que hay n sucesos elementales, todos igualmente
probables, entonces si A es un suceso, la probabilidad de que ocurra el suceso A es:
número de casos favorables al suceso A
p(A) =
número de casos posibles
Ejemplo: Lanzamos un dado normal al aire. Consideramos el suceso A= “sale par”. Calcular p(A).
Casos posibles hay 6, pues E={1,2,3,4,5,6}.
Casos favorables al suceso A={2,4,6}.
3 1
Por tanto p(A) = = = 0 5.
6 2
(Notemos que la probabilidad siempre es un número positivo y menor, o a lo sumo igual a 1).
El inconveniente que plantea la definición de Laplace es que necesariamente los sucesos elementales
tienen que tener la misma probabilidad de ocurrir.
Observemos un caso tan sencillo como el siguiente:
De una urna que contiene 8 bolas rojas, 5 amarillas y 7 verdes se extrae una bola al azar. Calcula
la probabilidad de que la bola extraı́da sea :
a) roja
b) verde
c) amarilla
El espacio muestral en este caso serı́a: E={R,V,A}, que consta sólo de tres elementos, pero serı́a un
poco ingenuo asignar las probabilidades mediante la regla de Laplace,
1 1 1
p(R) = p(V ) = p(A) =
3 3 3
porque ya intuitivamente se ve que hay más posibilidades, por ejemplo, de que salga una bola roja
que de que salga una bola amarilla, de modo que ¿cómo asignar probabilidades?.
CAPÍTULO 2. PROBABILIDAD 22
Una probabilidad p es una función que asocia a cada suceso A del espacio de sucesos S , un número
real p(A), es decir: p : S −→ R , y que cumple las propiedades:
1. 0 ≤ p(A) ≤ 1, (es decir, cualquier suceso tiene probabilidad positiva y menor o igual que 1).
Ejemplo:
Sea un experimento aleatorio cualquiera y definamos en S (espacio de sucesos) la siguiente proba-
bilidad:
número de elementos del conjunto A
p(A) =
número total de elementos
Comprobemos que p es una probabilidad.
Para ello, comprobemos las tres propiedades:
a) Se ve que la probabilidad de cualquier suceso está entre cero y uno, puesto que cualquier conjunto
que tenga elementos ya tendrá probabilidad positiva, y el número de elementos de cualquier conjunto
no puede ser mayor que el número total de elementos existentes.
b) p(E) = 1, es evidente.
c) Tomemos dos sucesos A y B que no tengan elementos en común. Entonces:
Ejemplo:
En el ejemplo de las urnas anterior, lo lógico es definir la probabilidad ası́: Como en total hay 20
8 7 5
bolas y 8 son rojas, 7 verdes y 5 amarillas, p(R) = p(V ) = p(A) = .
20 20 20
Se puede comprobar que ası́ definida p es una probabilidad.
Sin embargo, comprobar las propiedades de la definición de Kolmogorov es una labor larga y engorrosa,
puesto que hay que verificar que se cumple para todos aquellos sucesos del espacio de sucesos S, que es
ciertamente amplio en muchas ocasiones. El siguiente resultado simplifica la tarea de decidir cuándo
una función p sobre el espacio de sucesos es una probabilidad, basándose sólo en los sucesos elementales,
es decir, aquellos que forman parte del espacio muestral. Lo enunciaremos sin demostración:
CAPÍTULO 2. PROBABILIDAD 23
Propiedad
Si w1 , w2 , . . ., wn son los n sucesos elementales de un suceso aleatorio cualquiera,p una función
p : S −→ R de modo que cumple las propiedades:
1. 0 ≤ p(wi) ≤ 1 ∀ i ∈ {1, 2, . . . , n}
Ejemplo: Comprobar si las siguientes funciones definidas para los sucesos elementales son probabilidad,
siendo E={a,b,c,d} el espacio muestral del experimento aleatorio:
1 1 1 1
a) p(a) = , p(b) = , p(c) = , p(d) =
2 3 4 5
Es obvio que la primera propiedad se cumple, puesto que las 4 probabilidades son números positivos
menores que 1.
Para ver si se cumple la segunda, basta realizar la suma:
1 1 1 1 30 + 20 + 15 + 12 77
+ + + = =
2 3 4 5 60 60
que evidentemente NO es 1, luego p NO es probabilidad.
1 1 1
b) p(a) = , p(b) = , p(c) = 0, p(d) =
4 2 2
Es obvio que la primera propiedad se cumple, puesto que las 4 probabilidades son números positivos
o cero menores que 1.
Para ver si se cumple la segunda, basta realizar la suma:
1 1 1 1+2+1
+ + = =1
4 2 4 4
1. p(Ā) = 1 − p(A)
En efecto, puesto que E = A ∪ Ā y además A y Ā son incompatibles, resulta por la propiedad
3) de la definición que
p(E) = p(A ∪ Ā) = p(A) + p(Ā)
Y por la propiedad 2), p(E)=1, luego 1 = p(A) + p(Ā) y por tanto p(Ā) = 1 − p(A).
2. p(∅) = 0
Como Ē = ∅, resulta que:
Ejemplo:
Se tira una moneda 3 veces. Calcular la probabilidad de obtener alguna cara.
Los problemas de este tipo, en los que se pide la probabilidad de obtener “alguna” cosa, se suelen
resolver muy bien por paso al complementario. En este caso concreto, A = “obtener alguna cara”.
Ā= “no obtener ninguna cara”= “obtener 3 cruces”.
1
Entonces, p(A) = , pues hay 8 casos posibles (2·2·2, ¡haz el diagrama de árbol!) y sólo uno
8
favorable (XXX, 3 cruces), por tanto:
1 7
p(A) = 1 − p(Ā) = 1 − =
8 8
Ejercicio:
Calcular la probabilidad de obtener al menos 1 seis si se lanza 4 veces un dado.
Ejemplo:
Se lanza un dado dos veces y se suman las dos caras. Sea A el suceso A= “la suma de resultados
es mayor o igual que 10” y B= “la suma de los resultados es múltiplo de 6”. Calcular p(A), p(B) y
p(A ∩ B).
Hay 36 posibles resultados al lanzar dos veces un dado. ¿Cuántos de ellos suman 10 o más?
Que sumen 10: (4,6), (5,5), (6,4)
Que sumen 11: (5,6), (6,5)
Que sumen 12: (6,6)
6 1
Por tanto, p(A) = = .
36 6
¿Cuántos hay que sumen múltiplo de 6?
Que sumen 6: (1,5), (2,4),(3,3), (4,2), (5,1)
Que sumen 12: (6,6)
6 1
Por tanto, p(B) = = .
36 6
1
En cuanto a A ∩ B = (6, 6), luego p(A ∩ B) = .
36
Ejercicios:
1. Se ha encargado la impresión de una encuesta a una imprenta, que imprime 12 folios defectuosos
de cada 1000. Hallar la probabilidad de que elegido un folio de la encuesta al azar:
a) Esté mal impreso.
b) Esté correctamente impreso.
2. Una bolsa contiene 8 bolas numeradas. Se extrae una bola y anota su número. Sean los sucesos
A= “salir par”, B= “salir impar”, C= “salir múltiplo de 4”.
Calcular las probabilidades de A ∪ B, A ∪ C, B ∪ C, A ∪ B ∪ C.
4. En el banquete posterior a una boda se sientan en la presidencia 10 personas, entre los cuales se
encuentran los novios. Calcular la probabilidad de que los novios estén juntos en el centro de la
mesa.
CAPÍTULO 2. PROBABILIDAD 25
p(A ∩ B)
p(A/B) =
p(B)
Ejercicios:
1. Calcula la probabilidad de que la suma de las caras de dos dados sea mayor a igual que 10
sabiendo que en el primer dado ha salido un seis.
2. Se lanzan dos dados:¿cuál es la probabilidad de obtener una suma de puntos igual a siete?.
Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados haya
salido un 3?
CAPÍTULO 2. PROBABILIDAD 26
Propiedad:
Ejemplo:
1 1 1
En el caso anterior, p(A ∩ B) = , y por otra parte p(A) = y p(B) = ,luego se cumple que
6 2 3
1 1 1
p(A ∩ B) = = · = p(A) · p(B)
6 2 3
luego A y B son independientes.
Ejercicio:
2 1
De dos sucesos conocemos que p(A ∪ B) = y p(A) = , calcula p(A ∩ B) y p(B) para que A y
3 5
B sean independientes.
(Indicación: Utilizar la fórmula de la unión de dos sucesos y la de la independencia de sucesos).
7 7
(Solución: p(B) = 12 , p(A ∩ B) = 60 ).
CAPÍTULO 2. PROBABILIDAD 27
NOTA IMPORTANTE:
No se deben confundir los conceptos de sucesos incompatibles y sucesos independientes. Dos sucesos
son incompatibles cuando no tienen elementos en común, es decir, A ∩ B = ∅, o con diagramas de
Venn:
Dos sucesos son independientes si p(A ∩ B) = p(A) · p(B). Son conceptos totalmente distintos. Uno
se refiere a CONJUNTOS y otro se refiere a PROBABILIDADES.
Ejemplo: Se extraen 2 cartas, sucesivamente, de una baraja de 40. Calcular la probabilidad de extraer
2 sotas.
Sea A = “sacar sota en la 1ª” y B = “sacar sota en la 2ª”.
Nos piden p(A ∩ B).
Según la fórmula anterior, p(A ∩ B) = p(A) · p(B/A).
4 1 3 1 1 1 1
Ahora bien , p(A) = = y p(B/A) = = , por lo que p(A) = · = .
40 10 39 13 10 13 130
La forma más sencilla de calcular probabilidades en experimentos compuestos es un digrama de
árbol, donde en cada rama situamos la probabilidad que le corresponde al suceso del final de dicha
rama. Estas probabilidades que se van poniendo en el árbol son probabilidades condicionadas, porque
dependen de los resultados anteriores.
En el caso del ejercicio anterior, el diagrama serı́a:
Figura 2.10: Diagrama de árbol para la extracción de sota(S) u otra carta (S̄)
CAPÍTULO 2. PROBABILIDAD 28
Nota:
Este mismo resultado se podrı́a haber obtenido
sin usar la probabilidad condicionada, del modo:
40
Formas de elegir 2 cartas de entre 40= .
2
4
Formas de elegir 2 sotas entre 4= .
2
4
casos favorables 2 6 1
Por la regla de Laplace, p(obtener 2 sotas)= = = = .
casos posibles 40 780 130
2
Ejercicios:
1. Una urna contiene 9 bolas rojas y 5 negras. Se extraen sucesivamente 2 bolas. Calcula la proba-
bilidad de que:
a) la primera bola sea roja y la segunda negra.
b) una sea roja y la otra negra.
2. En una bolsa hay 4 canicas rojas, 4 azules y 2 verdes. Se extraen 3 canicas que resultan ser 2
rojas y una azul. Sin devolverlas a la bolsa se saca otra canica, ¿de qué color es más probable
que salga?.
Ejemplo:
Tenemos dos urnas, una con 7 bolas rojas y 2 azules, y otra con 3 bolas rojas y 8 azules. Tiramos
un dado. Si nos sale un 3 o un 5, sacamos una bola de la primera urna y en caso contrario, sacamos
una bola de la segunda urna. ¿Cuál es la probabilidad de que la bola extraı́da sea azul?.
Evidentemente estamos realizando un experimento compuesto. En primer lugar, se trata de elegir una
urna, para lo cuál lanzamos un dado. Si U1 = “elegir la urna 1” y U2 = “elegir la urna 2”, es claro que
2 1 4 2
p(U1 )= = y p(U2 )= = .
6 3 6 3
Por otra parte, luego realizamos otro experimento consistente en sacar una bola de la urna elegida.
Si A= “sacar una bola azul”, las probabilidades que conocemos son:
2
p(A/U1 ) =
9
y
8
p(A/U2 ) =
11
Lo que nos piden es p(A). Para calcular dicha probabilidad, si representamos el diagrama de árbol:
Como la probabilidad de A depende de la urna en la que estemos, basta multiplicar las probabili-
dades de cada rama que llegue a la bola azul y luego sumar los 2 resultados, es decir:
2 2 4 8 4 32 166
p(A) = · + · = + = = 0 559
6 9 6 11 54 66 297
CAPÍTULO 2. PROBABILIDAD 29
Ejercicio:
Se tienen dos urnas, la primera de las cuales tiene 6 bolas blancas, 4 negras y 2 rojas y la urna 2
tiene 3 bolas blancas y 7 negras.
Se lanza un dado al aire, y si sale múltiplo de 3 se saca de la primera urna y en otro caso se saca
una bola de la segunda urna.
Calcular la probabilidad de que sea:
a) bola blanca b) bola negra c) bola roja.
Solución: 11 26 1
30 45 18 .
, ,
Ejemplo: En un taller se sabe que acuden, por la mañana 3 automóviles con problemas de eléctricos,
8 con problemas mecánicos y 3 con problemas de chapa. Por la tarde hay 2 con problemas eléctricos,
3 con problemas mecánicos y 1 con problemas de chapa.
a) Calcular el porcentaje de los que acuden por la tarde.
b) Calcular el porcentaje de los que acuden con problemas mecánicos
c) Calcular la probabilidad de que un automóvil con problemas eléctricos acuda por la mañana.
Resumiendo los datos en una tabla de contingencia:
1. Se haya curado.
2. No se haya curado.
Teorema de Bayes:
Si A1 , A2 , . . . , An son sucesos incompatibles 2 a 2, y cuya unión es el espacio muestral
(A1 ∪ A2 ∪ . . . ∪ An = E), y B es otro suceso, resulta que:
p(Ai ) · p(B/Ai )
p(Ai /B) =
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 ) + . . . + p(An ) · p(B/An )
Demostración:
p(Ai ∩ B)
Por definición,p(Ai /B) = .
p(B)
Ai ∩ B
Ahora bien, recordando que p(Ai ∩ B) = p(Ai ) · p(B/Ai ), debido a que p(B/Ai ) = .
p(Ai )
Por tanto, combinando los dos hechos:
Nota:
Las probabilidades p(Ai ) se denominan probabilidades a priori.
Las probabilidades p(Ai /B) se denominan probabilidades a posteriori.
Las probabilidades p(B/Ai ) se denominan verosimilitudes.
CAPÍTULO 2. PROBABILIDAD 32
Ejemplo:
Dos clases de 2º de Bachillerato, una de 28 alumnos y otra de 35 alumnos hacen conjuntamente
un examen de Matemáticas. La probabilidad de aprobar de los alumnos de la primera clase es de 0’68
y los de la segunda del 0’73. Se toma un examen al azar y resulta que está aprobado. ¿Cuál es la
probabilidad de que sea de un alumno de la 1ª clase?.
Sea A1 = “el examen es de un alumno de la primera clase”
A2 = “el examen es de un alumno de la segunda clase”
B= “el examen está aprobado”
Nos piden p(A1 /B).
Hagamos antes que nada un diagrama de árbol:
p(A1 ) · p(B/A1 )
p(A1 /B) =
p(A1 ) · p(B/A1 ) + p(A2 ) · p(B/A2 )
Sustituyendo:
28
· 0 68 0 302
p(A1 /B) = 63 = = 0 427
28 35 0 708
· 0 68 + · 0 73
63 63
p(A1 ) es la probabilidad “a priori”, es decir , antes de realizar el experimento y careciendo de
información.
28
En este caso p(A1 ) = = 0 444.
63
p(A1 /B) es la probabilidad “a posteriori”, después de realizarlo y conocer más información. En
este caso p(A1 /B) = 0 427 (es algo menor).
Ejercicio:
Se tienen dos urnas. En la primera hay 10 bolas blancas, 7 negras y 5 rojas. En la segunda 24
blancas, 4 negras y 9 rojas. Se elige una urna al azar y se saca una bola. Calcular:
a) Probabilidad de sacar bola blanca.
b) Sabiendo que la bola extraı́da es blanca, probabilidad de que provenga de la segunda urna.
Solución: 449 264
814 , 449 .
Capı́tulo 8
PROGRAMACIÓN LINEAL
8.1. Introducción
La programación lineal es una técnica matemática relativamente reciente (siglo XX), que consiste
en una serie de métodos y procedimientos que permiten resolver problemas de optimización en el
ámbito, sobre todo, de las Ciencias Sociales.
Nos centraremos en este tema en aquellos problemas simples de programación lineal, los que tienen
sólamente 2 variables, problemas bidimensionales.
Para sistemas de más variables, el procedimiento no es tan sencillo y se resuelven por el llamado
método Simplex (ideado por G.B.Danzig, matemático estadounidense en 1951).
Recientemente (1984) el matemático indio establecido en Estados Unidos, Narenda Karmarkar,
ha encontrado un algoritmo, llamado algoritmo de Karmarkar, que es más rápido que el método
simplex en ciertos casos. Los problemas de este tipo, en el que intervienen gran número de variables,
se implementan en ordenadores.
ax + by ≤ c
(donde el sı́mbolo ≤ puede ser también ≥ , < o bien >), donde a, b y c son números reales y x e y las
incógnitas.
Para resolver estas inecuaciones, se recordará de otros cursos, hay que representar gráficamente en
el plano la recta dada por la correspondiente ecuación lineal y marcar una de las dos regiones en que
dicha recta divide al plano.
127
CAPÍTULO 8. PROGRAMACIÓN LINEAL 128
La recta divide al plano en dos regiones, una de las cuales es la solución de la inecuación. Para
saber qué parte es, hay dos procedimientos:
Ejercicios:
1. Calcular los otros dos vértices.
2. Resolver los sistemas de inecuaciones lineales siguientes encontrando los vértices de las regiones
que sean solución:
x + 2y ≤ 12
3x + 6y ≥ 420 3x + 5y ≤ 150 2x + y ≥ 4
a) b) c)
4x + 2y ≥ 290 3x + 3y ≤ 120
x − 2y ≤ 6
x−y ≥0
CAPÍTULO 8. PROGRAMACIÓN LINEAL 130
Lo mismo ocurre con y ≤ 1, que será en este caso la parte inferior a la recta horizontal y = 1, es
decir:
En el caso particular de que sea x ≥ 0 o y ≥ 0, las rectas coincidirán con los ejes de coordenadas.
Ejercicios: Resolver los sistemas de inecuaciones lineales siguientes, encontrando los vértices de las
regiones que sean solución:
x + 3y ≥ 50
5x + 15y ≤ 150
2x + y ≤ 10
9x − 8y ≥ 0
6x + 8y ≤ 120 x + 3y ≤ 12
a) b) 3x + 4y ≥ 60 c)
x ≥ 0
0≤x≤8
x≥0
y≥0 0≤y≤2
y≥0
Propiedad:
Si hay una única solución óptima, ésta se encuentra en un vértice de la región factible, y si hay
infinitas soluciones óptimas, se encontrarán en un lado de la región factible.
Es posible que no haya solución óptima, pues cuando el recinto es no acotado, la función objetivo
puede crecer o decrecer indefinidamente.
Para resolver el problema, podemos abordarlo de dos formas, pero antes a aplicar cualquiera
de ellas siempre hay que dibujar la región factible, resolviendo el sistema de inecuaciones lineales
correspondiente, como se ha visto en los epı́grafes anteriores (la región factible puede estar acotada o
no), y se calculan los vértices de dicha región.
Se trata ahora de trazar paralelas al vector que pasen por los vértices anteriores, es decir:
Se observa gráficamente que de las tres paralelas trazadas, la que corta al eje y en un punto mayor
es la que pasa por el punto (5,1), que por tanto será la solución óptima al problema de máximos
planteado.
Para saber cuál es este valor ,máximo sustituimos en la función:
F (5, 1) = 2000 · 5 + 5000 · 1 = 10000 + 5000 = 15000
Luego la función tiene su solución óptima en (5,1) donde toma el valor 15000.
2x + y ≤ 10
x + 3y ≤ 12
1. Maximizar F (x, y) = 4x + 5y sujeto a: .
0≤x≤8
0≤y≤2
3x + 2y ≥ 12
4x + 5y ≥ 29
2. Minimizar F (x, y) = 12x + 10y sujeto a: .
x≥0
y≥0
4x + 2y ≤ 6
7x + 8y ≤ 28
3. Maximizar F (x, y) = 120x + 80y sujeto a: .
x≥0
y≥0
4x + 5y ≥ 20
4. Minimizar F (x, y) = 12x + 8y sujeto a: 7x + 2y ≥ 14 .
x≤y
Ejemplo 1:
x + y ≥ 14
2x + 3y ≥ 36
Maximizar g(x, y) = 3x + 4y sujeta a las rectricciones: .
4x + y ≥ 16
x − 3y ≥ 0
Si representamos la región factible:
Si aplicamos el método geométrico, deberı́a trazar paralelas al vector director por los vértices, pero
como la región en no acotada, dichas rectas son cada vez mayores al trazarlas sobre los puntos de la
recta t, que son soluciones factibles. Por tanto el problema no tiene solución.
En general, un problema de máximos no tiene solución si la región factible no está acotada supe-
riormente, y un problema de mı́nimos no tiene solución si la región no está acotada inferiormente.
También puede tener el problema infinitas soluciones:
Ejemplo 2:
x+y ≥5
≤ x+3
y
Minimizar g(x, y) = 3x + 3y sujeta a las restricciones 3y − x ≥ −1 .
y + 2x ≤ 16
4y − x ≤ 22
La región es, en este caso:
CAPÍTULO 8. PROGRAMACIÓN LINEAL 136
Es decir, como buscamos el valor mı́nimo, todos los puntos comprendidos entre A y E sirven, es
decir, hay infinitas soluciones.
Si utilizamos el método algebraico: g(x, y) = 3x + 3y, luego:
A : g(1, 4) = 3 + 12 = 15
B : g(2, 5) = 6 + 15 = 21
C : g(6, 4) = 18 + 12 = 30
D : g(7, 2) = 21 + 6 = 27
E : g(4, 1) = 12 + 3 = 15
Observamos que el valor mı́nimo se toma en A y en E, y por tanto en todos los puntos comprendidos
entre ellos, es decir, hay infinitas soluciones.
Ejemplo:
Una fábrica de muebles fabrica dos tipos de sillones, S1 y S2. La fábrica cuenta con dos secciones;
carpinterı́a y tapicerı́a.
Hacer un sillón de tipo S1 requiere 1 hora de carpinterı́a y 2 de tapicerı́a, mientras que uno de tipo
S2 requiere 3 horas de carpinterı́a y 1 de tapicerı́a.
El personal de tapicerı́a trabaja un total de 80 horas, y el de carpinterı́a 90.
Las ganancias por las ventas de S1 y S2 (unidad) son, respectivamente 60 y 30 euros. Calcular
cuántos sillones de cada tipo hay que hacer para maximizar las ganancias.
CAPÍTULO 8. PROGRAMACIÓN LINEAL 137
Este es un problema tı́pico en el que hay que usar las técnicas de programación lineal. Intentaremos
seguir el siguiente esquema:
3. Representar gráficamente la región factible, calcular sus vértices y el vector si usamos el método
geométrico.
En este caso, representando la región factible:
CAPÍTULO 8. PROGRAMACIÓN LINEAL 138
S1 30 31 32 33 34 35 36 37 38 39 40
S2 20 18 16 14 12 10 8 6 4 2 0
Ejemplo:
Una empresa tiene 2 plantas de producción (P1 y P2) de cierto artı́culo que vende en 3 ciudades
(C1,C2 y C3). En P1 produce 5000 unidades, y en P2 7000 unidades. De estas 12000 unidades las
vende ası́: 3500 es C1, 4000 en C2 y 4500 en C3. Los costes de transporte, en euros por unidad de
producto, desde las plantas de producción a las ciudades son:
Envı́os Hasta C1 Hasta C2 Hasta C3
Desde P1 3 2’5 3’5
Desde P2 2’25 3’75 4
Determina el nº de artı́culos que debe enviar la empresa desde cada planta a cada ciudad para que los
costes de transporte sean mı́nimos.
C(x, y) = 1 25 · x − 0 75 · y + 22625
CAPÍTULO 8. PROGRAMACIÓN LINEAL 140
Ejercicio:
Dos fábricas de cemento, F1 y F2, producen respectivamente 3000 y 4000 sacos de cemento al dı́a.
Hay que enviar ese cemento a tres centros de ventas C1, C2 y C3 en cantidades de 3000, 2500 y
1500 sacos respectivamente.
Los costes de transporte de cada fábrica a los puntos de venta vienen dados, en euros por cada
saco, por:
Determina cómo hay que distribuir la producción para que el transporte resulte lo más económico
posible.
Capı́tulo 7
SISTEMAS DE ECUACIONES
LINEALES
7.1. Introducción
Se denomina ecuación lineal a aquella que tiene la forma de un polinomio de primer grado, es decir,
las incógnitas no están elevadas a potencias, ni multiplicadas entre sı́, ni en el denominador.
Por ejemplo, 3x + 2y + 6z = 6 es una ecuación lineal con tres incógnitas.
Como es bien sabido, las ecuaciones lineales con 2 incógnitas representan una recta en el plano.
Si la ecuación lineal tiene 3 incógnitas, su representación gráfica es un plano en el espacio.
Un ejemplo de ambas representaciones puede observarse en la figura:
El objetivo del tema es el estudio de los sistemas de ecuaciones lineales, es decir, un conjunto de
varias ecuaciones lineales. Diremos que dos ecuaciones son equivalentes si tienen las mismas soluciones,
o geométricamente representan la misma recta o plano.
109
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 110
se llama matriz ampliada del sistema y se representará por (A|B) o bien por A∗ .
x+y−z = 5
Ejemplo: El sistema: x+y =7 escrito matricialmente es:
2x + 2y − z = 12
1 1 −1 x 5
1 1 0 · y = 7
2 2 −1 z 12
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 111
Como cada ecuación lineal con 2 incógnitas se interpreta geométricamente como una recta, el estudio
de la solución del sistema se limita a estudiar la posición de 2 rectas en el plano.
Veamos algunos ejemplos con los tres casos que se pueden presentar. Resolver e interpretar el
x + 2y = −3
sistema: .
−2x + y = 1
Por reducción:
2x+4y=-6
-2x+ y=1
5y=-5
x + 2y = −3
Resolver e interpretar el sistema: .
−2x − 4y = 5
x = −3 − 2y
Por igualación: 5 + 4y de donde:
x=
−2
5 + 4y
−3 − 2y = =⇒ 4y + 6 = 5 + 4y =⇒ 0y = −1 =⇒ 0 = −1
−2
lo cuál es imposible y por tanto el sistema no tiene solución, es un sistema incompatible y por
tanto las rectas son paralelas. Geométricamente:
x + 2y = −3
Resolver e interpretar el sistema: .
3x + 6y = −9
Por sustitución, como x = −2y − 3 resulta 3(−2y − 3) + 6y = −9, es decir −6y − 9 + 6y = −9, por
tanto 0y = 0, 0 = 0.
Como 0 = 0 es una igualdad siempre cierta, quiere decir que el sistema tiene infinitas soluciones,
es compatible indeterminado, o que las rectas son la misma.
Aplicar el método de Gauss consiste en realizar transformaciones elementales mediante las filas de la
matriz para obtener la matriz escalonada siguiente:
a11 a12 b1
(A|B) = 0 a∗22 b∗2
0 0 b∗3
Recordemos que las operaciones elementales permitidas en las filas de la matriz (ecuaciones del sistema)
eran:
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 114
T1) Multiplicar o dividir una fila por un número real distinto de cero.
T2) Sumar o restar a una fila otra multiplicada por un número real no nulo.
T3) Intercambiar el lugar de dos filas entre sı́.
Utilizando estas transformaciones, los sucesivos sistemas que se obtienen son equivalentes al pri-
mero, es decir, tienen las mismas soluciones.
Debemos eliminar, en este orden, el elemento a21 utilizando la fila 1, el elemento a31 , utilizando
también la fila 1, y por último el elemento a32 utilizando la fila 2, de modo análogo al método de
Gauss-Jordan para la inversa.
Además, es conveniente en cada paso indicar la operación realizada con las filas, poniendo en
primer lugar aquella que se va a sustituir por otra.
Llegados a la matriz ampliada escalonada al final del proceso, pueden darse los casos siguientes:
1. a∗22 = 0. Entonces hay dos posibilidades:
a) b∗3 = 0. Sistema incompatible (hay una ecuación del tipo 0=k), sin solución.
Geométricamente, puede ocurrir que:
a) Dos rectas sean paralelas y la otra las corte.
b) Las rectas se corten dos a dos (formen un triángulo).
b) b∗3 = 0. Aparece una ecuación 0=0 que no influye en la resolución del sistema, que redu-
cido a las dos ecuaciones iniciales tiene solución única, es decir, el Sistema es Compatible
Determinado.
Geométricamente:
a) Dos rectas son coincidentes y la otra las corta.
b) Las tres rectas se cortan en un mismo punto.
b) Si b∗2 = 0, b∗3 = 0 o bien b∗2 = 0, b∗3 = 0, aparece una ecuación 0=0 (que no influye) y otra
0=k (que es imposible). El sistema es incompatible.
Geométricamente:
a) Dos rectas son paralelas y la otra las corta.
b) Dos rectas coinciden y la otra es paralela.
c) Si b∗2 = 0, b∗3 = 0, hay dos ecuaciones 0=k que son imposibles, el sistema es incompatible.
Geométricamente, las tres rectas son paralelas o dos son coincidentes y una paralela.
En cada uno de los casos, para determinar la posición concreta de las rectas, basta representarlas.
9 22
Figura 7.5: Solución del sistema. Las tres rectas se cortan en un punto: P= ,
7 7
se observa
que las rectas se cortan en un punto, precisamente el punto solución del sistema: P =
9 22
, .
7 7
Ejercicios
a) Resuelve e interpreta geométricamente los sistemas:
x+y =0 x − y = −2 2x + y = 2
a) −x + y = 2 b) x + 2y = 1 c) −x + y = −3
x + 3y = −2 4x − 10y = −14 y = −2x
b) Discute y resuelve en función del parámetro:
x−y = 1 2x + y = 3
a) x + 2y = −1 b) −x + 3y = 0
2x + my = 0 mx + 4y = 3
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 117
* Son coincidentes: Lo cuál es fácil de saber porque sus correspondientes ecuaciones tienen coefi-
cientes de las incógnitas y los términos independientes proporcionales, es decir, si los planos son:
α ≡ Ax + By + Cz = D
β ≡ A x + B y + C z = D
entonces se verifica:
A B C D
= = =
A B C D
(siempre que se puedan realizar las divisiones).
Por ejemplo, los planos 2x + 3y − z = 5, y −10x − 15y + 5z = −15 son coincidentes.
* Son paralelos: También es sencillo de saber porque los coeficientes de las incógnitas son propor-
cionales, pero los términos independientes NO. Es decir, en este caso:
α ≡ Ax + By + Cz = D
β ≡ A x + B y + C z = D
entonces se verifica:
A B C D
= = =
A B C D
(siempre que se puedan realizar las divisiones).
Por ejemplo, los planos 2x + 3y − z = 5 y −10x − 15y + 5z = 7 son paralelos.
* Son secantes: Simplemente los coeficientes no son proporcionales, es decir:
α ≡ Ax + By + Cz = D
β ≡ A x + B y + C z = D
entonces se verifica:
A B C D
= = =
A B C D
(siempre que se puedan realizar las divisiones, y basta con que un par de ellas correspondientes a las
incógnitas sean diferentes).
Por ejemplo, los planos 7x + 3y − z = 5 y −10x − 15y + 5z = 7 son secantes.
Puesto que podemos determinar la posición de los planos 2 a 2, podemos determinar en qué posición
se encuentran los 3 a la vez, fijándonos en los casos:
1. Si el sistema es S.C.D. (Solución única), es que los tres planos se cortan en un punto, que es la
solución del sistema.
Lo que indica que el sistema es incompatible y por tanto no tiene solución, los planos no tienen puntos
comunes.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 120
Se obtienen dos valores distintos de z, lo que es absurdo y el sistema en este caso no tiene solución
(S.I.)
Conclusión:
* Si m = 1 S.I.
* Si m = 1 S.C.D.
Ejercicios:
1. Discutir en función del parámetro desconocido los sistemas siguientes e interpretar geométrica-
mente el resultado:
x + y + az = 1 x + y − 6z = 0
a) x + ay + z = 1 b) x − 2y + 6z = 0
ax + y + z = 1 3x + −y + mz = 0
3x + y + 2z = 1 − a x + y + az = a2
c) (1 + a)x + 2y + z = a d) x + ay + z = a
ax − y + z = 1 − a ax + y + z = 1
x + 2y − z = 8
2. Dado el sistema 2x − 3y + z = −1 , se pide:
3x − y + kz = 5
a) Hallar el valor de k que hace el sistema incompatible.
b) Hallar el valor de k que hace el sistema compatible y además z= -1.
c) Para el valor de k hallado en b), resolver el sistema.
A·X =B
donde A,X y B son las matrices ya definidas de coeficientes, incógnitas y términos independientes
respectivamente.
Como el objetivo es calcular la matriz X de incógnitas, el problema estarı́a resuelto si conseguimos
despejar X de dicha ecuación.
Sabemos que eso se puede hacer sólo cuando la matriz A posee inversa, y en ese caso aplicarı́amos
que:
A · X = B =⇒ A−1 · A · X = A−1 · B =⇒ I · X = A−1 · B =⇒ X = A−1 · B
es decir podrı́amos calcular X, y el sistema tendrı́a solución única.
Si A no posee inversa, no podemos despejar X y el sistema no se puede resolver de esta manera.
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 122
Conclusión: En un sistema cuadrado y cuya matriz de coeficientes tenga inversa, la solución del
sistema viene dada por:
X = A−1 · B
2x + y − z = 11
Ejemplo: Resolver, aplicando la inversa, el sistema: x − 3y = −20 .
4x + 2y + 5z = 8
2 1 −1
La matriz de coeficentes es 1 −3 0 .
4 2 5
Para poder aplicar lo anterior es necesario que A tenga inversa, lo que por ejemplo comprobamos
haciendo det (A).
Como det(A) = −49, no nulo, A tiene inversa. Por tanto y según lo dicho,X = A−1 · B , es decir:
−1
x 2 1 −1 11
y = 1 −3 0 · −20
z 4 2 5 8
y por tanto, 15
1 3
x 49 7 49 11 1
y = 5 −2 1
· −20 = 2
49 7 49
−2 1
z 49 0 7 8 7
es decir x=1, y=7 , z=-2 , solución que ya habı́amos obtenido utilizando el método de Gauss.
La regla de Cramer:
Para un sistema de Cramer (cuadrado y con matriz regular) se verifica que la incónita número k
se calcula dividiendo entre el determinante de A el determinante que resulta de sustituir la columna
k (correspodiente al lugar que ocupe la incógnita que se está calculando) por la columna de términos
independientes.
2x + y − z = 11
Ejemplo: Resolver el sistema x − 3y = −20 .
4x + 2y + 5z = 8
Como el sistema es de Cramer puesto que det(A) = −49, aplicamos la regla de Cramer:
Para x sustituimos la primera columna por la de términos independientes pues x es la primera
incógnita:
11 1 −1
−20 −3 0
8 2 5 −49
x= = =1
−49 −49
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 123
Para y sustituimos la segunda columna por la de términos independientes pues y es la segunda incógni-
ta.
2 11 −1
1 −20 0
4 8 5 −343
y= = =7
−49 −49
Para z sustituimos la tercera columna por la de términos independientes pues z es la tercera incógnita).
2 1 11
1 −3 −20
4 2 8 98
x= = = −2
−49 −49
Y obtenemos la solución como antes.
Recordemos que esto sólo se puede aplicar para sistemas de Cramer.
Teorema de Rouché-Frobenius:
Un sistema cualquiera de matriz A y matriz ampliada (A|B) tiene solución (es compatible) si y
solamente si Rg(A) = Rg(A|B).
Por tanto si los dos rangos son distintos el sistema no tiene solución (S.I.).
Además, si dicho rango coincide con el número de incógnitas del sistema, la solución es única
(S.C.D.), y si dicho rango es menor que el número de incógnitas, hay infinitas soluciones (S.C.I.).
Es importante darse cuenta de que Rg(A) ≤ Rg(A|B), puesto que la matriz de coeficientes forma
parte de la ampliada, es decir, la matriz A no puede tener rango mayor que la ampliada.
Aún siendo importante, el único problema que plantea este teorema es que NO ofrece ningún método
para calcular la solución, sólamente dice si hay solución o no.
Ejercicio: Aplicar el teorema de Rouché para determinar el tipo de sistema que es:
x+y−z+t = 4 2x − y = 1 x + 3y = 3
3x + 3y − z = −1
a) 2x − y + 3z + 2t = −1 b) x + 3y = −2 c) 3x + 5y = 7 d)
x + y − 5z = 2
−4x + 5y − 11z − 4t = 11 5x − 4y = 7 2x + 4y = 5
CAPÍTULO 7. SISTEMAS DE ECUACIONES LINEALES 124
Ejercicios:
TEST DE HIPÓTESIS
5.1. Introducción
En este tema trataremos el importante aspecto de la toma de decisiones, referida a decidir si un
valor obtenido a partir de la muestra es probable que pertenezca a la población.
En general, la media (o proporción) en una muestra suele ser distinta a la media de la población,
de la cuál se extrae la muestra. Lo normal suele ser que tal diferencia entre la media muestral y
poblacional sea pequeña y debida al azar, pero podrı́a suceder que dicha diferencia no esté justificada
por el azar y se deba a un cambio en la población, y debamos modificar los datos que conocemos
previamente.
Ejemplos:
a) Hace algunos años, la media de estatura de los españoles adultos varones era de 170 cm y su
desviación tı́pica 9 cm. Pasado el tiempo, un muestreo realizado a 36 adultos da una medida de 172
cm. ¿Puede afirmarse que esa diferencia de 2 cm es debida al azar o realmente la estatura media ha
aumentado?.
b) Supongamos que, respecto a una determinada ley, el 52 % de los ciudadanos está en contra.
Pasado el tiempo, una encuesta realizada a 400 personas indica que los ciudadanos en contra han
descendido hasta el 49 %.¿Ha cambiado realmente la opinión pública o tal resultado es debido al
azar?.
c) El porcentaje de aprobados en las PAU en un determinado distritouniversitario ha sido del 82 %.
En una ciudad de ese distrito, el porcentaje de aprobados fue del 86 %. ¿Puede afirmarse con un nivel
de confianza del 90 % que los resultados en esa ciudad son superiores a la media?.
Los métodos de decisión estadı́stica están ligados a los de estimación de parámetros mediante los
intervalos de confianza, aunque también aparecerán otros nuevos conceptos.
Llamaremos hipótesis nula, y se representa por H0 , a la hipótesis que se formula y por tanto se quiere
contrastar o rechazar, e hipótesis alternativa, y se representa por H1 , a cualquier otra hipótesis que
sea diferente de la formulada, y que sea contraria a H0 , de forma que la aceptación de la hipótesis nula
H0 implica el rechazo de la alternativa H1 y viceversa, el rechazo de H0 implica la aceptación de H1 .
72
CAPÍTULO 5. TEST DE HIPÓTESIS 73
En un problema de contraste de hipótesis, pues, siempre tiene que formularse una hipótesis nula H0 ,
y ha de ir acompañada de una alternativa, H0 que es la que aspira a desplazar a la nula.
Ejemplo: Un investigador afirma que la temperatura del cuerpo humano en un adulto sano se distri-
buye según una normal de media µ = 37º C y desviación tı́pica σ = 0 9º C. Formular la hipótesis
nula y la hipótesis alternativa
A la vista de los datos, el investigador afirma que la temperatura media del cuerpo humano es 37º,
es decir la hipótesis o conjetura que formula es:
H0 = 37 (hipótesis nula)
Como hipótesis alternativa, hemos de tomar aquella contraria a esta, que la media sea distinta de 37º
C, es decir:
H1 = 37 (hipótesis alternativa)
Si la hipótesis nula fuese del tipo µ ≥ k la hipótesis alternativas serı́a:µ < k.
5.3. Errores
Hay ocasiones en que la hipótesis nula, H0 , es cierta, pero a la vista de la muestra tengamos que
rechazarla. En tal caso, estamos cometiendo un error.
El error que consiste en rechazar la hipótesis nula cuando ésta es verdadera, se denomina error de
tipo I.
Otro tipo de error puede ocurrir cuando, siendo H0 falsa, las evidencias de la muestra, sin embargo,
nos lleven a aceptarla.
Este error, cometido al aceptar cuando ésta es falsa, se denomina error de tipo II. Resumiendo:
Situación
H0 verdadera H1 verdadera (H0 falsa)
Mantener H0 Decisión correcta Decisión incorrecta:
Probabilidad=1 − α ERROR DE TIPO II
Decisión Probabilidad=β
y
α = p (Aceptar H0 /H0 es cierta)
Por otra parte:
β = p (Aceptar H0 /H0 es falsa) = p(Error de tipo II)
y
1 − β = p (Rechazar H0 /H0 es falsa)
A la probabilidad 1 − β se le denomina potencia del contraste.
CAPÍTULO 5. TEST DE HIPÓTESIS 74
2. Contraste unilateral (o de una cola): En este caso la región crı́tica está formada por un
sólo conjunto de puntos.
Como se observa en las figuras, el nivel de significación α se concentra sólo en una parte o cola.
Este caso se presenta cuando la hipótesis nula es del tipo H0 : µ ≥ k (o bien H0 : p ≥ k) y la
hipótesis alternativa, por tanto, es del tipo H1 : µ < k (o bien H1 : p < k).(También si aparece
≤)
A nivel de confianza 1 − α, las regiones serı́an, en la N(0;1):
o bien
p·q
p − zα · ,∞
n
Las correspondientes regiones crı́ticas serán:
σ
−∞, µ − zα · √
n
o bien:
p·q
−∞, p − zα ·
n
En todos los casos, conociendo el nivel de confianza 1 − α, tendremos que determinar el valor z α2
(para contrastes bilaterales) o bien zα (para contrastes unilaterales), que separa las regiones de rechazo
y aceptación.
Algunos de estos valores más comunes se dan en la tabla adjunta, que en los bilaterales son los
mismos que para intervalos de confianza o probabilidad, ya vistos con anterioridad:
Figura 5.4: Valores más comunes para contrastes bilaterales y unilaterales derechos. Los correspon-
dientes para los unilaterales izquierdos son negativos.
3. Determinar la distribución que sigue el parámetro muestral (x o p̂) y en base a ella y al valor
obtenido en la etapa anterior, escribir las correspondientes regiones de aceptación y rechazo.
4. Calcular el estadı́stico usado en la prueba (en nuestro caso, calcular media muestral x o propor-
ción muestral p̂, a partir de la muestra).
5. Aplicar el test,es decir, dependiendo de si el estadı́stico cae en la región de aceptación o de
rechazo, tomar la decisión de aceptar una de las dos hipótesis.
A continuación se ofrecen algunos ejemplos de problemas de test de hipótesis:
1. La vida media de una muestra de 100 tubos fluorescentes producidos por una empresa es de
1570 horas, una desviación tı́pica de 120 horas. Si es la vida media media de los tubos de dicha
empresa, ¿se puede afirmar a nivel de significación 0’05 que la duración media de los tubos es
de 1600 horas?.
Determinar los errores de tipo I y II
Etapa 1: Queremos saber si la duración media de los tubos es de 1600 horas, es decir, que nuestra
hipótesis nula es H0 : µ = 1600.
Por lo tanto, la hipótesis alternativa será que la duración no sea de 1600 horas, es decir, la
hipótesis alternativa es H1 : µ = 1600.
Por tanto estamos ante un contraste bilateral.
Etapa 2: A nivel de significación α = 0 05 =⇒ 1 − α = 0 95, y realizando el dibujo habitual
(hacer como ejercicio), obtenemos que z α2 = z0 025 = 1 96.
Etapa 3: Determinemos la distribución de la media muestral, x, teniendo en cuente que como la
desviación tı́pica de la población no la conocemos, tomamos la muestral, que es s = 120, y por
tanto sabemos que la media muestral sigue una normal:
120
N 1600; √ = N (1600; 12)
100
Por tanto la región de aceptación será el intervalo de probabilidad:
120 120
1600 − √ , 1600 + √ = (1600 − 1 96 · 12, 1600 + 1 96 · 12) = (157648, 162352)
100 100
De modo que, Región de Aceptación:(1576’48,1623’52)
Región de Rechazo: (−∞, 157648) ∪ (162352, ∞)
Etapa 4: En la muestra se ha obtenido que x = 1570.
Etapa 5: Para aplicar el test, simplemente hemos de comprobar si el valor de está dentro de la
región de aceptación o de la de rehazo.
Como en este caso se observa que
/ (157648, 162352)
1570 ∈
es decir, 1570 no está en la región de aceptación, sino en la de rechazo.
Por tanto, hemos de rechazar que la media es 1600 (hipótesis nula) y aceptar la alternativa.
A este nivel de confianza no se puede afirmar que la duración media de los tubos sea de 1600
horas.
En cuanto a los errores:
Error de tipo I es afirmar que la duración media no es de 1600 horas cuando en realidad sı́ lo es.
Error de tipo II es afirmar que la duración media es de 1600 horas cuando en realidad no lo es.
CAPÍTULO 5. TEST DE HIPÓTESIS 78
2. Una encuesta, realizada a 64 empleados de una fábrica, concluyó que el tiempo medio de duración
de un empleo en la misma era de 6’5 años con una desviación tı́pica de 4. ¿Sirve esta afirmación
para aceptar, con un nivel de significación del 5 %, que el tiempo medio de empleo en esa fábrica
es menor o igual que 6? Justificar adecuadamente la respuesta.
El enunciado no puede ser más claro a la hora de determinar las hipótesis nula y alternativa.
Queremos comprobar si el tiempo medio de empleo en esa fábrica es menor o igual que 6, luego
la hipótesis alternativa será que dicho tiempo medio de empleo sea MAYOR que 6, es decir:
H0 : µ ≤ 6
H1 : µ > 6
Para calcular el nivel zα = z0 05 , y por tanto z0 05 = 1 645. Ası́ pues, la región de aceptación es,
puesto que µ = 6 , s = 4 y n = 64, resulta ser, aproximadamente:
(−∞, 6 8225)
Y la región crı́tica:
(6 8225, ∞)
H0 : p ≥ 0 4
H1 : p < 0 4
Y la de rechazo:
pq
−∞, p − zα
n
Para calcular el nivel zα = z0 01 , y por tanto z0 01 = 2 33. Ası́ pues, la región de aceptación es,
puesto que p = 0 4 , q = 0 6 y n = 200, resulta ser, aproximadamente:
(0 3192, ∞)
Y la región crı́tica:
(−∞, 0 3192)