Sei sulla pagina 1di 279

Probabilidades

1
Captulo 1. Probabilidades
1.1 Modelos matemticos
La aplicacin de las matemticas para describir el universo es una prctica que ha dado muy
buenos resultados durante siglos. Las matemticas conforman un lenguaje completamente lgico que
puede aplicarse a la descripcin de la naturaleza porque los sucesos y los objetos de la naturaleza tie-
nen propiedades que ofrecen un paralelo suficiente a las matemticas. Aunque la descripcin de la na-
turaleza en trminos matemticos nunca es completamente exacta, hay suficiente concordancia entre
las formas de la naturaleza y las de la expresin matemtica para que la descripcin sea aceptable. La
aproximacin es a menudo tan grande que una vez que se ha aplicado la descripcin matemtica, se
puede proseguir con esa lgica matemtica para hacer deducciones que tambin se apliquen a la natu-
raleza.
1.1.1 Definiciones:
Se denomina experimento a la reproduccin controlada de un fenmeno cualquiera que ocurre
en la naturaleza.
Un modelo matemtico se emplea para describir un fenmeno que ocurre en la naturaleza, y
puede ser: determinstico o no determinstico.
Un modelo es determinstico cuando las condiciones bajo las cuales se verifica el experimento
determinan su resultado. Por ejemplo: si se deja caer un cuerpo en el vaco, desde una altura h, hasta el
piso, la velocidad que alcanza es:
gh v 2 =

Este modelo determina la velocidad con que el cuerpo cae al piso todas las veces que se repita el
experimento, si se repiten las mismas condiciones del experimento.
Un modelo es no determinstico o probabilstico cuando las condiciones bajo las cuales se veri-
fica el experimento no determinan su resultado. Segn el fenmeno que se estudie, es posible determi-
nar un modelo. Por ejemplo: si se quiere saber cuntos autos llegan a una gasolinera entre las 7 y las 8
a.m.; con base en datos histricos se puede disear un modelo que d un resultado aproximado con
cierto grado de confiabilidad. La forma de disear este modelo se ver en el captulo 4. Se sabr, por
ejemplo, qu tan probable es que no llegue ningn vehculo, que lleguen menos de 5 vehculos, que
lleguen entre 6 y 10 vehculos, o que lleguen entre 11 y 15 vehculos, etc.
A diferencia del experimento anterior, no es posible mantener las mismas condiciones del expe-
rimento, pues no estn al alcance del que investiga.
1.1.2 Caractersticas de un fenmeno probabilstico:
Sin cambiar las condiciones bajo las cuales se verifica el experimento, se pueden obtener dis-
tintos resultados.
Se puede describir el conjunto de todos los resultados posibles.
Inicialmente los resultados parecen ocurrir en forma caprichosa; pero cuando el experimento
se repite muchas veces, aparece un modelo definido de regularidad que hace posible la cons-
truccin de un modelo matemtico preciso, con el cual se puede analizar el fenmeno.
Probabilidades

2
1.2 Permutaciones y combinaciones
Para calcular ciertas probabilidades es necesario calcular permutaciones y combinaciones. Para
un mejor entendimiento de estas definiciones se emplean ejemplos sencillos, muchos de los cuales tie-
nen relacin con los juegos de azar, aunque puedan resultar poco tiles para efectos prcticos.
Una permutacin es un arreglo, en un determinado orden, de un conjunto de elementos. Por
ejemplo, con las letras del abecedario se pueden formar las siguientes permutaciones de dos letras: ab,
ba, ac, ca, bc, cb,..., xy, yx, yz, zy.
Una combinacin es un arreglo, sin que importe el orden, de un conjunto de elementos. Por
ejemplo, con las letras del abecedario se pueden formar las siguientes combinaciones de tres letras:
abc, abd, abe,..., bcd, bce, bcf,..., cde,..., xyz.
1.2.1 Teoremas relativos a permutaciones y combinaciones
TEOREMA 1: El nmero de permutaciones de r elementos que se pueden formar a partir de un
conjunto de N elementos diferentes, es:
)! (
!
) , (
r N
N
r N P

=
Se demuestra este teorema de la siguiente manera: para escoger el primer elemento hay N posi-
bilidades, para escoger el siguiente hay (N 1) posibilidades, luego (N 2) posibilidades, y as suce-
sivamente. Se deduce que, para escoger el r-simo elemento hay N (r 1) posibilidades. El nmero
de formas en que se pueden permutar estas posibilidades es: N (N 1) (N 2)...N (r 1), que es
igual al cociente dado por el teorema.
Ejemplo 1:
Cuntos nmeros de tres dgitos pueden formarse con los dgitos impares?
N = 5 (los dgitos impares son: 1, 3, 5, 7, 9)
r = 3
)! 3 5 (
! 5
) , (

= r N P = 60
Pueden formarse 60 nmeros diferentes con los dgitos impares.
Ejemplo 2:
Se va a realizar una prueba de atletismo con 6 participantes. De cuntas formas se pueden en-
tregar las medallas para los tres primeros puestos?
N = 6
r = 3
)! 3 6 (
! 6
) , (

= r N P = 120
Las medallas para los tres primeros puestos se pueden entregar de 120 formas diferentes.

COROLARIO 1: El nmero de permutaciones de N elementos que se pueden formar a partir de
un conjunto de N elementos diferentes, es:
! ) , ( N N N P =
Ejemplo:
Cuntos nmeros de cinco dgitos pueden formarse con los dgitos impares?
N = 5 (los dgitos impares son: 1, 3, 5, 7, 9)
Probabilidades

3
120 ! 5 ) , ( = = N N P
Pueden formarse 120 nmeros diferentes empleando los cinco dgitos impares.

COROLARIO 2: Dado un grupo de N elementos, conformado por k grupos diferentes, de tal
forma que n
1

elementos iguales conforman el primer grupo, n
2

elementos iguales conforman el segun-
do grupo, ..., n
k

elementos iguales conforman el k-simo grupo, donde n
1

+ n
2

+ ... + n
k

= N ; el nme-
ro de permutaciones que pueden formarse, tomando los N elementos a la vez, es:
! ..., ! !
!
) ..., , , ; (
2 1
2 1
k
k
n n n
N
n n n N P =
Este corolario puede comprobarse siguiendo el siguiente razonamiento: si los elementos del
primer grupo fuesen diferentes, el nmero total de permutaciones que pueden formarse quedara mul-
tiplicado por n
1
!; y si los elementos del segundo grupo tambin fuesen diferentes, el total anterior que-
dara multiplicado por n
2
!; y si, al igual que los grupos anteriores, los elementos del k-simo grupo
tambin fuesen diferentes, el total tambin quedara multiplicado por n
k
!; resultando finalmente que el
nmero total de permutaciones con N elementos diferentes es N!, como era de esperarse.
Ejemplo:
Cuntos nmeros pueden formarse con los siguientes dgitos: 1, 1, 1, 1, 2, 2, 3, 4, 5, 5, 5, to-
mando todos a la vez?
P(11; 4, 2, 1, 1, 3) = 11!/ 4! 2! 1! 1! 3! = 138 600
Pueden formarse 138 600 nmeros diferentes.

TEOREMA 2: El nmero de permutaciones de r elementos que se pueden formar a partir de un
conjunto de N elementos diferentes, si se admite repeticin de los elementos, es:
r
R
N r N P = ) , (

La demostracin es similar a la del teorema 1, con la diferencia de que, para escoger cada uno de
los r trminos, hay siempre N posibilidades, resultando N N ... N, (r veces), es decir, N
r
permu-
taciones.
Ejemplo:
Cuntos nmeros de tres cifras pueden formarse con los dgitos impares, si se admite repeticin
de cualquiera de los dgitos?
P
R

(5, 3) = 5
3
= 125 nmeros

TEOREMA 3: El nmero de combinaciones de r elementos que se pueden formar a partir de un
conjunto de N elementos diferentes, es:
)! ( !
!
) , (
r N r
N
r N C

=

Se demuestra este teorema considerando que C(N, r) multiplicado por el nmero de permutacio-
nes que se pueden formar con los r elementos, r!, debe ser igual a P(N, r), es decir, N! / (N r)!
Ejemplo:
Un profesor quiere escoger 8 alumnos de un conjunto de 15. De cuntas formas puede hacerlo?
Resulta evidente que no importa el orden en que se escogen los 8 alumnos
Probabilidades

4
)! 8 15 ( ! 8
! 15
) 8 , 15 (

= C = 6 435
El profesor puede escoger 8 alumnos de 6 435 formas.
TEOREMA 4: El nmero de combinaciones de r elementos que se pueden formar a partir de un
conjunto de N elementos diferentes, si se admite repeticin de los elementos, es:
)! 1 ( !
)! 1 (
) , (

+
=
N r
r N
r N C
R

Se demuestra por induccin matemtica:
Para un conjunto de N elementos, sea r = 2. Se podrn formar las siguientes combinaciones:
(1,1), (1,2), (1,3), (1,4), , (1,N) N
(2,2), (2,3), (2,4), , (2,N) N 1
(3,3), (3,4), , (3,N) N 2 N +(N 1)+(N 2) + + 1 =
2
) 1 ( + N N
=
|
|
.
|

\
| +
2
1 N


(N,N) 1

Para r = 3 se podrn formar las siguientes combinaciones:
Cuando el primer dgito es 1:
(1,1,1), (1,1,2), (1,1,3), (1,1,4), , (1,1,N)
(1,2,2), (1,2,3), (1,2,4), , (1,2,N)
(1,3,3), (1,3,4), , (1,3,N)
|
|
.
|

\
| +
2
1 N


(1,N,N)

Cuando el primer dgito es 2:
(2,2,2), (2,2,3), (2,2,4), , (2,2,N)
(2,3,3), (2,3,4), , (2,3,N)
(2,4,4), , (2,4,N)
|
|
.
|

\
|
2
N


(2,N,N)
Cuando el primer dgito sea 3, resultar:
|
|
.
|

\
|
2
1 N

Y as, cuando el primer dgito sea N, resultar:
|
|
.
|

\
|
2
2
= 1
Considerando la siguiente propiedad:

|
|
.
|

\
|
k
N
=
|
|
.
|

\
|

1
1
k
N
+
|
|
.
|

\
|

1
2
k
N
+ +
|
|
.
|

\
|

1
1
k
k

El nmero de combinaciones para r = 3 ser:

|
|
.
|

\
| +
2
1 N
+
|
|
.
|

\
|
2
N
+
|
|
.
|

\
|
2
1 N
+ + 1 =
|
|
.
|

\
| +
3
2 N

Probabilidades

5
Por induccin, el nmero de combinaciones, para r = 4 ser:
|
|
.
|

\
| +
4
3 N

Y as, para r, el nmero de combinaciones ser:
|
|
.
|

\
| +
r
r N 1
=
)! 1 ( !
)! 1 (

+
N r
r N

Ejemplo:
Un club est conformado por ingenieros, administradores, mdicos, contadores y economistas.
Considerando estas profesiones, de cuntas formas se puede formar un comit de tres profesio-
nales?
N = 5
r = 3

)! 3 7 ( ! 3
! 7
) 3 , 5 (

=
R
C = 35

Problemas resueltos
1) Se extrae una mano de 5 cartas de una baraja completa.
a) Cuntas manos distintas se pueden obtener?
960 598 2
! 5 ! 47
! 52
) 5 , 52 ( = = C
b) En cuntas de estas manos habrn tres ases?

Se tiene que calcular el nmero de formas en que se pueden escoger 3 ases de un total de 4 y
luego 2 cartas cualesquiera (sin considerar el as que queda) de las 48 restantes.
512 4
! 2 ! 46
! 48
! 1 ! 3
! 4
) 2 , 48 ( ) 3 , 4 ( = = C C
2) De cuntas maneras se pueden sentar 6 personas en una banca, de tal manera que dos de ellas,
Elena y Graciela, nunca estn juntas?
Para conseguir esto, conviene suponer que Elena y Graciela conforman un solo elemento, para
calcular as el nmero de formas en que se pueden permutar 5 elementos, multiplicado por 2,
pues Elena y Graciela pueden permutarse. Este resultado se resta del nmero de formas en que
se pueden permutar 6 elementos.
480 240 720 ) 5 , 5 ( 2 ) 6 , 6 ( = = P P
3) De cuntas maneras se puede elegir un comit de 4 personas de un grupo de 10 personas, de tal
manera que est el nico abogado del grupo?
Primero se calcular el nmero de formas en que se puede escoger el nico abogado y luego el
nmero de formas en que se puede escoger las 3 personas restantes, de las 9 que quedan.
84 ) 3 , 9 ( ) 1 , 1 ( = C C
4) En un aula de 30 alumnos hay 20 deportistas, de los cuales 8 practican deportes individuales y
12 deportes colectivos.
a) Cuntos grupos de 5 alumnos se pueden formar?
Como no importa si los 5 alumnos son o no deportistas, el nmero de grupos de 5 alumnos
que se pueden formar es:
C(30, 5) = 142 506
Se pueden formar 142 506 grupos de 5 alumnos.
Probabilidades

6
b) En cuntos grupos todos son deportistas?
Ahora hay que calcular el nmero de formas en que se pueden escoger 5 deportistas de un
total de 20.
C(20, 5) = 15 504
Se pueden formar 15 504 grupos donde todos son deportistas.
c) En cuntos grupos hay 3 que practican deportes colectivos?
Como hay 12 alumnos que practican deportes colectivos y el resto no, hay que calcular el
nmero de formas en que se puede escoger 3 de esos 12 alumnos, y luego 2 de los restantes
18.
C(12, 3) C(18, 2) = 33 660
Se pueden formar 33 660 grupos donde haya tres alumnos que practican deportes colectivos.
d) En cuntos de los grupos donde todos son deportistas hay 3 que practican deportes colecti-
vos?
Considerando slo los grupos donde todos los alumnos son deportistas, hay 12 alumnos que
practican deportes colectivos y el resto, 8, deportes individuales; se calcula entonces el n-
mero de formas en que se puede escoger 3 de esos 12 alumnos y luego 2 de los 8 restantes.
C(12, 3) C(8, 2) = 6 160
De los grupos donde todos son deportistas, hay 6 160 grupos donde 3 practican deportes co-
lectivos
e) En cuntos grupos hay al menos un alumno que no practica deportes individuales?
Resulta ms prctico calcular el nmero de grupos donde no haya ningn alumno que no
practique deportes individuales (todos practican deportes individuales) y restarlo del total de
grupos que se pueden formar.
C(30, 5) C(8, 5) = 142 450
Se pueden formar 142 450 grupos donde al menos un alumno no practica deportes indivi-
duales
5) Las letras a, b, b, c, d, d, d se distribuyen al azar.
a) Cuntos arreglos distintos pueden hacerse?
Considerando los 4 subgrupos que hay:
P(7; 1, 2, 1, 3) = 420
Se pueden hacer 420 arreglos distintos.
b) En cuntos de estos arreglos las 3 letras d quedan juntas?
Si las 3 letras d quedan juntas, pueden considerarse como un solo elemento:
P(5; 1, 2, 1, 1) = 60
En 60 arreglos las 3 letras d quedan juntas.
6) Cuntos nmeros de tres cifras pueden formarse con los dgitos 1, 2, si se admite repeticin?
N = 2
r = 3
N
r
= 2
3
= 8
Se pueden formar 8 nmeros.
Probabilidades

7
1.3 Experimentos y eventos
Como ya se ha definido, un experimento es la reproduccin controlada de un fenmeno. En Es-
tadstica slo se consideran experimentos que se pueden representar mediante modelos probabilsticos.
A los resultados de los experimentos se les denomina eventos, los cuales pueden ser simples o
compuestos. Los eventos compuestos pueden contener dos o ms eventos simples.
1.4 Espacio muestra.
Es la representacin de todos los eventos posibles de un experimento. Esta representacin puede
ser grfica o analtica, como se ve en los siguientes ejemplos.
1.5 Variable aleatoria.
Es una funcin definida sobre un espacio muestra S, donde a cada evento del espacio muestra le
corresponde un nmero real:
X(e
i
) = x
i
Una variable aleatoria puede ser:
Discreta: si el nmero de eventos posibles es finito o numerablemente infinito.
Continua: si el nmero de eventos posibles es infinito (no numerable).
Dado un espacio muestra, se pueden definir varias variables aleatorias, como se ver en los si-
guientes ejemplos.

Problemas resueltos
1) Un experimento consiste en lanzar 2 monedas. La moneda puede mostrar cara (C) o sello (S).
El espacio muestra, que consta de 4 eventos simples, ser:
S = {CC, CS, SC, SS}
Grficamente, este espacio muestra se puede representar de dos formas (figura 1.1):

Figura 1.1. Representaciones de espacio muestra del lanzamiento de dos monedas
Un evento compuesto puede ser, por ejemplo, el resultado una cara y un sello: E = {CS, SC}
Para el espacio muestra S se podran definir las siguientes variables aleatorias:
X = Nmero de caras
Cara
Sello
Cara
Sello
Cara
Sello
Primer
lanzamiento
Segundo
lanzamiento
Primer
lanzamiento
Segundo
lanzamiento
Cara Sello
Cara
Sello
Probabilidades

8
Y = Nmero de sellos
Z = Nmero de caras Nmero de sellos
W = 2(Nmero de caras) + (Nmero de sellos)
2

etc.
En todos estos casos la variable aleatoria es discreta.
2) Un experimento consiste en lanzar 2 dados (o lanzar un dado dos veces).
El espacio muestra ser en este caso: S = {(1, 1),(1, 2),...,(1, 6), ...,(6, 6)}. En la figura 1.2 se re-
presenta grficamente este espacio muestra.

Figura 1.2. Representacin de un espacio muestra

Cada interseccin de la figura 1.2 representa un evento simple. Hay, por lo tanto, 36 eventos
simples, es decir, 36 posibles resultados.
Para este espacio muestra, la variable aleatoria se podra definir de las siguientes formas:
X = suma de lo que muestran los dos dados.
Y = (Nmero que muestra el dado 1) (Nmero que muestra el dado 2).
etc.
En todos estos casos la variable aleatoria es discreta.
3) Un experimento consiste en pesar el contenido de caf de una bolsa extrada al final de un pro-
ceso de llenado automtico.
El espacio muestra ser: S = {0,...,700}, suponiendo que las bolsas nunca pueden llegar a pesar
ms de 700 gr.
Grficamente, este espacio muestra se representa en la figura 1.3.
Primer
lanzamiento
Segundo
lanzamiento
1 3 2 6 5 4
6
5
4
3
2
1
Probabilidades

9
Figura 1.3. Representacin del espacio muestra de una variable aleatoria continua.
En este caso la variable aleatoria es continua.
1.6 Probabilidad
Se distinguen tres tipos de probabilidad: a priori, experimental y subjetiva.
1.6.1. Probabilidad a priori:
Si observamos algunos espacios muestra nos daremos cuenta de que, en la mayora de los casos,
todos los eventos simples tienen la misma posibilidad de ocurrencia. Si cuantificamos estas posibilida-
des, llamndoles probabilidades, de tal forma que la suma de stas sea la unidad, se puede entonces
definir la probabilidad de que ocurra un evento simple de la siguiente manera:
P(e
i
) = Nmero no negativo asociado al evento e
i
del espacio muestra S, de tal manera que:
P(e
i
) = 1 y S = e
1
e
2
... e
N

Entonces, si, por ejemplo:
A = e
1
e
2
... e
k


se deduce que:
P(A) = P(e
1
) + P(e
2
) + ... + P(e
k
)
N
k
N N N
A P = + + + =
1
...
1 1
) (
De esta forma, se puede decir que la probabilidad de que ocurra un evento cualquiera es posible
calcularla empleando la siguiente frmula:
total eventos de n
xito eventos de n
N
k
P

= =

Problemas resueltos:
1) Se lanza un dado. Cul es la probabilidad de obtener 5?
P = 1/6
2) Se lanzan dos dados. Cul es la probabilidad de obtener suma 5?
P = 4/36 = 1/9
...de obtener suma menor que 5?
P = (1 + 2 + 3)/36 = 6/36 = 1/6
3) Se lanzan dos monedas. Cul es la probabilidad de obtener dos caras?
Eventos posibles: {CC, CS, SC, SS} Eventos xito: {CC}
P = 1/4
Cul es la probabilidad de obtener slo una cara?
P = (1 + 1)/4 = 2/4 = 1/2
4) En un lote de 100 pernos hay 4 defectuosos. Si un comprador escoge 20 pernos aleatoriamente,
cul es la probabilidad de que se lleve 2 pernos defectuosos?
Peso (gr)
700
Probabilidades

10
El comprador se lleva 2 pernos defectuosos, de un total de 4, y 18 pernos no defectuosos, de un
total de 96. Entonces:
1531 , 0
) 20 , 100 (
) 18 , 96 ( ) 2 , 4 (
= =
C
C C
P
Ahora, el lector debe estar en condiciones de contestar la siguiente pregunta: cul es la proba-
bilidad de que el comprador se lleve al menos dos pernos defectuosos?
5) De una baraja completa de 52 cartas, se extrae una "mano" de 5 cartas. Cul es la probabilidad
de obtener:
a) dos espadas, dos corazones y un diamante?
Hay que determinar el nmero de formas en que se pueden escoger 2 espadas de un total de
13, y luego 2 corazones de un total de 13 y luego un diamante de un total de 13.
0304 , 0
) 5 , 52 (
) 1 , 13 ( ) 2 , 13 ( ) 2 , 13 (
= =
C
C C C
P
b) un pker? (cuatro cartas con la misma numeracin o letra)

4
10 4 , 2
) 5 , 52 (
) 1 , 48 ( ) 1 , 13 (

= =
C
C C
P
1.6.2. Probabilidad experimental
En algunas ocasiones, los posibles resultados de un experimento no tienen la misma probabili-
dad de ocurrencia, lo cual dificulta la prediccin de estas probabilidades.
Si un experimento de esta naturaleza se repitiera muchas veces, podramos ver la frecuencia con
que ocurriran los posibles resultados. Mientras ms veces se repita el experimento, las frecuencias re-
lativas se aproximarn cada vez ms a las verdaderas probabilidades de ocurrencia de cada uno de di-
chos resultados. Entonces:
N
f
erimento el repite se que veces de n
resultado un ocurre que con frecuencia
P =

=
exp

En la prctica, la mayora de las probabilidades slo pueden determinarse por la va experimen-
tal. Si, por ejemplo, se quiere saber cul es la probabilidad de que un foco funcione por lo menos las
horas que especifica el fabricante, se tendr que tomar una muestra grande de focos (N) y ver cuntos
de stos cumplen con dicha especificacin (f). Cuanto ms grande sea N, el cociente f / N se aproxima-
r ms a la probabilidad requerida. Como se ve, la nica forma de calcular una probabilidad de este
tipo es mediante la experimentacin.
En muchas situaciones no hace falta experimentar pues se cuenta con datos histricos suficien-
tes. Por ejemplo, cmo calculara un pastelero la probabilidad de que la demanda de sus pasteles de
manzana en un da sea de 10 a 15 unidades? Necesitara datos de la demanda de N das, para determi-
nar en cuntas ocasiones (f) la demanda fue de 10 a 15 unidades. La probabilidad ser f / N.
Una probabilidad que ha sido calculada "a priori" puede verificarse, con cierta aproximacin,
repitiendo el experimento. Por ejemplo, si queremos comprobar que la probabilidad de obtener dos ca-
ras y un sello, al lanzar tres monedas, es igual a 0,375; tenemos que lanzar las tres monedas una gran
cantidad de veces. A continuacin se muestra la frecuencia con que se obtuvo dicho resultado, luego
de N lanzamientos.
Nmero de lanzamientos (N) 10 20 100 200 500 1 000 10 000
Frecuencia observada (f) 5 9 34 76 162 367 3 738
Probabilidad (f /N) 0,5 0,45 0,35 0,385 0,352 0,365 0,3724

Probabilidades

11
Se puede concluir entonces que, conforme N crece, la frecuencia relativa o probabilidad experi-
mental tiende al verdadero valor de la probabilidad. Esta tendencia se visualiza mucho ms en el grfi-
co de la figura 1.4, donde la lnea horizontal representa la probabilidad real: 0,375.

Figura 1.4. Tendencia de una probabilidad experimental
1.6.3 Probabilidad subjetiva
En muchas ocasiones se necesita determinar la probabilidad de que ocurra un fenmeno que es
imposible repetir, o cuya repeticin no tiene significado.
Por ejemplo, si se va a construir un puente en cierto lugar, cmo determinar la probabilidad de
que, a 10 m. de profundidad el terreno no sea arenoso sino de arcilloso? En este caso, la probabilidad
de que ocurra dicho suceso no puede ser ms que una medida subjetiva del grado de confianza que
tenga un especialista para predecirlo. Si l opina que dicha probabilidad es de 0,25; estar expresando
un grado de credibilidad de su juicio; pues el terreno ser arcilloso o no, pero no ser arcilloso en el
25% de las observaciones que se haga.
La precisin de una probabilidad subjetiva depende de la habilidad o conocimiento que tenga
una persona para juzgar una determinada situacin.
La probabilidad subjetiva tambin puede aplicarse a fenmenos repetitivos. Por ejemplo, un ins-
pector que est revisando unos lotes de artculos producidos en una jornada, puede hacer caso omiso a
su experiencia previa, y decidir revisar ms artculos, porque tiene el presentimiento de que este da
hay ms artculos defectuosos de lo habitual.

Ahora que se entiende claramente el concepto de probabilidad, se ve que es correcto afirmar que
una probabilidad se puede interpretar como una proporcin, como una fraccin o como un por-
centaje. Por ejemplo, si, en un supermercado, la probabilidad de elegir aleatoriamente a un cliente con
un consumo mayor de $20, es 0,16; se puede afirmar que el 16% de los clientes gasta ms de $20, o
que la proporcin de clientes que gasta ms de $20 es 0,16.
1.7 Teoremas de probabilidad.
En este apartado se vern una serie de teoremas que son tiles, y en algunos casos indispensa-
bles para calcular ciertas probabilidades.
1.7.1 Suma de probabilidades:
Sean A y B dos eventos definidos en el espacio muestra S. La probabilidad de que ocurra el
evento A o el evento B, o ambos, es:
) ( ) ( ) ( ) ( B A P B P A P B A P + =

donde:
0,30
0,35
0,40
0,45
0,50
10 100 1000 10000
f/N
N
Probabilidades

12
A
S
A B
B
B A
P(A) representa la probabilidad de ocurra A,
P(B) representa la probabilidad de ocurra B,
P(A B) representa la probabilidad de ocurra A o B, o ambos, y
P(A B) representa la probabilidad de ocurran A y B conjuntamente.
Cuando dos o ms eventos estn definidos de tal manera que la ocurrencia de uno imposibilita la
ocurrencia de los dems, se dice que son mutuamente excluyentes, y la probabilidad de que ocurran
conjuntamente es entonces igual a cero.
Se puede deducir que, para dos eventos mutuamente excluyentes, por ejemplo Q y R:
Q = {e
1
,e
2
,e
3
} ; R = {e
4
,e
5
} ;
Es evidente que:
P(Q) = P(e
1
) + P(e
2
) + P(e
3
)
P(R) = P(e
4
) + P(e
5
)
y por lo tanto:
P(Q R) = P(e
1
) + P(e
2
) + P(e
3
)+ P(e
4
) + P(e
5
) = P(Q) + P(R)
Si dos eventos A y B no son mutuamente excluyentes, como se muestra en el diagrama de Venn
de la figura 1.5, se puede deducir que:
Figura 1.5. Eventos A y B no excluyentes

P(A B) = P(A) + P(B A')
P(B) = P(A B) + P(B A')
Sustituyendo P(B A') de la segunda ecuacin en la primera, resulta:
P(A B) = P(A) + P(B) P(A B)
con lo que queda demostrado el teorema.

Ejemplo:
Se lanzan dos dados. Cul es la probabilidad de que se obtenga una suma igual a 10 una dife-
rencia igual a 1?
Sean los eventos: A: suma igual a 10
B: diferencia igual a 1
Dado que A y B son mutuamente excluyentes (es fcil darse cuenta), se puede emplear la si-
guiente frmula:
P(A B) = P(A) + P(B) = 3/36 + 10/36 = 13/36
Probabilidades

13
En el grfico de la figura 1.6 se aprecia que los dos eventos compuestos: el evento A, represen-
tado por crculos, y el evento B, representado por aspas, son mutuamente excluyentes.
Figura 1.6. Eventos A y B mutuamente excluyentes

Y cul ser la probabilidad de obtener una suma igual a 8 una diferencia igual a 2?
Sean los eventos: C: suma igual a 8
D: diferencia igual a 2
En el grfico de la figura 1.7 se aprecian estos dos eventos compuestos: el C, representado por
crculos, y el D, por aspas. Se puede apreciar que hay dos eventos simples que pertenecen a am-
bos eventos C y D; se concluye entonces que los eventos C y D no son excluyentes.
Figura 1.7. Eventos C y D no mutuamente excluyentes
Dado que C y D no son mutuamente excluyentes:
P(C D) = P(C) + P(D) P(C D) = 5/36 + 8/36 2/36 = 11/36

Primer
lanzamiento
Segundo
lanzamiento
1 3 2 6 5 4
6
5
4
3
2
1
Primer
lanzamiento
Segundo
lanzamiento
1 3 2 6 5 4
6
5
4
3
2
1
Probabilidades

14
El teorema de la suma se puede generalizar de la siguiente manera: la probabilidad de que ocurra
el evento E
1
, o el evento E
2
, ..., o el evento E
N
, es:
) ... ( ...
... ) ( ) ( ) ( ... ) ( ) ( ) ... (
2 1
2 1 2 1
N
k j i j i N N
E E E P
E E E P E E P E P E P E P E E E P

+ + + + =

Ejemplo:
Suponga que, en la ciudad de Piura, el 25 % de la poblacin adulta lee el diario El Tiempo, el
40% lee el diario Correo, el 10% lee el diario Repblica y el 25% restante lee otros diarios.
Adems, se sabe que el 10% lee El Tiempo y Correo, el 5% lee El Tiempo y Repblica, el 5%
lee El Tiempo y otros, el 8% lee Correo y otros, y el 3% lee El Tiempo, Correo y otros. Si se se-
lecciona aleatoriamente un poblador, cul es la probabilidad de que lea Correo, El Tiempo u
otros?
Aunque el diagrama de Venn de la figura 8 es suficiente para visualizar y determinar esta proba-
bilidad, a continuacin se hace el clculo aplicando el teorema generalizado de la suma:
P(Correo El T. otros) = P(Correo) + P(El T.) + P(otros) P(Correo El T.)
P(Correo otros) P(El T. otros) + P(Correo El T. otros)
= 0,40 + 0,25 + 0,25 0,10 0,08 0,05 + 0,03 = 0,70
Dicha probabilidad se puede corroborar elaborando un diagrama de Venn, como el de la figura
1.8, e incluso se pueden calcular otras probabilidades con suma facilidad.

Figura 1.8. Diagrama de Venn del problema de los diarios.
1.7.2 Probabilidad condicional y regla de la multiplicacin:
Sean dos eventos A y B:
) (
) (
) \ (
B P
B A P
B A P

=

donde P(A \ B) representa la probabilidad de que ocurra el evento A, dado que ha ocurrido el
evento B, y se le denomina probabilidad condicional.
Ejemplo:
Se lanzaron dos dados y se sabe que la suma result igual a 8. Cul es la probabilidad de que la
diferencia sea igual a 2?
Sean los eventos: A: diferencia igual a 2
B: suma igual a 8
Si la suma es 8, entonces el espacio muestra queda restringido a:
S
B
= {(2,6),(3,5),(4,4),(5,3),(6,2)}
Probabilidades

15
por lo tanto, si de los 5 eventos posibles, se tendra xito en 2 de ellos, (3, 5) y (5, 3):
5 / 2 B) \ ( = A P
Como se ve en la figura 1.7, el numerador "2" representa el nmero de veces en que pueden
ocurrir A y B conjuntamente, y el denominador "5" representa el nmero de veces en que puede
ocurrir B.
Entonces se puede deducir:

) (
) (
/ ) (
/ ) (
) (
) (
B) \ (
B P
B A P
N B N
N B A N
B N
B A N
A P

=

=
Aplicando esta frmula al problema, se tiene el mismo resultado:

5
2
36 / 5
36 / 2
B) \ ( = = A P
De la definicin de probabilidad condicional se puede deducir que:
P(A B) = P(B) P(A \ B)
P(A B) = P(A) P(B \ A)
Estas expresiones resultan muy tiles para determinar una probabilidad conjunta, que usualmen-
te es ms difcil de determinar que la probabilidad condicional.
Ejemplo:
Una caja contiene 4 canicas blancas y 6 negras. Si se extraen dos aleatoriamente, cul es la
probabilidad de que:
a) las dos sean blancas?
Sean los eventos:
1B: canica blanca en la primera extraccin
2B: canica blanca en la segunda extraccin
P(1B 2B) = P(1B) P(2B\1B) = (4/10) (3/9) = 2/15
b) la primera sea blanca y la segunda negra?
Sea el evento 2N: canica negra en la segunda extraccin
P(1B y 2N) = P(1B) P(2N\1B) = (4/10) (6/9) = 4/15
c) una sea blanca y la otra negra?
Sea el evento 1N: canica negra en la primera extraccin
Hay dos formas excluyentes de obtener una canica blanca y una negra:
P = P(1B) P(2N\1B) + P(1N) P(2B\1N) = 4/15 + 4/15 = 8/15

Sean los eventos E
1
, E
2
,..., E
N
; se puede generalizar la regla de la multiplicacin:
) ... \ ( ... ) \ ( ) E \ ( ) ( ) ... (
1 2 1 2 1 3 1 2 1 2 1
=
N N N
E E E E P E E E P E P E P E E E P

En el primer miembro se expresa la probabilidad de que ocurran conjuntamente los eventos E
1
,
E
2
,..., E
N
. Si la probabilidad de que ocurran estos N eventos, en cualquier orden, es siempre la misma;
entonces esa probabilidad se puede obtener multiplicando ) ... (
2 1 N
E E E P por el nmero de for-
mas en que se pueden permutar los N eventos.
Probabilidades

16
Ejemplo 1:
En un lote de 100 pernos hay 4 defectuosos. Si un comprador escoge 20 pernos aleatoriamente,
cul es la probabilidad de que se lleve 2 pernos defectuosos? (Esta probabilidad a priori ya fue
calculada en el ejemplo 4 del apartado 1.6.1).
Si el comprador se lleva 2 pernos defectuosos, de un total de 4; se llevar tambin 18 pernos no
defectuosos, de un total de 96.
1531 , 0
! 18 ! 2
! 20
81
79
...
96
94
97
95
98
96
99
3
100
4
= |
.
|

\
|
|
.
|

\
|
= P
Ejemplo 2:
De una baraja completa de 52 cartas, se extrae una "mano" de 5 cartas. Cul es la probabilidad
de obtener: (Estas probabilidades ya fueron calculadas en el ejemplo 5 del apartado 1.6.1).
a) dos espadas, dos corazones y un diamante?
0304 , 0
! 1 ! 2 ! 2
! 5
48
13
49
12
50
13
51
12
52
13
= |
.
|

\
|
|
.
|

\
|
|
.
|

\
|
= P
b) un pker?
00024 , 0
! 1 ! 4
! 5
48
48
49
1
50
2
51
3
52
52
= |
.
|

\
|
|
.
|

\
|
= P
1.7.3 Eventos independientes
Se dice que dos eventos A y B son independientes, si la ocurrencia (o no ocurrencia) de uno de
ellos no influye en la ocurrencia (o no ocurrencia) del otro. Es decir:
P(A \ B) = P(A) y P(B \ A) = P(B)
Si se cumple una de estas dos ecuaciones, tambin se verifica la otra. Por ejemplo, si:
P(A \ B) = P(A)
Entonces:

P(B)
A) \ ( ) (
) (
) (
) (
B P A P
B P
B A P
A P

=

=
Por lo tanto:
P(B \ A) = P(B), tal como se quera demostrar.
Finalmente se concluye que, para que dos eventos sean mutuamente independientes, es condi-
cin necesaria y suficiente que:
P(A B) = P(A) P(B)
Inversamente, si dos eventos A y B son mutuamente independientes, entonces es vlida la ecua-
cin anterior.

Generalizando, la probabilidad de que ocurran conjuntamente N eventos independientes es:
P(E
1
E
2
... E
N
) = P(E
1
) P(E
2
)...P(E
N
)
Problemas resueltos:
1) Una fbrica elabora los productos A, B, C y D mediante cuatro procesos que son independientes
entre s. Usualmente son defectuosos el 3%, 5%, 5% y 4% de los productos A, B, C y D respec-
tivamente. Si se extrae aleatoriamente un producto de cada tipo, cul es la probabilidad de que:
Probabilidades

17
a) los cuatro sean defectuosos?

6
10 3 04 , 0 05 , 0 05 , 0 03 , 0

= = P
b) A y B sean defectuosos, y C y D no lo sean?

3
10 368 , 1 96 , 0 95 , 0 05 , 0 03 , 0

= = P
2) De una ciudad donde fuman el 30% de los ciudadanos mayores de edad, se toma una muestra de
6 de ellos. Cul es la probabilidad de que 3 de ellos fumen?
Se calcula la probabilidad de que los tres primeros fumen y los tres ltimos no fumen, y se mul-
tiplica por el nmero de formas en que se pueden ordenar tres fumadores y tres no fumadores.
1852 , 0
! 3 ! 3
! 6
7 , 0 7 , 0 7 , 0 3 , 0 3 , 0 3 , 0 = = P
3) Un sistema consta de seis rels que estn conectados en serie y en paralelo, tal como se muestra
en la siguiente figura 1.9.
Figura 1.9. Rels conectados en serie y paralelo
La probabilidad de que cada rel est cerrado es 0,90. Si los rels funcionan independientemen-
te, cul es la probabilidad de que pase la corriente de A a B?
Sea C
i
el evento: cerrado el i-simo rel. Para que pase la corriente de A a B debe pasar por el
rel 1, luego por el rel 2 por el rel 3, y luego por los rels 4 y 5 por el rel 6. Por lo tanto:
P = P[C
1
(C
2
C
3
) [(C
4
C
5
) C
6
] ]
La probabilidad de que la corriente pase por 2 3 (o por ambos) se puede calcular fcilmente
como: 1 P(no pase por 2 ni 3). De la misma forma se puede calcular la probabilidad de que
pase por 4 y 5, o por 6, como se muestra a continuacin:
P = (0,90)[1 (0,10)(0,10)][1 (1 0,900,90)(0,10)] = 0,874
4) Una persona lanza dos dados indefinidamente hasta obtener una suma igual a 2. Cul es la pro-
babilidad de que sea necesario realizar un quinto lanzamiento?
Para que sea necesario realizar el quinto lanzamiento, en los 4 primeros no debe haber salido
suma igual a 2. Por lo tanto:
P = (35/36)
4
= 0,893
1.7.4 Teorema de suma y multiplicacin: particiones
Sean los eventos E
1
, E
2
, E
3
... ,E
N
una particin del espacio muestra S, es decir, todos mutua-
mente excluyentes, de tal forma que la unin de todos conformen el espacio muestral S. Sea adems
un evento E, perteneciente a S, como se muestra (sombreado) en la figura 1.10.
Entonces podemos decir:

P(E) = P(E S) = P [E (E
1
E
2
... E
N
)]
P(E) = P(E E
1
) P(E E
2
) ... P(E E
N
)
P(E) = P(E
1
)P(E \ E
1
) + P(E
2
)P(E \ E
2
) + ... + P(E
N
)P(E \ E
N
)
P(E) = P(E
i
)P(E \ E
i
)
2
6
5
3
4
1 A
B
Probabilidades

18
Figura 1.10. Particiones de S.

Ejemplo 1:
Una empresa produce un componente mecnico. De la experiencia adquirida se ha determinado
que el 10% de la produccin es defectuosa. La produccin es sometida a un control de calidad
que acepta con una precisin del 95% los componentes que realmente son buenos, y rechaza
con una precisin del 85% los componentes que realmente son defectuosos. Determine la pro-
babilidad de que un componente sea aceptado.
Sean:
P(B) = 0,90 = probabilidad de que un componente sea bueno
P(D) = 0,10 = probabilidad de que un componente sea defectuoso
P(A) = probabilidad de que un componente sea aceptado
P(R) = probabilidad de que un componente sea aceptado
P(A \ B) = 0,95 ; P(R \ B) = 0,05
P(A \ D) = 0,15 ; P(R \ D) = 0,85
En la figura 1.11 se representa un diagrama de rbol donde se ve que un componente puede ser
aceptado de dos formas (mutuamente excluyentes): siendo bueno o siendo defectuoso.

Figura 1.11. Diagrama de rbol del problema de los componentes mecnicos
En la figura 1.12 se representa el mismo problema mediante un diagrama de Venn. En este caso
la probabilidades son representadas como porcentajes. El rea sombreada representa el porcen-
taje de componentes mecnicos que han sido aceptados en el control de calidad, ya sean com-
ponentes buenos o defectuosos. Si el 95% de los componentes buenos son aceptados, se deduce
que el porcentaje de componentes aceptados y buenos ser el 95% del 90%. Si el 15% de los
componentes defectuosos son aceptados, se deduce que el porcentaje de componentes aceptados
Bueno
Defectuoso
Aceptado
Aceptado
Rechazado
Rechazado
0,9
0,1
0,95
0,05
0,15
0,85
Probabilidades

19
y defectuosos ser el 15% del 10%. El porcentaje de componentes aceptados ser entonces la
suma de 9590/100 + 1510/100, es decir 87%.

Figura 1.12. Diagrama de Venn del problema de los componentes mecnicos
Aplicando el teorema de suma y multiplicacin se llega a la misma respuesta:
P(A) = P(B)P(A \ B) + P(D)P(A \ D)
P(A) = (0,90)(0,95) + (0,10)(0,15) = 0,87
Es decir, el 87% de los componentes mecnicos son aceptados por el control de calidad.
Otra forma de visualizar este problema, expresando las probabilidades como porcentajes, se
muestra en la siguiente tabla, donde se resaltan los datos del problema.
Aceptado Rechazado Total
Bueno 0,95 90 = 85,5 0,05 90 = 4,5 90
Defectuoso 0,15 10 = 1,5 0,85 10 = 8,5 10
Total 85,5 + 1,5 = 87 4,5 + 8,5 = 13 100
La probabilidad de que el componente sea aceptado o de que sea rechazado puede calcularse
sumando las columnas correspondientes.
Ejemplo 2:
Un mtodo muy empleado por investigadores estadsticos para obtener informacin es el de
efectuar encuestas personales. A menudo resulta importante investigar sobre temas muy perso-
nales, que pondran en aprietos al sujeto encuestado, ocasionando que d respuestas falsas o que
no conteste, deformando as los resultados de la encuesta. Para aminorar este problema, Warner
ide la "Tcnica de la respuesta aleatoria", que permite que el encuestado escoja al azar una de
dos preguntas: la pregunta personal, motivo de la encuesta, o una pregunta de control. As, slo
l sabr qu pregunta contest en realidad, y se mantiene su privacidad. Por ejemplo, supngase
que se desea estimar el porcentaje de alumnos secundarios de una ciudad que no resuelven por
su cuenta las tareas para la casa. Se hacen 1000 encuestas con las siguientes instrucciones: An-
tes de contestar lance una moneda: si sale cara conteste la pregunta A, y si sale sello conteste la
pregunta B. Slo conteste S o NO.
A: resuelve usted las tareas para la casa por su cuenta?
B: naci su padre en enero, febrero, marzo, abril o mayo?
Supngase que, una vez efectuadas las encuestas, hay 455 respuestas afirmativas y 545 negati-
vas. Qu porcentaje de alumnos no resuelve por su cuenta las tareas para la casa? Esto equivale
a calcular la probabilidad de que un alumno no resuelva por su cuenta las tareas para la casa.

Sean: P(NO) = probabilidad de contestar NO a cualquiera de las dos preguntas.
P(A) = probabilidad de que al alumno conteste la pregunta A (que obtenga cara).
P(B) = probabilidad de que al alumno conteste la pregunta B (que obtenga sello).
Buenos
90%
Defectuosos
10%
Aceptados
Rechazados


95%
15%
85%
5%
Probabilidades

20
Considerando que se puede contestar NO de dos formas diferentes (a las dos preguntas), mu-
tuamente excluyentes, se plantea:
P(NO) = P(A)P(NO \ A) + P(B)P(NO \ B)
0,545 = (0,5)P(NO \ A) + (0,5)(7/12)
P(NO \ A) = 0,5067
En la figura 1.13 se traza un diagrama de rbol que nos permite visualizar con suma facilidad el
planteamiento anterior.
Figura 1.13. Diagrama de rbol del problema de las encuestas
Se concluye que, aproximadamente, el 50,67 % de los alumnos secundarios de la ciudad no re-
suelve por su cuenta las tareas para la casa.
De la misma forma que con el problema anterior, se puede plantear la siguiente tabla:
SI NO Total
A 455 208,33 = 246,67 545 291,67 = 253,33 500
B 5/12 500 = 208,33 7/12 500 = 291,67 500
Total 455 545 1000
Como se ve, los datos de la primera fila pueden obtenerse restando los de la segunda fila del to-
tal. Se deduce entonces que la probabilidad de contestar NO, dado que se trata de la pregunta A
es: 253,33/500 = 0,5067. Esto equivale a decir que 50.67 % de los alumnos secundarios de la
ciudad no resuelve por su cuenta las tareas para la casa
Ejemplo 3:
Supngase que el 35% de los alumnos de una universidad que estudian una carrera de ciencias
provienen de los estratos socioeconmicos A y B, y que el 55% de los que no estudian una ca-
rrera de ciencias tambin provienen de los estratos socioeconmicos A y B. Si el 40% de los
alumnos estudian una carrera de Ciencias, qu porcentaje de alumnos provienen de los estratos
socioeconmicos A y B?
Sean: P(A y B) = probabilidad de un alumno provenga de los estratos A y B.
P(C) = probabilidad de que un alumno estudie Ciencias.
P(N) = probabilidad de que un alumno no estudie Ciencias.
) \ ( ) ( ) \ ( ) ( ) ( N B y A P N P C B y A P C P B y A P + =
= 0,40 0,35 + 0,60 0,55 = 0,47
Por lo tanto, el 47% de los alumnos provienen de los estratos socioeconmicos A y B.
El lector estar ahora en condiciones de completar la siguiente tabla para calcular la probabili-
dad o porcentaje requerido:
A
B
SI
SI
NO
NO
0,5
0,5
?
?
5/12
7/12
Probabilidades

21
C N Total
A y B
No A y B
Total 40 60 100
Aunque no haga falta para contestar la pregunta del problema, se podra completar tambin la
segunda fila de la tabla. Como ya se ha calculado previamente, el porcentaje de alumnos que
provienen de los estratos A y B debe resultar 47%.
1.7.5 Teorema de Bayes
Dada la misma particin conformada por los eventos E
1
, E
2
, ... ,E
N
; y el evento E, comentados en
el teorema de suma y multiplicacin, se puede deducir fcilmente:

) (
) (
) \ (
E P
E E P
E E P
k
k

=
) \ ( ) (
) \ ( ) (
) \ (
i i
k k
k
E E P E P
E E P E P
E E P

=
Se trata de una probabilidad condicional, que incluye las reglas de suma y multiplicacin de
probabilidades. Tiene mucha importancia pues ha servido para desarrollar la inferencia o estimacin
bayesiana, que, mediante el empleo de datos experimentales llega a estimar probabilidades subjetivas
con buena precisin.
Ejemplo 1:
Suponga que el concesionario de la cafetera de la UDEP est tratando de reducir el nmero de
clientes no pagan sus cuentas al final del ao. l est dispuesto a cancelarles el crdito a los
clientes que se demoren ms de una semana en los pagos que deben realizar a fin de cada mes.
El concesionario ha visto en sus archivos que, de todos los clientes que finalmente no pagaron
sus cuentas al final del ao, el 95% se haban demorado ms de una semana en sus pagos men-
suales. Adems, sabe que el 4% de los clientes que tienen crdito no pagan su cuenta, y que, de
los que s pagan su cuenta a fin de ao, el 35% se ha demorado alguna vez ms de una semana.
Determine la probabilidad de que un cliente que se ha demorado alguna vez ms de una semana
en sus pagos mensuales, no pague su cuenta al final del ao.
Los datos de este problema se pueden interpretar de la siguiente forma:
P(No pague) = 0,04; P(S pague) = 0,96
P(Haya demorado \ No pag) = 0,95 ; P(No haya demorado \ No pag) = 0,05
P(Haya demorado \ S pag) = 0,35 ; P(No haya demorado \ S pag) = 0,65
La probabilidad de que un cliente no pague, dado que se demor ser:
=

=
) (
) (
) / (
Demore P
Demore pague No P
Demor pague No P
) \ ( ) ( ) \ ( ) (
) \ ( ) (
pag No Demore P pague No P pag S Demore P pague S P
pag No Demore P pague No P
+
=
1016 , 0
374 , 0
038 , 0
95 , 0 04 , 0 35 , 0 96 , 0
95 , 0 04 , 0
= =
+

=
La probabilidad de que un cliente que se ha demorado alguna vez ms de una semana en sus pa-
gos mensuales no pague su cuenta al final del ao es 0,1016. O sea que el 10,16% de los moro-
sos no pagan al final su cuenta.
Probabilidades

22
Nuevamente, se puede plantear este problema mediante una tabla, como la que se completa a
continuacin:
Demore No demore Total
Pague 0,35 96 = 33,6 0,65 96 = 62,4 96
No pague 0,95 4 = 3,8 0,05 4 = 0,2 4
Total 33,6 + 3,8 = 37,4 62,4 + 0,2 = 62,6 100
Por lo tanto, la probabilidad de que un cliente que se ha demorado alguna vez ms de una sema-
na en sus pagos no pague su cuenta al final del ao es: 3,8/37,4 = 0,1016.
Ejemplo 2:
Con los datos del ejemplo 1 del apartado 1.7.4, determine la probabilidad de que un componente
que ha sido aceptado sea bueno.
9827 , 0
87 , 0
855 , 0
87 , 0
95 , 0 90 , 0
) (
) / ( ) (
) / ( = =

= =
A P
B A P B P
A B P
Antes del control de calidad se tena una certeza del 90% de producir un componente no defec-
tuoso. Despus del control de calidad, se tiene una certeza del 98,27% de escoger un componen-
te no defectuoso.
Este mismo resultado se puede obtener a partir de la tabla que se elabor en el problema 1 del
apartado 1.7.4. Verifique el lector este resultado.
Ejemplo 3:
Una persona tiene dos dados: uno normal que marca 1,2,3,4,5,6 en sus caras y otro anormal que
marca 2,2,4,4,6,6 en sus caras. Si se escoge un dado al azar, se lanza dos veces y en las dos oca-
siones se obtiene un nmero par, cul es la probabilidad de que el dado escogido sea el anor-
mal?
8 , 0
1 5 , 0 25 , 0 5 , 0
1 5 , 0
) , (
) / , ( ) (
) , / ( =
+

= =
par par P
Anormal par par P Anormal P
par par Anormal P
donde: P(par, par) = P(Anormal) P(par, par / Anormal) + P(Normal) P(par, par / Normal)
Como era de esperarse, en vista del resultado de los dos lanzamientos, es ms probable que el
dado escogido haya sido el dado anormal: 0,8 > 0,5.


Probabilidades

23
Problemas propuestos.
1. Carmen y Mario lanzan 3 y 4 monedas, respectivamente. Cul es la probabilidad de que Mario
obtenga exactamente el doble de sellos que Carmen?
2. Un comerciante quiere comprar un lote de 25 pias, y decide comprarlo solamente si al seleccio-
nar 3 aleatoriamente, ninguna est malograda. Supngase que realmente hay 4 pias malogradas
(el comerciante no lo sabe), cul es la probabilidad de que no compre el lote?
Respuesta: 0,4217
3. Jos, Bruno y Mnica lanzan sucesivamente una moneda. Si el primero en obtener cara gana el
juego:
a) Cules son las respectivas probabilidades de ganar el juego si cada uno lanza slo una vez?
Respuesta: P(gane Jos) = 1/2
P(gane Bruno) = 1/4
P(gane Mnica) = 1/8
b) Cules son sus respectivas probabilidades de triunfo si, en caso sea necesario, el juego conti-
na hasta un mximo de dos lanzamientos para cada uno?
Respuesta: P(gane Jos) = 9/16
P(gane Bruno) = 9/32
P(gane Mnica) = 9/64
4. Supngase que, en Piura, la probabilidad de que un da sea nublado es 1/18 en verano y 5/54 en
cualquier otra estacin. Qu porcentaje de das del ao se espera que sean nublados?
5. Se extraen aleatoriamente k boletos premiados de una urna que contiene n boletos enumerados 1,
2, ..., n. Determine la probabilidad de que:
a) El nmero premiado ms alto sea el r.
b) El nmero premiado ms alto sea el r y el ms bajo sea el s.
AYUDA: Primero resuelva ambos apartados para n = 10; k = 5; r = 8; s = 2.
6. Suponga que hay tres semforos entre la casa de Quique y la UDEP. Al llegar a cada uno de ellos,
stos pueden estar en rojo (R) o verde (V). Considrese que el mbar dura un tiempo despreciable.
Quique ha verificado que, en el primer semforo, el rojo dura tanto como el verde; pero en el se-
gundo, el rojo dura el doble que el verde; y en el tercero, el verde dura el doble que el rojo. Cul
es la probabilidad de que en el siguiente viaje a la UDEP:
a) Tenga que parar por exactamente una luz roja?
Respuesta: 7/18
b) Tenga que parar al menos por una luz roja?
Respuesta: 8/9
7. Cuatro canicas A, B, C, D, se pueden colocar en cinco vasijas numeradas del 1 al 5. Por ejemplo,
A1,B2,C3,D1 significa que A est en la vasija 1, B en la vasija 2, C en la 3 y D en la 1. De cun-
tas formas se pueden colocar las 4 canicas en las 5 vasijas, si en cada una caben hasta:
a) 4 canicas?
Respuesta: 625
b) 3 canicas?
Respuesta: 620
8. Se eligen 5 cartas de una baraja completa de 52. La baraja est conformada por cuatro palos (co-
razones, espadas, trboles y cocos) y por trece denominaciones (1, 2, ..., 13). Cul es la probabi-
lidad de que:
a) Todas las cartas sean del mismo palo?
b) Haya dos 1 y tres 13?
c) Haya dos cartas de una denominacin y tres de otra?
Probabilidades

24
d) Todas las cartas sean de distintas denominaciones?
9. En el curso de Estadstica hay 5 alumnos del IV ciclo, 34 del V, 21 del VI, 5 del VII y 2 del VIII.
Si se eligiera un comit de 5 personas, cul es la probabilidad de que:
a) todos los ciclos estn representados en el comit?
Respuesta: 0,00369
b) slo el VI ciclo tenga miembros en el comit?
Respuesta: 0,0021
10. Una familia tiene 5 hijos. Suponiendo que la probabilidad de que un hijo sea varn o mujer es la
misma, determine la probabilidad de que:
a) Los 5 sean del mismo sexo.
Respuesta: 1/16
b) Cuatro sean varones.
Respuesta: 0,15625
11. Se extraen tres cartas de una baraja. Determine la probabilidad de que:
a) Las tres sean de distinta figura.
Respuesta: 0,3976
b) Al menos dos nmeros sean iguales.
Respuesta: 0,171764
12. Una urna contiene canicas numeradas 1, 2, ..., n. Si se escogen dos canicas al azar, cul es la pro-
babilidad de que los dos nmeros sean consecutivos? Nota: Puede resolver este problema de dos
formas: dividiendo eventos xito entre eventos totales o aplicando algn teorema.
13. Se lanzan tres monedas, y, si se obtienen 2 caras y un sello, se extraen dos canicas, aleatoriamente,
de una urna que contiene canicas numeradas del 1 al 100. Si las tres monedas muestran el mismo
resultado (tres caras o tres sellos), se extraen dos canicas, de otra urna que contiene canicas nume-
radas del 1 al 50. Cul es la probabilidad de que se extraigan dos canicas que muestren dos nme-
ros consecutivos?
Respuesta: 7/400
14. Una persona elige 10 nmeros de una lista de nmeros del 1 al 80. Luego, de una urna donde hay
80 canicas enumeradas del 1 al 80, se extraen 20 canicas. Cul es la probabilidad de que en la se-
gunda extraccin no se extraiga ninguno de los 10 nmeros elegidos al principio?
15. Una caja contiene nueve etiquetas numeradas consecutivamente del 1 al 9. Si se extraen dos de
estas etiquetas al azar, cul es la probabilidad de que sumen 8?
16. Dos amigos compraron pasajes para viajar en un pequeo mnibus. El mnibus consta de 48
asientos, en filas de 4, con 24 asientos al lado izquierdo y 24 al lado derecho. Si los asientos fue-
ron asignados aleatoriamente, determine la probabilidad de que los dos amigos,
a) Se sienten en el mismo lado.
Respuesta: 0,48936
b) Se sienten en la misma fila.
Respuesta: 0,06383
c) Se sienten juntos (uno al lado del otro o uno detrs del otro).
Respuesta: 0,06028
17. Hay 8 amigos solteros y la probabilidad de que cualquiera de ellos se case en los prximos 15 aos
es 1/4. Cul es la probabilidad de que por lo menos uno se case?
Respuesta: 0,8999
18. De cuntos modos puede dividirse una tarea de 10 ejercicios, en dos tareas de 5 ejercicios cada
una?
Respuesta: de 252 formas
Probabilidades

25
19. Una persona compra un boleto de la LOTTO todas las semanas. Siempre apuesta a los mismos 6
nmeros, seleccionados entre los enteros del 1 al 36. Para ganar, los seis nmeros seleccionados
deben coincidir con los que se escogen al azar en una urna. Determine:
a) El tamao del espacio muestra.
b) La probabilidad de que gane en una semana particular.
c) La probabilidad de que gane en cada una de las prximas tres semanas.
d) La probabilidad de que gane por lo menos una vez durante las prximas 52 semanas.
20. La empresa CRAG S.A. es demandada por supuesta violacin de patente sobre el proceso de ma-
nufactura de un producto. El asesor de la empresa, que es un ingeniero industrial que sabe de m-
todos cuantitativos para la toma de decisiones, ha hecho el diagnstico de este problema emplean-
do un rbol de decisiones. Dentro de su anlisis estima que la probabilidad de ganar un juicio es X,
y que la probabilidad de perder es 1 X. Si CRAG S.A. gana el juicio, los demandantes pueden
apelar o no, con probabilidades 0,90 y 0,10 respectivamente. Si pierde el juicio, estima que CRAG
S.A. puede apelar o no, con probabilidades de 0,20 y 0,80 respectivamente. Adems, estima que
quien gana el juicio tiene 0,75 de probabilidad de ganar la apelacin correspondiente.
a) Si la probabilidad de ganar el juicio (X) es 0,40, Cul es la probabilidad de ganar el litigio?
Respuesta: 0,34
b) Si la probabilidad de ganar el litigio fuese 0,10, Cul sera entonces la probabilidad de ganar
el juicio (X)?
Respuesta: 0,069
c) Cul es la mxima probabilidad de ganar el litigio?
Respuesta: 0,775
21. Un estudiante de Ingeniera ha estimado que en 4 horas puede estudiar un tema para el examen del
da siguiente. Comienza a estudiar a las 8 p.m. con el riesgo de que haya un "apagn" en cualquier
momento. Cul es la probabilidad de que, como consecuencia de un "apagn", lo que le falte es-
tudiar sea menos de la quinta parte de lo que haya estudiado? Asuma que el apagn puede ocurrir
en cualquier instante debido a problemas con el generador.
Respuesta: 1/6
22. Los compradores de grandes volmenes de mercancas utilizan el muestreo de aceptacin para ca-
lificar las mercancas que compran. Los lotes de mercancas son rechazados o aceptados con base
en los resultados obtenidos al inspeccionar una muestra del lote. Suponga que un inspector de una
planta procesadora de alimentos ha aceptado el 97% de los lotes que son de calidad buena, y ha
rechazado, incorrectamente, 3% de lotes que eran de calidad buena. Adems se sabe que el ins-
pector acepta el 95% de todos los lotes y que slo el 3% de los lotes son de calidad mala. En-
cuentre la probabilidad de que:
a) un lote sea de calidad buena y que adems sea aceptado.
Respuesta: 0,9409
b) un lote sea de calidad mala y que sea aceptado.
Respuesta: 0,0091
c) un lote de calidad malasea aceptado.
Respuesta: 0,3033
23. Una persona lanza un dado cuyas seis caras muestran: un "1", dos "2" y tres "3". Si obtiene "1" en
el primer lanzamiento, gana el juego. Si no obtiene "1" puede seguir lanzando el dado y gana si
repite el resultado del primer lanzamiento. Si obtiene "1" antes de repetir el resultado del primer
lanzamiento, pierde el juego. Cul es la probabilidad de ganar? Nota: Puede ser til la siguiente
frmula: 1 + x + x
2
+ x
3

+ ... = 1/(1 x), si 0 < x < 1.
Respuesta: 0,76388.
24. Una caja contiene 9 etiquetas numeradas consecutivamente del 1 al 9. Si se extraen dos de estas
etiquetas al azar, cul es la probabilidad de que sean consecutivas o sumen ocho?
Respuesta: 11/36
Probabilidades

26
25. En un conocido juego con dados (timba) el jugador participante lanza dos dados. Si obtiene suma
siete, gana. Si no, debe seguir lanzando hasta obtener el mismo resultado del primer lanzamiento,
antes de que salga siete. Si sale siete antes de conseguir el mismo resultado del primer lanzamien-
to, pierde.
a) Si el jugador obtiene suma cuatro en el primer lanzamiento. Qu probabilidad tiene de ganar?
Respuesta: 1/3
b) Cul es la probabilidad de que el jugador obtenga suma tres en el primer lanzamiento, y lue-
go pierda el juego?
Respuesta: 1/24
26. Una urna contiene cuatro canicas enumeradas del 1 al 4. Si se extraen sucesivamente las canicas,
una por una, cul es la probabilidad de que por lo menos uno de los nmeros extrados coincida
con el orden de extraccin de la canica? (Por ejemplo, que la tercera canica tenga el nmero 3)
Respuesta: 15/24
27. En un examen de Estadstica slo hay que contestar verdadero (V) o falso (F), para cada una de las
cinco preguntas
a) De cuntas formas se puede contestar el examen?
b) Si contestase al azar, cul sera la probabilidad de contestar todas bien?
c) Si un alumno estima que la probabilidad de que conteste bien cada pregunta es 2/3, cul ser
la probabilidad de que conteste bien al menos cuatro preguntas?
28. Diga si se trata de una probabilidad a priori, experimental o subjetiva:
a) Probabilidad de que haya empate entre los dos candidatos a la presidencia de un comit.
Respuesta: Subjetiva.
b) Probabilidad de que una lata de conservas de pescado contenga algn objeto extrao.
Respuesta: Experimental.
c) Probabilidad de que dentro de tres aos ocurra el fenmeno de El Nio.
Respuesta: Subjetiva
d) Probabilidad de que encontremos un semforo en rojo.
Respuesta: A priori.
29. En una urna hay siete esferas, que tienen marcadas las siguientes letras: C, A, L, C, U, L, O. Si se
extraen, una por una, las siete esferas, y se van colocando de izquierda a derecha, cul es la pro-
babilidad de que se forme la palabra CALCULO?
Respuesta: 7,94 10
4
30. Un vendedor estima que la probabilidad de venderle a un cliente en su primera visita es 0,4, pero
que aumenta a 0,55 en la segunda visita, si en la primera no efectu la venta. Calcule la probabili-
dad de que:
a) El vendedor venda a un cliente
b) El cliente no compre
31. En una urna se colocan n esferas blancas numeradas 1, 2, ..., n; y n esferas rojas numeradas 1, 2,
..., n. Si se extraen luego dos esferas aleatoriamente, cul es la probabilidad de que:
a) Sean blancas y consecutivas?
b) Sean blancas o consecutivas?
c) Sean consecutivas de distinto color?
32. En una urna hay seis canicas blancas y seis negras. Se escogen nueve de stas aleatoriamente y se
colocan en tres filas. Determine la probabilidad de que:
a) en cada fila haya slo un color.
b) en cada fila hayan dos canicas blancas.
Probabilidades

27
33. Una tabla para jugar est conformada por 15 casilleros. En 11 de stos se encuentran las letras de
la palabra ESTADISTICA y los 4 restantes estn en blanco. Un jugador debe escoger, descono-
ciendo lo que hay en cada casillero, casillero por casillero, hasta que conforme la palabra ESTA-
DISTICA, sin importar el orden. Por cada casillero en blanco que se escoja, al jugador se le quita
$20 de los $60 que le dan inicialmente. Cul es la probabilidad de que el jugador:
a) Gane $60
Respuesta: 1/1365
b) Gane $40
Respuesta: 11/1365
c) Gane $20
Respuesta: 66/1365
d) No gane
Respuesta: 286/1365
e) Pierda $20
Respuesta: 1001/1365
34. De cuntas formas puede un sindicato elegir entre sus 30 miembros a: un presidente, un vicepre-
sidente, un secretario y tres vocales?
Respuesta: de 71 253 000 formas
35. Se lanza una moneda cuya probabilidad de que el resultado sea cara es 2/3. Si aparece cara, se ex-
trae una canica de una urna que contiene dos rojas y tres verdes. Si el resultado es sello, se extrae
una canica de otra urna que contiene dos rojas y dos verdes. Cul es la probabilidad de extraer
una canica roja?
36. De una baraja completa de 52 cartas se extrae una mano de 5 cartas al azar. Cul es la probabili-
dad de obtener una escalera? (5 nmeros consecutivos).
37. Suponga que en una regin se ha determinado que en un ao lluvioso llueve aproximadamente el
50% de los das del ao y en un ao no lluvioso llueve aproximadamente el 25% de los das del
ao. Un agricultor quiere tomar las previsiones del caso y, transcurrida la primera semana del ao,
se percata de que ha llovido 2 das. Cul es la probabilidad de que se trate de un ao no lluvioso?
Supngase que el 40% de los aos son considerados lluviosos.
Respuesta: 0,7402
38. Se lanzan cinco monedas. Determine la probabilidad de que:
a) El nmero de caras exceda al nmero de sellos en 2 ms.
b) Los 5 resultados sean iguales.
39. Suponga que se escribe aleatoriamente un nmero de 4 dgitos (se permiten dgitos repetidos).
Cul es la probabilidad de que no haya ningn dgito repetido?
40. En una urna hay 15 canicas blancas y seis negras. Se extrae una canica y luego otra hasta que sta
sea negra. Determine la probabilidad de que haya que realizar una cuarta extraccin, si:
a) Las canicas se extraen sin sustitucin.
b) Las canicas se extraen con sustitucin.
41. Se sabe que el veredicto dado por un jurado es un 90% confiable cuando el sospechoso es culpable
y un 98% confiable cuando es inocente. En otras palabras, declara inocente al 10% de los culpa-
bles y declara culpable al 2% de los inocentes. El sospechoso se selecciona entre un grupo de per-
sonas, de las cuales slo el 5% ha cometido un delito alguna vez. Si el jurado lo declara culpable,
cul es la probabilidad de que esa persona sea inocente?
Respuesta: 0,2969
42. Una urna contiene 3 canicas blancas y 5 negras. Si se extraen canicas al azar, una por una, hasta
que no quede ninguna, cul es la probabilidad de que las dos ltimas canicas sean negras?
Probabilidades

28
Respuesta: 0,357
43. Doce estudiantes se disponen a sentarse en una sola fila, al azar. Si dos de ellos son hermanos,
Cul es la probabilidad de que no se sienten juntos?
Respuesta: 5/6
44. Una asociacin consiste en 14 miembros. Seis de los miembros son varones y los otros ocho
miembros son mujeres. Ellos desean seleccionar un comit de tres hombres y tres mujeres. De
cuntas maneras puede seleccionarse este comit si :
a) no hay restricciones?
b) dos de los hombres se rehsan a estar juntos en el comit si el otro est?
c) uno de los hombres y una de las mujeres rehsan estar juntos en el comit si el otro est?
d) Ana slo participar en el comit si Juana tambin participa?
e) el comit debe tener un presidente y un secretario y estos dos oficiales deben ser del mismo
sexo?
45. De cuntas maneras se puede formar un equipo de fulbito que debe estar compuesto por cuatro
jugadores novatos y dos veteranos, a partir de un grupo de diez novatos y cinco veteranos, si todos
ellos pueden jugar en cualquier posicin?
46. Un jugador lanza un dado y gana un juego si obtiene 5 6. Si lanza varias veces seguidas hasta
que gane dos veces.
a) Cul es la probabilidad de que necesite hacer un mnimo de 5 intentos?
b) Cul es la probabilidad de que gane al menos dos veces en ms de 4 intentos?
47. Una compaa procesadora de alimentos est considerando implantar una nueva lnea de almuer-
zos instantneos. Las estimaciones actuales indican una probabilidad de gran xito de 0,1, una
probabilidad de xito moderado de 0,4 y una probabilidad de no tener xito de 0,5. La compaa
hace una prueba a nivel regional, antes de implantarla a nivel nacional y obtiene resultados signifi-
cativos, aunque no concluyentes. La confiabilidad de tal prueba est dada por las probabilidades
condicionales de la siguiente tabla:
La prueba indic
Dado que un producto fue
Gran xito xito moderado Sin xito
Muy aceptado 0,6 0,4 0
Medianamente aceptado 0,2 0,6 0,2
No aceptado 0,1 0,3 0,6

Construya una diagrama de rbol y calcule las probabilidades condicionales:
a) P(muy aceptado \ prueba indica gran xito)
b) P(muy aceptado \ prueba indica xito moderado)
c) P(muy aceptado \ prueba indica sin xito)
d) P(medianamente aceptado \ prueba indica gran xito); etc.
48. En una prueba de aptitud conformada por 25 preguntas, 4 son de cultura general. Si a cada alumno
se le asignan 20 preguntas al azar, Cul es la probabilidad de que:
a) no se le asigne ninguna pregunta de cultura general?
Respuesta: 3,95 10
4
b) le asignen al menos 2 preguntas de cultura general?
Respuesta: 0,98379
49. Tres amigos comienzan un juego de dados llamado dudo. Cada uno debe lanzar 5 dados sin que
los dems vean su resultado (se cubre los dados con el vaso o cacho). Si a uno de ellos le toca el
siguiente resultado: 5, 1, 5, 5, 3; cul es la probabilidad de que:
a) En total haya 3 cincos?
b) En total haya un mnimo de 4 cincos?
Probabilidades

29
50. Se tiene una baraja de 52 cartas. Si se seleccionan 5 cartas al azar, cul es la probabilidad de ob-
tener el 2 de espadas, el 2 de corazones y las otras tres cartas de diamantes?
Respuesta: 1,1 10
-4
51. Un grupo de amigos estn jugando "millonario" y uno de ellos desea obtener suma "4" al arrojar
los dados. Un dado tiene las opciones: 0, 0, 1, 2, 3, 4 y el otro dado: 0, 0, 1, 2, 2, 4. Cul es la
probabilidad de obtener la suma deseada?
Respuesta: 7/37
52. Un jugador tiene un dado normal. Cul es la probabilidad de que:
a) necesite hacer 8 ms lanzamientos para obtener un seis?
Respuesta: 0,2790
b) en 8 lanzamientos slo obtenga un seis?
Respuesta: 0,3721
c) recin obtenga un seis en el octavo lanzamiento?
Respuesta: 0,0465
53. Una persona tiene dos dados, uno de los cuales es normal y el otro tiene dos "2",dos "4" y dos "6".
Si se lanzan los dos dados, cul es la probabilidad de que:
a) ambos resultados sean pares?
b) un resultado sea par y el otro impar?
c) ambos resultados sean iguales?
54. En la UDEP aproximadamente el 52% del alumnado estudia Ingeniera, el 21% Administracin de
Empresas, el 18% estudia Informacin y el 9% restante estudia Educacin. En Ingeniera, el 82%
son varones, en Administracin el 48%, en Informacin el 15% y en Educacin el 5%. Si se esco-
ge una persona al azar y resulta que es varn.
a) Cul es la probabilidad de que no estudie Ingeniera?
b) Cul es la probabilidad de que estudie Administracin o Informacin?
55. En la ciudad de Piura se publican los diarios A, B y C. Una encuesta indica que el 36% lee A, el
26% lee B y el 27% lee C; 11% leen A y B, 10% leen A y C, 6% leen B y C y 3% leen A, B y C.
Se escoge a una persona adulta al azar. Calcule la probabilidad de que:
a) lea al menos un diario.
b) lea slo un diario.
c) lea al menos A y C, si se sabe que lee al menos uno de los diarios.
56. Un pequeo club formado por diez parejas de casados va a elegir a dos representantes al azar.
Cul es la probabilidad de que:
a) no sea elegido un matrimonio.?
b) sean de sexo opuesto?
c) sean mujeres?
57. De 30 objetos elegimos 5 al azar, con sustitucin.
a) Cul es la probabilidad de que ningn objeto sea elegido ms de una vez?
Respuesta: 0,70373
b) Cul es la probabilidad de que slo un objeto se repita una vez?
Respuesta: 0,27066
58. Un jugador tiene un dado normal.
a) Cul es la probabilidad de que necesite hacer 10 ms lanzamientos para obtener un seis?
Respuesta: 0,1938
b) Cul es la probabilidad de que recin obtenga un seis en el dcimo lanzamiento?
Respuesta: 0,0323
c) Cul es la probabilidad de que en 10 lanzamientos slo obtenga un seis?
Probabilidades

30
Respuesta: 0,323
59. En un examen formado por 25 preguntas pueden omitirse 5 de ellas.
a) Cuntas selecciones de 20 preguntas pueden hacerse?
Respuesta: 53 130
b) En cuntas de stas estarn las 6 preguntas ms fciles?
Respuesta: 11 628
60. En un grupo de 20 problemas hay dos muy fciles y uno muy difcil. Si a un estudiante se le deja
un trabajo de 6 problemas, Cul es la probabilidad de que le toque el problema ms difcil y uno
de los dos ms fciles?
61. Se lanzan tres dados. Si dos de los resultados son impares, cul es la probabilidad de que la suma
total sea menor que siete?
Respuesta: 4/27
62. Suponga que usted y dos amigos participan en un juego. Cada uno lanza cinco dados y slo pue-
den ver su propio juego. Si usted tiene dos "1", cul es la probabilidad de que al menos hayan
cuatro "1" en total?
Respuesta: 0,5155
63. Un alumno de Estadstica quiere medir la capacidad de un meteorlogo. Los datos recolectados en
el pasado indican lo siguiente:
- La probabilidad de que el meteorlogo prediga sol en das asoleados es 0.80
- La probabilidad de que el meteorlogo prediga sol en das nublados es 0.40
- La probabilidad de un da asoleado es 0.90
Determine la probabilidad de que:
a) Haya sol, si el meteorlogo lo pronostic.
Respuesta: 0,9474
b) El meteorlogo pronostique que habr sol.
Respuesta: 0,76
64. Una caja contiene esferas numeradas 1, 2, ..., n. Se escogen tres al azar. Cul es la probabilidad
de que los tres nmeros sean consecutivos?
Respuesta: 6/n(n + 1)
65. Miguel lanza tres dados y slo dice que no sali ningn 2 y ningn 6. Cul es la probabilidad de
que:
a) la suma de los tres dados sea par?
b) la suma de los tres dados sea mayor que 12?
66. Si a, b, c, c, d, d, e, f se distribuyen al azar. Cul es la probabilidad de que las dos letras "c" que-
den separadas?
Respuesta: 0,75
67. Se van a seleccionar cinco soldados de un grupo de doce voluntarios para una misin peligrosa.
a) De cuntos modos se podrn seleccionar?
Respuesta: 792
b) Cuntas veces podrn ser incluidos los dos ms valientes?
Respuesta: 120
c) Cuntas veces ser incluido slo uno de los dos ms valientes?
Respuesta: 420
68. Se tiene una baraja de 52 cartas.
a) Cuntas "manos" de 5 cartas se pueden seleccionar?
Probabilidades

31
Repuesta: 2 598 960
b) En cuntas de estas "manos" se tendrn tres nmeros iguales?
Respuesta: 58 656
69. De un grupo de ocho hermanos se eligen tres al azar. Luis tiene 18 aos, Jorge 17 aos, Miguel 15
aos, Ral 12 aos, Mario 10 aos, Ana 9 aos, Luca 6 aos y David 5 aos. Determine la proba-
bilidad de que:
a) Luis sea elegido.
Respuesta: 3/8
b) Ana y Luca sean elegidas
Respuesta: 3/28
c) la suma de las edades de los tres elegidos sea menor que 28.
Respuesta: 1/7
d) el menor de los tres sea Ral.
Respuesta: 3/56
e) el mayor de los tres sea Ral.
Respuesta: 3/28
f) el mayor de los tres sea Ral, dado que este s fue elegido.
Respuesta: 2/7
g) el mayor de los tres sea Ral, si David no fue elegido.
Respuesta: 3/35
h) el mayor de los tres sea Ral y David no sea elegido.
Respuesta: 3/56
70. Se va a elegir por sorteo un comit de seis personas a partir de un grupo de diez hombres; tres de
los cuales son profesionales. Cul es la probabilidad de que:
a) por lo menos haya dos profesionales en el comit?
Respuesta: 2/3
b) no haya ningn profesional en el comit?
Respuesta: 1/30
71. Las probabilidades que tienen tres alumnos de aprobar Estadstica son: 0,20; 0,40; 0,50. Determine
la probabilidad de que:
a) Solamente apruebe uno.
Respuesta: 0,46
b) Solamente apruebe el segundo.
Respuesta: 0,16
c) Si aprueban al menos dos, est incluido el primero.
Respuesta: 0,4666
72. Supngase que de un grupo de 20 objetos se eligen 5, reponiendo cada uno de los que se va eli-
giendo antes de extraer el siguiente. Cul es la probabilidad de que:
a) slo uno de los objetos se repita una vez?
b) ningn objeto salga repetido?
c) slo dos objetos salgan elegidos?
73. Un club est conformado por 5 abogados, 10 ingenieros y 3 mdicos.
a). De cuntas maneras se puede elegir un comit conformado por 2 abogados, 2 ingenieros y 2
mdicos.
b). En cuntos de estos comits estarn la ingeniera Peralta y el doctor Zapata.
74. En una caja hay 10 canicas enumeradas del 1 al 10.
a) De cuntas formas se pueden pintar, 3 de color rojo, 2 de color azul y 5 de color verde?
b) En cuntas de stas formas, las 3 canicas que se pinten de color rojo sern consecutivas?
c) En cuntas de stas formas, las 3 canicas rojas son consecutivas y las dos azules tambin?
Probabilidades

32
75. Aproximadamente 2/5 de las personas en el Per pertenecen al grupo sanguneo A. Cul es la
probabilidad de que, en una muestra aleatoria de cinco personas, al menos tres pertenezcan al gru-
po A?
76. En una escuela el 25% de los alumnos son hombres. El 25% de los hombres y el 20% de las muje-
res tuvieron muy buen rendimiento el ao anterior. Si se escoge un alumno al azar. Cul es la
probabilidad de que haya tenido muy bien rendimiento el ao anterior?
77. Un fabricante de computadoras ha indicado que la demanda mensual es de uno a siete equipos. Si
se supone que cualquier nivel de demanda (dentro del rango de 1 a 7) es igualmente probable, de-
termine las siguientes probabilidades:
a) Que se vendan dos computadoras en un mes determinado.
b) Que se vendan menos de cuatro computadoras en un mes determinado.
c) Que se vendan no ms de cinco computadoras en un mes determinado.
d) Que se vendan por lo menos tres computadoras en un mes determinado.
78. Un inversionista cuenta con la opcin de invertir en dos de cuatro tipos de accin. El inversionista
ignora que, de estos cuatro tipos, slo dos aumentarn sustancialmente de valor dentro de los
prximos cinco aos. Si el inversionista elige los dos tipos de accin al azar, determine el espacio
muestra correspondiente. Determine adems qu eventos simples conforman los siguientes even-
tos compuestos:
a) Por lo menos uno de los tipos de accin redituable fue escogido.
b) Por lo menos uno de los tipos de accin redituable no fue escogido.
79. Se le pide a una ama de casa su opinin sobre cuatro marcas de conservas de atn (A, B, C y D),
indicando el orden de su preferencia, marcando con el 1 la que ms prefiere, con el 2 la que le si-
gue, etc. Suponga que la seora en realidad no tiene ninguna preferencia por ninguna marca, y de-
cide dar los nmeros del 1 al 4 al azar. Cul es la probabilidad de que:
a) la marca A quede como la 1?
Respuesta: 1/4
b) C quede en primer lugar y D en segundo?
Respuesta: 1/12
c) A quede en alguno de los dos primeros lugares?
Respuesta: 1/2
80. Una compaa produce un foco ahorrador en tres lneas de produccin. Estos focos se envan en
grandes lotes y, debido a que la inspeccin de la calidad es destructiva, la mayora de los compra-
dores muestrean un nmero pequeo de focos de cada lote. En general las tres lneas de produc-
cin trabajan al mismo ritmo y, el porcentaje de defectuosos, que es el mismo para las tres, es de
slo 2%. Durante el mes de septiembre, la lnea 1 sufri un desperfecto y estuvo produciendo con
un porcentaje de 5% de defectuosos, lo cual se supo mucho despus. Un cliente recibi un lote
producido en septiembre, del cual prob 3 focos, y result uno defectuoso. Cul es la probabili-
dad de que este lote haya venido de las lneas de produccin 2 3?
81. Suponga que en la UDEP el 44% de los alumnos estudian Ingeniera y el 12% de stos son muje-
res. Adems, el 60% de los otros programas son mujeres. Si se selecciona un alumno al azar y re-
sulta que es hombre. Cul es la probabilidad de que no estudie Ingeniera?
Respuesta: 0,3665
82. Se va a elegir por sorteo el Comit de Deportes de la Facultad de Ingeniera entre los 30 alumnos
que se han presentado a una reunin convocada por la Directora de Estudios. De estos 30 alumnos,
20 son hombres y 10 mujeres. Si el comit debe estar formado por 6 alumnos Cul es la probabi-
lidad de que:
a) en el comit haya el doble nmero de hombres que de mujeres?
b) en el comit no haya hombres?
Probabilidades

33
83. Una fbrica de balones de bsquet impone los siguientes controles de calidad: un baln se rechaza
si rebota demasiado o muy poco, o si tiene un defecto en su cuero. El 12% de los balones que se
producen, rebotan demasiado o muy poco, y el 50 % de stos tienen defecto en el cuero. El 10%
de los balones producidos tienen defectos de cuero. Qu porcentaje de balones:
a) sern rechazados por defecto en el rebote?
Respuesta: 12%
b) sern rechazados por defecto en el cuero?
Respuesta: 10%
c) sern rechazados por ambos tipos de defecto?
Respuesta: 6%
d) sern rechazados?
Respuesta: 16%
84. Una fbrica de harina de pescado clasifica su produccin segn la calidad: A, B y C. En promedio,
el 20% es de calidad A, el 30% de calidad B y el 50% de calidad C. Supngase que procesa dos ti-
pos de pescado: 60% de la produccin de harina proviene del pescado P1 y 40% del pescado P2,
con la caracterstica de que no los mezcla durante el proceso. Supngase adems que el 40% de la
harina de calidad A proviene del pescado P1 y el 40% de la harina de calidad B proviene del pes-
cado P2. Determine la probabilidad de que:
a) Un saco de harina de calidad C provenga del pescado P1.
b) Un saco de harina proveniente del pescado P1 sea de calidad C.
85. Un empleado de una fbrica inspecciona siempre 10 unidades extradas aleatoriamente de la pro-
duccin del da. Supngase que un da se produjeron 50 unidades, 5 de las cuales eran defectuosas.
Si el gerente de produccin llegase al puesto del empleado justo cuando le falta inspeccionar 2
unidades, cul es la probabilidad de que:
a) las 2 unidades sean defectuosas?
Respuesta: 0,008163
b) las 2 unidades sean defectuosas, si no haba salido ninguna defectuosa antes?
Respuesta: 0,0116
86. Tres cajas iguales contienen dados de la siguiente manera: la primera contiene un dado normal y
dos anormales, la segunda contiene dos dados normales y uno anormal, y la tercera contiene tres
dados anormales. Un dado normal marca 1, 2, 3, 4, 5 y 6 en sus caras, mientras que un dado anor-
mal marca 2, 2, 4, 4, 6, 6 en sus caras.
a) Se extrae un dado de una de las cajas, en forma aleatoria y se lanza dos veces. Cul es la pro-
babilidad de que los dos dados muestren resultado par?
b) Se extrae un dado de una de las cajas, en forma aleatoria y se lanza dos veces, obtenindose
par en los dos lanzamientos. Cul es la probabilidad de que el dado elegido sea el anormal?
87. Se estima que el 35% de los autos estacionados en Piura no tienen alarma contra robos. Adems,
la probabilidad de que uno de estos autos sea robado es 0,10; en cambio esta probabilidad es 0,005
en los autos con alarma. Si se han robado un auto, cul es la probabilidad de que no tenga alar-
ma?
88. Se dispone de una urna con 6 canicas blancas y cuatro canicas negras. Se lanza un dado y, a conti-
nuacin, se extraen de la urna tantas canicas como lo indica el resultado del dado. Suponiendo que
obtuvieron exactamente 3 canicas blancas, cul es la probabilidad de que el resultado del dado
haya sido 5?
89. Una hamburguesera ofrece a sus clientes cinco tipos de ingredientes: lechuga, tomate, papitas,
salsa de tomate y mayonesa. Cuntos tipos de hamburguesas se pueden preparar? Considere que
es posible un tipo de hamburguesa sin ingredientes, o con uno o ms ingredientes.

Introduccin a la Estadstica

34
Captulo 2. Introduccin a la Estadstica
2.1 Definicin de Estadstica
Aunque estemos acostumbrados a que la palabra Estadstica se emplee para designar descrip-
ciones numricas o conjuntos de datos, es conveniente definirla como una ciencia que ha llegado a
emplearse en casi todas las ciencias.
Se dice con razn que la Estadstica es el lenguaje universal de las ciencias. Se emplea, por
ejemplo, en: Produccin, Calidad, Finanzas, Marketing, Logstica, Economa, Psicologa, Sociologa,
Educacin, Medicina, Informtica, Biologa, Qumica, etc.
La Estadstica es la ciencia que recopila, clasifica, presenta, describe e interpreta conjuntos de
datos. Generalmente se ocupa de estudiar fenmenos aleatorios.
2.2 Definicin de algunos trminos bsicos
2.2.1 Universo o poblacin:
Es el conjunto de datos o elementos cuyas propiedades se van a analizar. Cuando se quiere reali-
zar una investigacin estadstica, debe definirse cuidadosamente el universo. Si se quiere investigar,
por ejemplo, qu proporcin de la poblacin de Piura fuma cigarrillos, debe definirse claramente el
universo, diciendo quines lo conforman. No sera correcto decir que lo conforman los adultos, pues
este trmino no est claramente definido. Podra definirse correctamente el universo diciendo, por
ejemplo, que lo conforman aquellos que tienen 18 aos cumplidos. En este ejemplo el universo est
conformado por personas, o mejor dicho, por un atributo de dichas personas; pero el universo podra
estar conformado por atributos o mediciones de personas, objetos o animales.
2.2.2 Muestra
Es un conjunto de datos seleccionados de un universo, de tal forma que refleje las caractersticas
de ste. Se dice entonces que la muestra es representativa del universo.
A pesar de que slo se debe llamar muestra a un conjunto de datos representativos del universo,
se suele clasificar las muestras en: probabilsticas y no probabilsticas. Las primeras suelen ser re-
presentativas de la poblacin; las segundas no.
Se dice que una muestra es probabilstica cuando cada elemento del universo tiene una probabi-
lidad conocida de ser seleccionado en la muestra. La muestra es no probabilstica cuando sus elemen-
tos se eligen con base en el juicio o criterio del investigador. Esto puede dar lugar a una muestra que
no sea representativa del universo del cual fue extrada. Generalmente, cuando se hace una investiga-
cin, se extraen muestras probabilsticas, por razones evidentes.
Una muestra probabilstica puede ser: muestra aleatoria simple, muestra estratificada o muestra
por conglomerados.
Se denomina muestra aleatoria simple a aqulla que es seleccionada de tal forma que cada
elemento del universo tiene la misma probabilidad de ser seleccionado. Un buen mtodo para conse-
guir esto consiste en enumerar previamente todos los elementos que conforman el universo, y, em-
pleando nmeros aleatorios, seleccionar la muestra del tamao deseado.
Si el universo es de gran tamao, puede resultar muy engorroso este ltimo mtodo, pues se ne-
cesitara mucho tiempo y/o dinero. Conviene en este caso dividir el universo en estratos, y tratar a ca-
Introduccin a la Estadstica

35

da uno de stos como un universo.
Se denomina muestra estratificada a aqulla que se obtiene dividiendo el universo en estratos,
para luego seleccionar submuestras de cada uno de stos.
Se denomina muestra por conglomerados a aqulla que se obtiene estratificando el universo,
para luego tomar todos los elementos de algunos estratos, seleccionados aleatoriamente.
Como conclusin, es conveniente tener en cuenta que el tipo de muestra que se debe emplear
depende de lo que se va a investigar, y para seleccionar sta adecuadamente, en caso que el universo
sea grande y complicado, conviene estudiar con ms detalle la Teora del Muestreo.
2.3 Estadstica descriptiva e inferencial
La estadstica se divide en dos partes: descriptiva e inferencial
La estadstica descriptiva se encarga de recopilar, clasificar, presentar y describir un conjunto
de datos. Como generalmente se estudian poblaciones muy grandes, este conjunto de datos suele ser
una muestra.
La estadstica inferencial se encarga de interpretar los datos estudiados por las tcnicas descrip-
tivas. De los datos obtenidos de las muestras, saca conclusiones que da como vlidas para todo el uni-
verso. Es de esperarse que al sacar estas conclusiones siempre exista una pequea probabilidad de
error, pues la inferencia es inductiva. Existe, pues, cierta incertidumbre al sacar dichas conclusiones;
pero tal incertidumbre puede ser cuantificada.
2.4 Importancia de la Estadstica
A continuacin se presentan cuatro razones (Guilford y Fruchter) por las cuales es recomenda-
ble alcanzar cierto dominio de la Estadstica:
1. Para poder leer literatura profesional.
Para nadie es un secreto que un buen profesional siempre debe estar leyendo sobre su especiali-
dad, y difcilmente podr leer gran cosa sin encontrarse con smbolos, conceptos e ideas estadsti-
cas. Quienes esquivan estas partes seguramente no podrn opinar ni sacar conclusiones propias, y
tendrn que depender de lo que opinen los dems.
2. Para dominar tcnicas que se necesitan en otras materias.
Generalmente es imposible hacer un buen anlisis de los resultados sin emplear un mnimo de tc-
nicas estadsticas.
3. Porque es parte esencial de la formacin profesional.
En casi todas las profesiones.
4. Porque es parte fundamental en la Investigacin.
El progreso de cualquier profesin y de la competencia de sus miembros depende de la perma-
nente actitud de investigacin y de los esfuerzos de investigacin de esos miembros.
La estadstica es fundamental en la investigacin por las siguientes razones:
Permite describir con mayor exactitud cualquier fenmeno.
Obliga a ser claros y exactos en los procedimientos y en el pensar.
Sin el empleo de la Estadstica se puede ser vago sin equivocarse; pero lo ideal es ser claro y
exacto sin equivocarse.
Permite resumir resultados significativamente.
Esto mediante distintos tipos de tablas y grficos.
Permite deducir conclusiones generales.
Introduccin a la Estadstica

36
Adems, se puede saber qu tan confiables son esas conclusiones generales sacadas en un es-
tudio, y hasta dnde se pueden ampliar nuestras generalizaciones.
Permite hacer predicciones.
Si se conocen las condiciones en que se encuentra algo o alguien, podemos predecir qu suce-
der a futuro. Por ejemplo, si la produccin en un proceso de manufactura se ve afectada por
diversos factores, y se tiene registrados valores que cuantifiquen estos factores, se puede de-
terminar una ecuacin predictiva que relacione la produccin con dichos factores.
Permite analizar algunos factores causales en sucesos complejos.
Se pueden determinar, por ejemplo, los factores causales por los que un producto tiene acepta-
cin en el mercado, y analizar cunto influye cada uno.


Estadstica Descriptiva


37
Captulo 3. Estadstica Descriptiva
3.1 Introduccin
Si se tuviera que informar respecto a datos obtenidos en una investigacin, no servira de mucho
que stos se presenten en un simple listado, o que slo se exprese alguna medida descriptiva (por
ejemplo, la media o promedio) de dichos datos. En el primer caso la informacin resultar excesiva y
en el segundo puede ser pobre. Lo ms prctico sera presentar los datos de una forma condensada, ya
sea mediante el uso de tablas o de grficos.
En este captulo se van a presentar las medidas descriptivas ms empleadas en anlisis de datos,
y las distintas formas de representar dichos datos en tablas y grficos.
3.2 Medidas descriptivas
A continuacin se definen las medidas descriptivas ms usadas en las investigaciones estadsti-
cas, que nos permiten localizar con cierta precisin un conjunto de datos. Estas medidas pueden ser: de
tendencia central, de variabilidad, de posicin y de forma.
Las medidas de tendencia central, como la media aritmtica, la mediana y el modo, tratan de
ubicar la parte central de un conjunto de datos.
3.2.1 Media aritmtica
Dado un conjunto de n datos de una muestra, se define la media aritmtica:

=
=
n
i
i
x
n
x
1
1

Dado un conjunto de los N datos de una poblacin, se define la media aritmtica:

=
=
N
i
i
x
N
1
1

Dada una muestra conformada por un conjunto de k valores; si cada uno de stos se repite con
una frecuencia f
i
, o si cada uno tiene un peso o ponderado w
i
, entonces las medias aritmticas sern,
respectivamente:

=
=
=
k
i
i
k
i
i i
f
x f
x
1
1

=
=
=
k
i
i
k
i
i i
w
x w
x
1
1


A esta ltima se le denomina media aritmtica ponderada.
Si en lugar de contar slo con datos muestrales se tuviera todos los datos poblacionales, para
calcular la media aritmtica se emplearan estas dos mismas frmulas.
Estadstica Descriptiva

38
Si se tienen k muestras de tamaos N
1
, N
2
, ... , N
k
, con medias aritmticas , , ... , ,
2 1 k
x x x respec-
tivamente; entonces la media aritmtica del conjunto ser:

=
=
=
k
i
i
k
i
i i
N
x N
x
1
1


Ejemplo 1:
Una entidad financiera ofrece los siguientes intereses anuales, segn los montos que depositen
los ahorristas a plazo fijo: 6% para depsitos A (de 1000 dlares); 8% para depsitos B (de
2000 dlares) y 10% para depsitos C (de 5000 dlares). Cul es el inters anual promedio que
est pagando el banco si hay 15 depsitos A, 10 depsitos B y 5 depsitos C?
% 33 , 7
30
10 5 8 10 6 15
=
+ +
= x
Ejemplo 2:
Se han registrado los pesos de las bolsas de arroz empacadas por una empresa durante 7 horas,
resultando un promedio de 0,992 Kg. Si cada hora se embolsan 30 unidades, cul ser el peso
promedio si en la octava hora se registra un peso promedio de 1,025 Kg?
En este caso se debe hallar la media de dos medias aritmticas, donde los pesos o ponderaciones
pueden ser 7 y 1, 210 y 30.
996 , 0
8
025 , 1 1 992 , 0 7
=
+
= x Kg.
3.2.2 La mediana
Dado un conjunto de n datos, la mediana es aqul que ocupa la posicin central, cuando los da-
tos se ordenan en orden creciente (o decreciente). Si el nmero de datos es par, la mediana ser la me-
dia aritmtica de los dos datos que ocupen la posicin central.
Si algunos datos se repiten con una determinada frecuencia, el clculo de la mediana se compli-
ca; pero no vale la pena ahondar en esto, pues se puede recurrir a una herramienta tan accesible como
Excel para hacer este clculo.
3.2.3 La moda
Dado un conjunto de datos, la moda (Mo) es el valor que se repite con mayor frecuencia. Cuan-
do dos o ms datos son los que tienen la mayor frecuencia, se dice que el conjunto de datos es bimodal
o multimodal, respectivamente.

Las medidas de variabilidad, como la amplitud, la desviacin media, la varianza y la desvia-
cin estndar, indican qu tan dispersos se encuentran los datos.
En muchas situaciones es importante conocer la variabilidad de los datos. Por ejemplo, entre dos
procesos de elaboracin de planchas de acero del mismo espesor, es ms eficiente aqul cuyas medi-
das de espesor tienen una menor variabilidad. Igualmente, entre dos negocios con similar promedio de
ganancias, quien tiene aversin al riesgo preferir aqul que tenga menor variabilidad, pues as puede
evitar una posible ganancia muy baja o una prdida.
Estadstica Descriptiva


39
3.2.4 La amplitud
Dado un conjunto de datos, la amplitud es la diferencia entre el mayor y el menor. Es una medi-
da que puede ser muy til, dada la facilidad con que se calcula; pero en ciertas ocasiones puede dar
una idea equivocada de la variabilidad de los datos; por ejemplo, cuando uno de los datos difiere signi-
ficativamente de los dems.
3.2.5 La desviacin media
Dado un conjunto de datos, la desviacin media es la media aritmtica de los valores absolutos
de lo que se desva cada valor respecto a la media aritmtica. Es una medida poco usada debido a la
dificultad al hacer clculos con la funcin valor absoluto.

=
=
n
i
i
x x
n
M D
1
1
. .
3.2.6 La varianza
Dado un conjunto de n datos, se define la varianza:
( )
2
1
2
1

=
=
n
i
i
x x
n
s
Dado un conjunto de k datos; si cada uno se repite con una frecuencia f
i
, la varianza ser:
( )
2
1
2
1

=
=
k
i
i i
x x f
n
s
Algunos autores emplean n 1 en lugar de n en las dos ltimas frmulas. Ms adelante se ver
que es recomendable emplear n 1 cuando la muestra extrada es pequea. Para n grande esto no oca-
siona una diferencia numrica apreciable.
Si se cuenta con el total de datos (N) de una poblacin, la varianza es:
( )
2
1
2
1

=
=
N
i
i
x
N

( )
2
1
2
1

=
=
k
i
i i
x f
N

3.2.7 La desviacin estndar
Es la raz cuadrada positiva de la varianza. Es la medida de variabilidad que ms se emplea, de-
bido a que se expresa en las mismas unidades que los datos y la media aritmtica.
3.2.8 El coeficiente de variacin
Se define como el cociente entre la desviacin estndar y la media aritmtica de un conjunto de
datos. Segn se trate de una muestra o poblacin, el coeficiente de variacin ser:

= V
x
s
v =
Esta medida se suele usar para comparar el grado de dispersin de dos o ms conjuntos de datos;
incluso si se trata de medidas diferentes. Suele ser de gran utilidad cuando se desea comparar las dis-
persiones de dos conjuntos de datos cuyas medias difieren significativamente.
Ejemplo:
Medio ao despus de haber sembrado 50 semillas, se miden las alturas de las plantas, obtenin-
dose una media de 43,6 cm. y una desviacin estndar de 5,1 cm. Al cumplir un ao, se vuelven
a medir las alturas de las plantas, encontrndose una media de 128,7 cm. y una desviacin es-
tndar de 6,6 cm. Compare las dispersiones de las plantas en ambos momentos.
Estadstica Descriptiva

40
Al medio ao: V
1
= 5,1/43,6 = 0,117
Al ao: V
2
= 6,6/128,7 = 0,051
Si se comparasen las desviaciones estndar, se afirmara que la dispersin aument; pero com-
parando las dispersiones respecto a las alturas (representadas por las medias aritmticas), se
puede afirmar que la dispersin relativa ha disminuido.

Las medidas de posicin, como los cuartiles y los percentiles, localizan los datos respecto a los
dems.
3.2.9 Los cuartiles
Dado un conjunto de datos ordenados en forma ascendente, los cuartiles lo dividen en cuatro
partes iguales.
El primer cuartil, Q
1
, es un valor tal que, a lo sumo, la cuarta parte de los datos es menor que Q
1
,
y, a lo sumo, las tres cuartas partes son mayores.
El segundo cuartil, Q
2
, coincide con la mediana.
El tercer cuartil, Q
3
, es un valor tal que, a lo sumo, las tres cuartas partes de los datos son meno-
res que Q
3
, y, a lo sumo, la cuarta parte es mayor.
Ejemplo 1:
, 15 , 13 , 12 , 20 , 19 , 18 , 26 , 25 , 21 34 , 30 , 28


Ejemplo 2:
, 17 , 16 , 15 , 12 , 10 28 , 27 , 26 , 23 , 19


Para el clculo de los cuartiles se recomienda recurrir a una herramienta tan accesible y de tan
fcil uso como Excel. Obsrvese, en el ejemplo 1, que Q
1
no es la media de 15 y 18.
3.2.10 Los percentiles
Dado un conjunto de datos ordenados en forma ascendente, los percentiles lo dividen en cien
partes iguales.
El k-simo percentil, P
k
, es un valor tal que, a lo sumo, el k por ciento de los datos son menores
que P
k
. Para determinar los percentiles se sigue el mismo procedimiento que para los cuartiles.

Las medidas de forma, como el coeficiente de asimetra y la curtosis, expresan la forma como
se distribuye un conjunto de datos.
3.2.11 Coeficiente de asimetra
Mide si un conjunto de datos estn ms dispersos por encima de la media aritmtica o por deba-
jo de ella. Si hay ms datos por encima de la media, el coeficiente de asimetra es positivo; si hay ms
datos por debajo de la media, el coeficiente de asimetra es negativo; y si los datos estn igualmente
dispersos por encima y por debajo de la media, el coeficiente de asimetra es cero.
El coeficiente de asimetra puede calcularse mediante la siguiente frmula (de Excel), aunque lo
ms prctico es calcularlo en Excel.
Q
1
=17,25 Q
3
=26,5 Q
2
=20,5
Q
1
=15,25 Q
2
=18 Q
3
=25,25
Estadstica Descriptiva


41
3
) 2 )( 1 (

|
.
|

\
|

=
s
x x
n n
n
sk
i

Existen otras frmulas para medir la asimetra, como el coeficiente de Asimetra de Pearson:
s
Mo x
sk

=
3.2.12 Curtosis
Mide el grado en que los datos estn agrupados alrededor de la media aritmtica. Si la mayor
parte de los datos estn cerca de la media, la curtosis es positiva, y se dice que los datos tienen una dis-
tribucin leptocrtica; en caso contrario, si la mayor parte de los datos estn lejos de la media, la cur-
tosis es negativa, y se dice que los datos tienen una distribucin platocrtica. Si los datos se distribu-
yen normalmente (captulo 8), la curtosis es cero, y se dice que la distribucin es mesocrtica.
Es importante aclarar que la curtosis no es una medida de la variabilidad de los datos; que un
conjunto de datos tenga una distribucin leptocrtica no indica que tenga menor desviacin estndar.
Para medir la curtosis se puede emplear la siguiente frmula (de Excel), aunque lo ms prctico
es calcularla en Excel.



|
.
|

\
|

+
=
) 3 )( 2 (
) 1 ( 3
) 3 )( 2 )( 1 (
) 1 (
2
4
n n
n
s
x x
n n n
n n
k
i

3.3 Exactitud y precisin
La mayora de la gente usa estos dos trminos indistintamente, y por lo tanto, incorrectamente.
Exactitud es la proximidad de un resultado o de un conjunto de resultados de un experimento con el
resultado verdadero o real. Precisin es la cercana entre los resultados de un experimento.
As, se pueden tener resultados precisos pero no exactos, o exactos y precisos; aunque es difcil
tener resultados exactos e imprecisos. Los cientficos experimentales hacen una distincin entre dos
tipos de errores: aleatorios y sistemticos.
Los errores aleatorios provocan que los resultados se dispersen alrededor del valor promedio, es
decir, afectan la precisin o reproducibilidad de un experimento. La varianza o desviacin estndar
miden qu tan grande o pequeo ser el error aleatorio.
Los errores sistemticos provocan que los resultados se desven en el mismo sentido, es decir,
afectan la exactitud de los resultados. La diferencia entre la media de los resultados y el valor verdade-
ro es una medida del error sistemtico.
En 1936, A. Benedetti-Pichler ilustr estos conceptos, como se muestra en la figura 3.1.
Figura 3.1 Exactitud y precisin
Valor verdadero
Exacto y preciso
Preciso e inexacto
Impreciso e inexacto
Estadstica Descriptiva

42
3.4 Medidas descriptivas en Excel
Resulta sumamente fcil calcular las medidas descriptivas de un conjunto de datos con Excel.
Slo basta ingresar los datos en una hoja de clculo, ubicarse en la celda donde se desea expresar la
medida, y hacer click en el icono . Excel abre un cuadro de dilogo con todas las funciones dispo-
nibles, por categoras, como se muestra en la figura 3.1.

Figura 3.1. Cuadro de dilogo de funciones de Excel

Una vez seleccionada una funcin, Excel indica, en el mismo cuadro de dilogo, qu resultado
va a devolver, y qu datos necesita, explicando en qu consiste cada uno de stos. Las medidas des-
criptivas estudiadas en este captulo que estn en el listado de funciones de Excel se muestran en la ta-
bla 3.1.
Tabla 3.1. Funciones de Excel para el clculo de algunas medidas descriptivas
Medida descriptiva Funcin de Excel
Media aritmtica PROMEDIO
Mediana MEDIANA
Moda MODA
Varianza (muestra)
Varianza (poblacin)
VAR
VARP
Desviacin estndar (muestra)
Desviacin estndar (poblacin)
DESVEST
DESVESTP
Cuartil CUARTIL
Percentil PERCENTIL
Coeficiente de asimetra COEFICIENTE.ASIMETRA
Curtosis CURTOSIS

Cabe aclarar que las funciones VARP y DESVESTP emplean n en el denominador, a diferencia
de las funciones VAR y DESVEST que emplean n 1.
Excel tiene tambin, en el men de Herramientas, la opcin Anlisis de datos (si no aparece,
puede activarse en la opcin Complementos, escogiendo la opcin Herramientas para Anlisis). Esta
opcin Anlisis de Datos abre un cuadro de dilogo con un listado de herramientas estadsticas. Una
de estas herramientas es: Estadstica Descriptiva, que abre el cuadro de dilogo que se muestra en la
figura 3.2.
Estadstica Descriptiva


43

Figura 3.2. Cuadro de dilogo de Estadstica descriptiva de Excel para el ingreso de datos

Ejemplo:
Se ingresan los siguientes 20 datos en Excel, en una fila o columna; por ejemplo, desde la celda
A1 hasta la celda A20.
73 69 65 87 86 61 65 77 80 72 75 85 63 75 73 78 74 81 73 81.

En el rango de entrada del cuadro de dilogo saldr: A1:A20. Ejecutando la opcin Resumen de
estadsticas, Excel muestra el resultado que se muestra en la tabla 2.

Tabla 3.2. Medidas descriptivas del Anlisis de datos de Excel
Fila1

Media 74,65
Error tpico 1,67846264
Mediana 74,5
Moda 73
Desviacin estndar 7,50631313
Varianza de la muestra 56,3447368
Curtosis -0,64638537
Coeficiente de asimetra -0,13330001
Rango 26
Mnimo 61
Mximo 87
Suma 1493
Cuenta 20
Estadstica Descriptiva

44
3.5 Representaciones de datos
3.5.1 Distribucin de frecuencias: diagrama de barras
Al repetirse sucesivamente un experimento, los resultados obtenidos constituyen los valores que
toma la variable aleatoria definida, X. Cada uno de estos resultados se representa con x
i
(minscula).
La cantidad de veces que se repite cada resultado se denomina frecuencia, f.
Al conjunto de parejas de valores {x
i
, f
i
} se le denomina distribucin de frecuencias, y se repre-
senta en una tabla de distribucin de frecuencias como la que se muestra en la tabla 3.3.
Tabla 3.3. Tabla de distribucin de frecuencias
X x
1
x
2
... x
n
f f
1
f
2
... f
n

Esta distribucin de frecuencias suele representarse mediante diagramas de barras, que represen-
ta cada una de las frecuencias en barras proporcionales.
Ejemplo:
Los siguientes datos expresan las cantidades de piezas que produjeron 20 trabajadores durante
una semana en un taller de manufactura:
73 79 75 77 76 76 75 77 74 72 75 75 73 75 73 78 74 76 73 80

La distribucin de frecuencias correspondiente a estos datos se expresa en la tabla 3.4, que da
una idea ms clara de cmo estn distribuidos los datos que conforman la muestra.
Tabla 3.4 Distribucin de frecuencias de la piezas producidas por los 20 trabajadores
X 72 73 74 75 76 77 78 79 80
f 1 4 2 5 3 2 1 1 1

Para este ejemplo, el diagrama de barras de la figura 3.3 nos da una visin mucho ms clara de
cmo estn distribuidos estos datos. Como se ve, la mayora de los trabajadores (14 de 20) elaboraron
entre 73 y 76 piezas.

Figura 3.3 Diagrama de barras del nmero de piezas producidas por los 20 trabajadores

0
1
2
3
4
5
6
72 73 74 75 76 77 78 79 80
f
Estadstica Descriptiva


45
Si en una distribucin de frecuencias se suman sucesivamente las frecuencias, de tal forma que
stas se van acumulando: f
1
, f
1
+ f
2
, f
1
+ f
2
+ f
3
, etc., se obtiene una distribucin de frecuencias
acumuladas. Para el ejemplo anterior, esta distribucin se representa en la tabla 3.5.
Tabla 3.5 Distribucin de frecuencias acumuladas del nmero de piezas producidas por los 20 trabajadores
X 72 73 74 75 76 77 78 79 80
f
acum

1 4 7 12 15 17 18 19 20

3.5.2 Representaciones tallo-hoja
Las representaciones tallo-hoja (stem-and-leaf) muestran en la columna que est a la izquierda
de la barra, la(s) cifra(s) de la izquierda de cada dato (tallos), y a la derecha de la barra, las cifras de
las unidades (hojas). As, cada hoja, junto con su tallo, conforma un dato. Si todos o casi todos los da-
tos de una muestra tienen la misma cifra de las decenas, como en el ejemplo anterior, la representacin
tallo-hoja no es til.
Ejemplo:
Se ha medido el tiempo que tarda vehculo que transporta productos terminados desde una fbri-
ca a uno de sus almacenes, durante 30 das, obtenindose los siguientes resultados, en minutos:
41 33 47 56 56 58 30 42 55 34
47 41 31 35 36 40 38 40 46 40
41 40 56 44 42 39 58 53 59 37

La representacin tallo-hoja para el ejemplo del apartado anterior se muestra en la figura 3.4.

3 3 0 4 1 5 6 8 9 7
4 1 7 2 7 1 0 0 6 0 1 0 4 2
5 6 6 8 5 6 8 3 9

Figura 3.4 Representacin tallo-hoja de la piezas producidas por los 20 trabajadores
En este ejemplo, esta representacin puede resultar til para formarse una idea de la distribucin
de los datos, decena por decena. Como se ve, los datos no necesitan ser representados en un orden de-
finido.
3.5.3 Diagrama de caja-bigote
Representa un conjunto de datos mediante una caja formada con los siguientes valores: mnimo,
mximo, primer cuartil, segundo cuartil y tercer cuartil. De esta forma se visualiza fcilmente cmo
estn distribuidos un conjunto de datos.
Ejemplo:
El administrador de una gasolinera ha anotado el nmero de vehculos que llegan a su local cada
dos minutos, de 7 a 11 a.m. y de 3 a 7 p.m., con el propsito de comparar la afluencia de vehcu-
los por la maana y por la tarde. A continuacin se muestran los datos obtenidos en ambos ho-
rarios. Trace dos diagramas de caja y bigote.
Ingresando los datos a Excel, se calculan fcilmente los datos que se necesita para construir los
diagramas de caja bigote, es decir:
Para el horario de la maana:
Min = 2; Max = 17; Q
1
= 7; Q
2
= 8,5; Q
3
= 11

Para el horario de la tarde:
Min = 1; Max = 15; Q
1
= 6; Q
2
= 7; Q
3
= 10

Estadstica Descriptiva

46
Tabla 3.4. Nmero de vehculos que llegan a una gasolinera cada dos minutos
Horario de la maana Horario de la tarde
9 7 7 7 6 7 6 10 6 11 15 8 9 4 9 11 6 8 5 4 1 4 7 8
7 11 15 6 6 11 9 2 9 4 9 17 6 5 9 12 8 14 6 4 9 8 6 7
9 8 4 6 6 8 7 7 9 10 10 4 8 8 11 3 6 10 11 5 4 5 6 6
10 12 12 11 5 11 7 11 12 10 10 7 7 8 5 13 10 11 11 11 2 8 10 7
12 5 8 8 10 12 6 13 7 12 8 10 7 7 5 4 7 5 8 9 12 14 8 4
10 14 8 10 9 5 6 8 8 11 6 6 8 11 7 3 6 4 10 6 15 5 4 13
5 9 11 9 10 8 5 11 7 4 8 12 11 6 4 6 11 6 7 9 4 13 7 6
10 15 11 9 14 6 10 8 11 9 8 8 11 8 9 11 6 3 6 5 11 10 11 6
11 11 6 3 8 10 9 7 9 13 10 6 12 10 4 8 4 8 6 4 10 8 10 6
13 6 9 7 8 7 8 13 7 2 5 12 6 9 9 8 5 7 10 11 11 6 6 10

En la figura 3.5 se presentan los dos diagramas de caja bigote, juntos y con la misma escala,
para poder hacer una comparacin de ambos grupos de datos.

Figura 3.5. Diagramas de caja bigote del nmero de vehculos que llegan a una gasolinera en dos minutos.

Aunque bastara hallar las medias aritmticas de los dos turnos para darse cuenta que por la tar-
de hay una pequea disminucin en el nmero de vehculos que llegan a la gasolinera, los diagramas
de caja-bigote nos dan ms informacin. Se puede afirmar, por ejemplo, que por la maana, en la cuar-
ta parte (25%) de los intervalos de dos minutos llegaron entre 2 y 7 vehculos; sin embargo, por la tar-
de, en la mitad de los intervalos de dos minutos llegaron entre 1 y 7 vehculos.
3.6 Distribuciones de frecuencias agrupadas
3.6.1 Agrupacin de datos.
Si se tiene un conjunto de datos que corresponden a una variable aleatoria continua, o a una va-
riable aleatoria discreta en cuya tabla de distribucin de frecuencias hay demasiadas frecuencias, es
conveniente agrupar los datos en intervalos, pues el diagrama de barras correspondiente tendra dema-
siadas barras y no mostrara con claridad de qu forma se distribuyen dichos datos.
Agrupar un conjunto de datos en intervalos, y representarlo grficamente, suele ser ms un arte
que una tcnica. Existen frmulas matemticas que se emplean para determinar el nmero de interva-
los que conviene tener, y a partir de este resultado se determinan los tamaos de estos intervalos, obte-
nindose en la mayora de los casos valores numricos poco prcticos y/o inmanejables.
Para agrupar en forma adecuada un conjunto de datos, se propone seguir los siguientes pasos:
1) Determinar la amplitud, A.
0
2
4
6
8
10
12
14
16
18
0
2
4
6
8
10
12
14
16
18
Estadstica Descriptiva


47
2) Determinar el nmero de agrupaciones o clases, m, y la longitud de cada clase, k, de tal for-
ma que el producto mk sea mayor o igual que A. Es recomendable que el nmero de clases
est comprendido entre 6 y 15, para una mejor interpretacin, y que la longitud de las clases
sea impar, si se quiere trabajar con las marcas de clase (se definen ms adelante).
3) Determinar uno por uno los lmites de cada clase, procurando que, los lmites inferiores o
los superiores, sean mltiplos de 5, 10, 100, 1 000, etc., para facilitar su visualizacin.
4) Contar el nmero de elementos de cada clase.

Es muy importante establecer la precisin de las cifras con las que se va a trabajar. Por ejemplo,
si los datos representan dimetros de ciertas piezas cilndricas, en mm.: 125,5; 127,3; 124,0; etc; los
lmites se expresarn tambin con una cifra decimal.
Antes de seguir adelante, conviene definir:
1) Frecuencia de clase: Es el nmero de elementos que hay en cada clase.
2) Lmites de clase: Son los valores extremos de cada clase.
3) Fronteras de clase: Son valores que no estn presentes en los datos. Se localizan en los pun-
tos medios entre el lmite superior de una clase, y el inferior de la clase siguiente. Incluyen
por lo tanto una aproximacin superior a la que consider al agrupar los datos (dos decima-
les para el ejemplo de los dimetros).
4) Longitud de clase: Es la extensin o tamao de las clases. Se obtiene calculando la diferen-
cia entre las fronteras de una clase, o la diferencia entre dos lmites superiores (o inferiores)
consecutivos.
5) Marca de clase: Es el punto medio de cada clase. Se obtiene calculando la semisuma de los
lmites superior e inferior de cada clase.

Vale la pena aclarar que, dado un conjunto de datos, stos se pueden agrupar de varias maneras,
sin que se pueda decir en muchos casos que slo una es la manera correcta. Se podra decir, sin em-
bargo, que la mejor agrupacin es aquella que se elabora de una forma rpida y que permite mostrar de
una manera clara cmo se distribuyen los datos, ya sea de forma tabular o grfica.
Ejemplo:
Suponga que los siguientes datos representan el nmero de piezas que produjeron 100 trabajadores
durante la ltima semana:
23 20 16 18 30 22 26 15 13 18
14 17 11 37 21 16 10 20 22 25
19 19 19 20 12 23 24 17 18 16
27 26 28 26 15 29 19 18 20 17
12 24 21 22 20 15 18 16 23 24
15 24 28 19 24 22 17 19 8 18
17 18 23 21 25 19 20 22 21 21
16 20 19 11 23 17 23 13 17 26
26 14 15 16 27 18 21 24 33 20
21 27 18 22 17 20 14 21 22 19

A continuacin se siguen los pasos recomendados:
1) A = 37 8 = 29
Estadstica Descriptiva

48
2) Podra ser: k = 5 y m = 6, de tal forma que: mk = 30 > 29.
3) As, los lmites de clase seran:

1a. clase: de 8 a 12
2a. clase: de 13 a 17
3a. clase: de 18 a 22
... ...
6a. clase: de 33 a 37
Tambin podran agruparse de esta forma:
1a. clase: de 5 a 9
2a. clase: de 10 a 14
3a. clase: de 15 a 19
... ...
6a. clase: de 30 a 34
7a. clase: de 35 a 39
que resulta mucho ms cmodo para trabajar.
Tomando esta ltima agrupacin, se tendr finalmente:
Lmites de clase Fronteras de clase Marca de clase Frecuencia Frecuencia acumulada
5 9 4,5 9,5 7 1 1
10 14 9,5 14,5 12 10 11
15 19 14,5 19,5 17 37 48
20 24 19,5 24,5 22 36 84
25 29 24,5 29,5 27 13 97
30 34 29,5 34,5 32 2 99
35 39 34,5 39,5 37 1 100

En esta tabla se puede apreciar la ventaja de que la longitud de clase sea impar, ya que as las
marcas de clase resultan con la misma aproximacin decimal que los datos y lmites de clase.
Las fronteras de clase, en cambio, tienen una cifra decimal ms.
3.6.2 Histograma, polgono de frecuencias y ojiva.
Aunque la tabla de distribucin de frecuencias agrupadas nos da una idea de cmo estn distri-
buidos los datos, una representacin grfica nos permitir mejorar esta idea.
El histograma es una grfica que expresa la frecuencia con que sucede cada clase. La forma que
tenga el histograma permitir formarse una idea no slo de cmo estn distribuidos los datos, sino, en
muchos casos, descubrir por qu causa(s) los datos estn distribuidos de esa forma.
En el eje de abcisas se identifica la variable X, ya sea mediante las fronteras de clase, las marcas
de clase, o mediante los lmites inferiores o superiores de clase. En el eje de ordenadas se expresan las
frecuencias de clase. Cada clase formar un rectngulo de altura igual a su frecuencia y base igual a la
longitud de clase.
El polgono de frecuencias se puede trazar fcilmente sobre el mismo histograma, uniendo los
puntos medios de la parte superior de cada rectngulo, partiendo y finalizando en dos clases ficticias
de frecuencia cero y de la misma longitud de clase.
Las figuras 3.6 y 3.7 muestran el histograma y el polgono de frecuencias correspondientes al
ejemplo anterior.
Considerando que las alturas de los rectngulos del histograma vienen dadas por las frecuencias
de cada clase, y que la base de estos rectngulos es k, la longitud de clase; se puede deducir el rea que
hay bajo el histograma:
Estadstica Descriptiva


49
A = f
1
k + f
2
k + ... + f
N
k = ( f
i
) k = Nk
Figura 3.6. Histograma y polgono de frecuencias

Observando la figura 3.6 se deduce que el rea que hay bajo el polgono de frecuencias es tam-
bin igual a Nk. Ms adelante (captulo 6) se ver la importancia que tiene esta rea.
Se le denomina ojiva a la representacin grfica de la distribucin de frecuencias acumuladas,
expresando las fronteras de clase en el eje de abcisas y las frecuencias acumuladas en el eje de ordena-
das. Para el ejemplo anterior se tiene la ojiva de la figura 3.7.

Figura 3.7. Ojiva: frecuencias acumuladas
4,5 9,5 14,5 19,5 24,5 29,5 34,5 39,5
2 7 12 17 22 27 32 37 42
x
f
4,5 9,5 14,5 19,5 24,5 29,5 34,5 39,5
10
80
70
60
50
40
30
20
100
90
x
f
acum
Estadstica Descriptiva

50
3.6.3 Clculo de algunas medidas descriptivas.
Cuando se cuenta con una distribucin de frecuencias agrupadas, y no con el conjunto de datos,
puede hacerse el clculo de la media aritmtica, la varianza y la desviacin estndar, considerando que
los valores de X son las marcas de clase. Los resultados que se consiguen de esta forma son muy
aproximados a los verdaderos.
3.7 Tablas y grficas para la representacin de datos en Excel
3.7.1 Tabla y grfico de distribucin de frecuencias no agrupadas
Dado un conjunto de datos, conformado por valores discretos, se puede elaborar una tabla de
distribucin de frecuencias con la ayuda de Excel. Como ya se dijo antes, Excel muestra un cuadro de
dilogo con todas sus funciones al hacer click en el icono de funcin (f
x
). La funcin FRECUENCIA
calcula las frecuencias (f
i
) con que se repiten los valores (x
i
) de un conjunto de datos y las devuelve en
una matriz vertical de nmeros. Seleccionando un nmero de celdas verticales donde se desea que apa-
rezcan las frecuencias y escogiendo luego la funcin FRECUENCIA, aparece un cuadro de dilogo
donde Excel pide:
Datos: aqu se ingresa el rango de celdas donde estn los datos.
Grupos: aqu se ingresa el rango de celdas donde estn los valores x
i
.
Generalmente no se conocen todos los valores x
i
del conjunto de datos; pero como tales valores
son discretos, es posible determinarlos hallando previamente el menor y el mayor de todos los datos,
empleando las funciones MIN y MAX, respectivamente.
Para que la frmula ingresada sea matricial, una vez seleccionadas las celdas donde irn los re-
sultados, se digita controlshiftenter al final de la frmula.
El nmero de elementos de la matriz devuelta puede superar en una unidad el nmero de ele-
mentos de Grupos. El elemento adicional de la matriz devuelta corresponde a la suma de todos los va-
lores superiores al mayor x
i
.
Para construir el diagrama de barras correspondiente basta con recurrir al asistente de grficos
de Excel. Si se tiene problemas para construir este diagrama, conviene ingresar primero los datos de
frecuencias y luego, en el cuadro de dilogo de Datos de origen, aadir el rango de los x
i
en Rtulos
del eje de categoras (X).
3.7.2 Tabla de distribucin de frecuencias agrupadas e histogramas en Excel
Dado un conjunto de datos que convenga agrupar en intervalos, se puede recurrir a Excel para
que haga la agrupacin de acuerdo a su criterio (de Excel), o definir los lmites superiores de clase que
se consideren apropiados (ver apartado 3.6.1).
Esta opcin se encuentra en Herramientas/Anlisis de datos/Histograma. Excel abre un cuadro
de dilogo que pide:
Para los datos de entrada:
Rango de entrada: aqu se ingresa el rango de celdas donde estn los datos.
Rango de clases: aqu se ingresa el rango de celdas donde estn los lmites superiores de cla-
se, que el usuario ha ingresado previamente en Excel. Si no se ingresa nada en Rango de cla-
ses, es Excel quien escoge los lmites superiores de clase. Estos lmites pueden servir de gua
para que el usuario escoja unos lmites ms apropiados.
Para los datos de salida, se puede escoger entre las siguientes tres opciones de salida:
Rango de salida: aqu se ingresa la celda desde donde se va a construir la tabla de distribucin
de frecuencias agrupadas y el histograma, si se desea hacerlo en la misma hoja de clculo.
En una hoja nueva: aqu se puede ingresar el nombre de la hoja de clculo donde se desea
construir la tabla de distribucin de frecuencias agrupadas y el histograma. Si se deja en blan-
co, Excel le asignar un nombre, por ejemplo, Hoja4.
Estadstica Descriptiva


51
En un libro nuevo: se elige esta opcin si se desea construir la tabla de distribucin de fre-
cuencias agrupadas y el histograma en un nuevo archivo. Excel le asigna un nombre a este ar-
chivo, por ejemplo, Libro2. Posteriormente, si lo desea, el usuario puede cambiarle el nombre
a este archivo.
Finalmente se selecciona la opcin Crear grfico, y Porcentaje acumulado, si se desea graficar
la ojiva. La opcin Pareto, que no es recomendable, ordena el histograma en orden descendente de
frecuencias.
Ejemplo:
Elabore un histograma a partir del siguiente conjunto de 100 datos:
397,00 393,10 396,73 416,61 385,56 374,22 406,94 400,72 422,06 404,44
387,22 383,10 396,30 383,88 391,53 414,48 403,23 408,30 414,44 406,18
402,44 381,53 413,43 405,39 384,78 387,20 390,60 408,62 413,04 402,13
412,76 390,22 399,15 409,02 396,37 393,46 397,59 393,63 401,13 389,73
411,98 392,26 398,14 419,19 399,68 407,58 401,32 390,77 400,02 412,38
417,33 378,82 394,87 399,15 400,28 404,67 405,58 411,11 404,54 396,89
378,16 394,32 419,72 394,76 396,77 408,75 401,39 387,99 399,74 391,60
397,66 395,96 408,66 406,75 421,95 405,96 390,89 384,41 389,45 391,79
410,95 401,35 423,76 396,19 382,58 386,28 418,85 407,11 382,25 395,71
389,13 396,35 393,45 407,58 392,64 388,84 404,87 406,38 408,28 395,47

En este ejemplo se van a trazar dos histogramas: en el primero se dejar que Excel decida el
nmero de clases, y, en el segundo, el usuario elegir el nmero de clases, siguiendo las suge-
rencias vistas en el apartado 3.5.1.
En la figura 3.8 se muestra el cuadro de dilogo que muestra Excel al entrar al men: Herra-
mientas/Anlisis de datos/Histograma. Ntese que ya se ha ingresado el rango de entrada y se
ha seleccionado una hoja nueva como opcin de salida, con el nombre Histograma1.

Figura 3.8. Cuadro de dilogo de Histograma1
Adems, se ha dejado en blanco el rango de clases; de esta manera Excel elegir los lmites su-
periores de clase.
En la figura 3.9 se muestra el resultado de esta operacin, con unos lmites superiores de clase
inadecuados, y un nmero de clases muy pequeo (m = 4).
.
Estadstica Descriptiva

52

Clase Frecuencia
374.22 1
390.73 20
407.25 54
y mayor... 25
Histograma
0
10
20
30
40
50
60
374.22 390.73 407.25 y mayor...
Clase
F
r
e
c
u
e
n
c
i
a
Frecuencia

Figura 3.9. Histograma1
Para conseguir que dichos parmetros sean adecuados, habra que averiguar antes el menor y el
mayor de los datos, que en este caso son 374,22 y 423,76. As, se ve conveniente que los lmites
superiores de clase sean, por ejemplo: 380, 390, 400, 410, 420, 430. Precisamente estos datos se
ingresan en unas celdas de Excel, las cuales se seleccionan como Rango de clases, tal como se
muestra en la figura 3.10.

Figura 3.10. Cuadro de dilogo de Histograma2
En la figura 3.11 se muestra el resultado de esta operacin. Los lmites superiores son mucho
ms claros (mltiplos de 10) y el nmero de clases (m = 6) es el adecuado para el conjunto de
100 datos. Adems se ha mejorado la presentacin del histograma, como se puede apreciar cla-
ramente, empleando algunas opciones que da Excel con el clic derecho.
Vale la pena aclarar que los valores en el eje X del histograma que construye Excel correspon-
den al lmite superior de cada barra, y que el lmite inferior de la primera clase comienza en
370.
Estadstica Descriptiva


53

Clase Frecuencia
380 3
390 16
400 34
410 30
420 14
430 3
y mayor... 0
Histograma
0
5
10
15
20
25
30
35
40
380 390 400 410 420 430 y
mayor...
Clase
F
r
e
c
u
e
n
c
i
a

Figura 3.11. Histograma2


Estadstica Descriptiva

54
Problemas propuestos.
1. El promedio de sueldos de los empleados de una fbrica es una cierta cantidad. Qu contestara
usted, como Jefe de Personal, ante una queja de que nadie debera ganar por debajo del promedio,
sea cual fuere ste?
Respuesta: La nica forma de satisfacerlos es haciendo que todos ganen igual, lo cual no es posi-
ble.
2. Hasta el semestre pasado un alumno de la UDEP haba aprobado 108 de 141 crditos matricula-
dos, con un ndice acumulado de 10,43. Si este semestre se ha matriculado en 21 crditos, Hasta
cunto puede subir su ndice acumulado como mximo?
Respuesta: Hasta 11,67
3. Puede la desviacin media tener un valor cero? Puede ser negativa?
4. Qu puede decirse de una distribucin en la que s = 0?
5. Una asociacin de ahorro y prstamo tiene las siguientes hipotecas con sus respectivas tasas de in-
ters: $40 000 al 10%; $25 000 al 9%; $20 000 al 8%; $10 000 al 7% y $5 000 al 6%. Cul es la
tasa de inters promedio que se paga?
6. En las cuatro aulas donde se rindi una prueba de Estadstica hubieron 14, 27, 27 y 36 alumnos.
Las medias (o promedios) en estas aulas fueron 14,4; 12,1; 9,9 y 10,2 respectivamente. Cul es la
media general?
7. Un grupo de amigos que salieron juntos del colegio, egresaron de la UDEP el ltimo semestre.
Cuatro de Ingeniera con un ndice promedio de 14,95; seis de Administracin de Empresas con un
ndice promedio de 14,12 y tres de Informacin con un ndice promedio de 15,10. Cul es el ndi-
ce promedio del grupo? Cul es la desviacin estndar?
8. Dada la siguiente distribucin de salarios, en dlares, en una empresa extranjera:
80 52 92 75 82 96 80
70 90 69 83 94 67 63
61 96 88 63 78 83 99
85 75 81 73 97 109 87
100 85 95 88 98 78 98
98 76 100 58 108 89 84
88 64 81 70 105 64 64
81 91 59 72 97 77 97

a) Construya una tabla de distribucin de frecuencia, utilizando intervalos de $10, desde $50.
b) Dibuje el histograma y el polgono de frecuencia.
c) Determine la media y la desviacin estndar.
d) Comente brevemente cmo es la distribucin de salarios en esta empresa.
e) Construya una tabla de frecuencias acumulativas.
f) Encuentre el salario sobre el cual est el 25% de los empleados.
9. El dimetro de 180 tornillos vara entre 0,829 a 1,286 cm. Sugiera un agrupamiento indicando sus
lmites, fronteras y marcas de clase.
10. Considere la siguiente muestra: resistencia de 50 lotes de algodn (Kg. necesarios para romper una
madeja)
7,4 10,0 9,0 9,9 9,7 8,9 10,8 9,4 8,7 7,9
10,1 9,0 10,5 8,3 9,1 9,6 8,1 9,8 8,1 9,8
10,5 11,0 9,1 9,9 10,1 9,4 10,6 9,8 9,3 8,2
9,0 8,6 9,6 8,8 9,7 10,3 8,5 10,6 9,2 11,5
9,7 10,1 10,2 9,6 10,0 7,6 9,6 8,1 10,1 9,3
a) Haga una tabla de distribucin de frecuencias de la muestra no agrupada y represntela grfi-
camente.
Estadstica Descriptiva


55
b) Agrupe la muestra de tal forma que las marcas de clase sean 75, 80, 85, etc. y represente grfi-
camente la distribucin de frecuencias resultante.
c) Calcule la media y la desviacin estndar de los datos no agrupados.
d) Calcule la media y la desviacin estndar de los datos agrupados y compare estos resultados
con el apartado anterior.
11. El grosor de 400 arandelas vara entre 0,421 y 0,563 centmetros. Determine las fronteras y marcas
de clase para el primero y ltimo intervalos de clase.
12. En una muestra de 125 valores de la resistencia a la ruptura bajo cargas de tensin (en lb/pulg
2
) de
cilindros de concreto, el mnimo es 408 y el mximo es 465. Determine los lmites, fronteras y
marcas de clase que mejor le parezca.
13. Los precios de venta de 60 casas en una comunidad varan de $58050 a $184900. Determine unos
lmites de clase considerando 7 clases en las cuales se podra agrupar estos precios.
14. En la oficina de un peridico, el tiempo empleado en colocar los tipos de la pgina frontal fue re-
gistrado durante 50 das. A continuacin se muestran los datos:
20,8 22,8 21,9 22,0 20,7 20,9 25,0 22,2 22,8 20,1
25,3 20,7 22,5 21,2 23,8 23,3 20,9 22,9 23,5 19,5
23,7 20,3 23,6 19,0 25,1 25,0 19,5 24,1 24,2 21,8
21,3 21,5 23,1 19,9 24,2 24,1 19,8 23,9 22,8 23,9
19,7 24,2 23,8 20,7 23,8 24,3 21,1 20,9 21,6 22,7

a) Agrupe estos datos expresndolos en una tabla de distribucin de frecuencias, empleando lon-
gitudes de clase de 0,8 minutos.
b) Construya el histograma y el polgono de frecuencia correspondientes.
c) Calcule la media aritmtica y la varianza, a partir de la tabla elaborada, considerando que los
valores de X estn dados por las marcas de clase.
15. En un taller donde se confecciona calzado a mano, se anot cada da el nmero de unidades que
confeccionaron 10 trabajadores elegidos aleatoriamente, como se muestra en la siguiente tabla.
a) Construya un diagrama de barras con los 100 datos de la tabla y comente el resultado.
b) Trace un diagrama de caja bigote para cada semana y comente los resultados.

Semana 1 Semana 2
Lun Mar Mir Juev Vier Lun Mar Mir Juev Vier
7 5 5 5 5 10 7 9 7 8
4 5 3 6 5 9 8 10 8 9
4 5 5 6 6 9 10 5 12 4
2 6 7 6 4 10 6 9 7 6
3 1 5 2 6 8 8 9 5 9
6 7 8 5 3 5 9 9 10 9
6 6 6 7 5 9 5 8 5 7
3 6 3 4 6 7 7 7 9 8
4 6 4 4 6 9 7 9 8 7
6 4 4 4 5 7 10 6 10 7
16. Una muestra de 60 barras de manjar blanco producidas por una empresa da los siguientes pesos
(en gramos):
499,6 498,3 500,3 501,7 501,6 502,3 497,2 499,7 501,4 498,6 499,1 497,8 497,6 498,7 499,0
497,2 499,3 499,5 500,2 499,5 499,6 499,5 501,7 499,9 499,8 499,3 502,6 501,1 503,1 499,1
502,2 497,9 500,7 501,2 502,5 499,9 499,3 500,9 499,5 501,0 498,1 498,9 498,0 499,5 500,0
500,0 499,6 502,9 497,7 499,0 496,6 501,9 498,3 499,2 501,0 500,6 501,1 500,8 498,2 498,5

a) Construya una tabla de distribucin de frecuencia.
b) Dibuje el histograma y el polgono de frecuencia.
Estadstica Descriptiva

56
c) Interprete el histograma.
17. Se ha anotado la velocidad a la que pasaron por el kilmetro 25 de la carretera PiuraPaita, de una
muestra de 60 autos, durante este verano. En la siguiente tabla se muestran los datos.
76 95 78 87 60 94
83 92 105 75 52 87
66 92 86 87 83 75
72 89 81 65 73 87
99 83 75 76 78 65
94 92 97 75 68 76
75 86 106 71 66 75
66 75 54 67 80 71
73 90 105 69 70 67
68 69 94 69 74 69

a) Trace un histograma e interprtelo.
b) Trace un diagrama cajabigote e interprtelo. (Q
1
= 69; Q
2
= 75,5; Q
3
= 87).
c) Cree usted que valga la pena hacer una tabla de distribucin de frecuencias no acumuladas?
Por qu?
18. Los datos de la siguiente tabla son los cobros de electricidad durante un mes, de una muestra de 50
casas de Piura.
96 171 202 178 147 102 153 197 127 82
157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 150 154 130 143 187 166 139 149
108 119 183 151 114 135 191 137 129 158
a) Trace un diagrama tallo hoja.
b) Trace un histograma.
c) Comente cmo son los pagos mensuales de electricidad en Piura.
19. Un alumno de Estadstica de la UDEP quiere averiguar cmo se distribuyen los pagos que hacen
los alumnos universitarios por una habitacin individual en las casas de una urbanizacin cercana
a la UDEP. Despus de unos das tomando datos, casa por casa, ha averiguado que en 15 casas pa-
gan S/.200, en 21 casas pagan S/.210, en 29 casas pagan S/.220, en 41 casas pagan S/.230, en 21
casas pagan S/.240, en 15 casas pagan S/.250, en 11 casas pagan S/.260 y en 8 casas pagan S/.270.
(Nota: suponga que slo existen estos 8 tipos de pagos)
a) Halle la pensin promedio y la desviacin estndar de los pagos por habitacin en esa muestra
de casas.
b) Represente grficamente los pagos por habitacin de esa muestra y haga un comentario res-
pecto a dichos pagos
20. Qu medida descriptiva utilizara para medir la eficiencia de una mquina que debe cortar plan-
chas de una pulgada de espesor? Por qu?
21. Se toma una muestra de 60 alumnos de la Facultad de Ingeniera de la Universidad de Piura, a
quienes se les pregunta el nmero de horas que estudia en una semana, fuera de las horas de clase,
obtenindose las siguientes respuestas:
20 17 23 22 20 28 4 17 22 28 16 24 27 21 30 29 17 30 19 17
15 17 15 10 13 21 26 13 14 17 15 10 25 4 19 29 10 14 20 23
21 10 22 16 26 14 5 17 27 18 19 21 12 8 24 11 18 23 21 24

a) Trace un histograma y comente cmo ve la distribucin del nmero de horas que estudian los
alumnos de UDEP semanalmente.
b) Trace un diagrama de caja y comntelo. Los cuartiles 1, 2 y 3 son: 14,75; 19 y 23 respectiva-
mente.
Estadstica Descriptiva


57
22. Los precios de venta de 160 casas en una comunidad varan de $28050 a $124900. Determine
unos lmites de clase adecuados.
23. Se han tomado muestras de 64 sacos de un alimento balanceado para ganado que han enviado dos
proveedores, para medir el porcentaje de protena. En la siguiente tabla se muestran los valores ob-
tenidos. Trace un histograma y comente el resultado
73,8 69,9 76,0 80,1 79,8 59,3 67,4 65,3
81,9 66,3 74,1 79,4 70,7 59,5 63,7 64,6
72,2 68,2 67,6 71,1 71,9 64,4 69,9 62,3
66,5 72,7 73,4 75,5 73,5 64,0 64,9 68,1
73,7 73,5 77,4 74,7 74,3 64,8 64,4 66,0
72,9 82,9 78,5 84,5 72,4 67,1 61,5 60,3
81,6 68,6 77,2 78,6 82,7 64,0 70,9 60,5
76,7 72,9 77,7 73,5 78,0 62,5 64,0 64,2


58 Funcin de Probabilidad

Captulo 4. Funcin de probabilidad
4.1 Definicin de funcin de probabilidad.
Una funcin de probabilidad (f. de p.) de una variable aleatoria discreta X, se define como el
conjunto de parejas ordenadas {x
i
, f(x
i
)}, donde x
i
representa un valor que puede tomar X, y f(x
i
) es la
probabilidad de que X asuma dicho valor, de tal forma que f(x
i
) = 1.
Se le suele llamar distribucin de probabilidad a dicho conjunto de parejas, y funcin de pro-
babilidad a la funcin f(x), la cual asigna las probabilidades a los valores que puede tomar X.
Ejemplo 1:
Un experimento consiste en lanzar un dado, cargado de manera que la probabilidad de ocurren-
cia de cada cara es proporcional al nmero de puntos que tiene. Si se define X como el resultado
de un lanzamiento, se deduce que:
f(x) =
21
x

de manera que:

Ejemplo 2:
Se lanzan dos monedas. Si se define X como el nmero de caras que se obtiene en un lanza-
miento, no hay forma de expresar f(x) como en el ejemplo anterior; la funcin de probabilidad
se expresa simplemente con la tabla:
x 0 1 2
f(x)
4
1

2
1

4
1

La f. de p. se suele representar grficamente con diagramas de barras, tal como la distribucin de
frecuencias no agrupadas.
Ejemplo 3:
Se quiere determinar la distribucin de probabilidad del nmero de pacientes que llegan a una
clnica dental en un intervalo de una hora. En primer lugar, se debe tomar datos del nmero de
pacientes que llegan a la clnica dental, en varios intervalos de una hora, durante varios das. Su-
pngase que se obtienen los siguientes resultados:
1 1 2 3 0 1 1 2 1 3 1 3 3 4 4 3 2 2 4 3
3 3 2 1 4 1 3 3 4 1 3 3 2 4 4 1 3 0 0 3
0 1 1 0 2 2 3 7 1 1 0 1 2 0 1 1 2 2 2 3
2 1 2 2 2 3 3 0 1 3 3 3 1 0 1 1 1 1 5 1
En segundo lugar, se construye una tabla de distribucin de frecuencias:
x 0 1 2 3 4 5 6 7
f 9 24 17 21 7 1 0 1
x 1 2 3 4 5 6
f(x)
21
1

21
2

21
3

21
4

21
5

21
6

Funcin de Probabilidad 59


Finalmente, se estiman las probabilidades experimentales f(x), dividiendo cada frecuencia en-
tre la suma de frecuencias, que es 80, resultando:
x 0 1 2 3 4 5 6 7
f(x) 0,1125 0,3000 0,2125 0,2625 0,0875 0,0125 0 0,0125
Lgicamente, estas probabilidades experimentales sern ms certeras mientras mayor sea el n-
mero de veces que se repite el experimento, es decir, mientras ms datos se tomen del nmero
de pacientes que llegan a la clnica en un intervalo de una hora.
4.2 La funcin de distribucin (acumulativa).
La funcin de distribucin, F(x), acumula en forma sucesiva las probabilidades f(x) de la si-
guiente forma: si los posibles valores que puede tomar X, ordenados en forma ascendente, son: x
1
, x
2
,
x
3
, ... , x
n
; entonces:
F(x
1
) = f(x
1
)
F(x
2
) = f(x
1
) + f(x
2
)
F(x
3
) = f(x
1
) + f(x
2
) + f(x
3
)
...
F(x
n
) = f(x
1
) + f(x
2
) + f(x
3
) + ... + f(x
n
) = 1

El conjunto de parejas de valores {x ,F(x)} se expresa en una tabla, tal como la f.de p., y grfi-
camente en forma escalonada, tal como la distribucin de frecuencias acumulativas no agrupadas.
4.3 El valor esperado de una variable aleatoria discreta.
Se ha visto que la media aritmtica de un conjunto de n datos se calcula mediante la expresin:

i
n
i
i
i
n
i
i
x
n
f
x f
n
x

= =
|
.
|

\
|
= =
1 1
1

Cuando n tiende a ser un valor muy grande, f
i
/ n puede sustituirse por la probabilidad f(x), ya
que representa una probabilidad experimental, tal como se vio en el primer captulo. As, dicha media
aritmtica representa la media de la poblacin o el valor esperado de la variable aleatoria X.
Por lo tanto, dada una variable aleatoria con f.de p. {x, f(x)}, la media aritmtica terica o valor
esperado de X es:

=
= =
n
i
i i
x x f x E
1
) ( ) (
Si un experimento se repite indefinidamente y se anotan los resultados que se van obteniendo; es
decir, los valores que va tomando la variable aleatoria X, la media aritmtica de stos tender a .
Ejemplo 1:
Se lanza un dado normal. Cul es el valor esperado?
Conocida la funcin de probabilidad, se calcula:
= 1(1/6) + 2(1/6) + 3(1/6) + 4(1/6) + 5(1/6) + 6(1/6) = 3,5
Se entiende que, si un dado se lanza varias veces, la media de los resultados que se van obte-
niendo se aproxima cada vez ms a 3,5.
Ejemplo 2:
En un juego de azar, el jugador participante debe escoger aleatoriamente 3 esferas de una urna
que contiene 9 esferas numeradas del 1 al 9. Si los tres nmeros son consecutivos, el jugador
ganar $2. Si slo 2 nmeros son consecutivos, ganar $4. Si no obtiene nmeros consecutivos
perder $6. Cul es la ganancia o prdida esperada?
60 Funcin de Probabilidad

P(3 consec) = 7/C(9,3) = 1/12
P(2 consec) =
) 3 , 9 (
) 1 , 5 ( 6 ) 1 , 6 ( 2
C
C C +
= 1/2
P(no consec) = 1 1/12 1/2 = 5/12
La f.de p. correspondiente ser:
x 2 4 6
f(x) 1/12 1/2 5/12

Y el valor esperado ser = 2(1/12) + 4(1/2) + (6)(5/12) = 0,333, que representa la ganancia
esperada.
No sera correcto concluir que un jugador espera perder $0,33 si participa en este juego una vez,
pues l ganar $2 o $4, o perder $6; pero si juega muchas veces, en promedio perder $0,33
por juego.
Ejemplo 3:
Cuntos pacientes se espera que lleguen a la clnica dental (ejemplo 3 del apartado 4.1) en un
intervalo de una hora?
El valor esperado ser: = 0(0,1125) + 1(0,3000) + + 7(0,0125) = 2,013 pacientes.
Se ve claramente que, aunque el nmero de pacientes que llegue a la clnica dental en un inter-
valo de una hora, puede ser 0, 1, 2, etc., es correcto afirmar que el nmero esperado de pa-
cientes que llegan es 2,013, interpretndose este valor como un promedio. Por lo tanto, no tiene
sentido redondear dicho valor, argumentando que se trata de una variable aleatoria discreta.
4.4 Varianza y desviacin estndar de una variable aleatoria discreta
A partir de la definicin de varianza muestral, se deduce fcilmente la varianza de una variable
aleatoria, con f.de p. conocida:
( ) ( )

= =
|
.
|

\
|
= =
k
i
i
i
k
i
i i
x x
n
f
x x f
n
s
1
2
1
2
1

Cuando n tiende a ser un valor muy grande, f
i
/ n puede sustituirse por la probabilidad f(x), ya
que representa una probabilidad experimental, y la media muestral ( x ) puede sustituirse por la media
poblacional (). As, esta varianza representa la varianza de la poblacin o la varianza de la variable
aleatoria X.

=
=
n
i
i i
x x f
1
2 2
) )( (
Tambin se deduce fcilmente que:

=
=
n
i
i i
x x f
1
2 2 2
) )( (
La desviacin estndar es la raz cuadrada positiva de la varianza.
Ejemplo:
Determine la desviacin estndar del nmero de pacientes que llegan a la cnica dental del pro-
blema anterior.

2
= 0,1125(0)
2
+ 0,3000(1)
2
+ 0,2125(2)
2
+ + 0,0125(7)
2
(2,013)
2
= 3,825
= 1,956
Funcin de Probabilidad 61


Generalmente el valor numrico de la desviacin estndar de una variable aleatoria, por s solo,
no da informacin de qu tan dispersos estn los valores que tome dicha variable aleatoria, salvo que
sta tenga una distribucin normal, como se ver en el captulo 8. Sin embargo, puede ser til para
compararlo con el valor numrico de la desviacin estndar de otra muestra.
4.5 Teoremas sobre el valor esperado y la varianza.
Definida una variable aleatoria X, se deducen el valor esperado y la varianza de una funcin
h(X):
| |

= = ) ( ) ( ) (
) ( i i x h
x h x f X h E

| | | |
2
) (
2
) ( ) ( ) (

=
i i i
X h x h E x h x f
Se deducen adems seis teoremas, que se presentan a continuacin con sus respectivas demos-
traciones:
T1. E(kX) = kE(X)
E(kX) = f(x
i
)(kx
i
) = k f(x
i
)(x
i
) = kE(X).

T2. E(X+k) = E(X)+k
E(X+k) = f(x
i
)(x
i

+ k) = f(x
i
)(x
i
) + k f(x
i
) = E(X) + k

T3. E(k) = k
E(k) = f(x
i
)k = k f(x
i
) = k

T4. E(X ) = 0
E(X ) = f(x
i
)(x
i

) = f(x
i
)(x
i
) f(x
i
) = = 0

T5.
2
kX
= k
2

2
X


2
kX
= f(x
i
)(kx
i


kX
)
2
= k
2

f(x
i
)(x
i


x
)
2

= k
2

2
X

T6.
2
X+a
=
2
X

2
X+a

= f(x
i
)[(x
i

+ a)
X+a
]
2

= f(x
i
)(x
i


X
)
2

=
2
X


A partir de la varianza
2

h(X)
se deduce fcilmente que la varianza de X es el valor esperado del
cuadrado de la desviacin de la media , es decir:
2 2
) ( = X E x
NOTA: Estos teoremas tambin son vlidos para la media aritmtica de una muestra, x ,y para la
varianza de una muestra, s.
Ejemplos:
1) Dada la siguiente funcin de probabilidad:

x 1 2 3 4
f(x) 0,1 0,2 0,3 0,4
62 Funcin de Probabilidad

Si Y = 2X + 5, determine el valor esperado y la varianza de Y.
E(X) = 1(0,1) + 2(0,2) + 3(0,3) + 4(0,4) = 3
E(Y) = 2E(X) + 5 = 2(3) + 5 = 11

2
X
= 1
2
(0,1) + 2
2
(0,2) + 3
2
(0,3) + 4
2
(0,4) 3
2

= 1

2
Y

= 2
2
(1) = 4
2) La calificacin promedio en una prueba de Estadstica fue 9,24, con una desviacin estndar
igual a 1,25. El profesor desea ajustar todas las calificaciones por igual, de manera que el pro-
medio resulte 11 y la desviacin estndar 2,50. Qu debe hacer para conseguirlo?
Sean las variables: X, las calificaciones iniciales.
Y, las calificaciones corregidas.
Evidentemente: a X k Y + =
s
Y
= ks
X
Entonces: 11 = 9,24k + a
2,5 = 1,25k
Resolviendo: k = 2 ; a = 6,52
El profesor debe multiplicar cada calificacin por 2, y luego restarle 6,52.
4.6 La desigualdad de Tchebycheff.
Sea una variable aleatoria X, cuya f.de p. {x
i
, f(x
i
)} est definida. Denomnense x'
i
a todos los va-
lores que se desvan de la media, , por lo menos k veces la desviacin estndar; es decir, a todos los
valores x
i
que cumplen la siguiente condicin:
|x
i
| k ... para todo k > 1,
Se sabe que: f(x
i
)(x
i

)
2
=
2

Entonces, se cumplir que:

f(x'
i
)(x'
i

)
2

2

Y por lo tanto: f(x'
i
) k
2

2


2

( )


2
1
'
k
x f
i

Esta desigualdad se conoce como el teorema de Tchebycheff y se interpreta de la siguiente
forma: "La probabilidad de que un valor de X, escogido aleatoriamente, se desve de la media por lo
menos k veces la desviacin estndar, no es mayor que 1/k
2
".
El teorema de Tchebycheff puede aplicarse tambin a una muestra, con una distribucin cual-
quiera. En este caso se le dara la siguiente interpretacin: "La fraccin de elementos que se desvan de
la media por lo menos k veces la desviacin estndar, no es mayor que 1/k
2
".
Ejemplo:
Una mquina que se utiliza para llenar cajas de cereales descarga en promedio 12 onzas por ca-
ja. El fabricante quiere que la descarga real, en onzas, quede a una onza del promedio al menos
el 75% de las veces. Cul es la mayor desviacin estndar que se puede admitir si deben cum-
plirse los objetivos del fabricante?
Sea: X = descarga real (onzas)
= 12 onzas
P(|X 12| 1) 0,75 ; P(|X 12| 1) 0,25
Funcin de Probabilidad 63


Segn Tchebycheff: P(|x
i
| k) 1/k
2

Entonces: 1/k
2
= 0,25 y k = 1
Por lo tanto: = 0,5
La mayor desviacin estndar que se puede admitir es 0,5 onzas.
4.7 La funcin bivariante de probabilidad.
En algunas ocasiones surge la necesidad de analizar simultneamente dos caractersticas de al-
gn fenmeno aleatorio, y conviene definir por lo tanto dos variables aleatorias.
4.7.1 Definicin de funcin bivariante de probabilidad.
Si X e Y son dos variables aleatorias discretas, se define la funcin bivariante de probabilidad:
f(x, y) = P(X = x
i
; Y = y
j
) ; para: i = 1, 2,..., m.
j = 1, 2,..., n.
donde f(x, y) representa la probabilidad de que X e Y asuman los valores x
i
e y
j
, respectivamente,
de manera que:
i

j
f(x, y) = 1.
La distribucin bivariante de probabilidad se representa de la siguiente manera:
x / y y
1
y
2
... y
n
f(x)
x
1
P(x
1
, y
1
) P(x
1
, y
2
) ... P(x
1
, y
n
) f(x
1
)
x
2
P(x
2
, y
1
) P(x
2
, y
2
) ... P(x
2
, y
n
) f(x
2
)
... ... ... ... ... ...
x
m
P(x
m
, y
1
) P(x
m
, y
2
) ... P(x
m
, y
n
) f(x
m
)
f(y)

f(y
1
) f(y
2
) ... f(y
n
)
1

A f(x) y f(y) se les denomina funciones de probabilidad marginales.
Ejemplo:
Se tiene un lote de 20 artculos de la produccin diaria de una fbrica, de los cuales 14 han sido
clasificados de calidad A, 4 de calidad B y 2 de calidad C. Se seleccionan aleatoriamente 2 art-
culos de este lote. Sea X el nmero de artculos de calidad A e Y el nmero de artculos de cali-
dad B. Determine la distribucin de probabilidad bivariante de X e Y.
La siguiente tabla se construye calculando previamente las probabilidades de que ocurran las 9
combinaciones posibles:
X / Y 0 1 2 Total
0 1/190 8/190 6/190 15/190
1 28/190 56/190 0 84/190
2 91/190 0 0 91/190
Total 120/190 64/190 6/190 1
Ntese que en las columnas que dan los totales estn expresadas las funciones de probabilidad
marginales: f(x) y f(y), que se muestran a continuacin:
x 0 1 2
f(x) 15/190 84/190 91/190

y 0 1 2
f(y) 120/190 64/190 6/190

64 Funcin de Probabilidad

Se deduce, por lo visto en el captulo de probabilidades, que las variables X e Y de una funcin
bivariante de probabilidad son independientes si se cumple que: f(x
i
, y
j
) = f(x
i
) f(y
j
).
En la funcin bivariante del ejemplo anterior:
f(0, 0) = 1/190 f(0) f(0) = 180/3610
f(0, 1) = 28/190 f(0) f(1) = 1008/3610
..................... .............................
f(2, 2) = 0 f(2) f(2) = 546/36100
Verificndose, como era de esperarse, que X e Y son dependientes.
4.7.2 El valor esperado de funciones de dos variables.
A continuacin se ven algunos teoremas relativos a los valores esperados de algunas funciones
de dos variables aleatorias X e Y, como: X + Y, X Y, XY.
Teorema 7: E(X Y) = E(X) E(Y)
Demostracin:
E(X Y) =
i

j
f(x
i
, y
j
)(x
i
y
j
)
=
i

j
f(x
i
, y
j
)x
i

i

j
f(x
i
, y
j
)y
j

=
i
x
i

j
f(x
i
, y
j
)

j
y
j

i
f(x
i
, y
j
)
=
i
x
i

f(x
i
)

j
y
j
f(y
j
)
= E(X) E(Y)
En el ejemplo anterior, cul es el valor esperado de la suma de artculos tiles y recuperables?
E(X + Y) = E(X) + E(Y) = 266/190 + 76/190 = 1,8
Este teorema puede generalizarse para varias variables:
E(X
1
+ X
2
+ X
3
+ ...+ X
n
) = E(X
1
) + E(X
2
) + E(X
3
) +...+ E(X
n
)
La demostracin se puede hacer por induccin matemtica, considerando que ya se ha hecho la
demostracin para n = 2.
El valor esperado del producto de dos variables aleatorias X e Y es:
E(XY) =
i


j
f(x
i
, y
j
)(x
i
y
j
)
Para el ejemplo anterior:

190
56
0 0 0 0 ) 1 ( ) 1 (
190
56
0 0 0 0 ) ( = + + + + + + + + = XY E
Teorema 8: Si X e Y son independientes, con funcin bivariante de probabilidad f(x, y), enton-
ces: E(XY) = E(X)E(Y).
Demostracin:
E(XY) =
i

j
f(x
i
, y
j
)(x
i
y
j
)
=
i


j
f(x
i
) f(y
j
)x
i
y
j

=
i

f(x
i
)x
i

j
f(y
j
)y
j
= E(X)E(Y)
4.7.3 Varianza y covarianza de dos variables aleatorias.
Se define la covarianza de dos variables aleatorias X e Y:

XY
= E(X
X
)E(Y
Y
) =
i

j
f(x
i
, y
j
)(x
i

X
)(y
j

Y
)
Funcin de Probabilidad 65


Para el ejemplo anterior, la covarianza ser:
|
.
|

\
|
|
.
|

\
|
+ |
.
|

\
|
|
.
|

\
|
+ |
.
|

\
|
|
.
|

\
|
=
190
76
2
190
266
0
190
6
190
76
1
190
266
0
190
8
190
76
0
190
266
0
190
1
XY

0
190
76
1
190
266
1
190
56
190
76
0
190
266
1
190
28
+ |
.
|

\
|
|
.
|

\
|
+ |
.
|

\
|
|
.
|

\
|
+
2653 , 0 0 0
190
76
0
190
266
2
190
91
= + + |
.
|

\
|
|
.
|

\
|
+
Si la varianza de una variable X es:
2
X
= E(X
X
)
2
, se puede definir la varianza de la suma o
diferencia de dos variables aleatorias:

2

XY
= E[(X Y)
XY
)]
2

Entonces:

2

XY
= E[(X Y) (
X

Y
)]
2

= E[(X
X
) (Y
Y
)]
2

= E[(X
X
)
2
2(X
X
)(Y
Y
) + (Y
Y
)
2
]
= E(X
X
)
2
2E(X
X
)(Y
Y
) + E(Y
Y
)
2

Y
XY
X Y X
2 2 2
2 + =
Teorema 9: ( ) ( ) ( ) Y E X E XY E
XY
=
Demostracin:

XY
= E[(X
X
)(Y
Y
)]
= E(XY
X
Y
Y
X +
X

Y
)
= E(XY)
X
E(Y)
Y
E(X) +
X

Y

= E(XY) E(X)E(Y)
Aplicando este ltimo teorema resulta ms fcil el clculo de la covarianza. Para el ejemplo an-
terior, la covarianza es:
2653 , 0
190
76
190
266
190
56
= |
.
|

\
|
|
.
|

\
|
=
XY

tal como se haba calculado.
Se deduce de los dos teoremas anteriores que si X e Y son dos variables aleatorias independien-
tes, su covarianza es cero.
Se deduce tambin que si X e Y son dos variables aleatorias independientes, entonces:

2
XY
=
2
X
+
2
Y

4.8 Distribuciones de probabilidad en Excel
Existe una herramienta de Excel que puede ayudar a interpretar correctamente la funcin de
probabilidad. Esta herramienta genera un conjunto de nmeros aleatorios que sigue una funcin de
probabilidad determinada.
Ejemplo:
La demanda semanal de cierto artculo es una variable aleatoria, cuya funcin de probabilidad es
la siguiente:
66 Funcin de Probabilidad

x 0 1 2 3 4 5
f(x) 0,10 0,20 0,30 0,20 0,15 0,05

Simule la demanda de este artculo durante 400 semanas consecutivas y verifique si la demanda
promedio coincide con el valor esperado de la demanda semanal, es decir, .
Ingresando a Herramientas/Anlisis de datos/Generacin de nmeros aleatorios, Excel muestra
un cuadro de dilogo que pide:
Nmero de variables: aqu se ingresa el nmero de columnas donde se generarn los nmeros.
Cantidad de nmeros aleatorios: aqu se ingresa la cantidad de nmeros que se generarn en
cada columna.
Distribucin: aqu se escoge la distribucin discreta
Rango de entrada de valores y probabilidades: aqu se ingresa el rango de celdas donde estn
las parejas de valores {x
i
, f(x
i
)} (en dos columnas).

En la figura 4.1 se muestra este cuadro de dilogo con los valores ya ingresados.

Figura 4.1. Cuadro de dilogo de Generacin de nmeros aleatorios.
A continuacin se muestran los nmeros aleatorios generados por Excel, que simulan las de-
mandas semanales durante 400 semanas consecutivas. El promedio de estos valores es 2,278,
que es bastante aproximado al valor de = 2,25.
2 2 3 2 4 3 1 1 1 2 3 1 1 2 2 2 4 3 4 2
4 1 5 0 5 2 3 0 3 2 2 3 1 1 4 1 3 2 0 2
3 3 1 2 2 4 3 1 3 3 5 1 0 2 2 0 2 3 3 4
4 3 1 3 5 2 4 4 4 2 3 3 2 0 1 3 4 2 2 2
1 0 1 0 1 4 3 1 3 2 2 2 4 3 3 1 3 4 3 2
2 4 2 1 3 3 4 2 1 0 1 2 1 1 4 2 3 2 1 4
1 5 1 2 4 1 1 4 1 1 2 1 1 2 3 1 0 3 4 3
3 1 0 4 3 3 3 1 1 1 2 2 1 4 0 3 1 3 3 4
2 1 0 3 4 2 1 2 1 5 2 3 2 1 2 0 2 2 2 1
1 2 2 4 3 3 3 4 1 0 4 4 1 3 0 2 0 4 1 2
Funcin de Probabilidad 67


3 1 0 2 4 1 2 3 0 1 0 1 0 4 2 5 4 4 2 0
2 2 3 1 0 0 4 4 2 2 1 3 0 4 1 4 3 1 1 0
1 3 2 4 3 3 4 5 4 2 2 2 4 5 0 3 3 3 1 3
2 0 4 4 4 1 0 2 0 3 2 4 3 3 0 0 5 3 0 2
1 0 3 3 3 4 3 4 2 2 3 2 2 4 1 4 1 1 1 3
3 1 3 4 2 4 5 4 2 4 5 3 5 3 1 1 1 2 4 1
5 2 2 4 3 0 4 4 3 2 5 1 2 4 2 2 1 2 4 0
0 3 1 2 3 3 2 5 1 0 2 2 1 2 2 4 2 2 2 3
0 1 2 4 4 5 2 2 0 2 2 3 4 2 4 1 0 2 2 5
2 2 3 1 3 2 4 3 2 1 3 3 2 4 1 2 3 0 4 2

A manera de ejercicio, el lector podra ingresar estos 400 datos a Excel, construir la tabla de dis-
tribucin de frecuencias (con la funcin FRECUENCIA) y luego, dividiendo entre 400 cada una de las
frecuencias, determinar la distribucin de probabilidad, que debera corresponder, aproximadamente,
con la distribucin de probabilidad dada al inicio del problema.
68 Funcin de Probabilidad

Problemas propuestos.
1. Una persona que est participando en un juego, lanza un dado. Si sale un nmero par, el juego
termina y gana $10. Si no sale par, debe lanzar el dado nuevamente. Si sale un resultado mayor
que el del primer lanzamiento, gana $5; de lo contrario, pierde $20. Cunto espera ganar o per-
der? Interprete este resultado.
2. Una persona que participa en un juego lanza un dado. Si obtiene 5 6 en el primer lanzamiento
gana $10. Si no, vuelve a lanzar el dado, y si repite el resultado del primer lanzamiento, gana $8.
Si no repite este resultado, pero obtiene un nmero mayor, gana $4; pero si obtiene un nmero
menor, lanza el dado por tercera vez. Si esta vez repite el resultado del primer lanzamiento, se re-
tira sin ganar ni perder; pero si no se repite dicho resultado, pierde $20. Le parece que el juego es
justo? Explique.
3. En una urna hay seis dados blancos y cuatro dados negros. Una persona debe escoger un dado al
azar y lanzarlo. Si el dado escogido es blanco o negro, pierde o gana tantos dlares como puntos
muestre la cara superior, respectivamente. Cunto espera ganar o perder?
Respuesta: = 0,7
4. La calificacin promedio en una prueba de Estadstica fue 42,5. El profesor desea ajustar las cali-
ficaciones de manera que el promedio sea 50. Qu debe hacer?
5. Un dado est cargado de forma tal que la probabilidad de que quede hacia arriba cualquiera de sus
lados es proporcional al nmero de puntos que tiene dicho lado.
a) Sea X el nmero de puntos que quedan hacia arriba despus de arrojar el dado Cul es el va-
lor esperado de X?
Respuesta: 4,33
b) Si a usted le proponen el siguiente juego con este dado cargado: gana $1 000 si el resultado de
lanzamiento es par, y pierde $1 000 si es impar. Aceptara jugar? Explique su respuesta y
fundamntela.
Respuesta: Aceptara, pues esperara ganar $142,81 por juego, despus de muchos juegos.
6. La demanda semanal de cierto artculo es una variable aleatoria cuya funcin de probabilidad es la
siguiente:
x 0 1 2 3 4 5
f(x) 0,10 0,20 0,30 0,20 0,15 0,05
Un fabricante puede producir estos artculos a un costo unitario de $300, fijando su precio de ven-
ta en $800 cada uno; pero, por cada artculo que no venda en la semana, debe pagar $50 por alma-
cenaje. Si el fabricante dice producir tres artculos semanales, cul es su utilidad semanal espera-
da?
7. Se tiene el siguiente juego de azar: El jugador participante debe hacer un mximo de 2 lanzamien-
tos de tres monedas. Si obtiene tres caras o tres sellos en cualquiera de estos lanzamientos, gana
$10. Si no ocurre esto, y repite el resultado del primer lanzamiento, gana $5. Si no ocurre ninguna
de estas dos cosas, pierde $20. Determine la ganancia o prdida esperada, interpretando este resul-
tado.
8. Se lanzan dos dados cuyas caras muestran: (0,0,1,2,3,4) y (0,0,1,2,2,3).
a) Construya una funcin de probabilidad para la suma obtenida y construya su grfico.
b) Grafique la funcin de distribucin.
c) Determine el valor esperado y la desviacin estndar.
9. Suponga que usted tiene dos dados como los del problema 8. Si al lanzarlos obtiene una suma me-
nor que tres, pierde $100; si obtiene suma 3 no gana ni pierde; y si obtiene una suma mayor que 3
gana $100. Cul es la ganancia esperada?
Funcin de Probabilidad 69


Nmero de ventas 0 1 2 3 4
Probabilidad 0,49 0,28 0,18 0,04 0,01
10. La calificacin promedio en una prueba de Matemticas fue 65,2 con una desviacin estndar de
10. El profesor desea ajustar todas las calificaciones de manera que el promedio sea 70 y la des-
viacin estndar de 8. Qu debe hacer?
11. Una moneda se lanza al aire 4 veces. Represntense los resultados cara y sello por "0" y "1" res-
pectivamente. Sea X la suma de los resultados de los 2 primeros lanzamientos e Y la suma de los
resultados de los 4 lanzamientos.
a) Represente el espacio muestra.
b) Construya la tabla de la funcin bivariante de probabilidad.
c) Determine: E(XY), E(X + Y), E(X Y),
XY
.
Respuesta: 2,5; 3; 1; 0,5.
12. Un grupo de alumnos de la UDEP est conformado por 6 alumnos de Ingeniera, de los cuales 3
son hombres y 3 son mujeres; y 4 de Administracin de Empresas, de los cuales 2 son hombres
y 2 son mujeres. Se va a seleccionar aleatoriamente un comit de 2 personas para que organicen
la fiesta de fin de semestre. Sea X el nmero de mujeres seleccionados e Y el nmero de estu-
diantes de Ingeniera seleccionados.
a) Elabore la tabla de la funcin bivariante de probabilidad.
b) Si en el comit hay slo una mujer, cul es la probabilidad de que las dos personas sean de
Ingeniera?
Respuesta: 9/25.
c) Si en el comit no hay nadie de Ingeniera, cul es la probabilidad de que las dos personas
sean mujeres?
Respuesta: 1/6.
13. Dos jugadores A y B tienen 18 y 24 cartas, respectivamente, rojas y negras. A extrae una carta
de B, y B extrae una de A, simultneamente. Se considera que un jugador tiene xito cuando ex-
trae una carta roja. La probabilidad de que B tenga xito es 1/4, la probabilidad de que ambos
fracasen simultneamente es 1/3 y la probabilidad de que B tenga xito y A fracase es 1/9.
Cuntas cartas rojas tiene cada jugador?
Respuesta: A tiene 10 y B tiene 6.
14. Una mquina que llena bolsas de caf descarga en promedio 200 g. por bolsa. El gerente de pro-
duccin, que sabe que lo adecuado en el proceso de llenado es la menor variabilidad posible,
quiere que el peso de las bolsas no se aleje ms de 2 g. del promedio en ms del 90% de las bol-
sas. Cul es la mxima desviacin estndar que debe tener este proceso para que se cumpla el
objetivo del gerente de produccin?
15. En un juego de azar, la probabilidad de ganar es de 9/20. Un jugador participa en 20 juegos con-
secutivos, apostando un dlar en cada juego.
a) Cul es la ganancia o prdida esperada?
b) Cul es la probabilidad de que su ganancia sea, por lo menos, tres dlares?
16. A un constructor le aseguran que las bolsas de cemento que est comprando tienen un peso pro-
medio de 50 Kg. con una desviacin estndar de 0,11 Kg. Qu porcentaje de bolsas espera que
pesen menos de 49 Kg?
17. Los registros de ventas diarias de una empresa fabricante de computadoras muestran que se ven-
dern 0, 1 2 sistemas centrales de cmputo con las siguientes probabilidades:
Nmero de ventas 0 1 2
Probabilidad 0,7 0,2 0,1

a) Determine la distribucin de probabilidad del nmero de ventas en un perodo de 2 das, supo-
niendo que las ventas son independientes de un da a otro.
Respuesta:

70 Funcin de Probabilidad

b) Calcule la probabilidad de que al menos se formalice una venta en un perodo de 2 das.
Respuesta: 0,51
18. Se tiene el siguiente juego de azar: el jugador participante debe hacer un mximo de dos lanza-
mientos de tres monedas. Si obtiene tres caras o tres sellos en cualquiera de estos lanzamientos,
gana S/.10 000. Si no ocurre esto, y repite el resultado del primer lanzamiento, gana S/.5 000.
Si no ocurre ninguna de estas dos cosas, pierde S/.20 000. Determine la ganancia o prdida es-
perada e interprete este resultado.
19. Si un alumno contesta las 144 preguntas de un examen verdadero/falso lanzando una moneda
(cara = verdadero; sello = falso).
a) Cul es la probabilidad de contestar correctamente ms de 48 y menos de 96 preguntas?
b) Determine la misma probabilidad empleando la desigualdad de Tchebychev.
20. Considere el experimento de lanzar dos dados al aire. Sea X la variable aleatoria que representa
el valor absoluto de la diferencia de los valores observados. Encuentre la funcin de probabili-
dad de X.
Respuesta:
x 0 1 2 3 4 5
P(x) 6/36 10/36 8/36 6/36 4/36 2/36
21. Un aparato electrnico tiene cuatro transistores, de los cuales se sabe que dos estn defectuosos.
Los transistores se prueban siempre, uno a la vez, hasta identificar los dos defectuosos. Sea n
1
el
nmero de pruebas hasta encontrar el primer transistor defectuoso y n el nmero de pruebas adi-
cionales hasta encontrar el segundo. Encuentre la funcin conjunta de probabilidad de n
1
y n
2
.
(Escriba esta funcin en forma de tabla expresando las probabilidades con fracciones).
22. Se tiene el siguiente juego de azar: el jugador participante debe lanzar una moneda sucesivamen-
te. Si la diferencia entre el nmero de caras y de sellos (o viceversa) llega a ser igual a 3 al tercer
lanzamiento, gana $20. Si esto ocurre al quinto lanzamiento, gana $10. Si ocurre al sptimo lan-
zamiento, gana $5. Si necesita ms de 7 lanzamientos para conseguir dicha diferencia, pierde
$10. Cul es la ganancia esperada?

Distribuciones discretas de probabilidad 71


Captulo 5. Distribuciones discretas de probabilidad
5.1 La distribucin uniforme discreta
Si una variable aleatoria discreta X puede tomar cualesquiera de n valores distintos: x
1
, x
2
, , x
n
,
igualmente probables, se dice que tiene una distribucin uniforme discreta. Por lo tanto la probabilidad
de que X tome un valor x
i
ser:
n
x f
i
1
) ( =
El valor esperado y la varianza de una variable uniforme discreta se calculan de la siguiente ma-
nera:

=
=
n
i
i
n
x
1
1
;
( )

=
=
n
i
i
n
x
1
2 2
1

Un caso especial de distribucin uniforme discreta se tiene cuando X = 1, 2, 3, , n. En este ca-
so el valor esperado y la varianza resultan:

2
1
2
) 1 ( 1 1 1
1 1
+
=
+
= = =

= =
n n n
n
x
n n
x
n
i
i
n
i
i

2
1 +
=
n


( ) ( )

= = = = =
= + = = =
n
i
n
i
n
i
i i
n
i
i
n
i
i
x
n

n
x
n
x
n n
x
1 1 1
2 2
1
2
1
2 2
1 1 1 1 1


( )( ) ( )( ) ( )
12
1
4
1
6
1 2 1
2
1
6
1 2 1
2 2 2

=
+

+ +
= |
.
|

\
| +

+ +
=
n n n n n n n

12
1
2
2

=
n

5.2 La distribucin binomial
5.2.1 Probabilidad binomial
A continuacin se muestran dos ejemplos donde se calcula la probabilidad de que, de una mues-
tra de n elementos, una cantidad x cumpla con cierta caracterstica, conociendo cul es la proporcin
de la poblacin que cumple con dicha caracterstica. Esta proporcin puede interpretarse como la pro-
babilidad de que un elemento de la poblacin tenga la mencionada caracterstica.
Ejemplo 1
El 30% de todos los vehculos que llegan por una calle a cierta interseccin giran hacia la iz-
quierda. Si en un determinado momento se encuentran en dicha interseccin 8 autos detenidos
por la luz roja del semforo cul es la probabilidad de que giren hacia la izquierda exactamente
tres?
72 Distribuciones discretas de probabilidad

Aplicando el teorema generalizado de la multiplicacin, para eventos independientes, y multi-
plicando por el nmero de formas en que se pueden ordenar los 8 autos, que conforman un sub-
grupo de 3 autos que giran hacia la izquierda y otro subgrupo de 5 autos que no giran hacia la
izquierda:
P = (0,3)(0,3)(0,3)(0,7)(0,7)(0,7)(0,7)(0,7)
! 5 ! 3
! 8

P =
! 5 ! 3
! 8
(0,3)
3
(0,7)
5
= 0,2541
Ejemplo 2
La probabilidad de que un operario haga menos de 10 piezas en una jornada de trabajo es 0,20.
Determine la probabilidad de que durante la prxima semana (de 6 das laborables), en 3 das
haga menos de 10 piezas por jornada.
P = (0,2)(0,2)(0,2)(0,8)(0,8)(0,8)
! 3 ! 3
! 6

P =
! 3 ! 3
! 6
(0,2)
3
(0,8)
3
= 0,0819
Se puede notar que en ambos problemas se calcula la probabilidad de que, de una muestra de n
elementos, x tengan cierta caracterstica, y los restantes (n x) no la tengan; siendo constante la pro-
babilidad (p) de que un elemento cualquiera tenga dicha caracterstica, as como la probabilidad de que
no tenga la mencionada caracterstica (q = 1 p).
Ntese que, aunque se extraen varios elementos de la poblacin, todos juntos o uno por uno, la
probabilidad de que sea extrado un elemento cualquiera (p) se mantiene constante.
En situaciones como sta, la probabilidad de que, de una muestra de n elementos, x tengan dicha
caracterstica, es:
x n x
q p
x n x
n
x P

=
)! ( !
!
) (

A esta probabilidad, P(x), se le denomina probabilidad binomial. Usualmente a n se le denomina
nmero de pruebas binomiales, a p probabilidad de xito, y a q probabilidad de fracaso, en cada prue-
ba binomial.
5.2.2 La funcin binomial de probabilidad.
La funcin binomial de probabilidad, o distribucin binomial, est formada por el conjunto de
parejas ordenadas {x
i
, P(x
i
)}, donde X puede tomar los valores 0, 1, 2, 3, ... , n; y P(x) es la probabili-
dad binomial ya definida. Se dice entonces que la variable X (nmero de elementos de la muestra que
tienen cierta caracterstica) tiene una distribucin binomial.
Es necesario probar que P(x) es igual a 1. Para esto veamos el siguiente desarrollo binomial
(binomio de Newton):
(p + q)
n
=
|
|
.
|

\
|
0
n
p
0
q
n
+
|
|
.
|

\
|
1
n
p
1
q
n
+ ... +
|
|
.
|

\
|
1 n
n
p
n 1
q
1
+
|
|
.
|

\
|
n
n
p
n
q
0

Los trminos de esta sumatoria coinciden con las probabilidades binomiales P(0), P(1), ..., P(n).
Dado que (p + q)
n
es siempre igual a 1, queda demostrado que P(x) = 1. De esta propiedad de-
riva el nombre de "probabilidad binomial".
La distribucin binomial se representa grficamente mediante diagramas de barras. A estos dia-
gramas trazados con barras de ancho unitario se les suele llamar histogramas binomiales. A continua-
cin (figura 5.1) se muestran algunos ejemplos de histogramas binomiales.
Distribuciones discretas de probabilidad 73



Figura 5.1 Histogramas binomiales
Estos histogramas binomiales son muy tiles para visualizar qu tan probables son los posibles
resultados de un muestreo. Por ejemplo, si en una poblacin, conformada por familias de Piura, el 50%
consumen leche en polvo; la probabilidad de que, de una muestra de 12 familias, 8 consuman leche en
polvo (resulta aproximadamente 0,12) est representada por el rectngulo que corresponde a x = 8 en
el tercer grfico. Si el porcentaje de familias de Piura que consumen leche en polvo fuese 30%, la pro-
babilidad de que, de una muestra de 12 familias, 8 consuman leche en polvo, est representada por el
rectngulo que corresponde a x = 8 en el cuarto grfico. Como se ve, esta ltima probabilidad es casi
nula (aproximadamente 0,008). Se podra afirmar, inclusive, que es prcticamente improbable que,
dado que el 30% de las familias consumen leche en polvo, en una muestra de 12 familias, 8 ms
consuman leche en polvo.
5.2.3 El valor esperado y la varianza
El valor esperado de una variable X es x
i
f(x
i
). En el caso de la funcin binomial de probabili-
dad, donde X puede tomar los valores 0, 1, 2, 3, ... , n; se tendr:
= xP(x)
= x
x n x
q p
x
n

|
|
.
|

\
|
donde
|
|
.
|

\
|
x
n
=
)! ( !
!
x n x
n


= p x
x n x
q p
x
n

|
|
.
|

\
|
1

Pero:

p


x n x
q p
x
n

|
|
.
|

\
|
= x
x n x
q p
x
n

|
|
.
|

\
|
1

Entonces:
n = 6; p = 0,2
0
0,2
0,4
0,6
0 1 2 3 4 5 6
x
P
(
x
)
n = 12; p = 0.5
0
0,1
0,2
0,3
0 1 2 3 4 5 6 7 8 9 10 11 12
x
P
(
x
)
n = 10; p = 0,9
0
0,2
0,4
0,6
0 1 2 3 4 5 6 7 8 9 10
x
P
(
x
)
n = 12; p = 0,3
0
0,1
0,2
0,3
0 1 2 3 4 5 6 7 8 9 10 11 12
x
P
(
x
)
74 Distribuciones discretas de probabilidad

= p

(
|
|
.
|

\
|
x n x
q p
x
n
= p
(

+
n
q p
p

) (
= pn (p + q)
n 1
= pn
= np
Si p representa la proporcin de la poblacin que tiene cierta caracterstica, np representar , l-
gicamente, cuntos elementos de la muestra se espera que tengan dicha caracterstica.
La varianza de X, con funcin binomial de probabilidad, ser:

2
= x
2
P(x)
2
= x
2 x n x
q p
x
n

|
|
.
|

\
|

2

Pero:

2
2
p


x n x
q p
x
n

|
|
.
|

\
|
= x(x 1)
x n x
q p
x
n

|
|
.
|

\
|
2
=
= x
2 x n x
q p
x
n

|
|
.
|

\
|
2
x
x n x
q p
x
n

|
|
.
|

\
|
2
=
=
|
|
.
|

\
|
2
1
p
x
2 x n x
q p
x
n

|
|
.
|

\
|

|
|
.
|

\
|
2
1
p
x
x n x
q p
x
n

|
|
.
|

\
|
=
=
|
|
.
|

\
|
2
1
p
x
2 x n x
q p
x
n

|
|
.
|

\
|

|
|
.
|

\
|
2
1
p
np =
Pero tambin:

2
2
p

(p + q)
n
= n(n 1)( p + q)
n 2
= n(n 1) = n
2
n
Entonces:

|
|
.
|

\
|
2
1
p
x
2 x n x
q p
x
n

|
|
.
|

\
|

|
|
.
|

\
|
2
1
p
np = n
2
n
x
2 x n x
q p
x
n

|
|
.
|

\
|
= n
2
p
2
np
2
+ np
Por lo tanto:

2
= n
2
p
2
np
2
+ np n
2
p
2


2
= np np
2
= np(1 p)

2
= npq
5.2.4 Clculo de probabilidades binomiales acumulativas.
El clculo de probabilidades binomiales puede simplificarse considerablemente mediante el em-
pleo de tablas, como las del apndice (pg. 253), que nos proporcionan directamente probabilidades
acumulativas. Esta tabla permite calcular probabilidades acumulativas para distribuciones binomiales
con p = 0,05; 0,10; 0,15; 0,20; 0,25; ... 0,50; y para n = 1, 2, 3, ..., 19, 20. Para estos dos parmetros, n
y p, se puede calcular:
Distribuciones discretas de probabilidad 75


|
|
.
|

\
|
n
k x
x n x
q p
x
n
... donde k puede ser: 1, 2, 3,..., n.
Por ejemplo, para n = 8 se tiene:
p
n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
8 1 0,3366 0,5695 0,7275 0,8322 0,8999 0,9424 0,9681 0,9832 0,9916 0,9961
2 0,0572 0,1869 0,3428 0,4967 0,6329 0,7447 0,8309 0,8936 0,9368 0,9648
3 0,0058 0,0381 0,1052 0,2031 0,3215 0,4482 0,5722 0,6846 0,7799 0,8555
4 0,0004 0,0050 0,0214 0,0563 0,1138 0,1941 0,2936 0,4059 0,5230 0,6367
5 0,0000 0,0004 0,0029 0,0104 0,0273 0,0580 0,1061 0,1737 0,2604 0,3633
6 0,0000 0,0000 0,0002 0,0012 0,0042 0,0113 0,0253 0,0498 0,0885 0,1445
7 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0085 0,0181 0,0352
8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0017 0,0039

Ejemplo 1:
Para el primer ejemplo de este captulo (n = 8; p = 0,3), determine la probabilidad de que por lo
menos 3 vehculos giren hacia la izquierda.
P(X 3) = P(3) + P(4) + ... + P(8) =

|
|
.
|

\
|
8
3
8
7 , 0 3 , 0
8
x
x x
x

En la tabla encontraremos, para n = 8, p = 0,30 y k = 3
P(X 3) = 0,4482
Ejemplo 2:
Y cul ser la probabilidad de que giren hacia la izquierda menos de 5 vehculos?
P(X < 5) = P(0) + P(1) + ... + P(4) =

|
|
.
|

\
|
4
0
8
7 , 0 3 , 0
8
x
x x
x
= 1 [P(5) + P(6) + ... + P(8)] =
= 1

|
|
.
|

\
|
8
5
8
7 , 0 3 , 0
8
x
x x
x

Viendo en la tabla, para p = 0,30 y k = 5
P(X < 5) = 1 0,0580 = 0,9420
Ejemplo 3:
Supongamos que el 60% de los vehculos siguen de frente. Cul es la probabilidad de que, del
grupo de 8, al menos 5 sigan de frente?
P = P(5) + P(6) + P(7) + P(8) =

|
|
.
|

\
|
8
5
8
4 , 0 6 , 0
8
x
x x
x

Considerando aquella propiedad del desarrollo binomial, por ejemplo, de (p + q)
n
, que los tr-
minos equidistantes resultan iguales si se intercambian los exponentes de p y q, se tiene:

|
|
.
|

\
|
8
5
8
4 , 0 6 , 0
8
x
x x
x
=

|
|
.
|

\
|
3
0
8
6 , 0 4 , 0
8
x
x x
x

Por lo tanto:
76 Distribuciones discretas de probabilidad

P = 1

|
|
.
|

\
|
8
4
8
6 , 0 4 , 0
8
x
x x
x

P = 1 0,4059 = 0,5941
5.2.5 La proporcin muestral como estimacin de la proporcin poblacional.
Si X, que representa cuntos elementos de una muestra de tamao n tienen cierta caracterstica,
es una variable binomial, siendo p la proporcin de la muestra que tiene dicha caracterstica; la varia-
ble X/n, que representa la proporcin de la muestra que tiene tal caracterstica, tambin es binomial
con media igual a p y desviacin estndar igual a n pq / .
Segn el teorema de Tchebycheff, la probabilidad de que X/n se desve de la media p una distan-
cia mayor o igual a k, no puede ser mayor que 1/k
2
. Es decir:
P
2
1
k

Si a la distancia k se le llama d:
d = k = k n pq /
Se puede deducir que:

2 2
/ 1
d
n pq
k
=
Por lo tanto:

n d
pq
P
2

Cuando n tiende a infinito, esta probabilidad tiende a cero, lo que indica que X/n ser prctica-
mente igual a p.
5.2.6 La distribucin binomial en Excel
La funcin DISTR.BINOM de Excel permite calcular una probabilidad binomial especfica o
probabilidades acumulativas, para cualesquiera valores de n y p.
Aprovechando las bondades de Excel, es posible calcular todas las probabilidades P(x) que con-
forman una funcin binomial de probabilidad y trazar el histograma binomial correspondiente.
5.3 La distribucin binomial negativa
La probabilidad de que, de una muestra de n elementos, una cantidad x cumpla con cierta carac-
terstica, conociendo qu proporcin de la poblacin tiene dicha caracterstica (p), es la probabilidad
binomial P(x).
Como se ha visto en los ejemplos de probabilidad binomial del apartado 5.2.1, la extraccin de n
elementos puede interpretarse como una extraccin sucesiva de elementos, uno por uno, hasta comple-
tar n. Recurdese que a p se le denomina probabilidad de xito, o tambin, la probabilidad de que un
elemento de la poblacin tenga cierta caracterstica; y a q probabilidad de fracaso, o tambin, la pro-
babilidad de que un elemento de la poblacin no tenga dicha caracterstica.
En algunas situaciones puede resultar interesante calcular la probabilidad de que en la n-sima
extraccin ocurra el k-simo xito. Para que esto ocurra, es necesario que en las n 1 extracciones an-
teriores hayan ocurrido k 1 xitos, y que en la siguiente extraccin (la n-sima) ocurra otro xito (el
k-simo). Esta probabilidad ser entonces:
Distribuciones discretas de probabilidad 77


p q p
k
n
P
k n k

|
|
.
|

\
|

=
1
1
1

Lo que resulta:
k n k
q p
k
n
p k n P

|
|
.
|

\
|

=
1
1
) , ; ( para n = k, k + 1, k + 2,
Por lo tanto, el nmero de la extraccin en la cual ocurre el k-simo xito es una variable aleato-
ria que tiene una distribucin binomial negativa con parmetros k y p.
El nombre distribucin binomial negativa se debe a que los valores de P(n; k, p), para n = k, k +
1, k + 2, , son los trminos sucesivos del desarrollo binomial de
k
p
q
p

|
|
.
|

\
|

1
.
A la distribucin binomial negativa se le conoce tambin como distribucin de Pascal.
Ejemplo 1:
Una mquina que produce cierto tipo de piezas mecnicas no est bien ajustada, por lo que el
porcentaje de piezas defectuosas es 4,2%.
a) Cul es la probabilidad de que produzca la dcima pieza buena cuando ya se han producido
dos piezas defectuosas?
p = 1 0,042 = 0,958
n = 12
k = 10
P(n; k, p) = P(12; 2, 0,042) =
k n k
q p
k
n

|
|
.
|

\
|

1
1
= 06317 , 0 ) 042 , 0 ( ) 958 , 0 (
9
11
2 10
=
|
|
.
|

\
|

b) Cul es la probabilidad de que produzca la dcima pieza buena cuando se han producido
ms de dos piezas defectuosas?
Esta probabilidad es igual a uno menos la probabilidad de que se produzca la dcima pieza
buena cuando ya se han producido menos de dos piezas defectuosas:
1 P = 01225 , 0 ) 042 , 0 ( ) 958 , 0 (
9
11
) 042 , 0 ( ) 958 , 0 (
9
10
) 042 , 0 ( ) 958 , 0 (
9
9
2 10 1 10 0 10
=
|
|
.
|

\
|
+
|
|
.
|

\
|
+
|
|
.
|

\
|

P = 0,98775
Ejemplo 2:
El 30% de los nios expuestos a cierta enfermedad contagiosa, la contraen. Cul es la probabi-
lidad de que el octavo nio expuesto a esa enfermedad, sea el tercero en contraerla?
P(8; 3, 0,3) = 0953 , 0 ) 7 , 0 ( ) 3 , 0 (
2
7
5 3
=
|
|
.
|

\
|

5.4 La distribucin de Poisson.
5.4.1 La funcin de probabilidad de Poisson
Sea X una variable aleatoria que puede tomar los valores: 0, 1, 2, 3, ... . Si
!
) (
x
e
x P
x
= , en-
tonces la variable aleatoria discreta X tiene una funcin de probabilidad de Poisson, con parmetro .
78 Distribuciones discretas de probabilidad

La probabilidad de Poisson, P(x), expresa, por ejemplo, la probabilidad de que, en un determi-
nado intervalo de tiempo, ocurran exactamente x eventos, siendo la frecuencia media de ocurrencia,
es decir, el valor esperado de X.
Muchas variables aleatorias siguen distribuciones de Poisson. Por ejemplo, el nmero de vehcu-
los que llegan a una gasolinera, o el nmero de clientes que llegan a un banco en un determinado in-
tervalo de tiempo, o el nmero de defectos que hay en un lote de unidades producidas.
Se demuestra a continuacin que {x, P(x)} es una funcin de probabilidad:
1 ...
! 3 ! 2 ! 1
1
!
) (
0 0
= = |
.
|

\
|
+ + + + = =

=

=


x
x
x
e e

e
x
e
x P
Ejemplo 1:
En un taller donde cada operario trabaja con su respectiva mquina, hay un promedio de 3 m-
quinas en reparacin. Si el taller cuenta con 4 mquinas de repuesto, cul es la probabilidad de
que haya dos operarios desocupados?
Se asume que el nmero de mquinas que hay en reparacin tiene una distribucin de Poisson.
Habr dos operarios desocupados cuando haya 6 mquinas en reparacin. La probabilidad de
que haya 6 mquinas en reparacin es:
0504 , 0
! 6
3
!
) 6 (
6 3
=

= =

e
x
e
P
x

La probabilidad de que haya dos operarios desocupados es por lo tanto 0,0504.
Ejemplo 2:
Supngase que nmero de clientes que llega a un banco sigue una distribucin de Poisson, con
una media de 36 clientes por hora. Cmo ser la distribucin de probabilidad del nmero de
clientes que llega cada 5 minutos?
El promedio de clientes que llega cada 5 minutos ser: 3
60
5 36
=

= clientes
Aplicando la frmula, para x = 0, 1, 2, ... se obtiene:
x 0 1 2 3 4 5 6 7 8 9 10 > 10
P(x) 0,0498 0,1494 0,2240 0,2240 0,1680 0,1008 0,0504 0,0216 0,0081 0,0027 0,0008 0,0003

Como se puede apreciar, ya resulta poco probable que en 5 minutos lleguen ms de 6 clientes.
5.4.2 El valor esperado y la varianza.
Se demuestra que el valor esperado de una variable aleatoria con distribucin de Poisson, es
igual al parmetro .



=

=

= =
1 0
)! 1 ( !
) (
x
x
x
x
x
e
x
e
x x E
Haciendo el siguiente cambio de variable: s = x 1

s
e

s
e
x x E
s
s
s
s
= = =


=

=
+
0 0
1
! !
) (
Una caracterstica de una variable con distribucin de Poisson es que la varianza resulta igual al
valor esperado. Esto se demuestra a continuacin:

2 2 2
) ( = x E
Distribuciones discretas de probabilidad 79





=

=

= =
1 0
2 2
)! 1 ( !
) (
x
x
x
x
x
e
x
x
e
x x E
Haciendo el cambio de variable: x = s 1

s
e

s
e
s
s
e
s x E
s
s
s
s
s
s
+ = + = + =


=

=

=
+
2
0 0 0
1
2
! ! !
) 1 ( ) (
Por lo tanto:
= + =
2 2 2

En la figura 6.1 se muestran distribuciones de Poisson para distintos valores de . Para evitar
superposiciones de barras, se han trazado grficos continuos en vez de los clsicos grficos de barras.
Figura 6.1 Distribuciones de Poisson
5.4.3 Clculo de probabilidades acumulativas de Poisson
Para calcular probabilidades acumulativas de Poisson se puede recurrir a algunas tablas, como la
del apndice (pg. 258), que ha sido elaborada para distintos valores de , que van desde 0,1 hasta 10,
con incrementos de 0,1; y desde 11 hasta 20, con incrementos de 1.
Ejemplo:
El nmero de rdenes de trabajo que llegan a una oficina es una variable con una distribucin de
Poisson. Si en promedio llegan 5 rdenes por hora, cul es la probabilidad de que en la prxi-
ma hora lleguen menos de 5 rdenes?
Siendo = 5
P = P(0) + P(1) + ... + P(4) =

=
4
0
5
!
5
x
x
x
e
0,4405
La probabilidad de que en la prxima hora lleguen menos de 5 rdenes es 0,4405.
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
P
(
x
)
= 1
= 2
= 3
= 4
= 5
= 7
= 9
80 Distribuciones discretas de probabilidad

5.4.4 Aproximacin de la distribucin binomial a la distribucin de Poisson.
En el apartado 5.2.2 se vio que la probabilidad binomial es:

x n x x n x
q p
x
x n n n n
q p
x n x
n
x P

+
=

=
!
) 1 ( ... ) 2 ( ) 1 (
)! ( !
!
) (
Sustituyendo:
n

p=

x n x
n

x
x n n n n
x P

|
.
|

\
|
|
.
|

\
| +
= 1
!
) 1 ( ... ) 2 ( ) 1 (
) (

Dividiendo cada uno de los x factores del numerador entre n, resulta:
( )
x n
x
n

n n x

x P

|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|

|
|
.
|

\
|
= 1 1 ...
2
1
1
1 1
!
) (
Cuando n tiende a infinito y p tiende a cero, de tal forma que np se mantiene constante, la pro-
babilidad binomial P(x) tiende a:

x
e
x

x P

|
|
.
|

\
|
=
!
) (
Y esta es precisamente la probabilidad de Poisson definida en el apartado 5.4.1:

!
) (
x
e
x P
x
=

Ejemplo:
En una fbrica, el 0,5% de la produccin es defectuosa. Cul es la probabilidad de que haya
menos de 5 defectuosos:
a) en un lote de 2000 artculos?
n = 2000; p = 0,005
= np = 10
P = P(0) + P(1) + ... P(4) = 0,0293
b) en un lote de 1000 artculos?
n = 1000 ; p = 0,005
= np = 5
P = P(0) + P(1) + ... P(4) = 0,4405
5.4.5 La distribucin de Poisson en Excel
La funcin POISSON de Excel permite calcular una probabilidad de Poisson especfica o pro-
babilidades acumulativas, para cualquier valor de .
Aprovechando las bondades de Excel, es posible calcular todas las probabilidades P(x) que con-
forman una funcin de probabilidad de Poisson.
Distribuciones discretas de probabilidad 81


5.5 La distribucin hipergeomtrica.
5.5.1 La probabilidad hipergeomtrica
A continuacin se muestra un ejemplo donde se calcula la probabilidad de que, de una muestra
de n elementos, una cantidad x cumpla con cierta caracterstica, conociendo cuntos elementos de la
poblacin cumplen con dicha caracterstica.
A diferencia de la probabilidad binomial, que considera poblaciones muy grandes; en este caso
se consideran poblaciones pequeas, de tal manera que al seleccionar uno a uno los elementos de la
muestra, la probabilidad de seleccionar cada elemento no es constante.
Ejemplo:
Un fabricante de motores debe enviar un lote de 30 unidades de un modelo a un distribuidor. Por
un problema con el material de un proveedor, en el lote hay 5 motores defectuosos. Si el pro-
veedor selecciona aleatoriamente 6 motores para inspeccionarlos, cul es la probabilidad de
que escoja dos motores defectuosos?
Se va a calcular la probabilidad de que, de 25 motores buenos y 5 defectuosos, seleccione 3
buenos y 3 defectuosos.
La probabilidad que el primer motor seleccionado sea bueno es: 25/30.
La probabilidad que el segundo motor seleccionado sea bueno es: 24/29.
La probabilidad que el tercer motor seleccionado sea bueno es: 23/28.
La probabilidad que el cuarto motor seleccionado sea defectuoso es: 5/27.
La probabilidad que el quinto motor seleccionado sea bueno es: 4/26.
La probabilidad que el sexto motor seleccionado sea bueno es: 3/25.
Entonces, aplicando el teorema generalizado de la multiplicacin, la probabilidad de seleccionar
3 motores buenos y 3 defectuosos es:
03874 , 0
! 3 ! 3
! 6
25
3
26
4
27
5
28
23
29
24
30
25
= |
.
|

\
|
= P
Pero, si la muestra fuese ms grande, resultara mucho ms prctico calcular esta probabilidad
de la siguiente manera:
03874 , 0
) 6 , 30 (
) 3 , 5 ( ) 3 , 25 (
=

=
C
C C
P
Es decir:

|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
=
6
30
3
5
3
25
P
Se puede notar que, de una poblacin de N elementos donde k tienen la caracterstica y N k no
la tienen, se ha calculado la probabilidad de que se extraiga una muestra de n elementos, de tal manera
que x tengan dicha caracterstica, y los restantes (n x) no la tengan.
A dicha probabilidad se le denomina probabilidad hipergeomtrica:
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
n
N
x n
k N
n
k
k N n x P ) , , , (
82 Distribuciones discretas de probabilidad

5.5.2 La distribucin hipergeomtrica
Sea una variable aleatoria discreta X, que puede tomar los valores 0, 1, , n. Se dice que X si-
gue una distribucin hipergeomtrica si P(x) es igual a:

|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
n
N
x n
k N
n
k
k N n x P ) , , , (
5.5.2 La media y la varianza
La media y la varianza de la distribucin hipergeomtrica son:

N
nk
=
;
) 1 (
) )( (
2
2


=
N N
n N k N nk


Distribuciones discretas de probabilidad 83


Problemas propuestos.
1. Luego de una serie de experimentos se determin que la probabilidad de que una tachuela caiga en
cierta posicin es de 0,45. Cul es la probabilidad de que, en un nuevo experimento se lance la
tachuela 18 veces y caiga en dicha posicin 5 veces o menos?
2. La probabilidad de un lanzamiento exitoso es igual a 0,8. Si se hacen lanzamientos sucesivamente,
Cul es la probabilidad de que en el dcimo lanzamiento ocurra el quinto xito, luego en el deci-
moquinto lanzamiento ocurra el octavo xito, y, finalmente, en el vigsimo lanzamiento ocurra el
dcimo xito?
3. Un profesor de Estadstica tiene una moneda deformada. Despus de experimentar con ella, ha lle-
gado a la conclusin de que si la lanza muchas veces, obtendr el triple nmero de caras que de se-
llos. Si se lanza dicha moneda 20 veces, cul es la probabilidad de obtener ms de 15 caras?
4. En general, el 40% de los estudiantes que ingresan a una universidad terminan satisfactoriamente
la carrera. En un grupo de 18 recin ingresados escogidos aleatoriamente, cul es la probabilidad
de que al menos el 75% termine la carrera satisfactoriamente?
Respuesta: 0,0013
5. Supngase que en cierta poblacin el 55% son mujeres. Si una familia tiene 5 hijos. Cul es la
probabilidad de que no todos sean del mismo sexo?
Respuesta: 0,9312.
6. En un examen de Estadstica conformado por 10 preguntas, slo se debe contestar verdadero (V) o
falso (F) en las 5 primeras, y escoger una de cinco respuestas en cada una de las 5 restantes. Si un
alumno decide contestar todas las preguntas, al azar:
a) Cul es el nmero esperado de respuestas correctas? Interprete este valor.
Respuesta: Si el alumno repite este experimento muchas veces, en promedio tiende a contestar
3,5 preguntas correctamente.
b) Si todas las preguntas tienen el mismo puntaje, y no hay descuentos por preguntas mal contes-
tadas, cul es la probabilidad de aprobar?
Respuesta: 0,08229
7. Una persona participa en un juego donde la probabilidad de ganar es 0,40. Cuntas veces debe
jugar si quiere que la probabilidad de ganar al menos 3 veces sea mayor que 0,80?
Respuesta: Debe jugar ms de 10 veces.
8. Un experimento consiste en realizar pruebas binomiales hasta que ocurran exactamente k xitos. Si
la probabilidad de xito en cada prueba binomial es p, cul es la probabilidad de concluir dicho
experimento con x fracasos?
9. En una empresa que vende artefactos domsticos se sabe que la oportunidad de vender es mayor
mientras ms contactos realicen con los clientes potenciales. Si la probabilidad de que una persona
compre una lustradora despus de la visita es constante e igual a 0,20, y si las visitas son indepen-
dientes unas de otras, cuntos clientes potenciales debe visitar un vendedor, para que la probabi-
lidad de vender por lo menos una lustradora sea al menos 0,8?
10. En un juego de azar, la probabilidad de ganar es de 9/20. Un jugador participa en 20 juegos conse-
cutivos, apostando un dlar en cada juego.
a) Cul es la ganancia o prdida esperada?
Respuesta: Espera perder 2 dlares.
b) Cul es la probabilidad de que su ganancia sea, por lo menos, tres dlares?
Respuesta: 0,1308.
11. El nmero de clientes que llega a un banco es una variable aleatoria de Poisson. Si en promedio
llegan 120 clientes por hora Cul es la probabilidad de que:
84 Distribuciones discretas de probabilidad

a) en un minuto lleguen por lo menos 4 clientes?
b) en 5 minutos lleguen menos de 10 clientes?
12. El jefe del centro de cmputo de un banco afirma que la probabilidad de que las digitadoras pulsen
la tecla de un carcter incorrectamente, es igual a 0,001. Bajo este supuesto, cul es la probabili-
dad de que, de 10 000 teclas pulsadas, se cometan ms de 15 errores?
13. Se ha estimado que el 2% de los alumnos de la UDEP provienen de Morropn. Cul es la proba-
bilidad de que, en una muestra de 400 alumnos, 15 sean de Morropn?
14. El nmero de errores que comete cierta secretaria al escribir una pgina, tiene una distribucin de
Poisson, con un promedio de 2 errores. Si escribe un trabajo de 75 pginas, en cuntas pginas
espera encontrar:
a) un error?
Respuesta: en 20,3
b) dos errores?
Respuesta: en 20,3
c) tres errores?
Respuesta: en 13,533
d) ms de tres errores?
Respuesta: en 10,717
15. En cierto distrito escolar donde hay 2 000 maestros, la proporcin media de maestros ausentes por
da escolar es de 0,5%. Determine la probabilidad de que un cierto da todos los maestros estn en
su trabajo.
16. En general, el 1% de ciertas piezas son defectuosas. Si se compran 200, cul es la probabilidad de
que haya menos de 8 defectuosas?
Respuesta: 0,998903
17. El jefe de seguridad de una planta industrial dio a conocer el nmero de accidentes semanales ocu-
rridos en los ltimos aos, mediante la siguiente tabla:
N de accidentes 0 1 2 3 4 5 6 7 8 9 10 11 12 13
Frecuencia 0 3 9 18 27 31 34 27 21 14 8 5 2 1
a) Se ajusta a una distribucin de Poisson la distribucin de frecuencias de accidentes semanales
en dicha planta?
b) Qu probabilidad hay de cuatro a ms accidentes semanales?
Respuesta: Aproximadamente 0,8488 (con = 6)

18. Se encuentran en promedio 9,4 ralladuras por cada 10 m
2
de planchas de acero que se producen en
una fbrica. Cul es la probabilidad de que una plancha de 1 m
2
no tenga ralladuras?
19. El inspector de productos terminados de una fbrica debe hacer una rpida inspeccin de una
muestra de 8 unidades, extrada de un lote de 20 unidades. Si en el lote hay 3 unidades defectuosas
a) Cul es la probabilidad de que no extraiga ninguna unidad defectuosa?
b) Cuntas unidades defectuosas espera extraer el inspector?
20. Un alumno contesta las 20 preguntas de un examen verdadero/falso lanzando una moneda (cara =
verdadero; sello = falso). Cada pregunta bien contestada vale +1; mal contestada -0,5.
a) Cul es la probabilidad de aprobar el examen?
b) Cul es la nota esperada?
c) Otro alumno que rinde este mismo examen ha estudiado lo suficiente como para afirmar que la
probabilidad de acertar cualquier respuesta es 0,8. Cul es la probabilidad de que apruebe el
examen, si tambin contesta las 20 preguntas? Cul es su nota esperada?
21. Una experta tiradora falla en el 5% de los tiros al blanco. Cul es la probabilidad de que falle por
segunda vez en el tiro nmero 15?
Distribuciones discretas de probabilidad 85


22. El nmero promedio de descomposturas por mes de una PC es 1,8. Determine la probabilidad de
que esta PC funcione durante un mes:
a) sin descomposturas
Respuesta: 0,1653
b) con al menos 3 descomposturas.
Respuesta: 0,2694
23. Se selecciona una caja con 20 CDs producidos mediante un nuevo proceso. Si en esta caja se espe-
ra encontrar 2 CDs defectuosos, cul es la probabilidad de que haya ms de dos CDs defectuo-
sos?
24. La central telefnica de una empresa recibe un promedio de dos llamadas por minuto. Si la telefo-
nista se distrae durante un minuto, cul es la probabilidad de que no haya respondido al menos
una llamada?
25. Supngase que el 90% de los cables que se producen en una fbrica soportan una tensin mayor
que 200 Kg. Cul es la probabilidad de que, de una muestra de 6 cables:
a) todos soporten una tensin mayor que 200 Kg?
Respuesta: 0,5314
b) recin el quinto cable muestreado no soporte una tensin mayor que 200 Kg?
Respuesta: 0,0656
26. El director de un centro de cmputo se pregunta si el nmero de solicitudes para acceso a una
computadora sigue aproximadamente una distribucin de Poisson. Para verificarlo, cuenta con los
datos de la siguiente tabla:
N de solicitudes de acceso por hora 0 1 2 3 4 5 6 7 8 9 y ms
Frecuencia 55 61 50 32 18 9 5 2 1 0
a) Verifique si la media y la varianza son similares.
b) Determine las frecuencias que se esperara tener si realmente el nmero de solicitudes para ac-
ceso a una computadora sigue una distribucin de Poisson, y comprelas con las frecuencias
reales
27. Suponga que el nmero de clientes que salen de un consultorio mdico tiene una distribucin de
Poisson, con una media de 4,6 clientes por hora. Determine la probabilidad de que salgan ms de 3
pacientes del consultorio en el lapso de media hora.


86 Distribuciones continuas de probabilidad

Captulo 6. Distribuciones continuas de probabilidad
6.1 La funcin densidad de probabilidad.
6.1.1 Introduccin
Dado un conjunto de datos que definen una variable aleatoria continua, se puede conformar una
distribucin de frecuencias agrupadas, cuyo histograma y polgono de frecuencias nos dan una idea
clara de cmo se distribuye dicha variable aleatoria. Si el nmero de clases es pequeo, el polgono de
frecuencias se ver claramente discontinuo como se ve en la figura 6.1; pero si el nmero de clases es
muy grande, el polgono se parecer ms a una curva continua.
Figura 6.1 Polgono de frecuencias cuando la longitud de clase decrece
El rea bajo el polgono de frecuencias es Nk (N = n de datos; k = longitud de clase). Dividien-
do cada frecuencia f
i
entre Nk, se consigue que dicha rea sea igual a 1, como se ve en la figura 6.2.
Figura 6.2 Polgono de frecuencias con rea igual a 1.
El rea entre dos valores cualesquiera de X, por ejemplo a y b, representar la probabilidad de
que la variable aleatoria X tome un valor que est comprendido entre a y b.
La funcin f(x), cuya grfica es la curva lmite que se obtiene a partir del polgono de frecuen-
cias cuando la longitud de las clases tiende a cero, es decir, cuando el nmero de clases tiende a infini-
to, es la funcin densidad de probabilidad para la variable aleatoria continua X.
6.1.2 La funcin densidad de probabilidad.
Se define la funcin densidad de probabilidad como aquella funcin f(x), tal que:
x
f
x
f
x
A = 1
Nk
f
Distribuciones continuas de probabilidad 87


1) f(x) 0, para: < x <
2)

+

=1 ) ( dx x f
3) P(a x b) =

b
a
dx x f ) (
donde a y b son dos valores cualesquiera, como se ve en la figura 6.3.
Figura 6.3 Probabilidad de que X tome un valor comprendido entre a y b.
Se deduce, a partir del grfico, que la probabilidad de que X tome exactamente un valor x
i
es ce-
ro. Esto no significa que es imposible que X tome ese valor; sino que es muy poco probable. Por ejem-
plo, la probabilidad de que un alumno escogido al azar en un colegio, pese exactamente 65,3492 Kg.,
es prcticamente nula.
Para las distintas variables aleatorias continuas que se puedan analizar en los distintos campos
de la ciencia, se tendrn distribuciones cuyos polgonos de frecuencia sern muy parecidos a ciertas
funciones densidad de probabilidad. El anlisis de estas variables se simplifica enormemente em-
pleando las funciones densidad de probabilidad que resulten ms apropiadas. A partir de este captulo
se estudiarn algunas de stas, como la funcin normal, uniforme, t de Student, Ji-cuadrada y F.
6.1.3 La media y la varianza.
A partir de las definiciones de valor esperado y varianza de una variable aleatoria discreta, y
considerando la definicin de la funcin densidad de probabilidad, se deduce que, para una variable
aleatoria continua, el valor esperado y la varianza sern:

+

= dx x f x ) (

+

= dx x f x ) ( ) (
2 2

6.2 La distribucin normal
6.2.1 La funcin densidad normal de probabilidad
En investigaciones realizadas sobre una gran cantidad de variables aleatorias continuas, se ha
visto que stas tienen una distribucin bastante simtrica en forma de campana, como se ve en la figu-
ra 6.4.
Se puede afirmar inclusive que la gran mayora de medidas que se puedan tomar en cualquier
proceso productivo tienen esta distribucin simtrica en forma de campana, si el proceso est bajo
control.

x
f(x)
a b
88 Distribuciones continuas de probabilidad

Figura 6.4 Histograma simtrico en forma de campana
Variables aleatorias como sta, pueden analizarse tomando como modelo una funcin denomi-
nada funcin densidad normal de probabilidad.
La funcin densidad normal de probabilidad es la siguiente:

2
2
1
2
1
) (
|
.
|

\
|

=

x
e

x f
Su representacin grfica, conocida como curva normal o "campana de Gauss", se muestra en la
figura 6.5.
Figura 6.5. Curva normal o campana de Gauss
La curva normal es simtrica y asinttica al eje x. Adems, puede comprobarse, integrando la
funcin f(x), que el rea bajo la curva normal es igual a uno.
Los parmetros y representan la media y la desviacin estndar, respectivamente, de la va-
riable aleatoria X, y determinan la posicin y la forma (variabilidad) de la funcin f(x).
En la figura 6.6 se puede apreciar cmo cambia la posicin de la curva normal al variar la me-
dia. Se ve que:
1
<
2
<
3
; y que las tres desviaciones estndar son iguales.
Figura 6.6. Curvas normales con distinta media.
x
f(x)
x
f(x)

1

2

3
x
f(x)
Distribuciones continuas de probabilidad 89


En la figura 6.7 se ve, en cambio, cmo cambia la forma de la curva al cambiar la desviacin es-
tndar. Evidentemente, si aumenta desviacin estndar, la curva normal se hace ms ancha, y por lo
tanto ms baja. Recurdese que el rea bajo cualquier curva normal es siempre igual a uno. Se puede
apreciar que:
1
<
2
<
3
, y que las tres medias son iguales.
Figura 6.7. Curvas normales con distinta desviacin estndar
6.2.2 La forma estandarizada.
La ventaja de tomar la funcin densidad normal de probabilidad como modelo de muchas distri-
buciones est en la facilidad de calcular probabilidades. Si, por ejemplo, los pesos de las bolsas de de-
tergente que llena una mquina automtica tienen una distribucin normal, con un promedio de 30 on-
zas y una desviacin estndar de 0,3 onzas, se podra determinar, por ejemplo, qu porcentaje pesa
menos de 29,5 onzas, es decir, cul es la probabilidad de que una bolsa pese menos de 29,5 onzas.
Considerando la diversidad de variables cuya distribucin es normal, se hace necesario emplear
una funcin densidad normal que sea independiente de los valores y unidades que puedan tomar di-
chas variables. Para esto, se define la variable estandarizada, Z, de la siguiente forma:

x
z

=
Esta variable estandarizada mide el nmero de desviaciones estndares que un valor de X se
desva de la media . Del ejemplo anterior, si una bolsa de detergente pesa 30,45 onzas, se puede
afirmar que se desva de la media 0,45 onzas, o sea, z = (30,45 30)/0,30 = 1,5 desviaciones estndar.
Para esta variable estandarizada, se define la funcin densidad normal estandarizada, cuya repre-
sentacin grfica, conocida como curva normal estandarizada, se aprecia en la figura 6.8.
Figura 6.8. Curva normal estandarizada.

x
f(x)

2
z

(z)
2
2
1
2
1
) (
z
e

z

=

90 Distribuciones continuas de probabilidad

El rea bajo la curva normal estandarizada es tambin igual a uno; la media es cero y la desvia-
cin estndar uno. Esto ltimo puede verificarse fcilmente aplicando los teoremas 4, 5 y 6 del aparta-
do 4.5.
El empleo de esta forma estandarizada ha permitido construir una nica tabla para calcular pro-
babilidades, en vez de hacerlo para cada una de las infinitas funciones densidad normal de probabili-
dad que existen.
En la figura 6.9 se muestran tres curvas normales con medias 50, 100 y 150, y desviaciones es-
tndar 10, 20 y 10, respectivamente. Para cada curva se ha sealado un valor de X que se desva de su
respectiva media 1,5 desviaciones estndar (z = 1,5). A la derecha se muestra la curva normal estanda-
rizada que representa a las tres curvas normales, con el valor de z correspondiente.
Figura 6.9. Representacin de tres curvas normales mediante la curva normal estandarizada.
6.2.3 reas bajo la curva normal.
La probabilidad de que X est comprendido entre dos valores x
1
y x
2
es igual al rea que hay en-
tre dichos valores, bajo la curva normal, y es igual al rea comprendida entre sus correspondientes va-
lores z
1
y z
2
, bajo la curva normal estandarizada.
As, por ejemplo, en la figura 6.9, el rea que hay a la derecha de 65, 130 y 165, bajo cada una
de las tres curvas normales, es la misma, y corresponde al rea que hay hacia la derecha de z = 1,5 bajo
la curva normal estandarizada.
Para calcular reas bajo esta ltima curva se puede recurrir a la tabla del apndice (pg. 264),
que permite hallar el rea que hay desde cualquier valor no negativo de Z hasta infinito. Cualquier otra
rea puede deducirse a partir de dicha tabla, que aqu se presenta en forma resumida:

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,500000 0,496011 0,492022 0,488033 0,484047 0,480061 0,476078 0,472097 0,468119 0,464144
0,1 0,460172 0,456205 0,452242 0,448283 0,444330 0,440382 0,436441 0,432505 0,428576 0,424655
0,2 0,420740 0,416834 0,412936 0,409046 0,405165 0,401294 0,397432 0,393580 0,389739 0,385908
... ... ... ... ... ... ... ... ... ... ...
0,9 0,184060 0,181411 0,178786 0,176186 0,173609 0,171056 0,168528 0,166023 0,163543 0,161087
... ... ... ... ... ... ... ... ... ... ...
4,8 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001
4,9 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000

Por ejemplo, el rea que hay desde z = 0,24 hacia la derecha es 0,405165; el rea que hay desde
z = 0,90 hacia la izquierda es 1 0,184060 = 0,815939.
6.2.4 Ordenadas de la curva normal.
Empleando una tabla similar a la anterior, que se muestra en el apndice (pg. 265), se pueden
determinar las ordenadas de la curva normal estandarizada, para ciertos valores de la variable Z.
Esto resulta de mucha utilidad para trazar curvas normales, como se ver ms adelante.
50 100 150
x
f(x)
65 130 165
z

(z)
1,5
Distribuciones continuas de probabilidad 91


6.2.5 Propiedades de la curva normal.
La curva normal es simtrica y asinttica al eje de abscisas (X o Z).
Presenta: un mximo para x = , (z = 0)
puntos de inflexin para: x = , (z = 1)
x = + , (z = +1)
Usando la tabla normal del apndice (pgina 264), se puede determinar que:



+

= =
1
1
6826 , 0 ) ( ) ( dz z dx x f






+

= =
2
2
2
2
9544 , 0 ) ( ) ( dz z dx x f






+

= =
3
3
3
3
9974 , 0 ) ( ) ( dz z dx x f



Estas reas nos dan una buena idea de cmo es una distribucin normal. La primera integral nos
indica que el 68,26% de los datos de una poblacin normal se alejan de la media una cantidad menor
que una desviacin estndar. La segunda integral nos indica que el 95,44% de los datos de una pobla-
cin normal se alejan de la media una cantidad menor que dos desviaciones estndar. La tercera inte-
gral nos indica que el 99,74% de los datos de una poblacin normal se alejan de la media una cantidad
menor que tres desviaciones estndar. En la figura 6.10 se muestran estas reas caractersticas.

Figura 6.10. reas caractersticas bajo la curva normal
De esto ltimo se puede afirmar que, con muy buena aproximacin, casi el 100% de los datos de
una distribucin normal estn comprendidos entre 3 y + 3.
Ejemplos
1) La cantidad de arroz que una mquina vierte en sacos de 50 Kg. se considera como una variable
aleatoria con una distribucin normal cuya media es 51,5 Kg., y su desviacin estndar 700 g.
Qu porcentaje de sacos estima que pesan menos de 50 Kg?
x
f(x)

3
2 +2 +3 +
0,9974
0,9544
0,6826
92 Distribuciones continuas de probabilidad

48.5 49 49.5 50 50.5 51 51.5 52 52.5 53 53.5 54 54.5
0 100 200 300 400
x
d
= 51,5 kg.
= 0,70 kg.

14 , 2
70 , 0
5 , 51 50
=

= z

A = 0,0162



Respuesta: se estima que el 1,62% de los sacos de arroz pesan menos de 50 Kg.
2) La demanda mensual de cierto producto
tiene una distribucin normal con una
media de 200 unidades y una desviacin
estndar de 40 unidades. Qu tan grande
debe ser el inventario disponible a
principio de un mes para que la
probabilidad de que la existencia se agote
no sea mayor de 0,05?
= 200 unidades
= 40 unidades
Para que la existencia x
d
se agote, la demanda debe ser mayor o igual que x
d
, y la probabilidad
de que esto ocurra debe ser menor de 0,05.

40
200
645 , 1
05 , 0

= =
d
x
z ; x
d
= 265,8
Respuesta: debe tener un inventario de 266 unidades a principio de mes.
6.2.6 Aproximacin a la distribucin binomial.
A continuacin se muestra cmo determinadas distribuciones binomiales se aproximan a una
distribucin normal, a tal punto que puede ser sustituida por sta en situaciones en que el manejo de la
distribucin binomial se torna complicado para el clculo de probabilidades acumulativas.
En la figura 6.11 se muestra el histograma binomial para una distribucin con n = 10 y p = 0,5;
vase que hay simetra gracias a que p es igual a q. Ntese que se parece mucho a una curva normal.
Figura 6.11. Histograma binomial para n = 10 ; p = 0,5
0
0.05
0.1
0.15
0.2
0.25
0.3
0 1 2 3 4 5 6 7 8 9 10
x
f(x)
Distribuciones continuas de probabilidad 93


Para una distribucin binomial con n = 10 y p = 0,1 el histograma binomial resulta bastante asi-
mtrico, como se ve en la figura 6.12.
Figura 6.12. Histograma binomial para n = 10; p = 0,1.
En esta ltima distribucin binomial, con n = 10 y p = 0,1, el histograma binomial resulta menos
simtrico que el anterior porque p y q difieren mucho; sin embargo, para n = 60 y p = 0,1 el histogra-
ma binomial es casi simtrico a pesar de la diferencia entre p y q, como se muestra en la figura 6.13.
Figura 6.13. Histograma binomial para n = 60; p = 0,1
Se ha podido apreciar que mientras ms cercanos estn los valores de p y q a 0,5, y mientras ms
grande sea n, ms simtrico resulta el histograma binomial y ms se parece a una curva normal.
Por experiencia, se ha determinado que si se cumplen las siguientes condiciones:
np > 5 ; nq > 5
la aproximacin de la distribucin binomial a la distribucin normal es buena.
Cuando se emplee la distribucin normal para calcular probabilidades binomiales, ser necesario
aplicar un factor de correccin. Si se desea calcular, por ejemplo, la probabilidad (binomial) de que X
est comprendido entre x
1
y x
2
(incluidos), como se muestra en el histograma binomial de la figura
6.14, se tendr que sumar las reas de cada uno de los rectngulos sombreados. En dicha figura se
aprecia que el rea total sombreada se aproxima mucho al rea bajo la curva normal comprendida en-
tre (x
1
0,5) y (x
2
+ 0,5).
Como se ve, se emplea un factor de correccin de + 0,5 cuando se quiere calcular un rea desde
cierto valor de X hacia la izquierda, o de 0,5 cuando se quiere calcular un rea desde cierto valor de
X hacia la derecha.
0
0.1
0.2
0.3
0.4
0.5
0 1 2 3 4 5 6 7 8 9 10
x
f(x)
0
0.05
0.1
0.15
0.2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
x
f(x)
94 Distribuciones continuas de probabilidad

Figura 6.14. Aplicacin del factor de correccin
La curva normal que se est ajustando tiene la misma media y desviacin estndar que la distri-
bucin binomial; es decir:
= np
npq =
La variable estandarizada para dicha distribucin normal ser, entonces:

npq
np x
z

=
5 , 0

Ejemplo:
Un distribuidor compra pernos a un fabricante que afirma que tiene un mximo de 5% de defec-
tuosos. Ante la duda, decide probar si esto es cierto y toma una muestra aleatoria de 120 pernos.
Cul es la probabilidad de que encuentre al menos 10 defectuosos?
= 120(0,05) = 6 pernos
387 , 2 95 , 0 05 , 0 120 = = pernos.
47 , 1
387 , 2
6 5 , 0 10
=

= z
A = 0,0708
Respuesta: La probabilidad de que encuentre al menos 10 pernos defectuosos en una muestra de
120 pernos es 0,0708.
6.2.7 Ajuste de la curva normal.
Si se sospecha que una variable aleatoria tiene una distribucin aproximadamente normal, se
puede conseguir una buena cantidad de datos de dicha variable y construir un histograma; y, sobre s-
te, trazar la curva normal que ms se le ajuste.
x
1
x
2
x
y
x
1
- 0,5 x
2
+ 0,5
Distribuciones continuas de probabilidad 95


Para trazar esta curva normal se estima que la media y la desviacin estndar del conjunto de da-
tos corresponden a y , respectivamente. Luego, para las marcas de clase del histograma se deter-
minan las frecuencias normales siguiendo los siguientes pasos:
1) Determinar los z
i
para cada marca de clase x
i
, haciendo: z
i
=


i
x

2) Determinar los (z
i
) empleando la tabla del apndice (pgina 265).
3) Determinar los f(x
i
), haciendo: f(x
i
) = (z
i
) /
4) Determinar finalmente las frecuencias normales f '
i
, a partir de: f '
i
= f(x
i
)(nk)
donde n es la suma de frecuencias y k la longitud de clase del histograma.
Una vez trazada la curva normal sobre el histograma, se puede determinar, por simple inspec-
cin, si la variable aleatoria tiene una distribucin aproximadamente normal. Ms adelante se ver un
mtodo analtico (prueba de bondad de ajuste con la distribucin Ji-cuadrada) que determinar si este
ajuste es aceptable o no.
Ejemplo:
En un anlisis de los dimetros de los pistones fabricados en un taller, se tom una muestra de
140 pistones, cuya distribucin de frecuencias se muestra en la siguiente tabla. Trace la curva
normal que ms se ajuste a dicha distribucin.
Lmites Frecuencia
7,20 7,24 3
7,25 - 7,29 7
7,30 - 7,34 12
7,35 - 7,39 16
7,40 - 7,44 19
7,45 - 7,49 24
7,50 - 7,54 22
7,55 - 7,59 19
7,60 - 7,64 12
7,65 - 7,69 6

La media y la desviacin estndar de dicha muestra son: = x 7,466; s = 0,1101. Se estima que
estos dos valores se aproximan a y , respectivamente.
Siguiendo los pasos establecidos previamente, se construye la siguiente tabla. Por comodidad,
los valores de z se han redondeado a dos cifras decimales, evitando as el tener que interpolar en
la tabla de ordenadas de (z).
x z (z) f (x) f '
7,22 -2,24 0,0325 0,2947 2,06
7,27 -1,78 0,0818 0,7430 5,20
7,32 -1,33 0,1647 1,4958 10,47
7,37 -0,88 0,2709 2,4593 17,22
7,42 -0,42 0,3653 3,3164 23,22
7,47 0,03 0,3988 3,6206 25,34
7,52 0,49 0,3538 3,2125 22,49
7,57 0,94 0,2565 2,3287 16,30
7,62 1,39 0,1518 1,3786 9,65
7,67 1,85 0,0721 0,6543 4,58
7,72 2,30 0,0283 0,2572 1,80
Para el clculo de las f ' se ha considerado que n = 140 y k = 0,05, siendo n el tamao de la
muestra y k la longitud de clase.
96 Distribuciones continuas de probabilidad

En la siguiente figura se traza la curva normal que ms se ajusta al histograma que representa la
distribucin de los dimetros de los pistones.
0
5
10
15
20
25
30
7.22 7.27 7.32 7.37 7.42 7.47 7.52 7.57 7.62 7.67 7.72

Se puede concluir que los dimetros de los pistones tienen una distribucin aproximadamente
normal.
6.3 La distribucin uniforme continua
Una variable aleatoria continua, X, tiene una distribucin uniforme continua si su funcin densi-
dad de probabilidad es:

< <

=
casos dems los en
b x a para
a b
x f
0
1
) (
donde: a y b son constantes y a < b.
En la figura 6.15 se muestra esta funcin densidad de probabilidad, donde resulta evidente que
el rea total bajo dicha funcin es igual a uno, es decir,

b
a
dx
a b
1
1

f(x)
x
a b
1/(b-a)

Figura 6.15. Distribucin uniforme continua
Distribuciones continuas de probabilidad 97


A partir de las frmulas del apartado 6.1.3, se obtienen, por integracin, la media y la varianza
de esta variable aleatoria continua con distribucin uniforme:

2
b a

+
=

12
) (
2
2
a b


=
Ejemplo 1:
La cantidad de caf que despacha diariamente una mquina ubicada en la sala de espera del ae-
ropuerto de Piura est distribuida uniformemente entre 6 y 10 litros.
a) Determine la probabilidad de que hoy da se despache un mximo de 9,2 litros.
8 , 0
6 10
6 2 , 9
) 2 , 9 ( =

= X P
b) Cuntos litros se espera que despache un da?
8
2
6 10
=
+
= litros
Ejemplo 2:
Ricardo y Eduardo se ponen de acuerdo para encontrarse en la puerta N 1 del estadio entre la
1:00 y la 2:00 p.m. Si cada uno no esperar al otro ms de 10 minutos y Ricardo llega a la 1:20
p.m., cul es la probabilidad de que se encuentren?
Como Ricardo estar en la puerta del estadio entre la 1:20 y la 1:30, Eduardo debe llegar entre
la 1:10 y la 1:30 p.m. La probabilidad de que se encuentren ser entonces:
333 , 0
3
1
60
20
= = = P
98 Distribuciones continuas de probabilidad

Problemas propuestos.
1. Una mquina est programada para llenar recipientes con 20 onzas de lquido. Sin embargo, se sa-
be que la variabilidad inherente a cualquier tipo de mquina es la causa de que las cantidades de
contenido sean distintas de recipiente a recipiente. La distribucin de dichos contenidos es normal
con una desviacin estndar de 0,02 onzas. Cul debe ser la cantidad media de llenado para que
slo el 4% de los recipientes reciban menos de 20 onzas?
Respuesta: 20,035 onzas.
2. Un estudiante de Estadstica ha comprobado que los pesos y las estaturas de los alumnos de la
UDEP siguen distribuciones aproximadamente normales con media y desviacin estndar de 72
Kg, 4,6 Kg. y 1,74m; 0,08 m. respectivamente. Determine la probabilidad de que un grupo de 10
alumnos escogidos aleatoriamente, la mayora est por encima de 70 Kg. y 1,70 m.
3. Suponga que los ndices acumulados de los alumnos de la Facultad de Ingeniera estn distribuidos
normalmente alrededor de 12,50. Si el 75% de estos ndices estn comprendidos entre 9,5 y 15,5,
Qu porcentaje de alumnos tendr ndice aprobado? (ndice 11).
4. La demanda mensual de cierto producto A tiene distribucin normal con una media de 200 unida-
des y desviacin estndar igual a 40 unidades. La demanda de otro producto B tambin tiene una
distribucin normal con media de 500 unidades y desviacin estndar igual a 80 unidades. Un co-
merciante que vende estos productos tiene en su almacn 280 unidades de A y 650 de B al co-
mienzo de un mes. Cul es la probabilidad de que en el mes se vendan todas las unidades de am-
bos productos?
5. Una fbrica produce pistones cuyos dimetros no tienen la precisin deseada. Se ha encontrado
que los pistones tienen un dimetro que oscila alrededor de 5 cm. con una desviacin estndar de
0,001 cm. El control de calidad ha determinado que si el dimetro del pistn es menor que 4,998
se desecha, y si es mayor que 5,002 se puede reprocesar. Qu porcentaje de pistones se aceptan
inmediatamente?
6. Los dimetros de unas piezas mecnicas estn distribuidos normalmente con media 0,4008 pulga-
das y desviacin estndar 0,0020 pulgadas. Los lmites de especificacin estn dados como 0,4000
0,0010 pulgadas. Cul es el porcentaje de unidades defectuosas?
Respuesta: 64,43%
7. Los dimetros de unas piezas mecnicas estn distribuidos normalmente con media 0,4002 pulga-
das. Los lmites de especificacin estn dados como 0,4000 0,0010 pulgadas. Cul es la mxi-
ma desviacin estndar aceptable que permitir no ms de un defectuoso de cada mil producidos?
Respuesta: 0,000097 pulgadas.
8. Las estaturas de 200 empleados se distribuyen as:
Estaturas en pulgadas Frecuencia observada
57,5 - 60,5 9
60,5 - 63,5 20
63,5 - 66,5 45
66,5 - 69,5 55
69,5 - 72,5 43
72,5 - 75,5 17
75,5 - 78,5 11
TOTAL 200
Determine la curva normal que ms se ajuste a esta distribucin.
9. Una mquina troqueladora produce tapas de latas cuyos dimetros estn normalmente distribuidos,
con una desviacin estndar de 0,01 pulgadas. En qu dimetro "nominal" promedio debe ajus-
tarse la mquina de tal manera que no ms del 5% de las tapas producidas tengan dimetros que
excedan las 3 pulgadas?
Distribuciones continuas de probabilidad 99


Respuesta: 2,98355 pulgadas.
10. La puntuacin media de un examen fue 72 y la desviacin media 8. De un total de 90 alumnos, a
los 18 mejores se les quiere dar la calificacin A. Cul es el puntaje mnimo que un alumno debe
tener para recibir un A? Suponga que los puntajes obtenidos se distribuyen normalmente.
Respuesta: 78,72.
11. Suponga que la lluvia anual que cae en el Departamento de Piura es una variable distribuida nor-
malmente con un promedio de 75,4 mm. y desviacin estndar 4,2 mm.
a) Cul es la probabilidad de que se tenga un ao con ms de 85 mm?
Respuesta: 0,011
b) Se podr admitir un pronstico de ms de 100 mm. para el prximo ao? Explique.
Respuesta: Se puede admitir, pero es muy poco probable.
12. Una academia pre-universitaria de mucho prestigio cuenta con tres aulas A, B y C con capacidades
para 50, 70 y 80 alumnos, para Ingeniera. Como se han presentado 500 alumnos, se les ha hecho
rendir un examen de ingreso. Los puntajes obtenidos por los 500 alumnos se distribuyen normal-
mente con media 151 y desviacin estndar 85. Si se desea seleccionar a los mejores en las aulas
A, B y C sucesivamente, qu puntajes se deben establecer como mnimos para ingresar a cada au-
la?
Respuesta: 260 para A, 211 para B y 172 para C.
13. Suponga que los promedios de prcticas de los alumnos de Estadstica estn distribuidos normal-
mente alrededor de 12. Si el 95% de estos promedios estn comprendidos entre 09 y 15. Qu por-
centaje de alumnos estarn aprobados? (Nota aprobatoria mnima: 10,5)
Respuesta: 83,65%
14. Los postulantes a una Escuela Militar tienen estaturas que se distribuyen normalmente alrededor
de 1,72m., con una desviacin estndar de 0,04m. Las calificaciones que obtuvieron se encuentran
distribuidas tambin normalmente alrededor de 220 puntos, con una desviacin estndar de 65. Si
se desea que ingresen 200 postulantes de un total de 880, con una estatura mnima de 1,70m.,
cul debe ser la calificacin mnima para ingresar?
Respuesta: 249.
15. Suponga que se ha medido el nivel intelectual en la escala para preescolar y primaria WPPSI de
Wechsler en Piura (la mxima puntuacin posible es 50), y se lleg a afirmar que tal medida sigue
una distribucin muy aproximada a la distribucin normal con media 24 y desviacin estndar 6,5.
a) Qu porcentaje de la poblacin piurana tiene un nivel intelectual mayor a 40?
b) Cul es la probabilidad de que un alumno de primaria de Piura escogido al azar tenga un ni-
vel intelectual comprendido entre 10 y 20?
16. La cantidad real de caf instantneo que coloca una mquina llenadora en bolsas se puede conside-
rar como una variable aleatoria distribuida normalmente con desviacin estndar 0,04 onzas. Un
requerimiento importante es que slo el 2% de las bolsas contengan menos de 6 onzas de caf.
Cul debe ser el contenido medio de las bolsas?
17. Los dimetros de unas piezas mecnicas estn distribuidos normalmente con media 0,4001 pulga-
das. Los lmites de especificacin estn dados como 0,4000 0,06 pulgadas. Cul es la mxima
desviacin estndar aceptable que permitir no ms de un defectuoso de cada diez producidos?
Respuesta: 0,000289 pulgadas.
18. Una empresa que tiene una flota de autos de alquiler ha averiguado que la duracin de las zapatas
del freno tiene una distribucin normal, con una media de 88 000 Km. y una desviacin estndar
de 7 200 Km. Cul es la probabilidad de que, de 8 zapatas, al menos 5 duren ms de 100 000
Km?
100 Distribuciones continuas de probabilidad

19. En una fbrica de cables elctricos, un tipo de cable tiene las siguientes especificaciones: dime-
tro nominal: 8,50 mm.; dimetro mnimo: 8,28 mm.; dimetro mximo: 8,72 mm. Se selecciona
una muestra de 800 cables, obtenindose un dimetro promedio de 8,58 mm. y una desviacin es-
tndar de 0,10 mm.
a) Cuntos cables se espera que no cumplan con las especificaciones?
b) Si ajustando la maquinaria se consigue cambiar el dimetro promedio, manteniendo constante
la desviacin estndar, cul es el mnimo porcentaje de cables defectuosos que se puede con-
seguir?
c) Qu se debe hacer para reducir a cero el porcentaje de cables defectuosos?
20. Considerando que existen 10 dgitos, halle la probabilidad de que, de 100 000 elecciones aleato-
rias, el dgito 6 salga al menos 9 971 veces.
21. Una persona que viaja diariamente a su trabajo en mnibus hace un trasbordo. Tanto en la parada
frente a su casa como en la parada donde hace el trasbordo, el tiempo de espera est distribuido
uniformemente entre 0 y 10 minutos. Cul es la probabilidad de que, de los 20 viajes que hace en
un mes, en menos de 5 viajes la espera total no supere los 15 minutos? Ayuda: para calcular la
probabilidad de que en un viaje el tiempo de espera no supere los 15 minutos, trace cada tiempo de
trasbordo en cada eje del sistema de coordenadas cartesianas.
22. Un fabricante de insecticidas asegura que el 85% de los zancudos que son rociados por su produc-
to, mueren Cul es la probabilidad de que en una sala con 200 zancudos se aniquilen al menos
150 zancudos con este insecticida?
23. Supngase que el 65% de los gerentes en el Per tienen un grado de maestra. Si se toma una
muestra de 100 gerentes, cul es la probabilidad de que haya menos de 50 que tengan grado de
maestra?

Distribuciones de proporciones 101


Captulo 7. Distribuciones de proporciones
7.1 La distribucin multinomial.
Ejemplo:
El 30% de todos los vehculos que llegan por una calle a cierta interseccin, giran hacia la iz-
quierda, el 20% giran a la derecha y el 50% restante siguen derecho. Si en un determinado mo-
mento se encuentran en dicha interseccin 8 autos detenidos por la luz roja del semforo cul
es la probabilidad de que 3 giren hacia la izquierda, 2 giren a la derecha y 3 sigan de frente?
Aplicando el teorema generalizado de la multiplicacin, y considerando independencia entre lo
que hagan los conductores:

! 3 ! 2 ! 3
! 8
) 5 , 0 ( ) 2 , 0 ( ) 3 , 0 (
3 2 3
= P
Se puede generalizar esta frmula de probabilidad para los casos en que, de una muestra de n
elementos, x
1
tengan cierta caracterstica, x
2
tengan otra caracterstica,..., y x
k
tengan otra caractersti-
ca; siendo p
1
, p
2
,..., p
k
, las probabilidades de que un elemento tenga cada una de las caractersticas
mencionadas, de tal forma que x
i
sea igual a n, y p
i
sea igual a 1. Entonces:

k
x
k
x x
k
p p p
x x x
n
P ) ( ... ) ( ) (
... ! !
!
2 1
2 1
2 1
=
es denominada probabilidad multinomial, por parecerse mucho a la probabilidad binomial, con
la diferencia de que presenta k posibilidades para cada elemento de la muestra, en lugar de dos.
A la distribucin conjunta de x
1
, x
2
, ..., x
k
, se le conoce como distribucin multinomial.
Considerada en forma independiente, cada variable X
i
es binomial con parmetros p
i
y n; por lo
tanto tiene un valor esperado igual a np
i
y una varianza igual a np
i
(1 p
i
).
7.2 La distribucin de una proporcin.
Si la variable binomial X, que representa el nmero de elementos de una muestra de tamao n
que poseen cierta caracterstica, se divide entre n, resulta otra variable aleatoria, X/n, que representa la
proporcin de elementos de la muestra, que tienen dicha caracterstica. A la proporcin de elementos
de la poblacin que poseen tal caracterstica se le denomina p.
Se ha visto que la variable estandarizada:
npq
np x
z

=
5 , 0

se distribuye normalmente cuando np y nq > 5.
Si se divide cada trmino de la fraccin entre n, resulta lo siguiente:

n
pq
p
n
p
n
pq
p
n n
x
z

=

=
2
1
2
1
1

102 Distribuciones de proporciones

donde a la proporcin X/n se le ha denominado p
1
.
Esta ltima expresin nos dice que la proporcin p
1
se distribuye normalmente alrededor de p,
con desviacin estndar igual a
n pq/
. En la figura 7.1 se muestra esta distribucin normal.
Figura 7.1. Distribucin de p
1
alrededor de p.
Es importante resaltar que esta nueva variable p
1
es discreta, aunque no tome valores enteros.
Como se puede deducir, la desviacin estndar disminuye al aumentar el tamao de la muestra,
lo cual se expresa en la figura 7.2, donde
1
<
2
<
3
.
Figura 7.2. Disminucin de la variabilidad al aumentar el tamao de la muestra
Se deduce fcilmente que al aumentar el tamao de la muestra, es decir, al disminuir la variabi-
lidad de p
1
, los valores de p
1
que se puedan obtener estarn ms cerca de p, lo cual equivale a afirmar
que se reduce el error de estimacin, conocido como error muestral, e.
e = p
1
p
Ejemplo:
En la fabricacin de cierto tipo de pernos se ha determinado que, en promedio, el 15% de la pro-
duccin no es de calidad ptima. Ante esta situacin, el jefe de mantenimiento decidi hacer al-
gunos cambios en el proceso de produccin, con el propsito de bajar considerablemente dicho
porcentaje. Suponiendo que los cambios que se hizo no hubieran bajado el porcentaje de pro-
ductos que no son de calidad ptima, cul es la probabilidad de que en una muestra de 200
pernos se encuentre que el porcentaje que no son de calidad ptima sea del 10% o menos?
p
1
p
p p 1

2
Distribuciones de proporciones 103


En primer lugar, se verifica si la distribucin de p
1
es aproximadamente normal:
np = 200(0,15) = 30 > 5
nq = 200(0,85) = 170 > 5

0252 , 0
200
85 , 0 15 , 0
=

=

08 , 2
0252 , 0
15 , 0
200 2
1
10 , 0
=

= z P = 0,0188
Como se puede ver, es muy poco probable que en una muestra de 200 pernos se encuentre que
el porcentaje que no son de calidad ptima sea del 10% o menos; por lo tanto se puede concluir
que es muy probable que el verdadero porcentaje de pernos que no son de calidad ptima ya no
sea 15% sino menor.
7.3 Determinacin del tamao de una muestra en poblaciones infinitas
7.3.1 Determinacin del tamao de una muestra para estimar una proporcin de una poblacin infini-
ta
Generalmente se desea determinar proporciones (o porcentajes, que es lo mismo) poblacionales
que resultan de inters para las fbricas, empresas, o para la sociedad; pero esto no es posible porque
las poblaciones de inters suelen ser muy grandes. Por ejemplo, se desea saber:
El porcentaje de productos defectuosos que elaboran en una fbrica.
El porcentaje de clientes que no estn satisfechos con el servicio que dan en un banco.
El porcentaje de ciudadanos que aprueban la gestin del presidente de un pas.
El porcentaje de familias que consumen un determinado jabn.
El porcentaje de familias que ven un determinado programa de TV.
Como no es posible determinar con precisin tales porcentajes (o proporciones), porque se nece-
sitara invertir mucho dinero y/o tiempo para encuestar a toda la poblacin, se recurre a la estimacin
de dicha proporcin poblacional, extrayendo una muestra de la poblacin y calculando la proporcin
muestral correspondiente.
Por ejemplo, para estimar el porcentaje de familias de Piura que compran un determinado jabn,
bastar con extraer una muestra de 400 familias y encuestarlas. Si hay 75 familias que lo compran, la
proporcin muestral ser:
% 75 , 18 1875 , 0
400
75
1
= = = =
n
x
p
Pero este es el porcentaje de familias de la muestra que compran ese jabn, que puede ser una
buena estimacin del porcentaje de familias de Piura que compran dicho jabn. Se dice que p
1
es un
estimador puntual de p.
Lgicamente, mientras ms grande sea la muestra, p
1
ser mejor estimacin de p. Pero qu tan
grande debe ser la muestra? La respuesta lgica ser: lo ms grande que sea posible. Y hasta cunto
ser posible? Esto depender del presupuesto y tiempo disponibles.
Generalmente, para definir el tamao de una muestra el interesado se fija los siguientes parme-
tros, limitados por el dinero y tiempo disponibles.
Confiabilidad
Cuando se quiere hacer una estimacin de una proporcin poblacional, el interesado quiere tener
cierta probabilidad de acertar, es decir, cierta confiabilidad. Por ejemplo, puede querer estar
95% seguro de acertar el verdadero valor de la proporcin poblacional. Tal estimacin se hace
p
1
es aproximadamente normal
104 Distribuciones de proporciones

dando un rango, dentro del cual debera estar la proporcin poblacional. Para tener dicha confia-
bilidad necesitar elegir un determinado tamao de muestra. Si quisiera una confiabilidad ma-
yor, necesitar, lgicamente, una muestra ms grande.
Error muestral
A la diferencia entre la proporcin muestral hallada y la verdadera proporcin poblacional (des-
conocida) se le llama error muestral.
e = p
1
p
Cuando se quiere estimar una proporcin poblacional, el interesado quiere aproximarse lo ms
que pueda a dicha proporcin. Lgicamente, mientras ms grande sea la muestra, ms se acerca-
r a la proporcin poblacional, y por lo tanto menor ser el error muestral.

Si la poblacin es bastante grande (N ), la muestra ser lo suficientemente grande y enton-
ces: np y nq > 5; por lo tanto p
1
se distribuira normalmente alrededor de p, como se ha visto anterior-
mente. Para efectos prcticos, se suele considerar infinita una poblacin conformada por 100 000 ele-
mentos ms.
Ejemplo:
En la figura 7.3 se representa la distribucin de una proporcin muestral p
1
cuando se quiere es-
timar una proporcin poblacional p con una confiabilidad del 95% de que el error muestral no
supere el 5%.
p 1
p
p - 0,05 p + 0,05
95%

Figura 7.3. Estimacin de p con 95% confiabilidad de un error muestral mximo del 5%
Como se ve en la figura 7.3, el mximo error muestral que se desea cometer es 5%.
Entonces, en general, para p
1
= p + e
max
la variable estandarizada ser:

n
pq
e
n
pq
p p
z
max 1
=

=
No se ha considerado el factor de correccin 1/2n pues resulta despreciable para muestras
grandes, como las que se emplean cuando se requiere al menos una confiabilidad del 95% y un error
muestral mximo de 5%.
De esta ltima expresin se puede despejar n, es decir, el tamao de la muestra:
Distribuciones de proporciones 105


2
max
2
e
pq z
n=
Donde:
z: queda determinado por la confiabilidad que se desee. Con la ayuda de la tabla que
proporciona reas bajo la curva normal, se puede determinar el valor de la variable es-
tandarizada z que corresponde a una determinada confiabilidad. Por ejemplo, para una
confiabilidad del 95%, el rea de la cola derecha a partir de (p + e
max
) es 0,025; a esta
rea le corresponde un valor de z = 1,96
pq: ser 0,25 en el peor de los casos. (el mximo valor que puede tener pq es 0,25).
e
max
: es el mximo error muestral que se est dispuesto a cometer.
Si se define el tamao de una muestra y la confiabilidad, el error muestral se obtiene fcilmente,
despejando e
max
:
n
pq
z e =
max

Ejemplo 1:
Cul ser el tamao de muestra necesario para estimar el porcentaje de familias de Piura que
compran un determinado jabn, si se quiere tener una confiabilidad del 95% de que el error
muestral no supere el 5%?

16 , 384
) 05 , 0 (
25 , 0 96 , 1
2
2
2
max
2
=

= =
e
pq z
n

Ser necesario entonces entrevistar a 385 familias. (Ntese que con n = 384 el error muestral su-
perara el 5%).
O sea que si el verdadero valor de p fuese 0,20; es decir, si realmente el 20% de las familias de
Piura compraran cierto jabn, y, si con una muestra de 385 familias se determina, por ejemplo,
p
1
= 0,1875 = 18,75%, entonces el error muestral sera: e = 0,1875 0,20 = 0,0125 = 1,25%
El resultado de esta encuesta se hubiese expresado de la siguiente manera: El porcentaje de fa-
milias de Piura que consume dicho jabn es:
p = 18,75% 5%
Como resultado de dicha encuesta se afirma entonces que, con una confiabilidad del 95%, el
porcentaje de familias de Piura que consume dicho jabn est comprendido entre 13,75% y
23,75%. Como se ve, la encuesta ha acertado con el resultado; pero, qu tan probable era no
acertar? Precisamente haba una probabilidad del 5% de no acertar.
Ejemplo 2:
Supngase que se desea estrechar el rango de la estimacin, es decir, disminuir el mximo error
muestral posible. Para esto ser necesario aumentar el tamao de la muestra:
Sean: confiabilidad = 95% y e
max
= 2%

2401
) 02 , 0 (
25 , 0 96 , 1
2
2
2
max
2
=

= =
e
pq z
n

O sea que si el verdadero valor de p fuese 0,20; es decir, si realmente el 20% de las familias de
Piura compran cierto jabn, y, si con una muestra de 2401 familias se determina, por ejemplo, p
1

= 0,1924 = 19,24%, entonces el error muestral hubiese sido: e = 0,1924 0,20 = 0,0076 =
0,76%
106 Distribuciones de proporciones

El resultado de esta encuesta se hubiese expresado de la siguiente manera: El porcentaje de fa-
milias de Piura que consume dicho jabn es:
p = 19,24% 2%
Como resultado de dicha encuesta se afirma entonces, con una confiabilidad del 95%, que el
porcentaje de familias de Piura que consume dicho jabn est comprendido entre 17,24% y
21,24%.
7.3.2 Determinacin del tamao de una muestra estratificada para estimar proporciones de los estra-
tos de una poblacin infinita.
Si se quiere estimar una proporcin poblacional para cada uno de los estratos en que se ha divi-
dido una poblacin, se tendr que fijar la confiabilidad y el mximo error muestral que se desea tener
en cada uno de estos estratos. Prcticamente, es como si se considerase cada estrato como una pobla-
cin.
Para decidir el tamao de cada uno de los estratos de la muestra se pueden seguir dos mtodos:
Mtodo 1: Estratos de la muestra proporcionales a los estratos de la poblacin.
Ejemplo:
Cul debe ser el tamao de una muestra y cmo debe estar constituida, para estimar el porcen-
taje de familias de los estratos socioeconmicos AB, C y D de Piura que compran un determi-
nado jabn (J), si se quiere tener una confiabilidad del 95% de que el error muestral no supere el
5% en ningn caso?
Supngase que en Piura los estratos socioeconmicos tienen la siguiente distribucin:
Estrato socioeconmico AB C D
Porcentaje 11,3 33,7 55

Si la muestra fuese de tamao n = 385 familias, como se obtuvo en el ejemplo anterior, debera
estar conformada de la siguiente manera:
Estrato socioeconmico AB C D
n
i
43,51 129,75 211,75

Por lo tanto, redondeando: n
AB
= 44 ; n
C
= 130 ; n
D
= 212
Pero si se considerasen estas muestras, cuando se expresen los resultados de la encuesta para ca-
da estrato, se tendr que considerar el error muestral mximo que se comete con cada estrato, y
ste se tendr que calcular a partir de la misma frmula que se ha deducido antes:

n
pq
z e =
max

Para cada estrato, los errores muestrales sern:
e
AB max
=
44
25 , 0
96 , 1 = 0,1477 = 14,77 %
e
C max
=
130
25 , 0
96 , 1 = 0,0860 = 8,60 %
e
D max
=
212
25 , 0
96 , 1 = 0,0673 = 6,73 %
Distribuciones de proporciones 107


Como se ve, aunque los errores muestrales para la estimacin en los estratos C y D no son tan
grandes, para el estrato ms pequeo (el AB), el error muestral es demasiado grande: 14,77%.
Si se quisiera mantener las proporciones de los estratos, de tal manera que el error muestral del
estrato ms pequeo, es decir, el mximo de los errores muestrales, no supere el 5%, la muestra
del estrato AB tendra que ser:
n
AB
=
2
2
05 , 0
25 , 0 96 , 1
= 385 familias.
De esta manera, el error muestral mximo del estrato ms pequeo (AB) ser:
e
AB max
= 5%.
Si esta muestra representa el 11,3%, la muestra total tendr que ser de tamao:
n = 385 100 / 11,3 =3 407,08 3 407 familias.
El error muestral mximo de la muestra completa ser:
e
max
=
3407
25 , 0
96 , 1 = 0,0168 = 1,68 %
El tamao de la muestra del estrato C se puede calcular a partir del tamao de la muestra total:
n
C
= 3 407 33,7 / 100 = 1 148,16 1 148 familias.
El error muestral mximo del estrato C ser:
e
C max
=
1148
25 , 0
96 , 1 = 0,0290 = 2,89 %
El tamao de la muestra del estrato D ser:
n
D
= 3 407 55 / 100 = 1 873,85 1 874 familias.
El error muestral mximo del estrato D ser:
e
D max
=
1874
25 , 0
96 , 1 = 0,0226 = 2,26 %
En la siguiente tabla se presentan las muestras y sus respectivos errores muestrales mximos:
Estrato socio-econmico Tamao de la submuestra Error muestral mximo
AB 385 5%
C 1 148 2,89%
D 1 874 2,26%
Total 3 407 1,68%
De esta forma, si, por ejemplo, las encuestas realizadas mostrasen los siguientes resultados:
Estrato socio-econmico Familias consumen jabn J % que consumen jabn J
AB 34 8,83%
C 210 18,29%
D 412 21,99%
Se deduce fcilmente, para toda la muestra, el porcentaje de familias que consumen jabn J:
% 25 , 19 1925 , 0
3407
412 210 34
1
= =
+ +
= p
Tambin se podra calcular este porcentaje como una media ponderada:
108 Distribuciones de proporciones

% 25 , 19
100
55 99 , 21 7 , 33 29 , 18 3 , 11 83 , 8
1
=
+ +
= p
Finalmente, qu porcentaje de familias de Piura, de los distintos estratos, se estima que com-
pran el jabn J?
P
AB
= 8,83% 5%
P
C
= 18,29% 2,89%
P
D
= 21,99% 2,26%
El porcentaje estimado de familias de Piura que consumen jabn J ser:
P = 19,25% 1,68%

Mtodo 2: Estratos de la muestra no proporcionales a los estratos de la poblacin.
El mtodo 1 tiene un inconveniente que salta a la vista: el nmero de encuestas que hay que
hacer es muy grande. Cmo se podra evitar esto, sin llegar a tener algn error muestral mxi-
mo muy elevado?
Una solucin posible es considerar el mismo error muestral mximo para cada estrato; as se
tendra el mismo tamao de muestra para cada estrato.
Ejemplo:
Si se decide tener una confiabilidad del 95% de que el error muestral mximo de cada estrato
sea el 5%, se tendra:
n
AB
=
2
2
05 , 0
25 , 0 96 , 1
= 385 familias.
n
C
=
2
2
05 , 0
25 , 0 96 , 1
= 385 familias.
n
D
=
2
2
05 , 0
25 , 0 96 , 1
= 385 familias.
Una vez realizadas las encuestas y obtenidos los porcentajes de familias que compran jabn J, se
tendr que calcular el porcentaje de familias de todo Piura que consumen ese jabn.
Supngase que en las encuestas se obtuvieron los siguientes resultados:
Estrato socio-econmico Familias consumen jabn J % que consumen jabn J
AB 31 8,05%
C 74 19,22%
D 93 24,16%
Se deduce, para toda la muestra, que el porcentaje de familias que consumen jabn J es:
% 67 , 20
100
55 16 , 24 7 , 33 22 , 19 3 , 11 05 , 8
1
=
+ +
= p
Qu porcentaje de familias de Piura, de los distintos estratos, se estima que compran el jabn J?
P
AB
= 8,05% 5%
P
C
= 19,22% 5%
P
D
= 24,16% 5%
Distribuciones de proporciones 109


El porcentaje estimado de familias de Piura que consumen jabn J ser:
P = 19,25% ? %
Cul ser el error muestral mximo para la muestra total?
Como la muestra total es de tamao: 385 3 = 1155, entonces:
e
max
=
1155
25 , 0
96 , 1 = 0,0288 = 2,88 %
7.4 Determinacin del tamao de una muestra en poblaciones finitas
Cuando se trata de estimar una proporcin de una poblacin finita, se recomienda emplear la si-
guiente frmula que demuestra Hsek (1960) para determinar el tamao de la muestra:

pq z N e
pqN z
n
2 2
max
2
) 1 ( +
=
Donde:
N: es el tamao de la poblacin.
z: queda determinado por la confiabilidad que se desee. Con la ayuda de la tabla que
proporciona reas bajo la curva normal, se puede determinar el valor de la variable es-
tandarizada z que corresponde a una determinada confiabilidad. Por ejemplo, para una
confiabilidad del 95%, el rea de la cola derecha a partir de (p + e
max
) es 0,025; a esta
rea le corresponde un valor de z = 1,96.
pq: ser 0,25 en el peor de los casos. (el mximo valor que puede tener pq es 0,25).
e
max
: es el mximo error muestral que se est dispuesto a cometer.

Se suele considerar finita una poblacin cuando su tamao es N < 100 000.
Si se define el tamao de una muestra y la confiabilidad, el error muestral se obtiene fcilmente,
despejando e
max
:

1
max

=
N
n N
n
pq
z e
7.5 La distribucin de la diferencia de dos proporciones.
Sean dos universos independientes donde p
x
y p
y
representan proporciones de elementos con
cierta caracterstica en cada uno. De ambos universos se extraen dos muestras de tamao N
x
y N
y
, don-
de x e y indican la cantidad de elementos de cada muestra que tienen tal caracterstica, de modo que:

y x
n
y
p
n
x
p = =
2 1
;
Si ambas proporciones p
1
y p
2
se distribuyen normalmente alrededor de p
x
y p
y
respectivamente;
entonces la diferencia (p
1
p
2
) tambin se distribuye normalmente alrededor de la diferencia (p
x
p
y
).
Si p
1
y p
2
son independientes, la desviacin estndar de (p
1
p
2
) ser, tal como se vio al final del cap-
tulo 4:
2 2 2
) (
2 1 2 1
p p p p
+ =



y
y y
x
x x
p p
n
q p
n
q p
+ =

2
) (
2 1

110 Distribuciones de proporciones

La variable estandarizada correspondiente ser:

y
y y
x
x x
y x
n
q p
n
q p
c f p p p p
z
+

=
. . ) ( ) (
2 1

donde el factor de correccin (f.c.) es:

y x
y x
y x
n n
n n
n n
c f
2 2
1
2
1
. .
+
= + =
Las aplicaciones de la diferencia de dos proporciones se ven en el captulo 9 (Contrastes de
hiptesis).

Distribuciones de proporciones 111


Problemas propuestos.
1. Las compaas auditoras generalmente seleccionan una muestra aleatoria de los clientes de un
banco y verifican los balances contables reportados por el banco. Si una compaa de este tipo se
encuentra interesada en estimar la proporcin de cuentas para las cuales existe una discrepancia
entre el cliente y el banco, cuntas cuentas debern seleccionarse de manera tal que con una con-
fiabilidad del 99%, la proporcin de la muestra se encuentre a menos de 0,02 de la proporcin re-
al?
2. Un fabricante de insecticidas asegura que el 85% de los zancudos que son rociados por su produc-
to, mueren Cul es la probabilidad de que en una sala con 200 zancudos se aniquilen al menos el
75% con este insecticida?
Respuesta: 0,999975
3. Un estudiante de Estadstica quiere estimar la proporcin de familias de la Urbanizacin Miraflo-
res que ve un determinado programa de televisin. Debido al elevado nmero de familias, resulta-
ra muy laborioso tomar los datos de todas stas. El alumno desea tomar una muestra y estimar di-
cha proporcin con una probabilidad de 0,98 no exceder un error de 10% Qu tamao de mues-
tra debe tomar?
4. Un dado tiene tres caras rojas, dos blancas y una azul. Si este dado se lanza nueve veces, cul es
la probabilidad de que cada uno de los colores aparezca tres veces?
5. Un comerciante quiere comprar un lote muy grande de tornillos. Para decidir si compra el lote ex-
trae en primer lugar 150 tornillos. Si encuentra ms de 5% defectuosos, no compra el lote; en caso
contrario, escoge 150 tornillos ms. Si encuentra ms de 3% defectuosos, no compra el lote; en ca-
so contrario, compra el lote. Si realmente el porcentaje de tornillos defectuosos es del 3%, cul es
la probabilidad de que el comerciante no compre el lote de tornillos?
6. Suponga que un grupo de estudiantes de Estadstica encuest a pobladores de cuatro ciudades del
norte del Per (Tumbes, Piura, Chiclayo y Trujillo) para saber si estn de acuerdo con unas decla-
raciones del Ministro de Economa. Suponga que las poblaciones de dichas ciudades son: 100 000,
300 000, 400 000 y 700 000 habitantes, respectivamente. Para ahorrar tiempo y dinero, decidieron
considerar una confiabilidad del 90% y encuestar a 200 pobladores de cada ciudad, obteniendo
que 46, 42, 54 y 56 pobladores de las respectivas ciudades s estaban de acuerdo con dichas decla-
raciones.
a) Qu % de cada ciudad estn de acuerdo con dichas declaraciones?
b) Qu % de las cuatro ciudades estn de acuerdo con dichas declaraciones?
7. Una empresa encuestadora afirma que hay empate tcnico entre dos candidatos de electorales.
Qu datos le pedira usted a dicha empresa para verificar tal afirmacin?
8. Un estudiante de Estadstica dise una encuesta para averiguar, entre otras cosas, qu porcentaje
de la poblacin universitaria del Per estudia ms de 20 horas semanales. l quiso estar 90% segu-
ro de estimar correctamente dicho porcentaje, y decidi encuestar a 450 alumnos, encontrando que
300 estudiaban ms de 20 horas semanales. Suponiendo que la poblacin universitaria en el Per
es de 200 000 alumnos, cuntos alumnos dira usted que estudian ms de 20 horas semanales en
el Per?
9. Supngase que el 65% de los gerentes en el Per tienen un grado de maestra. Si se toma una
muestra de 100 gerentes, cul es la probabilidad de que haya menos de 50 que tengan grado de
maestra?
10. Suponga que el gerente de CRASA quiere averiguar qu porcentaje de cada uno de los estratos so-
cioeconmicos A, B y C de la ciudad (de 10 millones de habitantes) han comprado alguna vez en
su cadena de supermercados. Antes de hacer una encuesta averigua que los porcentajes de dichos
estratos en la ciudad son: 5%, 15% y 30%. Qu muestra recomendara (detallada) si desea que el
error muestral no supere el 2% en ningn caso, si:
112 Distribuciones de proporciones

a) se considera la muestra con las mismas proporciones de los estratos de la poblacin?
b) se considera la muestra de tal forma que las proporciones de los estratos sean iguales?
Suponga que el gerente de CRASA decide encuestar a 3000 personas de los estratos A, B y C
(1000 personas de cada estrato), y obtiene los siguientes resultados:
- En la muestra A, el 23,5% han comprado alguna vez CRASA.
- En la muestra B, el 19,2% han comprado alguna vez CRASA.
- En la muestra C, el 13,1% han comprado alguna vez CRASA.
c) Qu porcentajes de cada estrato de la ciudad han comprado alguna vez CRASA?
d) Qu porcentaje de la ciudad ha comprado alguna vez CRASA?
11. Se desea averiguar qu porcentaje de la poblacin de Piura y Castilla consume gas para la cocina.
Para esto, se estn discutiendo dos posibilidades:
A: tener una confiabilidad del 97% de que el error muestral no supere el 5%.
B: tener una confiabilidad del 97% de que el error muestral no supere el 2%.
Evidentemente la segunda posibilidad implica una muestra mucho ms grande, por lo cual se opta
por una solucin intermedia (C): un tamao de muestra que sea el promedio de los tamaos que
implicaran las dos posibilidades mencionadas, pero con un error muestral mximo del 3%.
a) Qu confiabilidad tendra este muestreo?
b) Trace las curvas que representan cmo se distribuye la proporcin muestral para los tres mues-
treos descritos (A, B y C).
c) Cul es la probabilidad de que se estime el porcentaje de la poblacin de Piura y Castilla que
consume gas para la cocina con un error muestral menor del 1%?
12. Un ingeniero industrial cree que el 30% de todos los accidentes industriales en su planta se deben
a que los empleados no cumplen con las disposiciones de seguridad.
a) Si eso es cierto, cul es la probabilidad de que, entre 80 accidentes que ocurrieron el ao pa-
sado, menos de 20 se deban a ese motivo?
b) Si realmente el 40% de todos los accidentes industriales en su planta se deben a que los em-
pleados no cumplen con las disposiciones de seguridad, cul es la probabilidad de que, entre
los 80 accidentes que ocurrieron el ao pasado, menos de 20 se deban a ese motivo?
13. Una muestra de 400 amas de casa de Piura que realizan sus compras semanales en el mercado re-
vela que 360 incluyen leche en sus compras. Con qu confiabilidad se podr afirmar que el por-
centaje de amas de casa de Piura que incluyen leche en sus compras semanales en el mercado est
entre 88% y 92%? Asuma que dicho porcentaje es 90%.
Respuesta: 81,65%
14. Una encuestadora ha publicado los siguientes resultados de su ltima encuesta realizada a una
muestra de 600 votantes de Lima:
Candidato A: 38,2 %
Candidato B: 34,8 %
Suponiendo que se consider una confiabilidad del 95%, se puede afirmar que hay empate tcni-
co, como afirma el comentarista de un diario?
15. Si p > 0,1; determine si la probabilidad P(p
1
< 0.1) es mayor o menor cuando se toma una muestra
n
1
o cuando se toma una muestra n
2
, siendo n
1
> n
2
.


Distribucin de las medias muestrales

113
Captulo 8: Distribucin de las medias muestrales
8.1 Introduccin
En este captulo se estudia la distribucin que sigue la media de una muestra extrada de una po-
blacin y la distribucin que sigue la diferencia de las medias de dos muestras extradas de la misma
poblacin, o de poblaciones diferentes.
Una media puede ser, por ejemplo, el promedio de las edades de los suscriptores a una revista
econmica, en el Per, o el dimetro promedio de los pistones que se elaboran en una fbrica, o el pe-
so promedio de las bolsas de sal que se empacan automticamente en una fbrica, o el promedio men-
sual de las ventas de un supermercado, etc.
En todos los casos, para estimar la media poblacional, se extrae una muestra y se calcula la me-
dia aritmtica de dicha muestra.
8.2 Distribucin de la media muestral
Teorema del lmite central
Si se extraen varias muestras de tamao n de cualquier poblacin con media y desviacin es-
tndar , las medias de estas muestras (medias muestrales) tendrn una distribucin aproximadamente
normal con media y desviacin estndar / n , si n es grande. Si la poblacin tiene distribucin
normal, la media muestral tendr tambin distribucin normal aunque n sea pequeo.
Puede ilustrarse este teorema mediante el siguiente ejemplo: se seleccionan aleatoriamente, de
una empresa, 100 muestras de 50 vendedores cada una. Considerando que cada vendedor ha efectuado
un determinado nmero de ventas durante el ltimo mes, se calcula la media del nmero de ventas en
cada una de las muestras. Las 100 medias calculadas se agrupan en clases y se traza el histograma que
las representa. Este histograma se aproxima mucho a una curva normal. Si se supiera el verdadero va-
lor de la media y la desviacin estndar del nmero de ventas efectuadas por los vendedores de esa
empresa en el Per (parmetros poblacionales), se estara verificando tambin que la media de las me-
dias de las 100 muestras casi coincide con la media poblacional y la desviacin estndar de las medias,
dividida entre n casi coincide con la desviacin estndar poblacional.
La variable estandarizada correspondiente es:

n
x
z
/

=
Si no se conociera la desviacin estndar de la poblacin ( ) y la muestra fuese grande, se po-
dra estimar sta calculando la desviacin estndar de la muestra (s).
Ya que la desviacin estndar de la media muestral es / n , se deduce fcilmente que la preci-
sin de la media muestral para estimar la media de la poblacin aumenta conforme aumenta el tamao
de la muestra, como se aprecia en la figura 8.1.

Distribucin de las medias muestrales

114
Figura 8.1. Distribuciones de la media muestral para n
1
> n
2
> n
3


Viendo cmo se estrecha la distribucin normal alrededor de la verdadera media de la poblacin
conforme aumenta el tamao de la muestra, se deduce que para hacer una buena estimacin de la me-
dia poblacional es necesario considerar muestras muy grandes, que tiendan a infinito. La figura 8.2
muestra cmo vara la desviacin estndar de la media muestral conforme aumenta el tamao de la
muestra.

x
x

Figura 2. Variacin de la desviacin estndar de la media muestral


Figura 8.2. Variacin de la desviacin estndar de las medias muestrales
Como se ve en la figura 8.2, la desviacin estndar de la media muestral disminuye rpidamente
al aumentar n, el tamao de la muestra, hasta n = 30; pero a partir de n = 50 la disminucin se hace ca-
da vez ms lenta. A partir de este tamao de muestra se puede considerar que es lo suficientemente
grande para hacer una buena estimacin de la media de la poblacin a partir de la media de una mues-
tra.
8.3. Distribucin de la diferencia de las medias muestrales
Teorema
Si se extraen dos muestras independientes de tamaos n
x
y n
y
, de dos poblaciones cualesquiera
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0 10 20 30 40 50 60 70 80 90

n 1
n 3
n
2
x
n
Distribucin de las medias muestrales

115
con medias
x
y
y
, y desviaciones estndar
x
y
y
, respectivamente, la diferencia de las medias
muestrales, y x , se distribuye normalmente alrededor de la diferencia de las medias de las poblacio-
nes, con una desviacin estndar
y x


, siempre que las muestras sean lo suficientemente grandes (no
menores que 50).

y
y
x
x
y x
n n
2
2

+ =


Si las poblaciones de procedencia son normales, es decir, si X e Y se distribuyen normalmente,
entonces la distribucin de y x ser normal aunque las muestras sean pequeas. La variable estanda-
rizada correspondiente ser entonces:

y
y
x
x
y x
n

y x
z
2
2
) ( ) (
+

=
Si se desconocen las desviaciones estndar
x
y
y
, y las muestras extradas son grandes, stas
pueden estimarse calculando las desviaciones estndar de las muestras, s
x
y s
y
.
8.4. La distribucin t de Student: aplicaciones a las medias poblacionales
Se ha dicho que si la desviacin estndar de una poblacin es desconocida, como suele ocurrir
casi siempre, es posible estimarla calculando la desviacin estndar de una muestra grande (no menor
de 50); pero, qu hacer si no se puede extraer una muestra grande? Para muestras pequeas, la des-
viacin estndar calculada suele ser muy distinta de la desviacin estndar de la poblacin, y se come-
ter un error considerable si se emplea la distribucin normal con desviacin estndar s en vez de .
Ante esta situacin, se puede emplear la distribucin t de Student en vez de la distribucin normal.
8.4.1 La distribucin t de Student
Es una distribucin muy parecida a la distribucin normal, que depende de un parmetro n
l
, lla-
mado nmero de grados de libertad. La funcin densidad de probabilidad de la variable t de Student es
la siguiente:

2
1
2
1 ) (
+

|
|
.
|

\
|
+ =
n
l
n
t
k t f
Esta funcin es simtrica con media igual a cero (igual que la normal estandarizada). Su desvia-
cin estndar es ) 2 /(
l l
n n .
En el apndice se presenta una tabla (pg. 266) que proporciona valores de t (no negativos) para
determinadas reas de cola derecha, para n
l
= 1, 2, , 50, 60, 120, .
Conforme aumenta n
l
, la curva de Student se parece ms a la curva normal. Comprese, por
ejemplo, el valor de t que le corresponde a un rea bajo la curva de Student igual a 0,05, para n
l
= ,
con el valor de z que le corresponde a la misma rea bajo la curva normal.
8.4.2 Distribucin t de la media muestral
Si se extraen varias muestras de tamao n (menor que 50), de una poblacin normal con media
y desviacin estndar desconocida, entonces la siguiente variable:

1 /

=
n s
x
t


tiene una distribucin de Student con n
l
= n 1 grados de libertad.
Distribucin de las medias muestrales

116
Se ha definido la desviacin estndar s con denominador n; pero, cuando se extraen muestras
pequeas, el mejor estimador de la desviacin estndar de la poblacin emplea n 1 como denomina-
dor. Se distinguen entonces:

n
x x
s
n
i
i
n

=

=
1
2
) (
;
1
) (
1
2
1

=

=

n
x x
s
n
i
i
n

En conclusin, cuando n es pequeo conviene usar s
n-1
para estimar , y cuando n es grande am-
bas expresiones dan prcticamente el mismo valor.
Se puede deducir fcilmente que:

1
1

=
n n
s
n
n
s
Si se sustituye este valor de s
n
en lugar de s, en la expresin de t, el denominador resultar:
n s
n
/
1

que es como lo presentan algunos autores.
El concepto de grados de libertad se puede explicar de la siguiente manera: al calcular la desvia-
cin estndar de una muestra de tamao n, se suman los cuadrados de n desviaciones respecto a la me-
dia muestral. Como la suma de estas desviaciones es igual a cero, se tendr libertad para asignar valo-
res a cualesquiera n 1 desviaciones. La restante ya queda determinada y no se le puede dar cualquier
valor.
8.4.3 Distribucin t de la diferencia de las medias muestrales.
Cuando se quiere inferir respecto a la diferencia de las medias de dos poblaciones normales cu-
yas desviaciones estndar son desconocidas, a partir de la diferencia de las medias de dos muestras
pequeas, no se pueden utilizar las desviaciones estndar de las muestras como estimaciones de las
desviaciones estndar de dichas poblaciones. En situaciones como sta, la siguiente variable:

|
|
.
|

\
|
+
|
|
.
|

\
|
+
+

=
y x y x
y x x x
y x
n n n n
s n s n
y x
t
1 1
2
) ( ) (
2 2


tiene una distribucin t de Student con n
x
+ n
y
2 grados de libertad, siempre que las desviacio-
nes estndar de las dos poblaciones sean iguales.
Si las desviaciones estndar de las poblaciones fuesen diferentes, no se podra emplear la distri-
bucin t de Student. En 9.7 se explica cmo probar si las desviaciones estndar de dos poblaciones son
iguales.
Distribucin de las medias muestrales

117
Problemas propuestos
1. La duracin media de una resistencia es de 1 000 horas, con una desviacin estndar de 100 horas.
Se utilizan 3 resistencias de manera consecutiva en el mismo aparato, es decir, apenas se quema
una resistencia, se coloca la siguiente.
a) Cul es la probabilidad de que el aparato funcione al menos 3 600 horas?
Respuesta: 0,00027
b) Y si tuviera 20 resistencias, cul sera la probabilidad de que el aparato funcione ms de 19
500 horas?
Respuesta: 0,846136
2. Para controlar un proceso de llenado automtico de bebidas gaseosas, se toman muestras de 10 bo-
tellas cada hora, durante 20 horas. A continuacin se muestra el volumen promedio (en ml.) de ca-
da muestra:
499,82 499,23 500,15 500,77 500,72 501,04 498,69 499,86 500,66 499,35
499,59 498,99 498,89 499,41 499,54 498,73 499,66 499,76 500,08 499,78
Cul es la probabilidad de que una botella contenga ms de 501,5 ml?
3. Una panificadora enva diariamente una remesa de panes a sus tiendas. Cada da se pesa una
muestra de 35 panes en cada una de las tiendas. El administrador ha visto que el 80% de los pro-
medios (pesos) obtenidos en dichas muestras estn comprendidos entre 24,7 y 25,3 g., con un
promedio de 25g. En qu rango estar comprendido el 99% de los pesos de los panes de esta pa-
nificadora? Asuma que los pesos de los panes se distribuyen normalmente.
Respuesta: Entre 21,43 g. y 28,57g.
4. Suponga que el peso promedio de los pobladores de una ciudad es de 75 Kg., con una desviacin
estndar de 8,75 Kg. La poblacin de pesos est normalmente distribuida. Si la capacidad mxima
de un ascensor con capacidad para 16 personas es de 1 250 Kg., cul es la probabilidad de que el
ascensor nunca exceda su capacidad mxima?
5. El recorrido promedio de viaje (ida y vuelta a casa) de todos los trabajadores de una fbrica es de
50,5 Km. con una desviacin estndar de 3,6 Km. La poblacin de recorridos est normalmente
distribuida. Cul es la probabilidad de que una muestra de 25 trabajadores revele una distancia
promedio que se encuentre a un mximo de 1 Km. de la media poblacional?
6. El dueo de una empresa de taxis sabe que la duracin de las zapatas de los frenos con los que
cuenta vara normalmente con una media de 80 000 Km. y una desviacin estndar de 7 200 Km.
a) En qu rango se espera que est la duracin media de 8 zapatas, con una confiabilidad del
99%?
b) Cul es la probabilidad de que la duracin media de las 8 zapatas sea inferior a 83 200 Km?


118 Contrastes de hiptesis


Captulo 9: Contrastes de hiptesis
9.1. Introduccin
Una hiptesis es una aseveracin que se hace sobre una poblacin. Generalmente, tal asevera-
cin se refiere al valor numrico de algn parmetro poblacional, como la media o la proporcin. Por
ejemplo, una hiptesis puede establecer que la tensin de ruptura promedio de un material para solda-
dura es de 250 lb., o que el ensamble de una computadora promedia al menos 40 minutos, o que la
proporcin de piezas defectuosas en un proceso de manufactura es de menos de 0,05, o que el porcen-
taje de clientes exclusivos de un banco es menor del 5%.
Una prueba o contraste de hiptesis es una prueba de la validez de la aseveracin, y se lleva a
cabo mediante un anlisis de datos extrados de una muestra.
9.2. Hiptesis nula e hiptesis alternativa
Muchas veces se quiere investigar si un parmetro poblacional tiene una determinada caracters-
tica o no; por ejemplo, que menos del 25% de los consumidores de detergente usan detergente Real, es
decir, que la proporcin de consumidores de detergente Real es menor que 0,25. Como no se conoce
con exactitud cul es esa verdadera proporcin, se establece como hiptesis que es igual a 0,25, y se
contrasta esta hiptesis contra la hiptesis de que dicha proporcin es menor que 0,25. Para hacer este
contraste se extrae una muestra de consumidores de detergente y se calcula qu proporcin de la mues-
tra usa detergente Real. Lgicamente, si esa proporcin es mayor que 0,25, se aceptar la hiptesis ini-
cial; pero, cundo se podr afirmar que es menor? Si la proporcin encontrada en la muestra es lige-
ramente menor que 0,25, se podra aceptar la hiptesis inicial, pues esa pequea diferencia puede ser
consecuencia del azar, y, efectivamente la verdadera proporcin puede no ser menor que 0,25. Para
estar seguro de no cometer un grave error, rechazando injustamente la hiptesis inicial, se podra
tomar la decisin de rechazarla slo si la proporcin de la muestra resulta mucho menor que 0,25, es
decir, si se tiene un resultado inusual o poco probable. Pero, a partir de qu valor de la proporcin
que se encuentre en la muestra se podr afirmar que es mucho menor que 0,25?
En el ejemplo, a la aseveracin concreta de que la proporcin de consumidores de detergente
Real es 0,25 (o ms), se denomina hiptesis nula (H
0
). Se denomina hiptesis alternativa (H
1
), a la
hiptesis que motiv la investigacin, es decir, a la aseveracin de que la proporcin de consumidores
de detergente Real es menor que 0,25. Para este ejemplo, estas hiptesis se expresan matemticamente
de la siguiente forma:
H
0
: p 0,25
H
1
: p < 0,25
9.3. Regiones de aceptacin y de rechazo
Definidas la hiptesis nula y la alternativa, el investigador debe precisar qu resultados del
muestreo harn que se acepte la hiptesis nula, y qu resultados harn que se rechace la hiptesis
nula a favor de la hiptesis alternativa.
Se denomina regin de aceptacin al conjunto de los posibles resultados del muestreo que lleva-
ran a aceptar H
0
. Se denomina regin de rechazo al conjunto de los posibles resultados del muestreo
que llevaran a rechazar H
0
, y por lo tanto a aceptar H
1
.
Contrastes de hiptesis

119
Para definir estas regiones se suele usar el siguiente criterio: para rechazar la hiptesis nula se
tiene que dar un resultado muy poco usual en el muestreo. Por ejemplo, si la muestra est compuesta
por 40 consumidores de detergente (n = 40) y si es cierto que el 25% de la poblacin consume deter-
gente Real (p = 0,25), se espera encontrar 10 consumidores de detergente Real ( = np = 10). Si se en-
cuentran 8 ms consumidores de detergente Real, se puede aceptar H
0
; pero, a partir de qu valor ya
conviene rechazar H
0
? 7?, 6? Siguiendo el criterio de rechazar H
0
cuando se obtiene un resultado
muy poco usual, es decir, muy poco probable, se puede considerar que encontrar menos de 7 consumi-
dores de detergente Real es muy poco probable (p
1
= 6/40 = 0,15 parece considerablemente menor que
0,25). Concretamente:
P(X < 7) =

6
0
40
75 , 0 25 , 0
! )! 40 (
! 40
x
x x
x x
= 0,096 (calculada con Excel)
As, el investigador puede tomar la siguiente decisin: extraer una muestra de 40 consumidores
de detergente. Si hay 6 menos consumidores de detergente Real, rechaza H
0
; en caso contrario, acep-
ta H
0
. En la figura 9.1 se representan estas regiones de aceptacin y rechazo con las probabilidades bi-
nomiales (barras verticales) correspondientes a, 0, 1, , etc.
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Regin de rechazo Regin de aceptacin


Figura 9.1. Regiones de aceptacin y rechazo
9.4. Error tipo I y error tipo II
Una vez que el investigador ha definido las regiones de aceptacin y de rechazo para la hiptesis
nula, se puede llevar a cabo la prueba; pero se pueden cometer dos tipos de error:
1) Rechazar la hiptesis nula cuando es verdadera. A esto se le conoce como error tipo I, y a la
probabilidad de cometerlo se le designa .
Para el ejemplo de la proporcin, este error se cometera si se rechaza la aseveracin de que la
proporcin de consumidores de detergente Real es igual a 0,25 ( ms), es decir, si se acepta
que dicha proporcin es menor que 0,25, cuando realmente es 0,25. La probabilidad de cometer
este error es = P(X < 7) = 0.096 (ver figura 9.1).
2) Aceptar la hiptesis nula cuando es falsa. A esto se le conoce como error tipo II, y a la probabi-
lidad de cometerlo se le designa .
Para el ejemplo de la proporcin, este error se cometera si se acepta la aseveracin de que la
proporcin de consumidores de detergente Real es igual a 0,25, es decir, si se rechaza que dicha
proporcin es menor que 0,25, cuando realmente es menor que 0,25.
120 Contrastes de hiptesis


Supngase que la verdadera proporcin de consumidores de detergente Real (desconocida) es
0,12. Se cometer el error tipo II cuando se acepte que p = 0,25, y esto ocurrir cuando 7 ms con-
sumidores de detergente de la muestra consuman detergente Real. La probabilidad de cometer este
error es:
= P(X 7) =

40
7
40
88 , 0 12 , 0
! )! 40 (
! 40
x
x x
x x
= 0,198 (calculada con Excel)
En la figura 9.2 se representa la probabilidad de cometer el error tipo II ( ) cuando la verda-
dera proporcin de consumidores de detergente Real (desconocida) es 0,12. Como se ve, para la ver-
dadera proporcin p = 0,12 se tiene otra distribucin binomial con media igual a np = 40(0,12) = 4,8.
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
0.20
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Regin de rechazo Regin de aceptacin

Histograma binomial con p = 0,25


Histograma binomial con p = 0,12

Figura 9.2. Probabilidad de cometer los errores tipo I y tipo II.
Se deduce que mientras ms difiera la verdadera proporcin de la proporcin establecida como
hiptesis nula, menor es la probabilidad de cometer el error tipo II.
En una investigacin, lo usual es que se defina el tamao de la muestra y el mximo valor que se
desea de (0,10; 0,05; 0,025 0,01), y luego se determinen las regiones de aceptacin y rechazo.
9.5. Contrastes de hiptesis sobre proporciones
Ejemplo 1:
En el ejemplo que se ha venido analizando sobre la proporcin de consumidores de detergente
Real, se cumple la condicin de que np y nq > 5, por lo tanto la proporcin de la muestra (p
1
=
x/n) tiene una distribucin aproximadamente normal con media p y desviacin estndar n pq / .
Supngase que se toma una muestra de 40 consumidores de detergente (n = 40) y se define =
0,05. Si se encuentra que 6 consumen detergente Real, se podr afirmar que el porcentaje de
consumidores de detergente Real es menor del 25%?
Las hiptesis son: H
0
: p 0,25
H
1
: p < 0,25
Es posible determinar las regiones de aceptacin y rechazo en trminos de x (nmero de consu-
midores de detergente que usan detergente Real), o en trminos de p
1
(proporcin de consumido-
Contrastes de hiptesis

121
res que usan detergente Real). Para esta segunda opcin, se denomina p
1
* al valor que limita las
regiones de aceptacin y rechazo.
La variable estandarizada que le corresponde a p
1
* debe tener un rea igual a 0,05 en la cola iz-
quierda de la curva normal; este valor es z* = 1,645. Por lo tanto:
1,645 =
40 / 75 , 0 25 , 0
80 / 1 25 , 0 *
1

+ p

Resolviendo, resulta:
p
1
* = 0,1249
En la figura 9.3 se representa la distribucin normal de p
1
y las regiones de aceptacin y rechazo
delimitadas por p
1
*.
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70
Regin de rechazo Regin de aceptacin
= 0,05
p
1
*
= 0,1249

Figura 9.3. Regiones de aceptacin y rechazo para el contraste de hiptesis (de cola izquierda)
de una proporcin
La proporcin encontrada en la muestra es p
1
= 6/40 = 0,15, que est en la regin de aceptacin;
por lo tanto, se acepta la hiptesis nula, y se rechaza la hiptesis alternativa. En otras palabras,
no se podr afirmar que el porcentaje de consumidores de detergente Real es menor del 25%.
A partir de p
1
* se puede determinar con precisin las regiones de aceptacin y rechazo:

40
*
1249 , 0 *
1
x
p = =
x* = 4,996
Por lo tanto: Regin de rechazo: x = 0, 1, 2, , 4
Regin de aceptacin: x = 5, 6, 7, , 40
Dividiendo cada valor x entre 40, se determinan las regiones de aceptacin y rechazo de la va-
riable p
1
:
Regin de rechazo: p
1
= 0; 0,025; 0,050, ; 0,100
Regin de aceptacin: p
1
= 0,125; 0,150; ; 1.
122 Contrastes de hiptesis


El verdadero valor de se puede determinar calculando la probabilidad de que p
1
est en la re-
gin de rechazo, usando la aproximacin normal:
01 , 2 008 , 2
40
75 , 0 25 , 0
25 , 0
) 40 ( 2
1
1 , 0
=

+
= z
= 0,0222
Cul sera la probabilidad de aceptar la hiptesis nula si el verdadero valor de p fuese 0,20?
En este caso, la hiptesis nula (H
0
: p 0,25) sera falsa, por lo tanto, dicha probabilidad, es de-
cir, la probabilidad de que p
1
est en la regin de aceptacin, es :
38 , 1
40
80 , 0 20 , 0
20 , 0
) 40 ( 2
1
125 , 0
=


= z
= 1 0,0838 = 0,9162
En la figura 9.4 se muestran las reas que representan a y , incluyendo las reas que se aa-
den en cada caso.
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70
Regin de rechazo Regin de aceptacin
0,125


Figura 9.4. Representacin grfica de y del ejemplo 1.
Ejemplo 2:
Supngase que un grupo de profesionales de la educacin ha venido aplicando un mtodo espe-
cial para mejorar el nivel educativo de los alumnos del departamento de Piura. Se quiere investi-
gar si el porcentaje de alumnos con promedio mayor de 15 es superior en Piura que en el resto
del pas. Para esto, se toman dos muestras: la primera, de 200 alumnos del resto del pas, donde
se encuentran 38 alumnos con promedio mayor de 15; la segunda, de 100 alumnos de Piura,
donde se encuentran 23 alumnos con promedio mayor de 15. Se podr afirmar que dicho por-
centaje es mayor en Piura, con = 0,05?
Contrastes de hiptesis

123
Ntese que no se sabe cules son esas proporciones en las dos poblaciones consideradas en esta
investigacin; pero se sabe que si en ambos casos np y nq > 5, la diferencia de las proporciones
se distribuye normalmente alrededor de la diferencia de las proporciones de las poblaciones, con
una desviacin estndar que se puede estimar gracias a que las muestras tomadas son grandes.
Sean p
x
y p
y
las proporciones de alumnos con promedio mayor de 15 en Piura y el resto del pas,
respectivamente.
Sean adems:
Para Piura: N
x
= 100 Para el resto del pas: N
y
= 200
p
1
= 23/100 = 0,23 p
2
= 38/200 = 0,19
Conviene asumir, como hiptesis nula, que las proporciones p
x
y p
y
son iguales. La hiptesis que
motiva la investigacin es que p
x
> p
y
. Por lo tanto, las hiptesis son:
H
0
: p
x
p
y
= 0
H
1
: p
x
p
y
> 0
En primer lugar se deben definir las regiones de aceptacin y rechazo, considerando que esta l-
tima estar en la cola derecha. El lmite entre ambas regiones (p
1
p
2
)* se determina de la si-
guiente manera:

200
7967 , 0 2033 , 0
100
7967 , 0 2033 , 0
0075 , 0 0 * ) (
645 , 1
2 1


=
p p

donde: p
x
= p
y
2033 , 0
200 100
38 23
=
+
+
=
+
+
y x
N N
y x
; q
x
= q
y
= 1 p
x
; f.c. = 0075 , 0
) 200 )( 100 ( 2
200 100
=
+

(p
1
p
2
)* = 0,089
La diferencia (p
1
p
2
) encontrada en las muestras es: 0,23 0,19 = 0,04 < 0,089. Por lo tanto se
acepta la hiptesis nula (ver figura 9.5), es decir, no se puede afirmar que el porcentaje de alum-
nos con promedio mayor de 15 es mayor en Piura que en el resto del pas.
-0.20 -0.15 -0.10 -0.05 0.00 0.05 0.10 0.15 0.20
Regin de rechazo Regin de aceptacin
(p
1
- p
2
)*= 0,089

Figura 9.5. Regiones de aceptacin y rechazo para el contraste de hiptesis
de cola derecha de una diferencia de dos proporciones (ejemplo 2).
124 Contrastes de hiptesis


9.6. Contrastes de hiptesis sobre medias muestrales
Ejemplo 3:
El encargado de un taller ha estimado que el promedio del nmero de piezas producidas sema-
nalmente por cada uno de los trabajadores es de 55. Se quiere saber si una modificacin en el
proceso productivo que se ha aplicado recientemente ha aumentado el nivel de produccin. Para
esto se toma una muestra de 60 trabajadores y se obtiene un promedio de 58 piezas producidas
en una semana y una desviacin estndar igual a 9. Indica este resultado que el promedio de
piezas producidas semanalmente por cada trabajador ha aumentado, es decir, es superior a 55?
Considere = 0,05.
Teniendo en cuenta el motivo de la investigacin, se plantean las siguientes hiptesis:
H
0
: = 55
H
1
: > 55
Para definir las regiones de aceptacin y rechazo se determina el valor x * que las limita:
1,645 =
60 / 9
55 * x
x * = 56,91
En la figura 9.6 se muestran las regiones de aceptacin y rechazo para este problema. El prome-
dio encontrado en la muestra est en la regin de rechazo (58 > 56,91); por lo tanto se rechaza la
hiptesis nula, es decir, se acepta la afirmacin de que el promedio de piezas producidas sema-
nalmente por cada trabajador es mayor de 55, como consecuencia de la modificacin efectuada
en el proceso.
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
50 51 52 53 54 55 56 57 58 59
56,91
Regin de rechazo Regin de aceptacin

Figura 9.6. Regiones de aceptacin y rechazo para el contraste de hiptesis de cola derecha
de una media muestral (ejemplo 3)
Ejemplo 4:
Respecto al problema anterior, se hubiese llegado a la misma conclusin si la muestra extrada
hubiese sido mucho ms pequea y se hubiese obtenido el mismo promedio de 58 y la misma
desviacin estndar igual a 9, con una muestra de 26 trabajadores? Se asume que el nmero de
piezas producidas semanalmente por cada trabajador sigue una distribucin normal.
Como la muestra es pequea y no se conoce la desviacin estndar de la poblacin, sta no se
x
* =
Contrastes de hiptesis

125
puede estimar. Se recurre entonces a la distribucin t de Student para determinar el valor x *
que limita las regiones de aceptacin y de rechazo.
Se plantean las mismas hiptesis del ejemplo anterior:
H
0
: = 55
H
1
: > 55
Adems:
n = 26
n
l
= n 1 = 25 (grados de libertad)
t* = 1,7081 =
1 26 / 9
55 *

x
x * = 58,075
El promedio encontrado en la muestra est en la regin de aceptacin (58 < 58,075); por lo tanto
se acepta la hiptesis nula, es decir, se rechaza la afirmacin de que el promedio de piezas pro-
ducidas semanalmente por cada trabajador es mayor de 55, como consecuencia de la modifica-
cin efectuada.
Ejemplo 5:
Supngase que, aunque no se conoce el promedio de las puntuaciones que obtienen los alumnos
del cuarto ao de secundaria de los departamentos de Piura y Lambayeque en una prueba de ap-
titud acadmica, se cree que es el mismo. Sin embargo, algunos profesores sospechan que estos
promedios son diferentes. Se investiga si son diferentes, y para esto se toma una muestra de 80
alumnos de Lambayeque, encontrndose un promedio de 57 puntos y 10 puntos de desviacin
estndar. En Piura se extrae una muestra de 70 alumnos, encontrndose un promedio de 54 pun-
tos y 9 puntos de desviacin estndar. Con base en estos resultados, se podr afirmar que los
promedios son diferentes?
Sean:

x
: la media de las puntuaciones en Lambayeque.

y
: la media de las puntuaciones en Piura.
n
x
: el tamao de la muestra de Lambayeque.
n
y
: el tamao de la muestra de Piura.
x : la media de las puntuaciones obtenidas en la muestra de Lambayeque.
y : la media de las puntuaciones obtenidas en la muestra de Piura.
Se plantean las siguientes hiptesis:
H
0
:
x

y
= 0
H
1
:
x

y
0
A diferencia de los contrastes de hiptesis vistos hasta ahora, en este caso se rechazar la hipte-
sis nula cuando la diferencia de los promedios sea significativa, sin importar cul es mayor. Se
tendrn entonces dos regiones de rechazo: una en cada cola de la distribucin normal, como se
muestra en la figura 9.7.
En primer lugar, se determinan los valores ( y x )* que limitan las regiones de aceptacin y de
rechazo. Tngase en cuenta que el rea de cada cola debe ser 0,025.

70
9
80
10
0 * ) (
96 , 1
2 2
+

=
y x

Se ha asumido que las varianzas de las muestras son iguales a las varianzas poblacionales, debi-
do a que las muestras son suficientemente grandes (n
x
> 50; n
y
> 50).
126 Contrastes de hiptesis


-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7
Regin de rechazo
Regin de rechazo
Regin de aceptacin
/2 = 0,025 /2 = 0,025
-3,041 3,041

Figura 9.7. Regiones de aceptacin y rechazo para el contraste de hiptesis de dos colas
de una diferencia de medias (ejemplo 5)

Resolviendo:
( y x )* = 3,041
La diferencia y x encontrada en las muestras es 3; valor que cae en la regin de aceptacin.
Por lo tanto se acepta que los promedios en ambos departamentos es el mismo. La diferencia en-
contrada no es significativa.
Ejemplo 6:
Supngase que, en el ejemplo 5, las muestras que se extraen de Lambayeque y Piura son peque-
as, de tamaos 17 y 12, respectivamente, y que las medias y desviaciones estndar encontradas
son las mismas. Con base en estos resultados, se podr afirmar que los promedios son diferen-
tes?
En primer lugar, se asume que las puntuaciones obtenidas en Lambayeque y Piura se distribuyen
normalmente, y que las desviaciones estndar de dichas puntuaciones en ambas poblaciones son
iguales. (Ms adelante se podr aplicar la Prueba F para corroborar si son iguales).
Se plantean nuevamente las siguientes hiptesis:
H
0
:
x

y
= 0
H
1
:
x

y
0
Las regiones de aceptacin y rechazo son las mismas que las del ejemplo 5 (figura 9.7); pero con
otros lmites.
Se determinan los valores ( y x )* que limitan las regiones de aceptacin y rechazo:
t*
|
.
|

\
|
+
|
|
.
|

\
|
+
+

= =
12
1
17
1
2 12 17
9 12 10 17
0 * ) (
0518 , 2
2 2
y x

( y x )*
2
= ( y x )*
2
=
Contrastes de hiptesis

127
Como se ve, el nmero de grados de libertad es: 17 + 12 2 = 27
( y x )* = 7,696
La diferencia y x encontrada en las muestras es 3, que cae en la regin de aceptacin. Por lo
tanto se acepta que los promedios en ambos departamentos es el mismo. La diferencia encontra-
da no es significativa.
9.7 La distribucin F: comparacin de varianzas.
Se incluye en este captulo la distribucin F, empleada para comparar varianzas, por lo impor-
tante que es verificar si las varianzas de dos universos son iguales.
La funcin densidad de probabilidad de la variable F es:

( )
2 / ) (
2
1
1 2 /
2 1
1
1 ) (
n n
n
n
F n
kF F f
+

|
|
.
|

\
|
+ =

donde n
1
y n
2

representan grados de libertad, y k es una constante que depende de n
1
y n
2
.
En la figura 9.8 se representa esta funcin:
F
f(F)

Figura 9.8. Distribucin F

Como hay dos tipos de grados de libertad, resultara muy trabajoso tabular reas bajo la funcin
F tan detalladamente como se hace con las funciones
2
y t. En el apndice se muestra una tabla que
da los valores de F*, a partir de los cuales el rea bajo la funcin F es 5% 1%, para distintas combi-
naciones de n
1
y n
2
. A estos valores se les suele denominar F
n1, n2; p
(pgs. 268-269).
Teorema:
Si se extraen dos muestras de tamaos N
1
y N
2
del mismo universo, con varianzas s
1
2
y s
2
2
, el
cociente s
1
2
/ s
2
2
tiene una distribucin F con:
n
1
= N
1
1
n
2
= N
2
1, grados de libertad.
Como la distribucin F es asimtrica, y las tablas (pg.268; 269) slo proporcionan reas en la
cola derecha, se suelen plantear las siguientes hiptesis para hacer la comparacin de varianzas:
H
0
:
1
2
=
2
2
H
1
:
1
2
>
2
2

As entonces, al extraer las dos muestras, conviene denominarle s
1
2
a la mayor de las varianzas.
Cabe esperarse que el valor F* a partir del cual se rechaza la hiptesis nula, sea menor conforme
aumenten los tamaos de las muestras. As, cuando N
1
y N
2
tienden a infinito, F* tiende a 1; pues
cuando las muestras representen casi la totalidad de sus universos, slo se debe admitir que las varian-
zas de dichos universos son iguales si lo son tambin las varianzas de las muestras.
128 Contrastes de hiptesis


F
f(F)
F* = 2,29
Regin de aceptacin Regin de rechazo
Ejemplo:
Una mquina est programada para llenar recipientes con 20 onzas de lquido. El jefe de pro-
duccin est pensando aumentar la velocidad de llenado; pero teme que la variabilidad aumente
significativamente. Para asegurarse, toma una muestra de 16 recipientes llenados a velocidad
normal, encontrando una desviacin estndar de 0,020 onzas. Luego toma una muestra de 25 re-
cipientes llenados a la nueva velocidad, encontrando una desviacin estndar de 0,028 onzas.
Se podr afirmar que con la nueva velocidad de llenado la varianza aumenta? Considere un ni-
vel de significacin del 5%.
Se investiga:
H
0
:
1
2
=
2
2

H
1
:
1
2
>
2
2

Sean: s
1
= 0.028; N
1
= 25
s
2
= 0.020; N
2
= 16
Para: n
1

= 25 1 = 24
n
2
= 16 1 = 15
Resulta: F* = 2,29

Segn las muestras: 96 , 1
) 020 , 0 (
) 028 , 0 (
2
2
2
2
2
1
= = =
s
s
F < 2.29.
Se acepta H
0
y se concluye que la varianza no ha aumentado.
9.8 Contrastes de hiptesis en Excel
9.8.1 Prueba t para medias de dos muestras suponiendo varianzas iguales.
Ejemplo:
En un programa de capacitacin industrial algunos aprendices son instruidos con el mtodo A,
que consiste en instrucciones mecanizadas, y otros son capacitados con el mtodo B, que entraa
tambin la atencin personal de un instructor. Se seleccionaron aleatoriamente aprendices ins-
truidos con los dos mtodos, encontrndose las siguientes calificaciones (la calificacin mxima
es 100):
Mtodo A 68 75 69 71 73 66 68 71 71 68
Mtodo B 72 77 79 78 70 68 77 77 72 66
Se puede afirmar que el mtodo B es mejor? Considere = 0,05.
Se trata de una prueba de hiptesis de diferencia de medias, a partir de muestras pequeas. Co-
mo el propsito es investigar si el mtodo B es mejor, se plantea:
H
0
:
B

A
= 0
H
1
:
B

A
> 0
Ingresando al men Herramientas/Anlisis de datos/Prueba t para dos muestras suponiendo va-
rianzas iguales se abre el cuadro de dilogo que se muestra en la figura 9.9, que en este caso ya
tiene ingresados los datos del problema:
Contrastes de hiptesis

129

Figura 9.9. Cuadro de dilogo de Excel de la prueba t para la diferencia de medias
suponiendo varianzas iguales.
Cabe aclarar que los datos del mtodo B fueron ingresados en el rango B1:K1 y los datos del
mtodo A fueron ingresados en el rango B2:K2; con lo cual Excel asign la Variable 1 a las ca-
lificaciones del mtodo B y Variable 2 a las calificaciones del mtodo A.
Aceptando los datos ingresados en el cuadro de dilogo, se obtiene el siguiente resultado:
Variable 1 Variable 2
Media 73.6 70
Varianza 21.156 7.333
Observaciones 10 10
Varianza agrupada 14.244
Diferencia hipottica de las medias 0
Grados de libertad 18
Estadstico t 2.133
P(T<=t) una cola 0.023
Valor crtico de t (una cola) 1.734
P(T<=t) dos colas 0.047
Valor crtico de t (dos colas) 2.101
Como se trata de una prueba de cola derecha, la regin de rechazo est hacia la derecha del va-
lor crtico t*. Por lo tanto se rechaza H
0
, pues t = 2,133 >1,734 = t*.
Se llega a la misma conclusin, que t est en la regin de rechazo, observando que:
P(T <= t) = 0,023 < 0,05 =
Por lo tanto, se rechaza H
0
, se acepta H
1
; o sea que s se puede afirmar que el mtodo B es mejor
que el mtodo A.
9.8.2 Prueba t para medias de dos muestras suponiendo varianzas desiguales.
En este caso se procede de la misma forma que en el apartado anterior, ingresando al men
Herramientas/Anlisis de datos/Prueba t para dos muestras suponiendo varianzas desiguales.
Para saber si las varianzas de dos poblaciones son iguales o diferentes, se debe hacer la prueba
F, tal como se explic en el apartado 9.7.
130 Contrastes de hiptesis


9.8.3 Prueba z para medias de dos muestras cuando se conocen la varianzas de las poblaciones
Ejemplo:
Una encuesta de hbitos de consumo de alimentos realizada en Piura y Chiclayo revela los re-
sultados que se muestran a continuacin. En Piura fueron encuestadas 25 amas de casa y en
Chiclayo se entrevistaron 35 amas de casa. Se conocen las desviaciones estndar de ambas po-
blaciones: S/.55 para Piura y S/.65 para Chiclayo. Se puede afirmar que el gasto es menor en
Piura que en Chiclayo? Considere = 0,05
364,98 316,11 392,21 443,82 439,91 466,65 270,82 368,29 370,69 386,74
434,75 325,66 345,48 295,47 363,65 361,48 447,13 375,73 361,72 359,79 Piura
287,65 331,11 341,32 274,10 351,60
514,02 370,92 312,07 317,54 316,27 370,06 377,13 263,26 337,49 369,07
479,56 386,97 382,27 310,30 325,19 375,86 449,72 401,05 468,66 471,17
366,80 324,06 367,80 384,09 501,57 250,12 363,10 327,29 452,14 434,47
Chiclayo
316,12 359,47 389,47 407,21 310,85
Se trata de una prueba de hiptesis de diferencia de medias, cuando se conocen las varianzas de
las poblaciones. Como el propsito es investigar si el gasto es menor en Piura, se plantea:
H
0
:
P

Ch
= 0
H
1
:
P

Ch
< 0
Ingresando al men Herramientas/Anlisis de datos/Prueba z para medias de dos muestras, se
abre el cuadro de dilogo que se muestra en la figura 9.10, que ya tiene ingresados los datos del
problema. En este caso los datos de la Variable 1 corresponden a Piura y los de la Variable 2 a
Chiclayo.

Figura 9.10. Cuadro de dilogo de Excel de la prueba z para la diferencia de
medias cuando se conocen las varianzas de las poblaciones
Aceptando los datos ingresados en el cuadro de dilogo, se obtiene el siguiente resultado.
Como se trata de una prueba de cola izquierda, la regin de rechazo est hacia la izquierda del
valor crtico z*.

Contrastes de hiptesis

131
Variable 1 Variable 2
Media 363.0744 370.804
Varianza (conocida) 3025 4225
Observaciones 25 35
Diferencia hipottica de las medias 0
z -0.49717
P(Z<=z) una cola 0.3095
Valor crtico de z (una cola) -1.64485
P(Z<=z) dos colas 0.6191
Valor crtico de z (dos colas) 1.95996
Por lo tanto se acepta H
0
, pues z = 0,49717 > 1,64485 = z*. Se llega a la misma conclusin,
que z est en la regin de aceptacin, observando que:
P(Z <= z) = 0,3095 > 0,05 =
O sea que no se puede afirmar que el gasto por consumo de alimentos en Piura es menor que en
Chiclayo.
9.8.4 Prueba de una media cuando se conoce o no la varianza de la poblacin
Excel permite hacer pruebas de hiptesis respecto a una media, cuando se conoce la varianza de
la poblacin y cuando se desconoce. En el segundo caso considera la desviacin estndar de la mues-
tra, como se expresa en el cuadro de dilogo de Excel que se muestra en la figura 9.11.
La funcin de Excel que se emplea es PRUEBA.Z; aunque cuando la muestra que se emplea es
pequea, se trate realmente de una prueba t.
Para ambos casos, Excel slo considera una prueba de dos colas; sin embargo, se puede emplear
esta funcin para pruebas de una sola cola, comparando el valor de P que da Excel (que representa el
rea que hay desde la media de la muestra hasta ), con el valor de . Si P es menor que , la media
de la muestra est en la regin de rechazo, pues contendra a P.
En el siguiente ejemplo se hace un contraste o prueba de hiptesis de una media, de una cola,
cuando se conoce la varianza de la poblacin.
Ejemplo:
El dueo de un restaurante ha muestreado 20 clientes para averiguar si el consumo promedio por
cliente es de ms de S/.31, encontrando los siguientes consumos:

33,85 28,47 36,84 42,52 42,09 45,03 23,49 34,21 41,52 29,52
31,70 26,20 25,34 30,12 31,25 23,85 32,38 33,28 36,24 33,49

Si se sabe que los consumos de los clientes de este restaurante estn distribuidos normalmente
con una desviacin estndar igual a 6,4 se podr afirmar que el consumo promedio por cliente
es de ms de S/.31? Considere = 0,05
Como el propsito es investigar si el consumo promedio de los clientes del restaurante es mayor
que S/. 31, se plantea:
H
0
: = 31
H
1
: > 31
Insertando la funcin PRUEBA.Z, Excel muestra el cuadro de dilogo que se muestra en la figu-
ra 9.11. Ntese que en este cuadro ya se han ingresado los datos del problema, incluyendo la
desviacin estndar (sigma) de la poblacin.
Haciendo clic en Aceptar, Excel devuelve el valor P = 0,07 > 0,05. Por lo tanto se rechaza H
0
, se
acepta H
1
; o sea que el consumo promedio por cliente es de ms de S/.31.
132 Contrastes de hiptesis



Figura 9.11. Cuadro de dilogo de Excel de la prueba z de una media
9.8.5 Comparacin de varianzas
Con Excel se puede realizar la prueba de comparacin de varianzas utilizando la herramienta es-
tadstica Prueba F para varianzas de dos muestras que se encuentra en el men Herramientas/Anlisis
de datos. A continuacin se resuelve un problema.
Ejemplo:
Una empresa de servicios encuesta semanalmente a sus clientes para medir y controlar su nivel
de satisfaccin. En una de las preguntas de la encuesta los clientes deben puntuar entre 1 y 5 la
profesionalidad de los empleados que los acaban de atender. Suponga que en las ltimas 16 se-
manas la empresa obtuvo los siguientes promedios de la profesionalidad de sus empleados, de
las encuestas hechas en las oficinas de Piura y Chiclayo:
Piura 3,37 2,98 3,59 4,01 3,97 4,19 2,62 3,40 3,93 3,06 3,22 2,82 2,76 3,10 3,19 2,65
Chiclayo 2,53 3,76 3,29 2,80 2,62 3,61 2,88 3,15 2,92 2,97 3,00 2,81 3,64 2,50 3,15 3,15
Se puede afirmar que la variabilidad es mayor en Piura, y que por lo tanto los empleados de
Piura son menos homogneos en cuanto a la profesionalidad? Considere = 0,05
Se plantean las siguientes hiptesis:
H
0
:
P
2
=
Ch
2

H
1
:
P
2
>
Ch
2

Recurdese que esta prueba es siempre de una sola cola (derecha), debido a que las tablas F slo
estn tabuladas para calcular reas en la cola derecha de la funcin F.
Ingresando al men Herramientas/Anlisis de datos/Prueba F para varianzas de dos muestras,
se abre el cuadro de dilogo que se muestra en la figura 9.12, que ya tiene ingresados los datos
del problema. En este caso los datos de la Variable 1 corresponden a Piura y los datos de la Va-
riable 2 a Chiclayo.
Contrastes de hiptesis

133

Figura 9.12. Cuadro de dilogo de la prueba de comparacin de varianzas
Aceptando los datos ingresados en el cuadro de dilogo, se obtiene el siguiente resultado.
Variable 1 Variable 2
Media 3.30375 3.04875
Varianza 0.257745 0.14573167
Observaciones 16 16
Grados de libertad 15 15
F 1.76862727
P(F<=f) una cola 0.14032574
Valor crtico para F (una cola) 2.40344633
Por lo tanto se acepta H
0
, pues F = 1,7686 < 2,4034 = F*. Se llega a la misma conclusin, que F
est en la regin de aceptacin, observando que:
P(F <= f) = 0,1403 > 0,05 =
O sea que no se puede afirmar que la variabilidad es mayor en Piura, es decir, que los emplea-
dos de Piura son menos homogneos en cuanto a la profesionalidad.

134 Contrastes de hiptesis


Problemas propuestos
1. En una fbrica que produce artculos en serie, el 75% son, en promedio, de ptima calidad. El jefe
de produccin cree que con cierto cambio en el proceso, conseguir aumentar dicho porcentaje en
forma considerable. Para asegurarse, un da efecta dicho cambio, pone el proceso en marcha y
toma una muestra de 20 artculos, encontrando que 18 son de ptima calidad. Considerando =
10%:
a) Afirmara usted que ese cambio har aumentar el porcentaje de artculos de ptima calidad?
Respuesta: S afirmara que aumenta el % de artculos de ptima calidad.
b) Estara usted completamente seguro de la respuesta que ha dado en el apartado anterior?
Cul es la probabilidad de que usted est equivocado?
Respuesta: No estara tan seguro; hay una probabilidad del 9,13% de estar equivocado.
c) Suponga que el cambio efectuado s da los resultados que esperaba el jefe de produccin, pero
existe una probabilidad de 7,55% de no descubrirlo. A cunto ha aumentado el porcentaje de
artculos de ptima calidad?
2. Un profesor de Estadstica tiene una moneda deformada. Despus de experimentar con ella, ha lle-
gado a la conclusin de que si la lanza muchas veces, obtendr el triple nmero de caras que de se-
llos. Un grupo de alumnos cree que el profesor est equivocado, pero no estn seguros si tienden a
salir ms caras o sellos. Otro grupo tambin cree que el profesor est equivocado, pero no de tal
modo, pues opinan que deben salir an ms caras que sellos.
a) Determine qu regiones de aceptacin y rechazo debe plantear cada grupo de alumnos, si de-
ciden lanzar dicha moneda 20 veces, considerando un = 10%.
b) Determine, para cada grupo de alumnos, para qu valores de p, es menor del 30%.
3. El 80% de los pacientes que reciben cierto tratamiento reaccionan favorablemente. De un grupo de
15 pacientes de un hospital, 8 reaccionaron favorablemente.
a) Podra aceptarse la hiptesis de que los pacientes de este hospital reaccionan menos favora-
blemente a este tratamiento? Sea = 0,05.
Respuesta: Se acepta que los pacientes de este hospital reaccionan menos favorablemente al
tratamiento.
b) Cul es realmente la probabilidad de cometer el error tipo I?
Respuesta:
real
= 0,0181
c) Si realmente se recuperan el 70% de los pacientes del hospital, cul es la probabilidad de
aceptar la hiptesis inicial?
Repuesta: = 0,8689
4. En una compaa que produce ciertos artculos se afirma que, en promedio, el 5% son defectuosos.
El jefe de produccin quiere investigar si dicho porcentaje es mayor, tomando primeramente una
muestra de doce artculos. Si en la muestra se encuentran ms de dos artculos defectuosos, no
aceptar la afirmacin inicial. En caso contrario, tomar otra muestra de doce artculos y, si el n-
mero de artculos defectuosos es 2 como mximo, aceptar la afirmacin inicial.
a) Determine el valor de
Respuesta: = 0,0388
b) Si el porcentaje de artculos defectuosos es realmente 10, cul es la probabilidad de cometer
el error tipo II?
Respuesta: = 0,7905
5. El profesor de Estadstica ha informado a la Direccin de Estudios que el porcentaje de alumnos
de la Universidad que llega tarde a clases es 20%. El director de estudios inici un plan de aseso-
ramiento personal con el propsito de reducir ese porcentaje. Un alumno de Estadstica quiere
comprobar si dicho plan ha dado buenos resultados y muestrea aleatoriamente 20 alumnos, encon-
trando que cinco de stos llegaron tarde. Si considera = 0,05, a qu conclusin llegar?
Contrastes de hiptesis

135
6. Un candidato a la alcalda afirma que por lo menos el 55% de los ciudadanos votarn por l. Se
hizo una encuesta a 20 votantes para investigar su afirmacin y slo 8 dijeron que votaran por l.
Sea = 0,05.
a) Se aceptar la afirmacin del candidato?
Respuesta: S se acepta
b) Si en las elecciones, el mencionado candidato obtiene el 40% de los votos, Cul es la proba-
bilidad de que hayamos aceptado su afirmacin?
Respuesta: 0,75
7. Un peluquero afirma que por lo menos el 80% de sus clientes seguirn acudiendo a su peluquera,
a pesar de un fuerte incremento que est haciendo en su tarifa. Su ayudante no est muy seguro de
ello y consulta con 15 de sus clientes, tomados aleatoriamente, resultando que 11 de ellos piensan
seguir acudiendo a su peluquera. Considerando = 5%, qu opina sobre la afirmacin del pelu-
quero?
8. Se sabe que la proporcin de artculos defectuosos en un proceso de produccin es de 0,15. Con el
objeto de mejorar la produccin, se hizo una modificacin en una de las mquinas y se contrat
ms personal. Estas acciones dieron origen a una discusin entre dos Ingenieros de Planta. A pen-
saba que la proporcin de artculos defectuosos haba disminuido y B por el contrario sostena que
haba aumentado. Tomando una muestra de 20 artculos en un da de produccin, y considerando
= 0,10:
a) Determine las regiones de aceptacin y rechazo para A y B.
b) Si realmente la proporcin de defectuosos baj a 0,10. Quin puede cometer el error tipo II?
Cul es la probabilidad de que lo cometa?
9. El jefe del centro de cmputo de un banco afirma que la probabilidad de que las digitadoras pulsen
la tecla de un carcter incorrectamente, es igual a 0,001. Si en un documento de 10,000 caracteres
se pulsaron errneamente 15 teclas, concluira que dicha probabilidad es realmente mayor que
0,001? Considere = 0,10.
10. Se ha estimado que no ms del 2% de los alumnos de la UDEP provienen de Morropn. Si de una
muestra de 400 alumnos, 15 son de Morropn, que dira de esa estimacin? Considere = 0,10.
11. El departamento mdico desea actualizar su informacin con respecto a los alumnos que fuman.
Con base a estudios previos se cree que la proporcin es del 58%. El departamento lleva a cabo
una encuesta tomando una muestra aleatoria de 600 alumnos, a los cuales se les pregunta si fuman.
De los 600, 367 son fumadores. Afirmara usted, tomando este resultado, que el porcentaje de
alumnos que fuman ha aumentado? Considere = 0,10.
12. Un fabricante afirma que en general el 8% de las piezas que produce son defectuosas. Un ingenie-
ro industrial propone un control de calidad y afirma que as reducir considerablemente el porcen-
taje de defectuosos. El fabricante quiere comprobarlo, y escoge aleatoriamente 100 piezas, una vez
que se est aplicando el control de calidad, encontrando 5 defectuosas. Con = 0,05:
a) Aceptara la afirmacin del Ingeniero?
b) Si con este control de calidad, el fabricante escoge 100 piezas diarias durante 50 das, encon-
trando que slo en ocho das se verifica su hiptesis. Cul es aproximadamente el verdadero
porcentaje de piezas defectuosas?
13. En un grupo de 20 cartas estn incluidos los cuatro ases. En 80 extracciones son sustitucin se ob-
tienen 21 ases.
a) Se puede considerar este resultado fuera de lo usual? Sea = 0,05
b) Cul es el mnimo nmero de ases que debo obtener para considerar el resultado como usual?
Sea = 0,05
14. Uno de los dos candidatos a la presidencia del Club Grau afirma que al menos el 45% de los so-
cios votarn por l. Si se hace una encuesta a una muestra aleatoria de 200 socios ( = 0,05)
136 Contrastes de hiptesis


a) Cuntos socios del total de encuestados tendrn que afirmar que votarn por l para que se
acepte su afirmacin?
Respuesta: Por lo menos, 78 socios debern afirmar que votarn por l, para que se acepte su
hiptesis.
b) Si luego de las elecciones se determina que se equivoc, y que la probabilidad de aceptar su
afirmacin era 0,84, qu porcentaje de votos obtuvo?
Respuesta: Obtuvo aproximadamente el 42% de los votos.
15. Se sabe que la proporcin de artculos defectuosos en un proceso de manufactura es de 0,15. El
proceso se vigila en forma peridica, tomando muestras aleatorias de tamao 40 e inspeccionando
las unidades, con el propsito de detectar un aumento de dicha proporcin; en cuyo caso se detiene
el proceso y se considera como "fuera de control". Si se desea que en menos del 5% de las inspec-
ciones se declare que el proceso est "fuera de control", cuando realmente la proporcin de artcu-
los defectuosos no ha aumentado:
a) Enunciar las hiptesis nula y alternativa apropiadas.
b) Determine las regiones de aceptacin y rechazo.
c) Suponiendo que la proporcin de artculos defectuosos es 0,20, en qu porcentaje de inspec-
ciones se declarar que el proceso est fuera de control? Y si dicha proporcin es 0,30?
16. El 5% de los productos de una fbrica son defectuosos. Se hizo una modificacin del proceso de
produccin y se investig una posible mejora mediante una muestra de 120 unidades, encontrn-
dose 3 defectuosas. Sea = 0,05 Podra decirse que la modificacin redujo el porcentaje defec-
tuoso?
Respuesta: No se redujo el porcentaje defectuoso.
17. Hay 2 candidatos a la Alcalda para las prximas elecciones en la ciudad de Piura. Segn el candi-
dato A, alcanzar como mnimo el 65% de los votos. Si en las encuestas el candidato A obtiene el
56% de los votos. De qu tamao fue la muestra si los resultados fueron aceptables, a un nivel del
5%?
18. En una prueba de Estadstica tomada a un grupo de 70 alumnos, 52 alumnos contestaron correcta-
mente la primera pregunta y 57 alumnos contestaron correctamente la segunda pregunta. Se po-
dr afirmar que la segunda pregunta es ms fcil? Sea = 0,10.
19. Un fabricante afirma que las llantas que produce tienen una duracin media de 50 000 Km., con
una desviacin estndar de 7 300 Km. Una organizacin de proteccin al consumidor selecciona
una muestra de 100 de estas llantas, encontrando una duracin promedio de 47 000 Km. Debe
dudar dicho organismo de la aseveracin del fabricante? Sea = 0,10.
20. Se ha asegurado que el peso promedio de las alumnas de la UDEP es de 54,4 Kg. Uno de los pro-
fesores no cree que tal aseveracin sea correcta y rene una muestra aleatoria de 100 pesos. De
ello resulta una media de 53,75 Kg. y una desviacin estndar de 5,4 Kg. Es esta evidencia sufi-
ciente para rechazar la afirmacin inicial? Sea = 0,10.
Respuesta: No es suficiente para rechazar la afirmacin inicial.
21. Suponga que las calificaciones en matemticas de los alumnos de dos escuelas siguen distribucio-
nes normales. Para investigar si tales calificaciones son significativamente mayores en una de las
escuelas, se toman muestras aleatorias de 40 alumnos en ambas, encontrndose un promedio de 80
puntos y una desviacin estndar de 9,5 puntos para la primera escuela, y un promedio de 75 pun-
tos con una desviacin estndar de 7 puntos para la segunda escuela. Considere un nivel de signi-
ficancia del 5%:
a) Se podr aceptar que en una escuela se obtienen mayores calificaciones que en la otra?
Respuesta: S se acepta.
b) A partir de qu valor de la diferencia entre las calificaciones de las dos muestras, se podr
aceptar que en una escuela se obtienen mayores calificaciones que en la otra?
Respuesta: A partir de 3,15.
Contrastes de hiptesis

137
22. Un laboratorista piensa modificar el proceso para producir cal viva a partir de la caliza. Har la
modificacin slo si la cal viva promedio que se obtiene por este nuevo proceso aumenta su valor
con respecto al proceso actual. Con base en un experimento de laboratorio y mediante el empleo
de dos muestras aleatorias de tamao 11, una para cada proceso, se obtuvo lo siguiente: la cantidad
del cal viva promedio del proceso actual fue de 24,5 con una desviacin estndar de 2,2, y para el
proceso propuesto fue de 28,1 con una desviacin estndar de 2,6. Cree usted que debe adoptarse
el nuevo proceso? Haga las consideraciones y pruebas necesarias para contestar esta interrogante.
Respuesta: Debe aceptarse el nuevo proceso.
23. Se espera que dos operadores produzcan, en promedio, el mismo nmero de unidades terminadas
en el mismo tiempo. A continuacin se muestra la cantidad de unidades terminadas para ambos
trabajadores, en una semana de trabajo. Considere un nivel de significancia () del 5%.
Operador 1 12 11 18 16 13
Operador 2 15 18 17 16 17

a) Se puede discernir alguna diferencia entre los operadores?
Respuesta: No hay diferencia.
b) Si cree necesario, diga qu condiciones deben cumplir las variables aleatorias en estudio. Diga
adems qu representan esas variables.
Respuesta:
x
debe ser igual a
y
. X e Y representan el nmero de unidades terminadas por los
operadores 1 y 2 respectivamente; deben tener distribucin normal.
c) Si realmente hay una diferencia de una unidad entre los promedios mencionados, cul sera la
probabilidad de cometer el error tipo II? En que consistira este error?
Respuesta: Aproximadamente 0,93.
24. Una compaa adquiri mil pistones de un nuevo proveedor que, aunque dando un precio ms bajo
que el productor anterior, garantiza la misma calidad. Al llegar el embarque, la compaa selec-
cion una muestra de 30 artculos, encontrando que el dimetro promedio es de 7,504 cm. con una
desviacin estndar 0,018 cm. Las especificaciones requieren que no se sobrepase un dimetro
promedio de 7,500 cm. Suponiendo que se acepta un riesgo del 10% de una acusacin falsa, con-
siderara usted que el proveedor est cumpliendo con el acuerdo? Considere un nivel de signifi-
cancia del 5%
Respuesta: El proveedor s est cumpliendo con el acuerdo.
25. Supngase que en una lnea area se desea determinar si el peso promedio del equipaje que llevan
los pasajeros que van de Piura a Lima es de ms de 15 Kg. Se selecciona aleatoriamente una
muestra de 40 pasajeros y se pesa su equipaje, encontrando una media de 16 Kg. Supngase que se
sabe que la desviacin estndar de los pesos es de 2,8 Kg. Debera llegarse a la conclusin de que
el peso promedio del equipaje es de ms de 15 Kg?
Respuesta: S, el peso promedio es mayor que 15.
25. El gerente de una refinera piensa modificar el proceso para producir gasolina a partir del petrleo
crudo; pero har la modificacin slo si la gasolina promedio que se obtenga por este nuevo pro-
ceso (expresada como porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con
base en un experimento de laboratorio y mediante el empleo de dos muestras aleatorias de tamao
25 para cada proceso, la cantidad de gasolina promedio del proceso en uso fue de 26,34 con una
desviacin estndar de 2,4, y para el proceso propuesto fue de 28,8 con una desviacin estndar de
2,9. El gerente piensa que los resultados proporcionados por los dos procesos son variables aleato-
rias independientes normalmente distribuidas. Considere = 0,05.
a) Se podr afirmar que las varianzas de los dos procesos son iguales?
b) Debe adoptarse el nuevo proceso?
26. Una organizacin va a probar la distancia de frenado, a una velocidad de 80 Km/h, de dos marcas
distintas de automviles. Para la primera marca se seleccionaron 10 automviles y se probaron en
un medio controlado, obteniendo las siguientes distancias (en metros): 50,8; 53,5; 48,5; 49,6; 51,1;
138 Contrastes de hiptesis


52,3; 52,7; 50,5; 57,1; 48,8. Para la segunda marca se seleccionaron 8 automviles y se obtuvo:
40,5; 45,9; 50,1; 47,4; 46,2; 49,0; 43,3; 41,6. Con base en esta evidencia, existe alguna razn para
afirmar que los autos de la segunda marca tienen un mejor frenado? Considere = 0,05.
27. Un comerciante piensa comprar a un productor una gran cantidad de material para soldar. ste
asegura al comerciante que la tensin de ruptura del material que emplea es de 250 lb., con una
desviacin estndar de 25 lb. El comerciante enva a uno de sus tcnicos indicndole que compre
el material slo si una muestra de 64 especimenes da una tensin de ruptura promedio de por lo
menos 245 lb. Pero, por error, el productor muestrea 94 especimenes. Qu tensin de ruptura
promedio debe tener la muestra, como mnimo, para que el tcnico decida comprar el material,
cumpliendo con los requerimientos del comerciante?
28. Supongamos que la estatura media de los alumnos de la UDEP es 1.70m. Un alumno que quiere
investigar esto, toma una muestra aleatoria de 10 de sus compaeros, midindoles: 1,66; 1,82;
1,75; 1,58; 1,73; 1,72; 1,64; 1,63; 1,58 y 1,65m. Se puede considerar esta muestra representativa?
Considere = 0.05
Respuesta: S es representativa.
29. Se quiere saber si el nivel en el primer ciclo de la Facultad de Ingeniera ha mejorado respecto al
semestre pasado. Un alumno toma una muestra de 14 alumnos del primer ciclo del semestre pasa-
do y calcula un promedio de notas 10,18 con desviacin estndar 1,77. Luego toma una muestra
de 17 alumnos del primer ciclo del semestre actual y calcula un promedio 10,77 con desviacin es-
tndar 2,07. Sea = 0,05. Se podr afirmar que el nivel ha mejorado?
Respuesta: No se puede afirmar que ha mejorado.
30. Un fabricante requiere fibra de algodn con una resistencia media a la tensin de 6,50 onzas y
desviacin estndar 0,25 onzas. Investig un nuevo lote de fibras mediante una muestra de 17 pie-
zas y encontr una resistencia media de 6,35 onzas. Suponga que la desviacin estndar no ha
cambiado. Se puede afirmar que la resistencia media a este lote no se ajusta a sus requerimientos?
Sea = 0,05.
31. La experiencia indica que la resistencia a la rotura del alambre comprado a cierta compaa est
distribuida normalmente con una resistencia media de 100 Kg. y una desviacin estndar de 5 Kg.
Un comprador emplea estos alambres colocando 8 en paralelo, con el propsito de aumentar la re-
sistencia a la rotura a 800 Kg. Si se toma una conexin de estos alambres y resiste 755 Kg. Dira
usted que los alambres de esta compaa no soportan 100 Kg? Sea = 0,05.
32. Una muestra de 100 familias encuestadas en Lima revela que 10 familias consumen jugo de frutas
envasado. Con qu nivel de significancia () se podr afirmar que el porcentaje de familias de
Lima que consumen jugo de frutas envasado es de menos del 15%?
33. La SUNAT estima que el 25% de todas las devoluciones de impuestos contienen errores aritmti-
cos. Se toma una muestra aleatoria de 20 devoluciones. Sea = 0,10.
a) Cuntas de estas devoluciones tendran que contener errores para poder afirmar que el
porcentaje de las devoluciones de impuestos que contienen errores aritmticos es mayor del
25%?
b) Cuntas de estas devoluciones tendran que contener errores aritmticos para poder afirmar
que el porcentaje de las devoluciones de impuestos que contienen errores aritmticos es menor
del 25%?
34. Se afirma que la media poblacional en madurez lectora en los colegios de Piura es menor que 10
(Test ABC de Filho). Se aplica este test a una muestra de 36 nios y se obtienen los resultados que
se muestran. Qu opina de la afirmacin inicial?
18 17 7 12 15 6 7 10 9 4 2 7 20 9 10 13 11 2
16 8 3 9 4 2 19 14 15 9 8 11 10 13 10 4 10 3

La distribucin ji-cuadrada 139


Captulo 10. La distribucin ji-cuadrada (
2
)
10.1 Introduccin.
La distribucin ji-cuadrada (
2
) se usa con mucha frecuencia en investigaciones estadsticas; y
es, despus de la distribucin normal, la ms empleada.
La ms importante aplicacin de esta distribucin es la prueba de bondad de ajuste, donde se in-
vestiga si una determinada distribucin de frecuencias se ajusta a una distribucin de frecuencias te-
rica, analizando qu tanto difieren las frecuencias observadas y las frecuencias esperadas, las cuales
son calculadas a partir de la distribucin terica.
Otra aplicacin es la prueba de independencia, donde se investiga si dos variables cualitativas
son independientes.
Adems, se emplea en pruebas de hiptesis respecto a la varianza de una poblacin.
10.2 La funcin densidad de probabilidad ji-cuadrada.
La funcin densidad de probabilidad ji-cuadrada es la siguiente:
1 ) 2 / ( 2 2
) (
2

=
n
e k y


donde: n = nmero de grados de libertad (se explica ms adelante)
k = constante que depende de n
Dado que n es el nico parmetro de esta funcin, su valor determina la forma de sta. En la fi-
gura 10.1 se muestran algunas curvas de la funcin ji-cuadrado, donde se aprecia que la asimetra dis-
minuye conforme aumenta n.
0
0.1
0.2
0.3
0.4
0.5
0.6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
n =1
n =2
n =4
n =6
n =8

Figura 10.1. Curvas ji-cuadrado para distintos grados de libertad
140 La distribucin ji-cuadrada

Para valores grandes de n,
2
tiene una distribucin aproximadamente normal.
La media y la varianza de la funcin
2
son:
= n

2
= 2n
verificndose lo dicho anteriormente, que la funcin
2
queda determinada con n.
Por tratarse de una funcin densidad de probabilidad, el rea bajo la curva
2
es igual a 1, y, por-
ciones de esta rea representan probabilidades.
Existen tablas que permiten determinar reas bajo esta funcin, como la que se muestra en el
apndice (pg. 267). Esta tabla no puede ser tan detallada como la que determina reas bajo la curva
normal estandarizada; pues para ello se tendra que tabular cada curva
2
que corresponde a cada valor
posible de n. La tabla muestra los valores de
2
correspondientes a determinadas reas (las ms em-
pleadas) de la cola derecha de la curva.
Para n > 30, la curva
2
se aproxima mucho a una curva normal, y, como sugiere E. Mode, resul-
ta muy buena aproximacin emplear la siguiente expresin:
1 2 2
2
= n z y usar la tabla de reas bajo la curva normal.
10.3 Pruebas de bondad de ajuste.
Una prueba de bondad de ajuste es una prueba de hiptesis donde se investiga si una variable
aleatoria tiene una distribucin dada. Las hiptesis nula y alternativa que se plantean son las siguien-
tes:
H
0
: X tiene una distribucin ... (se especifica cul).
H
1
: X no tiene dicha distribucin.
Para llevar a cabo esta prueba, se toma una muestra y se elabora una tabla de distribucin de fre-
cuencias. Estas frecuencias observadas (f
i
) se comparan con las frecuencias esperadas o tericas (f
i
)
que se obtienen a partir de la distribucin terica especificada en la hiptesis nula. Si la muestra, de
tamao n, tiene m frecuencias, se puede demostrar que la siguiente suma:
( )

m
i i
i i
f
f f
1
2
'
'

tiene aproximadamente una distribucin
2
, con m 1 grados de libertad, siempre que ninguna
frecuencia esperada sea menor de 5.
Esto se puede comprobar de la siguiente manera: se toma una muestra de tamao n y se calcula

2
1
, luego otra muestra de tamao n y se calcula
2
2
, y as sucesivamente hasta tener la suficiente can-
tidad de valores para construir un histograma. As, se podr ver que el polgono de frecuencias corres-
pondiente se parece mucho a la curva
2
con m 1 grados de libertad.
Se puede apreciar que aquella sumatoria, que se denomina
2
, da una medida de la discrepancia
que hay entre las frecuencias observadas y las frecuencias esperadas; por lo que valores grandes de
2

nos harn rechazar la hiptesis nula. Dependiendo del valor de , se puede determinar el valor de
2

que limita las regiones de aceptacin y rechazo, lo que permitir decidir finalmente si se acepta o re-
chaza la hiptesis nula.
Para que la prueba
2
sea confiable, es recomendable que ninguna frecuencia esperada resulte
menor que 5. Esto se consigue agrupando clases vecinas o aumentando el tamao de la muestra. Es re-
comendable tambin que m sea un valor comprendido entre 5 y 20.
El nmero de grados de libertad refleja el hecho de que, en una muestra de tamao n, tabulada
con m frecuencias, existe libertad para asignar valores a m 1 de ellas; una vez fijadas stas, la restan-
te queda determinada por la ecuacin:
La distribucin ji-cuadrada 141


=
=
m
i
i
n f
1

Cabe sealar que, por cada medida descriptiva muestral que se emplee para estimar algn par-
metro de la poblacin, ya sea o , se pierde un grado de libertad.
10.3.1 Distribucin multinomial.
A continuacin se muestra un caso de prueba de bondad de ajuste de una determinada distribu-
cin multinomial. Aunque es recomendable que el nmero de frecuencias sea mayor que 5 y menor
que 15, la prueba es confiable si todas las frecuencias tericas resultan mucho mayores de 5, como se
dijo antes.
Ejemplo:
Luego de una investigacin se determin que, aproximadamente el 50% de todos los vehculos
que llegan por la avenida Loreto hacia la avenida Snchez Cerro, hacia el norte, giran hacia la
izquierda; el 20% giran a la derecha y el 30% restante siguen hacia el frente. Para verificar esto,
un estudiante de Estadstica fue a dicha interseccin y observ que, de 80 autos, 47 giraron ha-
cia la izquierda, 15 hacia la derecha y 18 siguieron de frente. Son aceptables los porcentajes es-
tablecidos, considerando un nivel de significancia del 5%?
H
0
: la cantidad de vehculos que giran en las tres direcciones establecidas siguen una distribu-
cin multinomial con probabilidades 0,50; 0,20 y 0,30.
H
1
: no siguen dicha distribucin.
Segn las probabilidades establecidas, y considerando que cada frecuencia esperada es: f
i
= np
i
,
se puede construir la siguiente tabla:
Izquierda Derecha Frente
p 0,50 0,20 0,30
f 47 15 18
f ' 40 16 24
Entonces:
7875 , 2
24
) 24 18 (
16
) 16 15 (
40
) 40 47 (
2 2 2
2
=

=
Para: = 0,05; n = 2; el valor crtico de
2
es:
2
* = 5,991
0
0.1
0.2
0.3
0.4
0.5
0.6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Regin de rechazo Regin de aceptacin

2
*=5,991
= 0,05

142 La distribucin ji-cuadrada

El valor de
2
= 2,7875 se encuentra en la regin de aceptacin, es decir, se acepta H
0
.
Se concluye por lo tanto que la cantidad de vehculos que giran en las tres direcciones estableci-
das: izquierda, derecha, de frente, siguen una distribucin multinomial con probabilidades 0,50;
0,20 y 0,30. Esto equivale a afirmar que los vehculos que siguen tales direcciones estn en pro-
porcin: 0,50; 0,20 y 0,30; o que el 50%, 20% y 30% siguen dichas direcciones.
10.3.2 Distribucin de Poisson.
A continuacin se muestra una prueba de bondad de ajuste donde se investiga si una variable
aleatoria sigue una distribucin aproximadamente de Poisson. Para poder realizar esta prueba se debe
estimar el parmetro a partir de los datos de la muestra, "perdindose" de esta manera un grado de
libertad.
Ejemplo:
La siguiente tabla muestra la cantidad de fallas diarias que presenta un sistema automtico, du-
rante 120 das consecutivos.
Fallas diarias 0 1 2 3 4 5 >5
Frecuencia 31 46 19 14 8 2 0
Se puede afirmar que la cantidad de fallas diarias de este sistema sigue aproximadamente una
distribucin de Poisson? Emplee = 0,05.
H
0
: la cantidad de fallas diarias sigue una distribucin de Poisson.
H
1
: no siguen dicha distribucin.
En primer lugar se estima la media de la poblacin:
4 , 1
120
0 ) 5 ( 3 ) 4 ( 8 ) 3 ( 14 ) 2 ( 19 ) 1 ( 46 ) 0 ( 31
=
+ + + + + +
= x
Se puede determinar la varianza de la muestra a partir de la tabla de distribucin de frecuencias.
Este valor resulta:
2
= 1,59, que es aproximadamente el valor de la media, como era de espe-
rarse en una distribucin de Poisson.
Las frecuencias esperadas, para cada x, se calculan entonces de la siguiente manera:
f ' = nP(x)
f ' =
! x
e
n
x



En la siguiente tabla se presentan los valores de estas frecuencias esperadas o tericas, junto con
las frecuencias observadas.
Fallas diarias 0 1 2 3 4 5 >5
Frecuencia observada 31 46 19 14 8 2 0
Frecuencia esperada 29,59 41,42 29,00 13,54 4,74 1,32 0,39
En este caso, para calcular
2
conviene agrupar las tres ltimas frecuencias, consiguiendo as
que todas las frecuencias tericas sean mayores que 5.
02 , 6
45 , 6
) 45 , 6 10 (
54 , 13
) 54 , 13 14 (
29
) 29 19 (
42 , 41
) 42 , 41 46 (
59 , 29
) 59 , 29 31 (
2 2 2 2 2
2
=

=
Considerando que se ha tenido que estimar el parmetro de la distribucin de Poisson, el n-
mero de grados de libertad es: n
l
= (m 1) 1.
Entonces: n
l
= 5 1 1 = 3
La distribucin ji-cuadrada 143


El *
2
ser entonces (tabla del apndice): 7,815.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

2
*=7,815
Regin de rechazo Regin de aceptacin
= 0,05

Por lo tanto, el
2
= 6,02 encontrado nos hace aceptar la hiptesis nula; se concluye que la can-
tidad de fallas diarias s tiene una distribucin de Poisson.
10.3.3 Distribucin normal.
En la prueba de bondad de ajuste de una distribucin normal es necesario estimar dos parme-
tros, y ; por lo que se "pierden" dos grados de libertad. El siguiente ejemplo ilustra cmo se efec-
ta una prueba de este tipo.
Ejemplo:
En un anlisis de los dimetros de los pistones de bolas fabricados en un taller, se tom una
muestra de 140 pistones, cuya distribucin de frecuencias se muestra en la siguiente tabla.
Lmites (cm) Frecuencia
7,20 7,24 3
7,25 - 7,29 7
7,30 - 7,34 12
7,35 - 7,39 16
7,40 - 7,44 19
7,45 - 7,49 24
7,50 - 7,54 22
7,55 - 7,59 19
7,60 - 7,64 12
7,65 - 7,69 6
Determine si dichos dimetros se distribuyen normalmente.
H
0
: los dimetros de los pistones siguen una distribucin normal.
H
1
: no siguen dicha distribucin.
En el captulo 6 (pg. 94) se determin la curva normal que ms se aproxima a estos datos, cal-
culndose las frecuencias esperadas para cada clase. En la siguiente tabla se muestran las fre-
cuencias observadas y las frecuencias esperadas. Ntese que se ha aadido una frecuencia ms.
f 3 7 12 16 19 24 22 19 12 6 0
f ' 2,06 5,20 10,47 17,22 23,22 25,34 22,49 16,30 9,65 4,58 1,80
Es necesario agrupar las dos primeras clases y las dos ltimas, para conseguir que: f ' > 5. As
entonces:
144 La distribucin ji-cuadrada

f 10 12 16 19 24 22 19 12 6
f ' 7,26 10,47 17,22 23,22 25,34 22,49 16,30 9,65 6,38
Por lo tanto:

+

=
49 , 22
) 49 , 22 22 (
34 , 25
) 34 , 25 24 (
22 , 23
) 22 , 23 19 (
22 , 17
) 22 , 17 16 (
47 , 10
) 47 , 10 12 (
26 , 7
) 26 , 7 10 (
2 2 2 2 2 2
2

464 , 5
38 , 6
) 38 , 6 6 (
65 , 9
) 65 , 9 12 (
30 , 16
) 30 , 16 19 (
2 2 2
=

+
El nmero de grados de libertad es: n = 9 1 2 = 6.
Entonces, para = 0.05: *
2
= 12,59 > 5,464.
Por lo tanto se acepta la hiptesis nula; es decir, que los dimetros de los pistones s se distribu-
yen normalmente.
10.4 Pruebas de independencia: tablas de contingencia.
En este tipo de pruebas se investiga si existe alguna relacin entre dos variables cualitativas, ca-
da una de las cuales se clasifica en atributos.
Ejemplo
Se quiere investigar si existe alguna relacin entre el desempeo en el trabajo de los empleados
de una empresa y la formacin acadmica de dichos empleados. La primera variable se clasifica
en excelente, bueno y regular; y la segunda en primaria, secundaria y superior. Esta clasifica-
cin se puede expresar con mucha claridad en una tabla de contingencia, como se ve a conti-
nuacin.
Formacin
Desempeo
Primaria Secundaria Superior Total
Muy bueno 40%
Bueno 30%
Regular 30%
Total 10% 40% 50%
Los registros de esta empresa muestran que, en promedio, el 10%, 40% y 50% de todos los em-
pleados de esta fbrica tienen formacin primaria, secundaria y superior, respectivamente.
Adems, el 40%, 30% y 30% tienen rendimiento muy bueno, bueno y regular, respectivamente.
Para realizar la investigacin se toma una muestra de 150 empleados, cumpliendo con los por-
centajes antes mencionados, obtenindose el resultado que muestra la siguiente tabla.
Formacin
Desempeo
Primaria Secundaria Superior Total
Muy bueno 8 25 27 60
Bueno 3 19 23 45
Regular 4 16 25 45
Total 15 60 75 150
Para determinar si hay alguna relacin entre las dos variables se asume que ambas son indepen-
dientes, y, bajo esta hiptesis (hiptesis nula), se determinan las frecuencias esperadas. La hip-
tesis alternativa expresa que dichas variables no son independientes.
H
0
: la formacin acadmica y el desempeo laboral son independientes.
H
1
: no son independientes.
La distribucin ji-cuadrada 145


La probabilidad de que un empleado elegido al azar tenga formacin acadmica X y desempeo
Y, es:
P(X Y) = P(X) P(Y \ X)
Pero, como se est asumiendo que X e Y son independientes:
P(X Y) = P(X) P(Y)
Las frecuencias esperadas para cada uno de los casilleros de la tabla se determinan multiplican-
do el tamao de la muestra por cada una de las probabilidades:
f

'(X Y) = n P(X Y)
As, por ejemplo:
P (desempeo muy bueno y formacin primaria) = 0,40 0,10 = 0,04
f

'(desempeo muy bueno y formacin primaria) = 150 0,04 = 6
P (desempeo bueno y formacin primaria) = 0,30 0,10 = 0,03
f

'(desempeo bueno y formacin primaria) = 150 0,03 = 4,5
En la siguiente tabla se muestran todas las frecuencias esperadas.
Formacin
Desempeo
Primaria Secundaria Superior Total
Excelente 6 24 30 60
Bueno 4,5 18 22,5 45
Regular 4,5 18 22,5 45
Total 15 60 75 150
As como en las pruebas de bondad de ajuste, la suma:


i
i i
f
f f
'
) ' (
2

tambin tiene una distribucin
2
con n
l
grados de libertad.
Si la tabla de contingencia tiene p filas y q columnas, el nmero de grados de libertad es:
n
l
= (p 1)( q 1)
ya que ser necesario conocer, como mnimo, (p 1)( q 1) frecuencias para que el resto que-
den determinadas.
Entonces:
1306 , 2
5 , 22
) 5 , 22 25 (
...
18
) 18 19 (
5 , 4
) 5 , 4 3 (
30
) 30 27 (
24
) 24 25 (
6
) 6 8 (
2 2 2 2 2 2
2
=

+ +

=
El nmero de grados de libertad es, en este caso: n = (3 1)(3 1) = 4.
Como
2
mide la discrepancia entre las frecuencias observadas y las frecuencias esperadas, valo-
res muy grandes de
2
nos harn rechazar la hiptesis nula. El valor de *
2
, por encima del cual
se rechazar la hiptesis nula, considerando un nivel de significancia del 5%, ser igual a 9,488
(tabla del apndice).
El valor de
2
= 2,1306 < 9,488 ; por lo tanto se acepta H
0
, concluyndose que en esta empresa
s hay independencia entre la formacin acadmica y el desempeo en el trabajo.

146 La distribucin ji-cuadrada

Un caso especial de las pruebas de independencia es el que emplea tablas de contingencia de
22. En estos casos el nmero de grados de libertad es igual a 1, y se suele emplear e factor de correc-
cin de Yates, para corregir el error de aproximacin que se comete al ajustar la distribucin
2
a la
distribucin que sigue la suma (f
i

f '
i
)
2
/ f '
i
.
Si una tabla de 2 2 tiene las siguientes frecuencias observadas:
X
1
X
2
Total
Y
1
a b a + b
Y
2
c d c + d
Total a + c b + d n

entonces, el valor de
2
se puede calcular con la siguiente frmula alternativa:

) ( ) ( ) ( ) (
) 2 / (
2
2
d b d c c a b a
n bc ad n
+ + + +

=
En estas pruebas de independencia, cuanto mayor es el tamao de la muestra, ms confiables
son los resultados. Cuando el nmero de grados de libertad es mayor que 1, se considera que una
muestra es lo suficientemente grande si f '
i
> 5,. Si n
l
es igual a 1 (tablas de 22), entonces se requiere
que f '
i
> 10.
10.5 Pruebas de hiptesis respecto a la varianza.
Teorema:
Sea s
2
la varianza de una muestra de tamao n, extrada de una poblacin con distribucin nor-
mal con varianza
2
. Entonces:

2
2

s n
tiene una distribucin
2
con n 1 grados de libertad.
Recurdese que en la frmula de la varianza de una muestra, s
2
, se emplea n en el denominador;
pero cuando la muestra extrada es pequea conviene usar n 1 en vez de n. Sea s
n-1
2
la varianza as
definida. Entonces:

2
2
1
) 1 (

n
s n
tambin tiene una distribucin x
2
con n 1 grados de libertad.
Aunque no se demostrar este teorema, se puede comprobar de la siguiente manera: se toma una
muestra de tamao n y se calcula ns
1
2
/
2
, luego otra muestra de tamao n y se calcula ns
2
2
/
2
, y as su-
cesivamente hasta tener la suficiente cantidad de valores para construir un histograma. Se podr com-
probar que el polgono de frecuencias correspondiente se parece mucho a la curva
2
con m 1 grados
de libertad.
Ejemplo:
Supngase que los pesos de las bolsas de leche que se producen en una fbrica tienen una distri-
bucin aproximadamente normal con una varianza igual a 0,025 l. El jefe de produccin decide
hacer algunos ajustes en la mquina llenadora. Una vez efectuado esto, se sospecha que la va-
riabilidad de los pesos ha aumentado considerablemente, pues en una muestra de 60 bolsas se
encontr una varianza de 0,032 l. Indica este resultado que la variabilidad realmente ha aumen-
tado? Considere = 0.05
H
0
:
2
= 0,025
H
1
:
2
> 0,025
8 , 76
025 , 0
032 , 0 60
2
2
2
=

= =

s n

La distribucin ji-cuadrada 147


n = 60 1 = 59
Como n > 30, se emplea la distribucin normal como aproximacin a la distribucin
2
.
Valores muy grandes de
2
, por encima de
2
*, nos harn rechazar H
0
en favor de H
1
.
1 ) 59 ( 2 * 2 1 2 2 645 , 1 *
2 2
= = = n z
*
2
= 77,646 < 76,8 ; entonces se acepta H
0
.
Se concluye que la variabilidad no ha aumentado. La varianza obtenida en la muestra no es lo
suficientemente grande como para aceptar que la variabilidad ha aumentado.
10.6 La distribucin ji-cuadrada en Excel
Excel cuenta con algunas funciones que pueden ser tiles en las distintas pruebas de hiptesis
con la distribucin ji-cuadrada. A continuacin se explica lo que realiza cada una de esas funciones:
DISTR.CHI: calcula la probabilidad de exceder un valor determinado de ji-cuadrado. Al eje-
cutar esta funcin, Excel presenta un cuadro de dilogo donde se ingresan dos datos: el valor
de ji-cuadrado y el nmero de grados de libertad.
PRUEBA.CHI: calcula la probabilidad de exceder el valor de ji-cuadrado que mide la discre-
pancia entre m frecuencias observadas y sus correspondientes tericas en una prueba de bon-
dad de ajuste. Esta funcin presenta el inconveniente que considera m 1 grados de libertad,
independientemente del nmero de parmetros que se hayan estimado para calcular las fre-
cuencias tericas. Al ejecutar esta funcin, Excel presenta un cuadro de dilogo donde se in-
gresa cada rango de celdas donde estn las frecuencias observadas y las tericas.
PRUEBA.CHI.INV: calcula el valor de ji-cuadrado para una determinada probabilidad de ex-
cederlo. Excel presenta un cuadro de dilogo donde se ingresan dos datos: la probabilidad y el
nmero de grados de libertad.
148 La distribucin ji-cuadrada

Problemas propuestos.
1. Se est probando un programa informtico generador de nmeros aleatorios. Las instrucciones del
programa originan 100 dgitos entre 0 y 9 con las siguientes frecuencias:
Entero 0 1 2 3 4 5 6 7 8 9
Frecuencia 11 8 7 7 10 10 8 11 14 14
Existe evidencia suficiente para pensar que los dgitos no estn siendo generados en forma aleato-
ria? Sea = 0,10.
2. Suponga que la Secretara Acadmica de la UDEP afirma que, aproximadamente, el 40% de los
alumnos estudian Ingeniera, el 20% Administracin de Empresas, otro 20% Educacin, el 15%
Informacin y el 5% Derecho. Adems, el 70% del alumnado proviene del departamento de Piura,
el 20% de Lambayeque, el 5% de La Libertad, y el 5% restante de otros departamentos y pases.
a) Se toma una muestra aleatoria de 80 alumnos, y se encuentra que 35 estudian Ingeniera, 18
Administracin, 12 Educacin, 12 Informacin y 3 Derecho. Es consistente este resultado
con lo que afirma la Secretara Acadmica?
Respuesta: El resultado s es consistente.
b) Se desea investigar si el lugar de procedencia influye en la eleccin de la carrera, para lo cual
se toma una muestra de 200 alumnos. Cmo debe estar constituida la muestra?
3. Suponga que la calidad de un producto ha dado una desviacin estndar igual a 8,1. Una muestra
de 30 unidades de dicho producto da una desviacin estndar de 9,5 Existe una evidencia de que
la variabilidad ha aumentado? Sea = 0,10.
4. En los primeros niveles de la Facultad de Ciencias de una Universidad, cada semestre, aproxima-
damente el 38% de los alumnos de los cursos de matemticas son repitentes. Adems, el 32% de
los alumnos de estos cursos suelen salir aprobados. El Director de Estudios quiere investigar si la
fraccin de alumnos de matemticas que aprueban es siempre la misma, ya sea que fueran repiten-
tes o no. Para esto toma una muestra aleatoria de 50 alumnos, encontrando que 9 de los repitentes
estn aprobados.
a) Cmo debe estar compuesta la muestra de 50 alumnos?
Respuesta: Repiten 19, no repiten 31, aprueban 16, no aprueban 34.
b) Cul ser el resultado de la investigacin? Considere = 0.10.
Respuesta: La fraccin de aprobados es independiente de la condicin (repitentes o no)
5. Los alumnos que ingresaron a la Facultad de Ingeniera este semestre han sido clasificados en 4
grupos, segn su nivel socio-econmico, tal como se indica:
A B C D
12 20 31 33
a) Investigue si los alumnos que ingresan a la Facultad de Ingeniera pertenecen indistintamente
a los distintos niveles.
Respuesta: No pertenecen indistintamente a los distintos niveles.
b) Investigue si en la Facultad de Ingeniera la mayora pertenece a los niveles medios (B y C).
Respuesta: La mayora no pertenece a los niveles medios.
6. El director de un colegio quiere investigar si existe mayor tendencia, por parte de los alumnos de
Ingeniera, a escoger la carrera de Ingeniera Industrial. Para esto toma una muestra de 13 alumnos
que encontr conversando en el tercer piso del edificio de Ingeniera y realiza una prueba
2
. Dis-
cuta el mtodo empleado.
7. La desviacin estndar de los dimetros de ciertas piezas de precisin que se producen en una f-
brica es 0,0865. El jefe de control de calidad sospecha que la calidad ha bajado y que por lo tanto
tiene una desviacin estndar mayor. Para estar seguro de su afirmacin, extrae aleatoriamente una
muestra de 25 piezas y calcula la desviacin estndar. En que rango tendra que estar este valor
para que se confirmen sus sospechas? Sea = 0,10.
La distribucin ji-cuadrada 149


8. Un profesor de una Universidad ha diseado un test mediante el cual determinar la carrera que
debe seguir un alumno promocional de secundaria, segn sus aptitudes y preferencias. Segn las
estadsticas de los ltimos aos, el 39% de los alumnos que estn por salir del colegio desea estu-
diar Ingeniera, el 15% Medicina, el 7% Derecho, el 30% Administracin de Empresas, Economa
o Contabilidad, y el resto otras carreras o nada. Se toma el test a un grupo de 50 alumnos promo-
cionales en Piura, obteniendo el siguiente resultado.
Ing. Med. Derecho A.E.C. Otros
25 9 3 10 3
Qu conclusin dara usted? Sea = 0,10.
9. Los pagos mensuales de 204 estudiantes que trabajan parte de su tiempo se distribuyen as:
Pagos ($) N estudiantes
78 - 82 6
83 - 87 12
88 - 92 16
93 - 97 22
98 - 102 30
103 - 107 35
108 - 112 32
113 - 117 20
118 - 122 15
123 - 127 10
128 - 132 6
Investigue la hiptesis de que la frecuencia observada se aproxima a una distribucin normal.
Considere = 0.05
10. De los 210 alumnos que ingresaron a la Facultad de Ingeniera este ao, 77 desean seguir Ing. In-
dustrial, 60 desean Ing. Civil y 73 desean Ing. Mecnica Elctrica.
a) Es consistente este resultado con la hiptesis de que el 40% de los alumnos seguirn Ing. In-
dustrial, el 25% Ing. Civil y el 35% Ing. Mecnica elctrica?
Respuesta: S es consistente, hasta para = 0.10.
b) Y ser consistente con la hiptesis de que los alumnos se distribuirn uniformemente en los
tres programas?
Respuesta: S es consistente, hasta para = 0,10.
11. Las estaturas de 200 empleados se distribuyen as:
Estaturas
(en metros)
Frecuencia
observada
1,51 1,55 9
1,56 1,60 20
1,61 1,65 45
1,66 1,70 55
1,71 1,75 43
1,76 1,80 17
1,81 1,85 11
Investigue la hiptesis de que tales estaturas se distribuyen normalmente. Considere = 0,05.
12. Durante este ao, en una fbrica que elabora artculos metlicos se han registrado 50 accidentes
laborales, lo cual ha provocado retrasos en la produccin. El jefe de seguridad tiene inters en sa-
ber en qu das de la semana ocurren los accidentes. A partir de los siguientes datos, se puede
afirmar que los accidentes son igualmente probables en los cinco das de la semana?
Da de la semana Lunes Martes Mircoles Jueves Viernes
Nmero de accidentes 12 7 8 10 13

150 Estimacin puntual y de intervalo

Captulo 11. Estimacin puntual y de intervalo
11.1 Introduccin
Con mucha frecuencia se realizan experimentos o se toman datos con el propsito de estimar al-
gunos valores o parmetros que no son conocidos con mucha exactitud. Por ejemplo: en una fbrica de
aceite se emplea una mquina que llena automticamente las botellas con un volumen fijo. En la
prctica, resulta que ese volumen no es tan fijo, y el fabricante necesita estimar peridicamente cul
es el volumen de llenado promedio. Evidentemente no le conviene que las botellas estn demasiado
llenas, pues resultaran costosas; ni que les falte mucho aceite, pues puede ser demandado por los con-
sumidores. Adems, es importante para el fabricante determinar la variabilidad del llenado de botellas.
Para ello tendr que estimar la varianza, para luego poder realizar los ajustes necesarios, y reducir al
mximo dicha varianza. En cada caso, ya sea para estimar el volumen de llenado promedio o la va-
rianza del llenado, se pueden hacer dos tipos de estimaciones: puntual y de intervalo.
11.2 Estimacin puntual.
Se hace una estimacin puntual de un parmetro, cuando se elige un valor nico para dicho pa-
rmetro. Por ejemplo, se puede estimar el volumen de llenado promedio de las botellas en una fbrica
de aceite, tomando una muestra y calculando la media aritmtica. A este resultado se le denomina es-
timado puntual.
Supngase que una variable aleatoria X tiene una distribucin que est determinada, salvo por
un parmetro . Si se toma una muestra x
1
, x
2
, ..., x
n
, y se escoge una funcin ) ..., , , (

2 1 n
x x x para es-
timar el parmetro desconocido, a la variable aleatoria

se le denomina estimador puntual, y el va-


lor que toma es el estimado puntual de .
Pueden existir muchos estimadores para un parmetro . En el caso de la media poblacional ,
podran considerarse como estimadores: la media muestral, la mediana muestral, el valor ms frecuen-
te o moda.
La variable aleatoria

es un estimador no sesgado del parmetro si su valor esperado es


igual a . Si los valores estimados tienden a ser muy grandes o muy pequeos, entonces

es un esti-
mador sesgado. A la diferencia E(

) se le denomina sesgo.
La variable aleatoria

es un estimador eficiente del parmetro si la varianza de

no es ma-
yor que la varianza de cualquier otro estimador de .
La media muestral x es un estimador no sesgado de la media del universo:
x E = ) (
La proporcin p
1
es un estimador no sesgado de la proporcin p:
E(p
1
) = p
La varianza muestral s
n-1
es un estimador no sesgado de :
E(s
n-1
) =
Se puede demostrar que s es un estimador sesgado de , pues E(s) resulta diferente a .
Estimacin puntual y de intervalo 151


11.3 Estimacin por intervalos.
Un parmetro se puede estimar dando un intervalo dentro del cual resulte probable incluir a di-
cho parmetro. Esta probabilidad, que mide el grado de confianza de la estimacin, depende del tama-
o que se le d al intervalo. Los estimadores de intervalo siempre sern funciones de la muestra. Se
podra afirmar, por ejemplo, que el promedio de llenado de las botellas en una fbrica de aceite est
comprendido entre 749,2 y 751,7 ml., con una probabilidad de 0,90. Este es un intervalo de confianza
del 90%. Entonces hay una probabilidad de 0,10 de que el verdadero promedio de llenado no est en
dicho intervalo.
A continuacin se ver la metodologa que se debe seguir para determinar intervalos de confian-
za de parmetros poblacionales. Ser fcil para el lector verificar que estos intervalos coinciden con la
regin de aceptacin de las pruebas de hiptesis de dos colas.
11.3.1 Intervalo de confianza para la media poblacional.
Para determinar un intervalo de confianza del 100(1 ) % para una media poblacional, se ex-
trae primeramente una muestra, se calcula la media muestral y, si no se conoce la varianza del univer-
so, la varianza muestral.
Como se vio en el captulo 8 (pg.113), la media muestral se distribuye normalmente si la po-
blacin es normal o, si la poblacin no es normal y la muestra es lo suficientemente grande (n 50). Si
se conoce la varianza de la poblacin o se estima con una muestra suficientemente grande, entonces
los lmites de confianza del intervalo se determinan a partir de la siguiente expresin:

n
x
z
/
*

=
Los lmites de confianza se obtienen despejando para cada signo del primer miembro de esta
ecuacin. En la figura 11.1 se representa el intervalo de confianza del 100(1 ) %.
1 -
/ 2 / 2

Figura 11.1. Intervalo de confianza de la media poblacional cuando se conoce
Ejemplo:
Determine un intervalo de confianza del 90 % del peso de las bolsas de harina que se llenan en
una mquina automtica, si una muestra de 60 bolsas dio una media de 0,996 Kg. y una desvia-
cin estndar de 0,03 Kg.
Para /2 = 5% z = 1,645
Por lo tanto:

60 / 03 , 0
996 , 0
* 645 , 1

=
Despejando: = 0,996 0,0064
z* +z*
z
152 Estimacin puntual y de intervalo

Por lo tanto se puede afirmar que la media poblacional se encuentra en el siguiente intervalo,
con un 90% de confianza:
0,9896 < < 1,0024
Si una poblacin es normal y se desconoce la varianza de dicha poblacin, entonces los lmites
de confianza del intervalo se determinan a partir de la siguiente expresin:

1 /
*

=
n s
x
t
Los lmites de confianza se obtienen despejando para cada signo del primer miembro de esta
ecuacin.
Ejemplo:
Determine un intervalo de confianza del 95 % del peso de las bolsas de harina que se llenan en
una mquina automtica, si una muestra de 40 bolsas dio una media de 0,996 Kg. y una desvia-
cin estndar de 0,022 Kg.
Para /2 = 2,5%; n 1 = 39 grados de libertad t* = 2,0227
Por lo tanto:

39 / 022 , 0
996 , 0
0227 , 2

=
Despejando:
= 0,996 0,0071
Por lo tanto se puede afirmar que la media poblacional se encuentra en el siguiente intervalo,
con un 95% de confianza:
0,9889 < < 1,0031
11.3.2 Intervalo de confianza para la diferencia de medias.
Para determinar un intervalo de confianza del 100(1 ) % para la diferencia de las medias de
dos poblaciones, se sigue el mismo procedimiento del apartado anterior, empleando las distribuciones
normal y t de Student correspondientes, segn sea el caso.

y
y
x
x
y x
n

y x
z
2
2
) ( ) (
*
+

=
|
|
.
|

\
|
+
|
|
.
|

\
|
+
+

=
y x y x
y x x x
y x
n n n n
s n s n
y x
t
1 1
2
) ( ) (
*
2 2

En cada caso se llegar a determinar dos valores para la diferencia (
x

y
), que son precisa-
mente los lmites del intervalo de confianza.
11.3.3 Intervalo de confianza para la proporcin p.
Dada una variable aleatoria binomial X, la proporcin X/n, denominada p
1
, se distribuye nor-
malmente alrededor de p, con una desviacin estndar igual a n pq / , cuando np y nq > 5.
La variable normal estandarizada que corresponde a p
1
es la siguiente:

n
pq
p
n
p
z

=
2
1
*
1

Estimacin puntual y de intervalo 153


Se determinan los lmites del intervalo de confianza del 100(1 ) % para p, empleando la
ecuacin anterior, donde z toma los valores +z* y -z*. El signo que tome el factor de correccin de-
pender de lo siguiente: si los lmites estn incluidos en el intervalo (a p b), el factor de correccin
ser positivo para +z* y negativo para -z*, como se muestra en la figura 11.2a. Si los lmites no estn
incluidos en el intervalo (a < p < b), el signo ser negativo para +z* y positivo para z*, como se
muestra en la figura 11.2b.
1-
+z*
+ f.c.
- f.c.
- z*
z
1-
- z*
+ f.c. - f.c.
+z*
z

Figura 11.2a. Intervalo a p b Figura 11.2b. Intervalo a < p < b
Es importante considerar que la distribucin de una proporcin, que es binomial, ser aproxima-
damente normal slo cuando np y nq > 5. Si no se cumplen estas condiciones, debe emplearse la dis-
tribucin binomial para determinar los intervalos de confianza.
Ejemplo:
Una compaa de telfonos quiere averiguar qu porcentaje de sus clientes de Piura estara dis-
puesto a suscribirse a Internet por cable. Selecciona aleatoriamente a 300 clientes y encuentra
que 36 de stos s se suscribiran. Haga una estimacin de intervalo con un 95% de confianza de
la proporcin de clientes que se suscribiran a Internet por cable.
Para /2 = 2,5% z = 1,96
Adems: p
1
= 36/300 = 0,12
Se va a determinar un intervalo de confianza del tipo: a p b. Por lo tanto se plantean las si-
guientes ecuaciones:

300
) 1 (
) 300 ( 2
1
12 , 0
96 , 1
p p
p

+
= + ;
300
) 1 (
) 300 ( 2
1
12 , 0
96 , 1
p p
p


=
De la primera ecuacin resulta:
p
2
0,2529p + 0,014616 = 0 p = 0,08938
De la segunda ecuacin resulta:
p
2
0,246317p + 0,013826 = 0 p = 0,15979
Por lo tanto, el intervalo de confianza del 95% es:
0,08938 p 0,15979
154 Estimacin puntual y de intervalo

Si se quisiera determinar un intervalo de confianza del tipo: a < p < b, se plantearan las siguien-
tes ecuaciones:

300
) 1 (
) 300 ( 2
1
12 , 0
96 , 1
p p
p


= + ;
300
) 1 (
) 300 ( 2
1
12 , 0
96 , 1
p p
p

+
=
De la primera ecuacin resulta:
p
2
0,246317p + 0,013826 = 0 p = 0,08652
De la segunda ecuacin resulta:
p
2
0,2529p + 0,014616 = 0 p = 0,16352
Por lo tanto, el intervalo de confianza del 95% es:
0,08652 < p < 0,16352
11.3.4 Intervalo de confianza para la diferencia de proporciones.
Dada dos variables aleatorias binomiales X e Y, la proporcin X/n
x
, denominada p
1
, se distribuye
normalmente alrededor de p
x
, con una desviacin estndar igual a
x x x
n q p / , cuando n
x
p
x
y n
y
p
y
son
mayores que 5; y la proporcin Y/n
y
, denominada p
2
, se distribuye normalmente alrededor de p
y
, con
una desviacin estndar igual a
y y y
n q p / , cuando n
x
p
x
y n
y
p
y
son mayores que 5. Asimismo, la di-
ferencia X Y se distribuye normalmente alrededor de p
x
p
y
, con una desviacin estndar igual a
y
y y
x
x x
n
q p
n
q p
+ .
Para determinar un intervalo de confianza del 100(1 ) % para la diferencia de las proporcio-
nes de dos poblaciones, se sigue el mismo procedimiento de los apartados anteriores, empleando la
aproximacin normal :

y
y y
x
x x
y x
y x
y x
n
q p
n
q p
n n
n n
p p p p
z
+
+

=
.
2
) ( ) (
*
2 1

Para poder despejar p
x
p
y
de las dos ecuaciones que se planteen (una para cada signo), es nece-
sario hacer las siguientes estimaciones de punto en el denominador:

x
x
n
x
p = ;
y
y
n
y
p =
11.3.5 Intervalo de confianza para la varianza.
Recurdese que si se extrae una muestra de tamao n de un universo normal con varianza
2
,
ns
2
/
2
tiene una distribucin ji-cuadrada con n 1 grados de libertad.
Recurdese tambin que es equivalente emplear
2 2
1
/ ) 1 (

n
s n o ns
2
/
2
.
As, para determinar un intervalo de confianza del 100(1 ) % (figura 11.3) para la varianza de
una poblacin normal, se usan las siguientes ecuaciones:

2
1
2
2
2 /

ns
=
2
2
2
2
2 / 1


ns
=


Estimacin puntual y de intervalo 155


De esta forma se determina el intervalo:
1
2
<
2
<
2
2


/ 2


/

2

2
/2

2
1- /2

2
1-

Figura 11.3. Intervalo de confianza para la varianza
Ejemplo:
El dueo de una hamburguesera ha visto que conocer la variabilidad del nmero de hambur-
guesas que vende diariamente es muy importante para una buena administracin de su negocio.
Determine un intervalo de confianza del 90% de la varianza del nmero de hamburguesas que
vende diariamente, si a partir de los registros de las ventas del ltimo mes (30 das) se ha calcu-
lado una desviacin estndar de 7,25 unidades.
Para: /2 = 5% ; n 1 = 29 grados de libertad.

2
1
2
2
05 , 0
2
2 /
) 25 , 7 ( 30
5569 , 42

= = = 0533 , 37
2
1
=

2
2
2
2
95 , 0
2
2 / 1
) 25 , 7 ( 30
7084 , 17



= = =

0467 , 89
2
2
=
Por lo tanto, el intervalo de confianza del 90% de la varianza es:
37,0533 <
2
< 89,0467
El intervalo de confianza del 90% de la desviacin estndar es:
6,0871 < < 9,4365
11.4 Intervalo de confianza para la media en Excel
Excel cuenta con la funcin INTERVALO.CONFIANZA dentro de las funciones que se des-
pliegan al ejecutar el icono f
x
o al entrar al men Insetar/Funcin.
Al ejecutar esta funcin INTERVALO.CONFIANZA, Excel presenta el cuadro de dilogo de la
figura 11.4. Al ingresar los datos, el resultado que muestra Excel es el rango que hay entre la media y
los intervalos de confianza que se quieren determinar. Ntese que entre los datos que se ingresan al
cuadro de dilogo de la figura 11.4 est la desviacin estndar de la poblacin y no est la media de la
muestra.
A continuacin se resuelve el ejemplo de la seccin 11.3.1, cuyo texto se repite por comodidad.
156 Estimacin puntual y de intervalo

Ejemplo:
Determine un intervalo de confianza del 90 % del peso de las bolsas de harina que se llenan en
una mquina automtica, si una muestra de 60 bolsas dio una media de 0,996 Kg. y una desvia-
cin estndar de 0,03 Kg.

Figura 11.4. Cuadro de dilogo para determinar el intervalo de confianza de la media
El resultado que muestra Excel es : 0,00637049 0,0064
Por lo tanto el intervalo de confianza es: 0,996 0,0064; que es el mismo resultado que se obtu-
vo en la seccin 11.3.1.

Estimacin puntual y de intervalo 157


Problemas propuestos.
1. Se hizo una encuesta antes de las elecciones municipales en la ciudad de Piura a una muestra de
100 votantes. De stos, el 40% declar que votaran por Gerardo Guzmn para Alcalde. Calcule el
intervalo de confianza de 90% para la proporcin de la ciudad que votara por Guzmn.
Respuesta: 0,318 p 0,486
2. Haga una estimacin de intervalo del porcentaje de alumnos de la Facultad de Ingeniera que tie-
nen ndice acadmico acumulado mayor que 14, con una confiabilidad del 95%, utilizando una
muestra de 45 alumnos. En dicha muestra se encontr que 27 tienen ndice acadmico acumulado
mayor que 14.
3. Determine el intervalo de confianza del 95% de la cantidad promedio de dlares que tienen los
cambistas del Jirn Arequipa de Piura, si se ha tomado una muestra de 10 cambistas y los resulta-
dos son los siguientes, en dlares: 5 255; 1 452; 2 236; 400; 860; 1 290; 3 030; 1 620, 750; 3 600.
4. Una muestra de 60 barras de manjar blanco producidas por una empresa da los siguientes pesos
(en gramos):
499,6 498,3 500,3 501,7 501,6 502,3 497,2 499,7 501,4 498,6 499,1 497,8 497,6 498,7 499,0
497,2 499,3 499,5 500,2 499,5 499,6 499,5 501,7 499,9 499,8 499,3 502,6 501,1 503,1 499,1
502,2 497,9 500,7 501,2 502,5 499,9 499,3 500,9 499,5 501,0 498,1 498,9 498,0 499,5 500,0
500,0 499,6 502,9 497,7 499,0 496,6 501,9 498,3 499,2 501,0 500,6 501,1 500,8 498,2 498,5
Determine un intervalo de confianza del 98% de:
a) el peso promedio de las barras de manjar blanco que produce la empresa.
b) la desviacin estndar del peso de las barras de manjar blanco que produce la empresa.
5. Un fabricante de frmacos est preocupado por el tiempo promedio que tarda en hacer efecto una
pastilla para el dolor de cabeza tensional. Si en una muestra de 20 pacientes se obtuvieron los
siguientes tiempos (en minutos):
34,85 34,93 36,10 33,50 34,22 29,10 35,11 33,11 38,22 35,23
36,63 34,68 33,46 31,97 37,96 33,72 40,03 30,05 35,51 31,51
Determine un intervalo de confianza del 95% de:
a) el tiempo promedio que tarda dicha pastilla en hacer efecto.
b) la desviacin estndar del tiempo que tarda dicha pastilla en hacer efecto.
6. El jefe de un taller mecnico toma una muestra de 35 unidades producidas durante una semana, y
mide una desviacin estndar de 0,07 cm. del dimetro de dichas unidades. Determine un intervalo
de confianza del 90% de la varianza de los dimetros de las unidades producidas en el taller.
Respuesta: 13,3232 <
2
< 49,5174
7. El gerente de una empresa que se dedica a la venta de automviles ha tomado una muestra de 300
clientes de distintas empresas, encontrando que 112 compraron su auto hace 10 aos o ms. Calcu-
le el intervalo de confianza del 95% para la proporcin de personas que compraron su auto hace
10 aos o ms. Considere los dos tipos de intervalo.
8. En una muestra de alumnos universitarios de Lima se encontr que, de 300 mujeres y de 350
hombres entrevistados, 223 y 187 respectivamente, vean alguna telenovela. Determine el interva-
lo de confianza del 95% de la diferencia entre las proporciones de universitarios mujeres y hom-
bres que ven alguna telenovela.
9. En una muestra de 400 alumnos universitarios de Piura se encontr que 312 ven algn programa
poltico los domingos en la televisin. Determine el intervalo de confianza del 95% de la propor-
cin de alumnos universitarios de Piura que ven algn programa poltico los domingos.

158 Diseo de experimentos y anlisis de varianza

Captulo 12. Diseo de experimentos y anlisis de
varianza
12.1 Introduccin.
Para comparar las medias aritmticas de dos poblaciones, se toma una muestra de cada pobla-
cin y, mediante una prueba de hiptesis, se hace la comparacin de medias, usando la distribucin
normal o la distribucin t de Student.
En este captulo se ve una nueva herramienta estadstica, llamada anlisis de varianza, que per-
mite hacer una comparacin de dos o ms de dos medias poblacionales, a partir de muestras tomadas
de dichas poblaciones.
A continuacin se dan algunos ejemplos de comparaciones de medias poblaciones:
La accin limpiadora de tres posibles frmulas mejoradas de una marca de detergente.
Las eficiencias de tres mtodos de enseanza de programacin.
La prdida de peso de ciertas piezas mecnicas debido a la friccin, usando tres tipos de lubri-
cante.
Las alturas de cierto tipo de planta despus de tres meses de sembrarlas usando distintos tipos
de riego y fertilizante.
La resistencia a la compresin de varios tipos de concreto.
El nmero de errores que se cometen, durante una semana, en cuatro laboratorios.
La productividad que se obtiene empleando tres procesos distintos de produccin.
12.2 Diseo de experimentos.
12.2.1 Definiciones
Los datos recolectados para la comparacin de medias pueden proceder de encuestas o de expe-
rimentos diseados, segn sea el propsito.
Como se dijo en el captulo 1, se denomina experimento a la reproduccin controlada de un fe-
nmeno cualquiera que ocurre en la naturaleza. Queda en evidencia entonces que un experimento es
controlado.
Se denominan unidades experimentales a los elementos (personas u objetos) sobre los que se
va a experimentar para obtener las medidas que se desea comparar. Por ejemplo, para comparar la ac-
cin limpiadora de tres posibles frmulas mejoradas de una marca de detergente, se requiera aplicar
dichas frmulas a algunas prendas de vestir (unidades experimentales); luego se comparar la limpieza
de las prendas limpiadas con las distintas frmulas.
Las unidades experimentales se dividen en grupos experimentales y, si es conveniente, en un
grupo de control.
Los grupos experimentales y el grupo de control son sometidos a distintos tratamientos. Por
ejemplo, las prendas de vestir se pueden dividir en tres grupos experimentales, cada uno de los cuales
es sometido a una distinta frmula mejorada (tratamientos).
Diseo de experimentos y anlisis de varianza 159


El grupo de control, cuando existe, estar sometido al tratamiento habitual. Por ejemplo, un gru-
po de prendas de vestir se puede someter a la frmula limpiadora que se emplea actualmente, es decir,
al tratamiento habitual.
En conclusin, todas las unidades experimentales son sometidas a distintos tratamientos, para
luego medir y promediar los resultados de dichos tratamientos. En el ejemplo, existe una forma de
medir la limpieza de cada prenda de vestir, y, ser posible entonces, comparar las limpiezas promedio
de cada grupo de prendas de vestir.
Generalmente, sobre las unidades experimentales actan, adems de los tratamientos, factores
externos que influyen en los resultados del experimento. Esta accin de los factores externos suele lle-
var a conclusiones errneas, salvo que se sepan controlar.
Hay dos formas de controlar la accin de los factores externos:
Aleatorizacin: se asignan aleatoriamente las unidades experimentales a los grupos experi-
mentales y al grupo de control, para que cada grupo tenga la misma probabilidad de ser afec-
tado por los factores externos. Por ejemplo, si se tienen 30 prendas de vestir de distinto mate-
rial, se puede controlar la distinta accin limpiadora de las tres frmulas de detergente sobre
los distintos materiales, repartiendo aleatoriamente las prendas de vestir en los tres grupos.
Formacin de bloques: se forman boques de unidades experimentales en cada grupo, de tal
forma que tales bloques sean homogneos respecto a los factores externos que se desea elimi-
nar. Por ejemplo, si se tienen 30 prendas de vestir de cuatro tipos de material, se pueden for-
mar cuatro bloques (uno de cada tipo de material) en cada grupo. De esta manera, los tres gru-
pos se vern igualmente afectados por este factor externo que es el tipo de material.
12.2.2 Diseo completamente aleatorizado
Se dice que el diseo de un experimento es completamente aleatorizado cuando se asignan las
unidades experimentales a los distintos grupos en forma aleatoria.
12.2.3 Diseo aleatorizado por bloques
Se dice que el diseo de un experimento es aleatorizado por bloques cuando se forman boques
de unidades experimentales en cada grupo, de tal forma que tales bloques sean homogneos respecto a
los factores externos que se desea eliminar. En cada bloque puede haber una o ms unidades experi-
mentales.
12.2.4 Errores en los datos de los experimentos
En un experimento se pueden cometer dos tipos de error: aleatorios y no aleatorios.
Error aleatorio o experimental: es la diferencia entre la medida obtenida del resultado de un
experimento y la obtenida promediando los resultados de varios experimentos: x x e
i A
=
Error no aleatorio o sesgo: es la diferencia entre la medida obtenida promediando los resulta-
dos de varios experimentos y la medida verdadera: = x e
N

12.3 Anlisis de varianza: ANOVA
El anlisis de varianza, o ANOVA, compara dos o ms medias de distintas poblaciones. Para es-
to extrae una muestra de cada poblacin y analiza qu tan dispersas estn las medias de dichas mues-
tras, es decir, qu tanto difieren entre s.
Para que el anlisis de varianza tenga validez se requiere que las poblaciones muestreadas sean
normales y que las varianzas de dichas poblaciones sean iguales. Una estimacin de esta varianza co-
mn,
2
, que sera tambin la varianza de todas las muestras, estar conformada por dos varianzas: la
varianza entre las medias de las muestras y la varianza promedio dentro de las muestras.
Para entender la naturaleza del anlisis de varianza, supngase que se quiere averiguar si son
160 Diseo de experimentos y anlisis de varianza

iguales o no las medias de tres poblaciones:
1
,
2
y
3
. Para esto, se extrae una muestra de cada po-
blacin, cuyas medidas se expresan en la figura 12.1. Se asume que el investigador slo conoce las
medias muestrales.
x x x x x x x x x x x x x x x x x x

1

2

3


Figura 12.1. Muestreos con medias muy diferentes
A simple vista se podra afirmar (figura 12.1) que
1
,
2
y
3
son diferentes, pues las tres me-
dias muestrales son muy diferentes (recuerde el lector que no se conocen las medias poblacionales).
Analticamente, se podra llegar a la misma conclusin calculando la varianza que hay entre las medias
de las muestras. Si esta varianza es grande, indicar que las medias muestrales difieren mucho; pero,
cmo determinar a partir de qu valor se puede afirmar que la varianza es grande? Una forma muy
prctica de hacerlo es comparndola con la varianza promedio de los datos de las muestras. As, si la
varianza que hay entre las medias de las muestras es significativamente mayor que la varianza que hay
dentro de las muestras, se puede afirmar que las medias poblacionales difieren significativamente.
Supngase ahora que se quiere averiguar si las medias de las tres poblaciones representadas en
la figura 12.2 son iguales o no. Nuevamente el lector debe asumir que no conoce las medias poblacio-
nales; aunque en la figura se aprecien estos valores.
x x x x x x x x x x x x x x x x x x

1

2

3


Figura 12.2. Muestreos con medias diferentes
Se aprecia en la figura 12.2 que las medias muestrales son diferentes; pero esta vez difieren me-
nos. La varianza entre las medias muestrales es, en este caso, ligeramente mayor que la varianza pro-
medio dentro de las muestras. Nuevamente se podr afirmar que las medias poblacionales difieren sig-
nificativamente.
Supngase, finalmente, que se desea averiguar si las medias de las tres poblaciones representa-
das en la figura 12.3 son iguales o no. Nuevamente el lector debe asumir que no conoce las medias
poblacionales, aunque en la figura se aprecie que estos valores son iguales.
x x x x x x
x x
x
x x x
x x
x
x x x

1
=
2
=
3
1
x
2
x


Figura 12.3. Muestreos con medias diferentes
1
x
2
x
3
x

1
x
2
x
3
x
1
x

2
x
3
x
Diseo de experimentos y anlisis de varianza 161


En esta ltima situacin, la varianza entre las medias muestrales es menor que la varianza pro-
medio dentro de las muestras, lo cual indica que las medias muestrales no difieren significativamente.
Se concluye entonces que las medias poblacionales son iguales.
Ahora se entiende cmo un anlisis de las varianzas permite probar si las medias de varias po-
blaciones son iguales o no. En caso que no sean iguales, se podra probar que una de las medias pobla-
cionales es la mayor (o la menor) mediante una prueba de hiptesis entre las dos con mayor (o menor)
media muestral.
12.3.1 Anlisis de varianza de un factor
Se denomina anlisis de varianza de un factor o unidireccional, al anlisis que se hace cuando
los factores externos se controlan mediante un diseo completamente aleatorio del experimento. En-
tonces, se considera que el nico factor que acta sobre las unidades experimentales son los tratamien-
tos. En el ejemplo anterior de las distintas frmulas nuevas de detergente que se aplican a distintos
grupos de prendas de vestir, los tratamientos sern precisamente las distintas frmulas del detergente.
Si se quiere comparar las medias de k poblaciones, se plantean las siguientes hiptesis:
H
0
:
1
=
2
= =
k

H
1
: Al menos una media es diferente
Como se dijo antes, la varianza total est conformada por dos varianzas: la varianza entre las
medias de las muestras y la varianza promedio dentro de las muestras. La varianza de las medias
muestrales se conoce como varianza explicada y, segn el teorema del lmite central, ser:

n
E
x
2
2

=
donde:
E
2
es la varianza explicada de las poblaciones, ya que se asume que stas tienen la mis-
ma varianza, y n es el nmero de datos de cada muestra.
La varianza de las medias muestrales puede ser estimada por la varianza de las medias de las k
muestras:

1
) (
1
2
2

=
k
x x
s
k
i
i
x

Por lo tanto, despejando de la ecuacin anterior, la varianza explicada s
E
2
resulta:

1
) (
1
2
2


=
k
x x n
s
k
i
i
E

En esta expresin, al numerador se le conoce como suma de los cuadrados de los tratamien-
tos (SST), y el denominador representa el nmero de grados de libertad. A este cociente tambin se
le llama promedio de los cuadrados de los tratamientos (PPT).
La varianza promedio dentro de las muestras se conoce como varianza no explicada o error,
pues se atribuye al azar. Esta varianza constituye otra estimacin de la varianza de la poblacin.
Para estimar la varianza no explicada se calcula, en primer lugar, la varianza de cada muestra:

1
) (
1
2
2

=
n
x x
s
n
j
i ij
i

donde: x
ij
es el j-simo dato de la muestra i;
i
x es la media de la muestra i, y n es el nmero de
datos de la muestra.
162 Diseo de experimentos y anlisis de varianza

El promedio de las varianzas de las i muestras ser la varianza no explicada:

k n
x x
s
n
j
i ij
k
i
N
) 1 (
) (
1
2
1
2

=

= =

En esta ltima expresin, al numerador se le conoce como suma de los cuadrados del error
(SSE), y el denominador representa el nmero de grados de libertad. A este cociente tambin se le
llama promedio de los cuadrados del error (PPE).
Para determinar si la varianza explicada o varianza de los tratamientos es mayor que la varianza
no explicada o varianza del error, se hace la Prueba F de comparacin de varianzas. Recurdese que
si ocurre esto (
2 2
N E
> ), se podr afirmar que la varianza de los tratamientos es muy grande, y por lo
tanto se podr afirmar que las medias de los tratamientos difieren significativamente.
Se plantean entonces las siguientes hiptesis:
H
0
:
2 2
N E
=
H
1
:
2 2
N E
>
Como se vio en la seccin 9.7, se aceptar la hiptesis nula si: *
2
2
F
s
s
F
N
E
< =
Si se acepta esta hiptesis nula, (H
0
:
2 2
N E
= ) se estara aceptando que las medias de los trata-
mientos no difieren significativamente, es decir, que dichas medias son iguales (H
0
:
1
=
2
= =
k
).
Tabla ANOVA
Los valores que se calculan para el anlisis de varianza suelen expresarse en una tabla, como se
muestra en la tabla 12.1.
Tabla 12.1. Tabla ANOVA de un factor
Variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de
los cuadrados
F F*

Entre muestras SST k 1 PPT = SST / (k 1) PPT / PPE F*
Dentro de las muestras SSE (n 1) k PPE = SSE / (n 1) k
Total
SSTOT nk 1
Ejemplo 1:
Se quiere evaluar tres mtodos de capacitacin del personal de una fbrica. El jefe de capacita-
cin selecciona 15 nuevos obreros y los distribuye aleatoriamente en los tres mtodos. Una vez
terminada la capacitacin, los obreros comienzan a trabajar y se anota la produccin semanal de
cada uno de ellos. Hay diferencia en la eficacia de los tres mtodos de capacitacin?
Produccin diaria
Mtodo 1 16 17 19 13 21
Mtodo 2 20 25 17 18 21
Mtodo 3 19 24 16 19 17
En primer lugar, se plantean las siguientes hiptesis:
H
0
:
1
=
2
=
3

H
1
: Al menos una media es diferente
A continuacin se calculan las medias muestrales y la media de las medias muestrales:
Produccin diaria x
x
Mtodo 1 16 17 19 13 21 17,2
Mtodo 2 20 25 17 18 21 20,2
Mtodo 3 19 24 16 19 17 19
18,8
Diseo de experimentos y anlisis de varianza 163


La varianza explicada s
E
2
resulta:

| |
4 , 11
2
8 , 22
1 3
) 8 , 18 19 ( ) 8 , 18 2 , 20 ( ) 8 , 18 2 , 17 ( 5
1 3
) 8 , 18 ( 5
2 2 2
1
2
2
= =

+ +
=


=
k
i
i
E
x
s

La varianza no explicada s
N
2
resulta:

3 ) 1 5 (
) 2 , 17 21 ( ) 2 , 17 13 ( ) 2 , 17 19 ( ) 2 , 17 17 ( ) 2 , 17 16 (
3 ) 1 5 (
) (
2 2 2 2 2
1 1
2
2

+ + + + +
=

= =
k
i
n
j
i ij
N
x x
s

3 ) 1 5 (
) 2 , 20 21 ( ) 2 , 20 18 ( ) 2 , 20 17 ( ) 2 , 20 25 ( ) 2 , 20 20 (
2 2 2 2 2

+ + + + + +

4667 , 9
3 ) 1 5 (
) 19 17 ( ) 19 19 ( ) 19 16 ( ) 19 24 ( ) 19 19 (
2 2 2 2 2
=

+ + + + +

Por lo tanto:
2042 , 1
4667 , 9
4 , 11
= = F
Para n
lE
= 2; n
lN
= 12 (grados de libertad), = 0,05: F* = 3,8853 (ver apndice).
La tabla ANOVA es entonces la siguiente:
Variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de
los cuadrados
F F*

Entre muestras 22,8 2 11,4 1,2042 3,8853
Dentro de las muestras 113,6 12 9,467
Total 136,4
Resulta entonces: F < F*; por lo tanto se acepta la hiptesis nula de comparacin de varianzas
(H
0
:
2 2
N E
= ) y se acepta tambin la hiptesis nula de medias (H
0
:
1
=
2
=
3
).
Se puede afirmar entonces que los tres mtodos de capacitacin son igualmente eficientes.
12.3.2 Anlisis de varianza de dos factores, sin interaccin entre los factores.
Se denomina anlisis de varianza de dos factores o bidireccional, al anlisis que se hace cuando
los factores externos se controlan mediante un diseo aleatorizado por bloques. Se consideran dos fac-
tores que actan sobre las unidades experimentales: los tratamientos y el factor externo que se desea
eliminar mediante la formacin de bloques.
Cabe la posibilidad de que estos dos factores interacten uno sobre el otro. Por ejemplo, una
frmula del detergente que se va a experimentar puede actuar mejor o peor sobre determinados mate-
riales de ropa. En este apartado no se va a considerar esta posibilidad de interaccin entre los factores.
Ya que se estn considerando dos factores que actan sobre las unidades experimentales, se
puede aprovechar esto para hacer simultneamente dos investigaciones: comparar las medias de los k
tratamientos y comparar las medias de los n bloques. Se pueden plantear entonces las siguientes hip-
tesis:
Para los tratamientos: H
0
:
1
=
2
= =
k

H
1
: Al menos una media es diferente
Para los bloques: H
0
:
1
=
2
= =
n

H
1
: Al menos una media es diferente
164 Diseo de experimentos y anlisis de varianza

En este caso se considera la varianza explicada de los tratamientos y la varianza explicada de los
bloques. La varianza explicada de los tratamientos s
ET
2
se calcula nuevamente con la expresin:

1
) (
1
2
2


=
k
x x n
s
k
i
i
ET

Al numerador se le conoce como suma de los cuadrados de los tratamientos (SST), y el de-
nominador representa el nmero de grados de libertad. A este cociente tambin se le llama prome-
dio de los cuadrados de los tratamientos (PPT).
La varianza explicada de los bloques s
EB
2
se calcula con una expresin similar. El nmero de
bloques es n, y el nmero de datos en cada bloque es k. La varianza explicada de los bloques ser en-
tonces:

1
) (
1
2
2


=
n
x x k
s
n
j
j
EB

Al numerador se le conoce como suma de los cuadrados de los bloques (SSB), y el denomina-
dor representa el nmero de grados de libertad. A este cociente tambin se le llama promedio de los
cuadrados de los bloques (PPB).
La varianza no explicada o error es (no se demostrar):

) 1 ( ) 1 (
) (
1
2
1
2

+
=

= =
k n
x x x x
s
n
j
j i ij
k
i
N

En esta ltima expresin, al numerador se le conoce como suma de los cuadrados del error
(SSE), y el denominador representa el nmero de grados de libertad. A este cociente tambin se le
llama promedio de los cuadrados del error (PPE).
Para determinar si la varianza explicada o varianza de los tratamientos es mayor que la varianza
no explicada o varianza del error, se hace la Prueba F de comparacin de varianzas. Igualmente se
podr determinar si la varianza de los bloques es mayor que la varianza no explicada o varianza del
error mediante otra Prueba F.
Se plantean entonces, independientemente, las hiptesis:
Para los tratamientos: H
0
:
2 2
N ET
=
H
1
:
2 2
N ET
>
Para los bloques: H
0
:
2 2
N EB
=
H
1
:
2 2
N EB
>
Se aceptar cada hiptesis nula si:
*
2
2
T
N
ET
T
F
s
s
F < =
*
2
2
B
N
EB
B
F
s
s
F < =
Si se acepta la primera hiptesis nula (H
0
:
2 2
N ET
= ), se estara aceptando que las medias de los
tratamientos no difieren significativamente, es decir, que las medias de los tratamientos son iguales
(H
0
:
1
=
2
= =
k
).
Diseo de experimentos y anlisis de varianza 165


Igualmente, si se acepta la hiptesis nula (H
0
:
2 2
N EB
= ), se estara aceptando que las medias de
los bloques no difieren significativamente, es decir, que las medias de los bloques son iguales (H
0
:
1

=
2
= =
n
).
Tabla ANOVA
Los valores que se calculan para este anlisis de varianza suelen expresarse en una tabla, como
se muestra en la tabla 12.2.
Tabla 12.2. Tabla ANOVA de dos factores sin interaccin
Variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de
los cuadrados
F F*

Entre tratamientos SST k 1 PPT = SST / (k 1) PPT / PPE F
T
*
Entre bloques SSB n 1 PPB = SSB / (n 1) PPB / PPE F
B
*
Error SSE (n 1) (k 1) PPE = SSE / [(n 1) (k 1)]
Total
SSTOT nk 1
Ejemplo 2:
El gerente de produccin de una fbrica quiere evaluar tres mquinas. Para esto, asigna cinco
empleados a cada mquina, distribuyndolos de acuerdo a su nivel acadmico, de manera tal
que cada mquina sea operada por empleados de los cinco niveles en los que se les ha clasifica-
do previamente. De esta forma ninguna mquina se ver favorecida al asignarle ms operarios
de mayor nivel acadmico. En la tabla adjunta se muestra la produccin diaria.
Mq. 1 Mq. 2 Mq. 3
Nivel 1 16 17 20
Nivel 2 15 20 17
Nivel 3 20 19 17
Nivel 4 19 22 23
Nivel 5 22 24 25
Se puede afirmar que las tres mquinas tienen la misma productividad?
En primer lugar, se plantean las siguientes hiptesis:
Para los tratamientos: H
0
:
1
=
2
=
3

(mquinas) H
1
: Al menos una media es diferente
Para los bloques: H
0
:
1
=
2
=
3
=
4
=
5

(niveles acadmicos) H
1
: Al menos una media es diferente
A continuacin se calculan las medias de los tratamientos, de los bloques y la media total:

Mq. 1 Mq. 2 Mq. 3
j
x
Nivel 1 16 17 20 17,667
Nivel 2 15 20 17 17,333
Nivel 3 20 19 17 18,667
Nivel 4 19 22 23 21,333
Nivel 5 22 24 25 23,667
i
x 18,4 20,4 20,4 19,733
La varianza explicada de los tratamientos s
ET
2
resulta:
667 , 6
2
333 , 13
1 3
) 733 , 19 ( 5
3
1
2
2
= =


= i
i
ET
x
s
166 Diseo de experimentos y anlisis de varianza

La varianza explicada de los bloques s
EB
2
resulta:
9 , 21
4
6 , 87
1 5
) 733 , 19 ( 3
5
1
2
2
= =


= j
j
EB
x
s
La varianza no explicada s
N
2
resulta:
25 , 3
8
26
) 1 3 ( ) 1 5 (
) 733 , 19 (
5
1
2
3
1
2
= =

+
=

= = j
j i ij
i
N
x x x
s
En la siguiente tabla se expresan estas varianzas. El lector puede verificar fcilmente los valores
de F y sus correspondientes valores crticos. Considere = 0,05.
Variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de
los cuadrados
F F*

Entre tratamientos 87,6 4 21,9 6,7385 3,8379
Entre bloques 13,3333 2 6,6667 2,0513 4,4590
Error 26 8 3,25
Total 126,9333 14
Resulta entonces: F
T
> F
T
*; por lo tanto se rechaza la hiptesis nula de comparacin de varian-
zas (H
0
:
2 2
N ET
= ) y se rechaza tambin la hiptesis nula de medias (H
0
:
1
=
2
=
3
).
Se puede afirmar entonces que las tres mquinas no tienen la misma productividad.
Adems: F
B
< F
B
*; por lo tanto se acepta la hiptesis nula de comparacin de varianzas (H
0
:
2 2
N EB
= ) y se acepta tambin la hiptesis nula de medias (H
0
:
1
=
2
=
3
=
4
=
5
).
Se puede afirmar entonces que la productividad es la misma en los distintos niveles acadmicos
de los empleados.
12.3.3 Anlisis de varianza de dos factores, con interaccin entre los factores.
Nuevamente se consideran dos factores que actan sobre las unidades experimentales: los trata-
mientos y el factor externo que se desea eliminar mediante la formacin de bloques; pero esta vez se
considera la posibilidad de que haya interaccin entre los factores.
Se podra dar el caso, por ejemplo, de que un grupo de empleados de cierto nivel acadmico
sean ms productivos que un grupo de otro nivel, si operan cierta mquina; pero con las otras mqui-
nas podran tener menor productividad. Esto indicara que hay interaccin entre el nivel acadmico y
el tipo de mquina.
Para probar si hay interaccin entre los dos factores es necesario disear el experimento por blo-
ques con al menos dos datos para cada combinacin tratamiento bloque.
De esta manera se pueden investigar las hiptesis:
Para los tratamientos: H
0
:
1
=
2
= =
k

H
1
: Al menos una media es diferente
Para los bloques: H
0
:
1
=
2
= =
n

H
1
: Al menos una media es diferente
Para la interaccin: H
0
: Los factores no interactan respecto a la variable investigada.
H
1
: Los factores s interactan respecto a la variable investigada.
En este caso se consideran tres varianzas explicadas: de los tratamientos, de los bloques y de la
interaccin.
Diseo de experimentos y anlisis de varianza 167


Si r es el nmero de datos en cada combinacin tratamiento bloque, y n el nmero de bloques
en cada muestra, el nmero total de datos que hay en cada muestra es nr; por lo tanto la varianza ex-
plicada de los tratamientos s
ET
2
se calcula con la expresin:

1
) (
1
2
2


=
k
x x r n
s
k
i
i
ET

Al numerador se le conoce como suma de los cuadrados de los tratamientos (SST), y el de-
nominador representa el nmero de grados de libertad. A este cociente tambin se le llama prome-
dio de los cuadrados de los tratamientos (PPT).
La varianza explicada de los bloques se calcula con una expresin similar. El nmero de blo-
ques es n, y el nmero de datos en cada bloque es kr. La varianza explicada de los bloques ser enton-
ces:

1
) (
1
2
2


=
n
x x r k
s
n
j
j
EB

Al numerador se le conoce como suma de los cuadrados de los bloques (SSB), y el denomina-
dor representa el nmero de grados de libertad. A este cociente tambin se le llama promedio de los
cuadrados de los bloques (PPB).
Se considera que hay interaccin entre los dos factores que actan sobre las unidades experi-
mentales si la diferencia entre la media de los r datos de una combinacin tratamiento bloque y la
media total ( x x
ij
) difiere de la suma de dos diferencias: una entre la media del tratamiento corres-
pondiente y la media total ) ( x x
i
, y otra entre la media del bloque correspondiente y la media total
) ( x x
j
. As, para todas las combinaciones tratamiento bloque, estas diferencias miden la interac-
cin entre los factores. La interaccin, para cada combinacin tratamiento bloque se mide entonces
con la expresin:
I = ( x x
ij
) [ ) ( ) ( x x x x
j i
+ ]
Simplificando, cada interaccin resulta:
I = x x x x
j i ij
+
La interaccin total se mide con la varianza explicada de la interaccin, que se calcula enton-
ces con la siguiente expresin:

) 1 ( ) 1 (
) (
1 1
2
2

+
=

= =
k n
x x x x r
s
k
i
n
j
j i ij
EI

Al numerador se le conoce como suma de los cuadrados de la interaccin (SSI), y el denomi-
nador representa el nmero de grados de libertad. A este cociente tambin se le llama promedio de
los cuadrados de la interaccin (PPI).
La varianza no explicada o error es:

) 1 (
) (
1 1 1
2
2

= = =
r nk
x x
s
k
i
n
j
r
h
ij ijh
N

En esta ltima expresin, al numerador se le conoce como suma de los cuadrados del error
168 Diseo de experimentos y anlisis de varianza

(SSE), y el denominador representa el nmero de grados de libertad. A este cociente tambin se le
llama promedio de los cuadrados del error (PPE).
Para determinar si cada una de las tres varianzas explicadas es mayor que la varianza no expli-
cada o varianza del error, se hacen tres Pruebas F de comparacin de varianzas:
Para los tratamientos: H
0
:
2 2
N ET
=
H
1
:
2 2
N ET
>
Para los bloques: H
0
:
2 2
N EB
=
H
1
:
2 2
N EB
>
Para la interaccin: H
0
:
2 2
N EI
=
H
1
:
2 2
N EI
>
Se aceptar cada hiptesis nula si:
*
2
2
T
N
ET
T
F
s
s
F < =
*
2
2
B
N
EB
B
F
s
s
F < =
*
2
2
I
N
EI
I
F
s
s
F < =
Si se acepta la hiptesis nula (H
0
:
2 2
N ET
= ), se estara aceptando que las medias de los trata-
mientos no difieren significativamente, es decir, que las medias de los tratamientos son iguales (H
0
:
1

=
2
= =
k
).
Si se acepta la hiptesis nula (H
0
:
2 2
N EB
= ), se estara aceptando que las medias de los bloques
no difieren significativamente, es decir, que las medias de los bloques son iguales (H
0
:
1
=
2
= =

n
).
Si se acepta la hiptesis nula (H
0
:
2 2
N EI
= ), se estara aceptando que las interacciones medidas
en cada combinacin tratamiento bloque son muy pequeas, es decir, que no hay interaccin.
Tabla ANOVA
Los valores que se calculan para este anlisis de varianza se expresan en la tabla 12.3.
Tabla 12.3. Tabla ANOVA de dos factores con interaccin
Variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de
los cuadrados
F F*

Entre tratamientos SST k 1 PPT = SST / (k 1) PPT / PPE F
T
*
Entre bloques SSB n 1 PPB = SSB / (n 1) PPB / PPE F
B
*
Interaccin SSI (n 1) (k 1) PPI = SSI / [(n 1) (k 1)] PPI / PPE F
I
*
Error SSE nk (r 1) PPE = SSE / [nk (r 1)]
Total
SSTOT nk 1
Ejemplo 3:
El gerente de produccin de una fbrica quiere evaluar tres mquinas. Para esto asigna cinco
empleados a cada mquina, distribuyndolos de acuerdo a su nivel acadmico, de manera tal
que cada mquina sea operada por empleados de los cinco niveles en que se les ha clasificado
Diseo de experimentos y anlisis de varianza 169


previamente. De esta forma ninguna mquina se ver favorecida al asignarle ms operarios de
mayor nivel acadmico. Como es probable que haya interaccin entre el tipo de mquina y el
nivel acadmico de los empleados, respecto a la productividad de stos, se consideraron dos
empleados para cada combinacin tipo de mquina nivel acadmico. En la tabla adjunta se
muestra la produccin diaria.
M1 M2 M3
14 20 15
1
16 16 17
11 21 18
2
13 22 21
18 17 15
3
20 16 15
17 22 21
4
21 21 23
20 25 24
5
26 28 25
Se puede afirmar que las tres mquinas tienen la misma productividad?
Se plantean las siguientes hiptesis:
Para los tratamientos: H
0
:
1
=
2
=
3

(mquinas) H
1
: Al menos una media es diferente
Para los bloques: H
0
:
1
=
2
=
3
=
4
=
5

(niveles acadmicos) H
1
: Al menos una media es diferente
Para la interaccin: H
0
: No hay interaccin entre el tipo de mquina y el nivel acadmico
de los empleados, respecto a la productividad de stos.
H
1
: S hay interaccin entre dichos factores.
A continuacin se calculan las medias para cada tratamiento, para cada bloque, la media total y
la media de cada combinacin nivel acadmico tipo de mquina (entre parntesis):

M1 M2 M3
j
x
14 20 15
(15) (18) (16) 16,333 1
16 16 17
11 21 18
(12) (21,50) (19,50) 17,667 2
13 22 21
18 17 15
(19) (16,50) (15) 16,833 3
20 16 15
17 22 21
(19) (21,50) (22) 20,833 4
21 21 23
20 25 24
(23) (26,50) (24,50) 24,667 5
26 28 25
i
x 17,60 20,80 19,40 19,267
170 Diseo de experimentos y anlisis de varianza

Aplicando las frmulas recientemente descritas para calcular las tres varianzas explicadas y la
varianza no explicada o error, se completa la tabla ANOVA que se muestra a continuacin:
Variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de
los cuadrados
F F*

Entre tratamientos 51,4667 2 25,7333 7,0182 3,6823
Entre bloques 292,2 4 73,05 19,9227 3,0556
Interaccin 97,2 8 12,15 3,3136 2,6408
Error 55 15 3,6667
Total 495,8667 29
Resulta entonces: F
T
> F
T
*; por lo tanto se rechaza la hiptesis nula de comparacin de varian-
zas (H
0
:
2 2
N ET
= ) y se rechaza tambin la hiptesis nula de medias (H
0
:
1
=
2
=
3
).
Se puede afirmar entonces que las tres mquinas no tienen la misma productividad.
Adems: F
B
> F
B
*; por lo tanto se rechaza la hiptesis nula de comparacin de varianzas (H
0
:
2 2
N EB
= ) y se rechaza tambin la hiptesis nula de medias (H
0
:
1
=
2
=
3
=
4
=
5
).
Se puede afirmar entonces que la productividad no es la misma en los distintos niveles acadmi-
cos de los empleados.
Finalmente, F
I
> F
I
*; por lo tanto se rechaza la hiptesis de que no hay interaccin. Se puede
afirmar entonces que el tipo de mquina y el nivel acadmico s interactan, lo cual afecta la
productividad de los empleados.
12.4 Anlisis de varianza en Excel
12.4.1 Anlisis de varianza de un factor
En este apartado se va a resolver el ejemplo 1, resuelto en el apartado 12.3.1.Por comodidad, se
repite el texto y el planteamiento de este problema.
Ejemplo 1:
Se quiere evaluar tres mtodos de capacitacin del personal de una fbrica. El jefe de capacita-
cin selecciona 15 nuevos obreros y los distribuye aleatoriamente en los tres mtodos. Una vez
terminada la capacitacin, los obreros comienzan a trabajar y se les anota la produccin semanal
de cada uno de ellos. Hay diferencia de eficacia entre los tres mtodos de capacitacin?
Produccin diaria
Mtodo 1 16 17 19 13 21
Mtodo 2 20 25 17 18 21
Mtodo 3 19 24 16 19 17
La hiptesis que se plantearon son:
H
0
:
1
=
2
=
3

H
1
: Al menos una media es diferente
Ingresando al men Herramientas/Anlisis de datos/Anlisis de varianza de un factor, Excel
muestra el cuadro de dilogo de la figura 12.4. En este cuadro ya se han ingresado los datos del
problema, que en la hoja de clculo figuran entre las celdas A1 y E3.
Aceptando los datos ingresados en el cuadro de dilogo, Excel presenta dos tablas: la primera es
un resumen de los datos del problema, incluyendo medias y varianzas; y la segunda es la tabla
ANOVA del problema, como se muestra a continuacin:

Diseo de experimentos y anlisis de varianza 171



Figura 12.4. Cuadro de dilogo del ANOVA de un factor
La tabla ANOVA que presenta Excel tiene una columna ms que la tabla ANOVA presentada
en el apartado 12.3.1, con P = 0,3337; que representa la probabilidad de que se obtenga un valor
de F mayor o igual a 1,2042. Lgicamente, si esta probabilidad es mayor que ; se rechazar H
0
.

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Fila 1 5 86 17.2 9.2
Fila 2 5 101 20.2 9.7
Fila 3 5 95 19 9.5

ANLISIS DE VARIANZA
Origen de las
variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de los
cuadrados
F Probabilidad
Valor crtico
para F
Entre grupos 22,8 2 11,4 1,2042 0,3337 3,8853
Dentro de los grupos 113,6 12 9,4667

Total 136,4 14

Resulta: F < F*; por lo tanto se acepta la hiptesis nula (H
0
:
2 2
N E
= ) y se acepta tambin la
hiptesis nula (H
0
:
1
=
2
=
3
).
Se puede afirmar entonces que los tres mtodos de capacitacin son igualmente eficientes.
12.4.2 Anlisis de varianza de dos factores, sin interaccin.
En este apartado se va a resolver el ejemplo 2, resuelto en el apartado 12.3.2. Por comodidad, se
repite el texto y el planteamiento de este problema.
Ejemplo 2:
El gerente de produccin de una fbrica quiere evaluar tres mquinas. Para esto asigna cinco
empleados a cada mquina, distribuyndolos de acuerdo a su nivel acadmico, de manera tal
que cada mquina sea operada por empleados de los cinco niveles en que se les ha clasificado
previamente. De esta forma ninguna mquina se ver favorecida al asignarle ms operarios de
mayor nivel acadmico. En la tabla adjunta se muestra la produccin diaria.
172 Diseo de experimentos y anlisis de varianza

Se puede afirmar que las tres mquinas tienen la misma productividad?
Mq. 1 Mq. 2 Mq. 3
Nivel 1 16 17 20
Nivel 2 15 20 17
Nivel 3 20 19 17
Nivel 4 19 22 23
Nivel 5 22 24 25
En primer lugar, se plantean las siguientes hiptesis:
Para los tratamientos: H
0
:
1
=
2
=
3

(mquinas) H
1
: Al menos una media es diferente
Para los bloques: H
0
:
1
=
2
=
3
=
4
=
5

(niveles acadmicos) H
1
: Al menos una media es diferente
Ingresando al men Herramientas/Anlisis de datos/Anlisis de varianza de dos factores con
una sola muestra por grupo, Excel muestra el cuadro de dilogo de la figura 12.5. En este cua-
dro ya se han ingresado los datos del problema, que estn entre las celdas B2 y D6.

Figura 12.5. Cuadro de dilogo del anlisis de varianza con dos factores, sin interaccin.
Aceptando los datos ingresados en el cuadro de dilogo, Excel presenta dos tablas: la primera es
un resumen de los datos del problema, incluyendo medias y varianzas; y la segunda es la tabla
ANOVA del problema, como se muestra a continuacin:
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 3 49 16.3333 2.3333
Fila 2 3 50 16.6667 26.3333
Fila 3 3 50 16.6667 2.3333
Fila 4 3 63 21 3
Fila 5 3 73 24.3333 6.3333

Columna 1 5 85 17 17.5
Columna 2 5 105 21 15.5
Columna 3 5 95 19 15
Como se puede ver en esta tabla y en la tabla ANOVA que se muestra a continuacin, lo que
Excel denomina filas corresponde a los bloques (niveles acadmicos) y lo que denomina colum-
nas corresponde a los tratamientos (tipos de mquina).
Diseo de experimentos y anlisis de varianza 173


ANLISIS DE VARIANZA
Origen de las
variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de los
cuadrados
F Probabilidad
Valor crtico
para F
Filas 151,3333 4 37,8333 7,4426 0,0084 3,8379
Columnas 40 2 20 3,9344 0,0646 4,4590
Error 40,6667 8 5,08333

Total 232 14
Para las filas resulta: F > F*; por lo tanto se rechaza la hiptesis nula (H
0
:
1
=
2
=
3
).
Se puede afirmar entonces que las tres mquinas no tienen la misma productividad.
Para las columnas: F < F*; por lo tanto se acepta la hiptesis nula (H
0
:
1
=
2
=
3
=
4
=
5
).
Se puede afirmar entonces que la productividad es la misma en los distintos niveles acadmicos
de los empleados.
El lector debe llegar a estas mismas dos conclusiones interpretando los valores de Probabilidad,
tal como se hizo en el apartado anterior.
12.4.3 Anlisis de varianza de dos factores, con interaccin.
En este apartado se va a resolver el ejemplo 3, resuelto en el apartado 12.3.3. Por comodidad, se
repite el texto y el planteamiento de este problema.
Ejemplo 3:
El gerente de produccin de una fbrica quiere evaluar tres mquinas. Para esto asigna cinco
empleados a cada mquina, distribuyndolos de acuerdo a su nivel acadmico, de manera tal
que cada mquina sea operada por empleados de los cinco niveles en que se les ha clasificado
previamente. De esta forma ninguna mquina se ver favorecida al asignarle ms operarios de
mayor nivel acadmico. Como es probable que haya interaccin entre el tipo de mquina y el
nivel acadmico de los empleados, respecto a la productividad de stos, se consideraron dos
empleados para cada combinacin tipo de mquina nivel acadmico. En la tabla adjunta se
muestra la produccin diaria.
M1 M2 M3
14 20 15
1
16 16 17
11 21 18
2
13 22 21
18 17 15
3
20 16 15
17 22 21
4
21 21 23
20 25 24
5
26 28 25
Se puede afirmar que las tres mquinas tienen la misma productividad?
Se plantean las siguientes hiptesis:
Para los tratamientos: H
0
:
1
=
2
=
3

(mquinas) H
1
: Al menos una media es diferente
Para los bloques: H
0
:
1
=
2
=
3
=
4
=
5

(niveles acadmicos) H
1
: Al menos una media es diferente
174 Diseo de experimentos y anlisis de varianza

Para la interaccin: H
0
: No hay interaccin entre el tipo de mquina y el nivel acadmico
de los empleados, respecto a la productividad de stos.
H
1
: S hay interaccin entre dichos factores.
Ingresando al men Herramientas/Anlisis de datos/Anlisis de varianza de dos factores con
varias muestras por grupo, Excel muestra el cuadro de dilogo de la figura 12.6. En este cuadro
ya se han ingresado los datos del problema.

Figura 12.6. Cuadro de dilogo del anlisis de varianza con dos factores, con interaccin.
Hay dos particularidades en el cuadro de dilogo de Excel para este anlisis que incluye la posi-
ble interaccin entre los factores (figura 12.6). La primera es que en el rango de entrada deben
incluirse no slo los datos (valores numricos) sino tambin los ttulos de las filas y columnas. A
continuacin se presentan los datos de este problema, tal como se escribieron en la hoja de cl-
culo de Excel:
A B C D
1 M1 M2 M3
2 1 14 20 15
3 16 16 17
4 2 11 21 18
5 13 22 21
6 3 18 17 15
7 20 16 15
8 4 17 22 21
9 21 21 23
10 5 20 25 24
11 26 28 25
La segunda particularidad es la opcin Fila por muestra del mismo cuadro de dilogo de la figu-
ra 12.6, donde se debe indicar el nmero de datos que hay en cada combinacin tratamiento
bloque. En este problema hay 2 datos por cada combinacin.
Aceptando los datos ingresados en el cuadro de dilogo, Excel presenta dos tablas: la primera es
un resumen de los datos de cada bloque y de cada tratamiento, incluyendo sus respectivas me-
dias y varianzas; y la segunda es la tabla ANOVA del problema, como se muestra a continua-
cin:

Diseo de experimentos y anlisis de varianza 175


RESUMEN M1 M2 M3 Total
1
Cuenta 2 2 2 6
Suma 30 36 32 98
Promedio 15 18 16 16.3333
Varianza 2 8 2 4.2667

2
Cuenta 2 2 2 6
Suma 24 43 39 106
Promedio 12 21.5 19.5 17.6667
Varianza 2 0.5 4.5 21.4667

3
Cuenta 2 2 2 6
Suma 38 33 30 101
Promedio 19 16.5 15 16.8333
Varianza 2 0.5 0 3.7667

4
Cuenta 2 2 2 6
Suma 38 43 44 125
Promedio 19 21.5 22 20.8333
Varianza 8 0.5 2 4.1667

5
Cuenta 2 2 2 6
Suma 46 53 49 148
Promedio 23 26.5 24.5 24.6667
Varianza 18 4.5 0.5 7.0667

Total
Cuenta 10 10 10
Suma 176 208 194
Promedio 17.6 20.8 19.4
Varianza 19.3778 14.8444 15.1556

ANLISIS DE VARIANZA
Origen de las
variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de los
cuadrados
F Probabilidad
Valor crtico
para F
Muestra 292,2 4 73,05 19,9227 7E-06 3,0556
Columnas 51,4667 2 25,7333 7,0182 0,007057 3,6823
Interaccin 97,2 8 12,15 3,3136 0,021807 2,6408
Dentro del grupo 55 15 3,6667

Total 495,8667 29

Para las muestras resulta: F > F*; por lo tanto se rechaza la hiptesis nula (H
0
:
1
=
2
=
3
).
Se puede afirmar entonces que las tres mquinas no tienen la misma productividad.
Para las columnas: F > F*; por lo tanto se rechaza la hiptesis nula (H
0
:
1
=
2
=
3
=
4
=
5
).
Se puede afirmar entonces que la productividad es la misma en los distintos niveles acadmicos
de los empleados.
176 Diseo de experimentos y anlisis de varianza

Para la interaccin: F > F*; por lo tanto se rechaza la hiptesis de que los factores interactan.
Se puede afirmar entonces que el tipo de mquina y el nivel acadmico s interactan, lo cual
afecta la productividad de los empleados.
El lector debe llegar a estas mismas tres conclusiones interpretando los valores de Probabilidad
de la tabla ANOVA, tal como se hizo en el ejemplo 1.






Diseo de experimentos y anlisis de varianza 177


Problemas propuestos.
1. El Departamento de Investigacin de la Facultad de Agronoma de una universidad quiere investi-
gar el crecimiento de un tipo de planta sometida a uno de tres tipos de riego y a uno de cuatro fer-
tilizantes. Considerando que no hay interaccin entre el tipo de riego y el fertilizante, se dise un
experimento aleatorizado por bloques, sembrando doce plantas del mismo tamao en un terreno
cuya calidad del suelo es homognea, de tal manera que cada planta fue sometida a un tipo de rie-
go y a un fertilizante. En la siguiente tabla se muestran los crecimientos de las plantas (en cm.)
despus de 6 meses.
Fertilizante
Tipo de riego 1 2 3 4
A 52 30 38 50
B 44 55 54 45
C 36 60 35 48
Determine si el crecimiento es el mismo, independientemente del tipo de riego y del fertilizante.
Considere = 0,05.
2. Se seleccionaron muestras aleatorias independientes de tres poblaciones. Los datos se muestran a
continuacin, junto con la salida de la tabla ANOVA de un software. Se considera = 0,05.





ANOVA
Fuente Suma de cuadrados GL Promedio de los cuadrados F P
Entre grupos 7,726666667 2 3,863333333 2,79502 0,138739
Dentro de los grupos 8,293333333 6 1,382222222
Total 16,02 8

a) Localice varianza entre las muestras. Qu tipo de variabilidad se mide con esta cantidad?
b) Localice la varianza dentro de las muestras Qu tipo de variabilidad se mide?
c) Se acepta Ho:
1
=
2
=

3
contra la hiptesis alternativa que al menos una media poblacional
difiere de las otras dos? Por qu?
d) A qu conclusin llega?
3. El jefe de un taller quiere investigar si el promedio de resistencia de unas lminas es el mismo pa-
ra tres temperaturas y tres presiones aplicadas durante la produccin. A continuacin se muestran
los datos obtenidos y la tabla ANOVA de Excel, incompleta. Se considera = 0,05.
a) Complete la tabla ANOVA
b) A qu conclusiones puede llegar?
Temperatura
Presin Baja Mediana Alta
66 83 80 86 92 121
56 82 77 81 90 106
Baja
72 88 93 81 119 121
109 98 131 136 53 74
103 64 148 127 63 73
Mediana
100 113 152 146 67 93
164 140 79 64 59 58
133 154 67 108 48 51
Alta
132 162 45 72 50 58
Muestra 1 Muestra 2 Muestra 3
2.1 4.4 1.1
3.3 2.6 0.2
0.2 3 2
178 Diseo de experimentos y anlisis de varianza


ANLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de Valor crtico
variaciones cuadrados libertad los cuadrados
F Probabilidad
para F
Muestra 0,006616254
Columnas 1,92315E-07
Interaccin 39715,77778 1,07475E-16
Dentro del grupo 8187,666667

Total 58041,33333

4. Un fabricante de llantas est investigando el desgaste de tres marcas distintas. Para esto se selec-
cionaron 6 llantas de cada marca y se colocaron en 18 autos, en la misma posicin. Despus de re-
correr 5 000 km. se tuvieron los siguientes desgastes:
Marca A 211 231 235 204 222 208
Marca B 145 168 161 134 187 125
Marca C 190 210 230 160 205 201
Diga si existe evidencia estadstica para concluir que las tres marcas de llanta no difieren en la re-
sistencia al desgaste. Excel proporciona la siguiente tabla ANOVA para un diseo completamente
aleatorizado con un nivel de significancia () del 5%.
Variaciones Suma de cuadrados Grados de lib. Prom. cuadrados F Prob. F*
Entre grupos 17422,86111 2 8711,43055 20,0784606 5,737E-05 3,68231667
Dentro de los grupos 6508,041667 15 433,869444
Total

Respuesta: No, se afirma que las tres marcas de llanta s difieren en la resistencia al desgaste.
5. Un profesor de matemticas quiere investigar si el aprendizaje en un determinado tema es el mis-
mo empleando cualquiera de tres mtodos: A, B o C. Se escogen aleatoriamente treinta alumnos
de distintos colegios, y se les distribuye tambin aleatoriamente en tres aulas, de tal manera que en
cada una se les ensea el tema con un mtodo. En la siguiente tabla se muestran las evaluaciones
de los alumnos despus de concluidas las clases.
Mtodo A 15 16 18 11 15 14 14 13 16 14
Mtodo B 13 18 19 15 17 16 12 15 16 18
Mtodo C 19 17 20 14 18 16 15 15 17 18
Se puede afirmar que con los tres mtodos se obtiene el mismo resultado? Considere = 0,05.
Respuesta: S se puede afirmar que con los tres mtodos se obtiene el mismo resultado
6. Cuando se hace un anlisis de varianza se investiga:
a) si las varianzas de varias poblaciones difieren, para comparar eficiencias.
b) si las medias de varias poblaciones difieren, lo cual se constata comparando las varianzas de
las muestras extradas de dichas poblaciones.
c) si las medias de varias muestras difieren.
d) ninguna de las anteriores.
7. Cuando se hace el anlisis de varianza con un solo factor, la variabilidad de todos los datos de-
pende de la variabilidad de los tratamientos o de la variabilidad dentro de los tratamientos?
8. Cuando se hace el anlisis de varianza con dos factores que no interactan, importa si se denomi-
nan indistintamente los tratamientos y los grupos?

Regresin lineal simple y correlacin 179


Captulo 13. Regresin lineal simple y correlacin.
13.1 Introduccin.
El propsito de este captulo es determinar la relacin que existe entre dos variables X e Y, que
representan dos caractersticas de un universo, con el propsito de predecir una en trminos de la otra.
Se podra establecer, por ejemplo, qu relacin hay entre:
El gasto en publicidad y las ventas mensuales en una empresa.
La resistencia del cemento y el tiempo de envejecimiento.
La rapidez en una lnea de produccin y el porcentaje de unidades defectuosas.
Los residuos de cloro en una piscina y el nmero de horas despus de que ha sido tratada.
La resistencia a la compresin de un suelo y la profundidad de ste.
La frecuencia de reparaciones en un auto y la edad del auto.
13.2 Regresin.
En cada uno de los ejemplos dados se puede ver que existe una asociacin entre una variable X,
llamada variable independiente o de prediccin, y otra Y, llamada variable dependiente o variable
respuesta. Evidentemente las variables de prediccin sern, para cada ejemplo:
El gasto de publicidad.
El tiempo de envejecimiento del cemento.
La rapidez en la lnea de produccin.
El nmero de horas despus que ha sido tratada la piscina.
La profundidad del suelo.
La edad del auto.
En el anlisis de regresin slo se examinan variables entre las cuales la relacin no es causal.
En los ejemplos mencionados, no es posible establecer una relacin causa-efecto entre las dos varia-
bles. No sera correcto decir, por ejemplo, que las ventas mensuales y en una empresa son altas debido
al alto gasto de publicidad x, pues, aunque las ventas s dependan de la publicidad, no las causan, ya
que hay muchas otras razones por las que se hacen las ventas. Tampoco se puede decir que un cemen-
to tiene una resistencia y debido a que se ha envejecido un tiempo x, pues la resistencia depende de ese
tiempo, pero el tiempo de envejecimiento no causa dicha resistencia. Ni se puede afirmar que en una
piscina hay y partes por milln de cloro debido a que hace exactamente x horas fue tratada; esto ltimo
influye pero no es la causa. As, en muchas otras situaciones, no se debe confundir una influencia que
pueda ejercer una variable sobre otra, con causalidad. Un caso donde s hay una relacin causa-efecto
es el siguiente: si a un motor se le inyecta cierto flujo de gasolina, adquirir una velocidad determina-
da. Pero esto no se puede estudiar mediante un anlisis estadstico; de esto se ocupa otra ciencia.
La palabra regresin fue usada por Francis Galton (18221911) cuando not que las caracters-
ticas promedio de la siguiente generacin de un grupo en particular tendan hacia las caractersticas
promedio de la poblacin general, ms que hacia las de la generacin previa de ese grupo. A esta ten-
dencia le llam regresin hacia la media de la poblacin.
Sean X e Y variables de prediccin y respuesta, respectivamente. Segn lo dicho antes, no ser
posible predecir con exactitud un valor de Y para ciertos valores de X; pero s se podr estimar un
promedio de Y para todos los casos en que X tome un determinado valor x. Para poder hacer esto ser
180 Regresin lineal simple y correlacin

necesario tomar una serie de mediciones y
1
, y
2
, ..., y
n
, correspondientes a los valores x
1
, x
2
, ..., x
n
, y es-
timar una funcin matemtica que describa el comportamiento de la variable respuesta, dados los valo-
res de la variable de prediccin. Una forma muy prctica para vislumbrar qu tipo de funcin puede
ser til es representar todas las parejas de valores (x, y) en un sistema de coordenadas cartesianas. A
este grfico se le conoce como diagrama de dispersin. El siguiente paso es estimar aquella funcin
empleando un mtodo muy aceptado por todos, denominado: Mtodo de los mnimos cuadrados. Si
dicha funcin es lineal, se le denomina modelo lineal simple. Lineal, pues lo es en los parmetros que
la determinan, y simple porque emplea una sola variable de prediccin (X).
Se puede afirmar que la variable de prediccin (X) no es una variable aleatoria pues sus valores
son fijos o se dan previamente. La variable de prediccin est controlada, y por lo tanto no existen
errores de observacin. En la prctica, esto ltimo no siempre es cierto, pero tales errores resultan des-
preciables. En cambio la variable respuesta (Y) s es aleatoria pues los valores que toma no estn de-
terminados.
13.3 La recta de regresin de la poblacin.
Si la relacin entre las variables X e Y es lineal, el modelo que ms se ajusta es la recta de regre-
sin de la poblacin, que se puede estimar mediante la recta de regresin de una muestra, por el mto-
do de los mnimos cuadrados.
La recta de regresin de la poblacin puede expresarse de la siguiente manera:
Y
i
= + X
i
+
i

donde y son parmetros de la poblacin y
i
es la diferencia entre Y
i
y el valor esperado de Y,
dado X
i
, es decir:

i
= Y
i

Y \ Xi
As, se deduce:
X
X Y
+ =
/

Esta ecuacin es conocida como recta de regresin de Y con respecto a X. Para cada valor de
X, la ordenada de la recta de regresin representa la media de un nmero tericamente infinito de valo-
res de Y.
El parmetro , que es la interseccin de la recta con el eje Y, expresa el valor promedio de Y
que corresponde a X = 0. El parmetro , que es la pendiente de la recta, expresa cunto se incrementa
Y por cada unidad de incremento de X.
Generalmente la distribucin de Y para cada valor de X es aproximadamente normal, y la des-
viacin estndar
Y / X
es la misma en cada caso (homoscedasticidad), como se aprecia en la figura
13.1, donde se muestra la distribucin normal de Y alrededor de
Y\X
, para tres valores de X. Se asume
entonces que los errores tienen la misma variabilidad para todos los valores de X. Se asume tambin
que los errores son independientes para cada valor de X.

Y \ X
= + X
X
Y
x
1
x
n
x
2

Figura 13.1. Suposiciones en la recta de regresin
Regresin lineal simple y correlacin 181


13.4 Mtodo de los mnimos cuadrados.
A partir de los datos de una muestra es posible estimar la recta de regresin de la poblacin, de-
terminando la recta de regresin de la muestra, por el mtodo de los mnimos cuadrados. A esta recta
se le llama tambin recta de mnimos cuadrados. Este mtodo determina los parmetros de la recta
minimizando la suma de los cuadrados de las diferencias entre los valores que toma la variable res-
puesta (y
1
, y
2
, ..., y
n
) y aquellos que determina la ecuacin de regresin.
En la figura 13.2 se muestra un diagrama de dispersin y una recta (y = a + bx) ajustada a dicho
diagrama, donde a y b son los estimadores de los parmetros y .
y = a + b x
y
x
*
e
1
= y
1
- y'
1
*
*
*
*
*
*
*
*
*
(x
1,
y
1
)
(x
n,
y
n
)
*
e
i
= y
i
- y'
i
(x
i,
y
i
)

Figura 13.2. Errores de estimacin de la recta de regresin
En este grfico, las diferencias entre los valores de Y observados y los correspondientes que de-
termina la ecuacin de la recta Y, estn representados por:
e
i
= y
i
y
i
= y
i
(a + bx
i
) para: i = 1, 2, ..., n.
A estas diferencias se les denomina errores de estimacin. Puede decirse que e
i
es un estimador
de
i
.
El mtodo de los mnimos cuadrados determina los parmetros de la ecuacin de la recta que
minimiza e
2
i
. Esta sumatoria ser mnima cuando:
0
2
=

a
e
i

0
2
=

b
e
i

Despejando a y b de estas ecuaciones resulta:

( )
2
2
2

=
i i
i i i i i
x x n
y x x y x
a ;
( )
2
2

=
i i
i i i i
x x n
y x y x n
b
El empleo de estas frmulas debe ser simple para un estudiante universitario; aunque s resulta
engorroso. De hecho, es mucho ms prctico emplear calculadoras que traen incorporadas estas fr-
mulas, adems de Excel u otros softwares estadsticos como SPSS, Minitab, Statistics o Statgraphics.
Ejemplo:
Se afirma que los alumnos que tienen mejores calificaciones promedio en la universidad, tienen
posibilidades de conseguir mejores trabajos y por lo tanto mejores salarios iniciales. Los datos
que se muestran en la siguiente tabla representan los ndices acadmicos acumulados (I.A.A.) de
182 Regresin lineal simple y correlacin

15 alumnos egresados de la Facultad de Ingeniera de una universidad y sus correspondientes
sueldos iniciales (en soles).
I.A.A. 12,20 13,12 13,94 14,76 13,12 14,50 12,71 11,73
Sueldo inicial 1850 2000 2150 2250 2100 2150 1800 1900
I.A.A. 12,51 15,52 11,28 16,36 12,92 12,10 11,32
Sueldo inicial 1950 2200 1550 2300 1900 1700 1650
Empleando las frmulas que determinan a y b, se determina la recta de mnimos cuadrados:
y = 166,8 + 136,04x
En la figura 13.3 se representan el diagrama de dispersin y la recta de mnimos cuadrados. sta
es una estimacin de la recta de regresin de la poblacin, conformada en este ejemplo por to-
dos los alumnos egresados de la Facultad de Ingeniera.
Los valores que se obtengan de Y para determinados valores de X, es decir, para determinados
ndices acadmicos acumulados, son las estimaciones de las medias de los salarios iniciales co-
rrespondientes a dichos ndices.
El valor que toma b (la pendiente de la recta) se interpreta de la siguiente manera: por cada pun-
to que un alumno mejore su I.A.A., puede esperar que su salario mejore en 136,04 soles.
Es importante tener en cuenta que esta recta estimada puede no ser apropiada para valores de la
variable de prediccin que no estn comprendidos en el intervalo de la muestra, es decir, entre
11,28 y 16,36.
1400
1600
1800
2000
2200
2400
2600
11 11.5 12 12.5 13 13.5 14 14.5 15 15.5 16 16.5 17

Figura 13.3. Diagrama de dispersin y recta de mnimos cuadrados

13.5 Propiedades de la recta de mnimos cuadrados
A continuacin se deducen algunas propiedades de la recta de mnimos cuadrados. A partir de la
primera ecuacin diferencial se puede deducir:
2(y
i
a bx
i
)(1) = 0
y
i
na b x
i
= 0
Dividiendo entre n:
0 =

n
x
b a
n
y
i i

Regresin lineal simple y correlacin 183


Entonces:
x b a y + =
Esto indica que la recta estimada pasa por el centroide ) , ( y x .
Los valores de Y determinados por la recta de mnimos cuadrados deberan denominarse y, ya
que se trata de estimaciones. Para simplificar la terminologa, se usar la comilla () slo en las situa-
ciones donde se requiera para fines de claridad.
La media de los valores de Y determinados por la recta de mnimos cuadrados puede expresarse
de la siguiente manera:
E(y) = E(a + bx) = E(a) + E(bx) = a + bE(x)
Es decir:
y x b a y = + = '
Dado este ltimo resultado, se puede deducir fcilmente:
0 '
'
' ) ' ( = =
|
|
.
|

\
|
= = =


y y
n
y
n
y
n y y y y e
i i
i i i i i

Esto indica que la suma de los errores positivos es igual a la suma de los errores negativos, lo
cual resulta til para trazar visualmente la recta de mnimos cuadrados sobre un diagrama de disper-
sin.
13.6 Medidas de variabilidad
En el anlisis de regresin, la variacin total de los valores Y alrededor de su media Y se puede
dividir en dos partes:
la variabilidad de los valores estimados Y respecto a la media Y , conocida como variacin
de la regresin o variacin explicada, pues se explica por la relacin que hay entre X e Y.
la variabilidad de los valores Y respecto a los valores estimados Y, conocida como variacin
del error o variacin no explicada, pues no se explica por la relacin que hay entre X e Y, si-
no por otros factores.
Para medir la variacin total se emplea la suma total de cuadrados (SST):

=
2
) ( y y SST
i

Para medir la variacin de la regresin se emplea la suma de cuadrados de la regresin (SSR):

=
2
) ' ( y y SSR
i

Para medir la variacin del error se emplea la suma de cuadrados del error (SSE):

=
2
) ' ( y y SSE
i

Los valores de Y que corresponden a un determinado valor de X, tienen una desviacin estndar
s
Y / X
que mide la variabilidad del error que se comete al medir Y en vez de Y:

e
i i i
X Y
s
n
e
n
y y
s =

=

2 2
) ' (
2 2
/

A s
Y \ X
se le denomina desviacin estndar del error.
El denominador es n 2, pues se pierden 2 grados de libertad al estimar los parmetros y
mediante los estimadores a y b.
184 Regresin lineal simple y correlacin

En la figura 13.5 se expresan estas tres medidas de variabilidad y se ve claramente que:
SST = SSR + SSE
y

=

a

+

b

x
y
x
*
y'
i
y
i
x
i

=
2
) ' ( y y SSR
i

=
2
) ' ( y y SSE
i

=
2
) ( y y SST
i
Y

Figura 13.5. Medidas de variacin
Se define el coeficiente de determinacin como el cociente de la suma de cuadrados de la re-
gresin y la suma de cuadrados total:
SST
SSR
r =
2

Este coeficiente de determinacin mide la fraccin de la variacin total de Y que es explicada
por la variable X. Se deduce que mientras ms se acerquen los Y estimados a los Y observados, es de-
cir, mientras ms concentrado est el diagrama de dispersin alrededor de la recta de mnimos cuadra-
dos, mayor ser el coeficiente de determinacin, pues menor ser la variacin de los errores de estima-
cin. Por lo tanto, el coeficiente de determinacin mide la bondad del ajuste de la recta de regresin.
Ejemplo:
En el ejemplo del primer sueldo de los ingenieros recin egresados de una universidad se tiene:
X Y Y' Y Y Y' Y
12,20 1850 1826,48 -113,33 -136,86
13,12 2000 1951,63 36,67 -11,70
13,94 2150 2063,19 186,67 99,85
14,76 2250 2174,74 286,67 211,40
13,12 2100 1951,63 136,67 -11,70
14,50 2150 2139,37 186,67 176,03
12,71 1800 1895,86 -163,33 -67,48
11,73 1900 1762,54 -63,33 -200,79
12,51 1950 1868,65 -13,33 -94,68
15,52 2200 2278,13 236,67 314,79
11,28 1550 1701,32 -413,33 -262,01
16,36 2300 2392,40 336,67 429,07
12,92 1900 1924,43 -63,33 -38,91
12,10 1700 1812,87 -263,33 -150,46
11,32 1650 1706,76 -313,33 -256,57
Los valores de la tercera columna (Y) corresponden a los valores estimados con la recta de re-
gresin. Por lo tanto:
Regresin lineal simple y correlacin 185


=
2
) ( y y SST
i
= 727 333,33

=
2
) ' ( y y SSR
i
= 600 312,84
8254 , 0
33 , 333 727
84 , 312 600
2
= = r
Se interpreta que el 82,54% de la variacin de los primeros sueldos de esa muestra de exalum-
nos se puede explicar por la variabilidad de los ndices acadmicos acumulados que tuvieron en
la universidad; y por lo tanto slo el 17,46% de la variabilidad de dichos sueldos se pueden atri-
buir a otros factores.
13.7 Estimaciones de intervalo para la regresin.
La recta de mnimos cuadrados proporciona el mtodo ms eficaz para estimar la media de la
variable respuesta (Y), para un valor especfico de la variable de prediccin (X); es decir, para estimar

Y\X

. Estas estimaciones, que denominamos y, o y simplemente, son puntuales.
Pero, para distintas muestras que se extraigan, se determinarn distintas rectas de mnimos cua-
drados. Si se tomaran n muestras de la poblacin, se obtendran n estimaciones y diferentes para cada
valor de X. Se puede demostrar que, para cada valor que tome X, Y se distribuye normalmente alrede-
dor de
Y\X
. Entonces, se podra hacer una estimacin de intervalo para
Y\X
, de la misma forma como
se hizo para en el captulo 11. Tambin se podra hacer una estimacin de intervalo para Y, dado un
valor de X, pues ya se ha asumido que Y se distribuye normalmente alrededor de
Y\X
.
Todas las estimaciones de intervalo que se puedan hacer de
Y\X
para distintos valores de X, se
suelen expresar grficamente mediante una banda de confianza de
Y\X
; de la misma manera se pue-
de graficar una banda de confianza de Y correspondiente a los intervalos de confianza de Y para de-
terminados valores de X, como se puede apreciar en la figura 13.6.
B
a
n
d
a
d
e
c
o
n
f
i
a
n
z
a
p
a
r
a

Y
/X
B
a
n
d
a
d
e
c
o
n
fia
n
z
a
p
a
ra
Y

Figura 13.6. Bandas de confianza
13.8 Correlacin lineal.
El objetivo del anlisis de regresin es predecir la variable dependiente o respuesta Y basndose
en la variable de prediccin o independiente X; en cambio, el objetivo del anlisis de correlacin es
medir el grado de asociacin que hay entre dichas variables.
Para medir el grado de asociacin lineal que hay entre dos variables X e Y, se define el coefi-
ciente de correlacin (), de tal forma que: 1 < < +1.
186 Regresin lineal simple y correlacin

En la figura 13.7 se muestran tres tipos diferentes de asociacin entre las variables X e Y. Se
puede apreciar que el valor 1 indica una correlacin perfecta entre X e Y, mientras que el signo, que
coincide con el signo de la pendiente de la recta de regresin, indica si la relacin es directa (+) o in-
versa (). Si r = 0, se dice que no existe ninguna relacin lineal entre X e Y.
y
x
*
*
*
*
*
*
*
*
*
*
*
y
x
*
*
*
*
*
*
*
*
*
*
x
y
*
*
*
*
*
*
*
*
*
= +1 = -1 = 0

Figura 13.7. Tipos de correlacin
En el anlisis de correlacin no se distingue entre las dos variables; tanto X como Y son aleato-
rias. Adems, para una muestra, se supone que los valores que tome X, dado un valor de Y, tambin se
distribuyen normalmente.
El coeficiente de correlacin se puede estimar a partir del coeficiente de determinacin, conside-
rando el signo de la pendiente de la recta de regresin:
2
r r =
Tambin se puede obtener r a partir de la muestra que se usa para determinar los estimadores
a y b, mediante la siguiente frmula:
] ) ( [ ] ) ( [
2 2 2 2


=
i i i i
i i i i
y y n x x n
y x y x n
r
Como el coeficiente de correlacin es igual a la raz cuadrada del coeficiente de determinacin,
se puede afirmar que r, adems de medir el grado de asociacin lineal entre dos variables, tambin mi-
de la bondad del ajuste de la recta de regresin.
Ejemplo:
En el ejemplo del primer sueldo de los ingenieros recin egresados de una universidad, el coefi-
ciente de correlacin es:

2
r r = = + 0,9085
Este valor indica un alto grado de asociacin entre el ndice acadmico acumulado de los alum-
nos egresados de la Facultad de Ingeniera de la muestra y su primer sueldo. Un ndice acadmi-
co acumulado ms alto est bastante asociado con un sueldo ms alto.
Para determinar, a partir de los datos de una muestra, si efectivamente existe correlacin entre
las variables X e Y, se tendr que investigar si el valor de es distinto de cero:
H
0
: = 0 No hay correlacin
H
1
: 0 S hay correlacin
Se emplea la siguiente variable t de Student para esta investigacin:
Regresin lineal simple y correlacin 187



2
1
2

=
n
r
r
t


Esta variable t tiene n 2 grados de libertad.
Ejemplo:
En el ejemplo del primer sueldo de los ingenieros recin egresados de una universidad, t es:
8392 , 7
2 15
8254 , 0 1
9085 , 0
=

= t
Si = 0,05; t* = 2,1604.
Como t > t* Se rechaza la hiptesis nula; o sea que se puede afirmar que s hay correlacin
entre el ndice acadmico acumulado de todos los alumnos egresados de la Facultad de Ingenie-
ra y su primer sueldo.
13.9 Regresin simple no lineal
Hay situaciones en las que el modelo lineal no se ajusta a la relacin que hay entre dos variables
X e Y. En la figura 13.8 se muestran algunos diagramas de dispersin donde la relacin entre dichas
variables no es lineal.
y
x
*
*
*
*
*
*
*
*
*
*
*
y
x
*
x
y
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*

Figura 13.8a. Relacin polinomial Figura 13.8a. Relacin potencial Figura 13.8a. Relacin exponencial
Se dice que la regresin es polinomial si la relacin entre X e Y puede expresarse de la siguien-
te manera:
Y = +
1
X +
2
X
2
+ +
n
X
n

Se dice que la regresin es potencial si la relacin entre X e Y puede expresarse de la siguiente
manera:
Y = x


Se dice que la regresin es exponencial si la relacin entre X e Y puede expresarse de la si-
guiente manera:
Y =

x

Para estos tres casos es posible estimar la correspondiente funcin a partir de los datos de una
muestra. Resulta muy prctico recurrir a Excel o a softwares de Estadstica para determinar la funcin
que ms se ajuste a una muestra representada por un diagrama de dispersin. Comparando los coefi-
cientes de determinacin de los distintos ajustes que se realicen se elige la mejor opcin, es decir, la
funcin que tenga el mayor coeficiente de determinacin.
188 Regresin lineal simple y correlacin

13.10 Regresin lineal, no lineal y correlacin en Excel
13.10.1 Diagrama de dispersin y tendencia lineal.
Dada una muestra, es decir, un conjunto de parejas de valores (x
i
, y
i
), se puede elaborar un dia-
grama de dispersin con la ayuda de Excel. Para esto, primero se seleccionan las celdas donde est la
muestra; luego se hace clic sobre el icono de grficos o se selecciona el men Insertar/Grfico. Ex-
cel muestra el cuadro de dilogo de la figura 13.9, donde ya se ha seleccionado el Tipo de grfico de-
nominado XY (Dispersin). Se elige luego el subtipo de grfico que aparece sombreado por defecto,
que es precisamente el diagrama de dispersin.

Figura 13.9. Cuadro de dilogo del asistente para grficos de Excel
Luego se selecciona sucesivamente el botn [Siguiente >], y se va conformando el grfico hasta
darle la forma deseada.
Una vez que Excel presenta el diagrama de dispersin, se seala cualquiera de los puntos del
grfico y se hace clic con el botn derecho del mouse. Enseguida Excel muestra el cuadro de dilogo
de la figura 13.10. Seleccionando Agregar lnea de tendencia aparece el cuadro de dilogo que permi-
te seleccionar el tipo de lnea de tendencia, como se muestra en la figura 13.11.

Figura 13.10. Cuadro de dilogo del diagrama de dispersin
Regresin lineal simple y correlacin 189



Figura 13.11. Cuadro de dilogo de la lnea de tendencia
Una vez que se ha elegido el Tipo de lnea de tendencia, se selecciona Opciones, que permite
aadir la ecuacin de la lnea de tendencia y el coeficiente de determinacin (r
2
).

Ejemplo:
En el ejemplo del primer sueldo de los ingenieros recin egresados de una universidad, siguien-
do los pasos que se acaban de describir y eligiendo finalmente el tipo Lineal, Excel muestra fi-
nalmente el grfico de la figura 13.12., que incluye el diagrama de dispersin, la recta de regre-
sin, su ecuacin y el coeficiente de determinacin.
y = 136.04x + 166.8
R
2
= 0.8254
1400
1600
1800
2000
2200
2400
2600
11 11.5 12 12.5 13 13.5 14 14.5 15 15.5 16 16.5 17

Figura 13.12. Recta de regresin de Excel para el ejemplo.
190 Regresin lineal simple y correlacin

13.10.2 Tendencia no lineal.
Si la muestra no se ajusta al modelo lineal, lo cual se puede contrastar con la prueba t, tal como
se hizo en el apartado 13.6; o si, visualizando el diagrama de dispersin se sospecha que uno de los
modelos no lineales se ajusta mejor a dicha muestra, conviene realizar ajustes no lineales con Excel.
Comparando los coeficientes de determinacin de los ajustes que se realicen, se elige la mejor opcin.
Ejemplo:
Observando el diagrama de dispersin del ejemplo del primer sueldo de los ingenieros recin
egresados de una universidad, se puede sospechar que el modelo lineal que ms se ajusta es el
polinomial de segundo orden, es decir, el parablico. Eligiendo este tipo de modelo en el cuadro
de dilogo (figura 13.11), Excel da el resultado de la figura 13.13.
y = -22.86x
2
+ 761.06x - 4051.1
R
2
= 0.8773
1400
1600
1800
2000
2200
2400
2600
11 11.5 12 12.5 13 13.5 14 14.5 15 15.5 16 16.5 17

Figura 13.13. Modelo polinomial de segundo orden para el ejemplo.
Como se aprecia en la figura 13.13, el coeficiente de determinacin es mayor que en el ajuste li-
neal (0,8733 > 0,8254); por lo tanto el ajuste polinomial de segundo orden, es decir, el ajuste pa-
rablico, describe mejor la tendencia de los sueldos de la muestra.
El lector puede verificar que ajustes polinomiales de mayor grado mejoran ligeramente (una y
dos centsimas para tercer y cuarto orden) el coeficiente de determinacin; pero la lnea de ten-
dencia prcticamente no vara, y la ecuacin polinmica se complica excesivamente.
13.10.3 Regresin lineal con funciones de Excel
Excel cuenta con algunas funciones que calculan individualmente algunos parmetros de la re-
gresin lineal, dentro de las funciones que se despliegan al ejecutar el icono f
x
o al entrar al men Inse-
tar/Funcin.
A continuacin se explica lo que realiza cada una de esas funciones:
COEF.DE.CORREL: calcula el coeficiente de correlacin (r) de un conjunto de datos (x
i
, y
i
).
Al ejecutar esta funcin, Excel presenta un cuadro de dilogo donde se ingresa cada rango de
celdas donde est cada columna de datos. Como este coeficiente slo mide el grado de rela-
cin que hay entre X e Y, Excel no distingue entre los datos de X y los datos de Y.
COEFICIENTE.R2: calcula el coeficiente de determinacin (r
2
) de un conjunto de datos (x
i
,
y
i
). Al ejecutar esta funcin, Excel presenta un cuadro de dilogo donde se ingresa cada rango
de celdas donde est cada columna de datos: una para X y una para Y.
Regresin lineal simple y correlacin 191


ERROR.TIPICO.XY: calcula la desviacin estndar del error (s
Y / X
) de un conjunto de datos
(x
i
, y
i
). Al ejecutar esta funcin, Excel presenta un cuadro de dilogo donde se ingresa cada
rango de celdas donde est cada columna de datos: una para X y una para Y.
ESTIMACION.LINEAL: calcula los parmetros a y b de la recta de regresin. Al ejecutar esta
funcin, Excel presenta un cuadro de dilogo donde se ingresa cada rango de celdas donde es-
t cada columna de datos: una para X y una para Y; presenta adems dos funciones lgicas: en
la primera se define si el parmetro a (interseccin de la recta con el eje Y) puede ser distinto
de cero, y en la segunda se define si se desean todos los parmetros de la regresin lineal. En
ambos casos conviene ingresar VERDADERO. Excel presenta los resultados en una matriz
horizontal de dos celdas. Como esta funcin es matricial, una vez que se seleccionan las dos
celdas donde Excel dar los resultados, se debe digitar controlshiftenter al final de la frmu-
la.
INTERSECCION.EJE: calcula la interseccin de la recta de regresin con el eje Y, es decir, el
parmetro a. Al ejecutar esta funcin, Excel presenta un cuadro de dilogo donde se ingresa
cada rango de celdas donde est cada columna de datos: una para X y una para Y.
PEARSON: calcula el coeficiente de correlacin (r), llamado tambin coeficiente de Pearson
de un conjunto de datos (x
i
, y
i
). Al ejecutar esta funcin, Excel presenta un cuadro de dilogo
donde se ingresa cada rango de celdas donde est cada columna de datos.
PENDIENTE: calcula la pendiente de la recta de regresin, es decir, el parmetro b. Al ejecu-
tar esta funcin, Excel presenta un cuadro de dilogo donde se ingresa cada rango de celdas
donde est cada columna de datos: una para X y una para Y.
TENDENCIA: estima algunos valores de la recta de regresin que corresponden a ciertos va-
lores de X. Al ejecutar esta funcin, Excel presenta un cuadro de dilogo donde se ingresa ca-
da rango de celdas donde est cada columna de datos: una para X y una para Y, y el rango de
celdas donde estn los nuevos valores de X. Excel presenta adems una funcin lgica donde
se define si el parmetro a (interseccin de la recta con el eje Y) puede ser distinto de cero.
Como esta funcin es matricial, una vez que se seleccionan las celdas donde Excel dar los
valores estimados de Y, se debe digitar controlshiftenter al final de la frmula. En la figura
13.14 se muestra la hoja de Excel donde se pueden apreciar las estimaciones hechas con esta
funcin (sueldos de exalumnos) para algunos valores de X (ndices acadmicos acumulados).
Las llaves {} que contienen la frmula aparecen despus de digitar controlshiftenter.

Figura 13.14. Estimaciones con la funcin TENDENCIA

192 Regresin lineal simple y correlacin

Problemas propuestos
1. Se tomaron las estaturas en cm. (X) y los pesos en Kg. (Y) de 15 alumnos de quinto de secundaria
de un colegio.
X 177 160 182 152 167 177 187 165 157 170 165 172 165 178 183
Y 74,3 68 81,6 61,2 70,7 76,2 86,7 72,6 60 71,2 63 74,6 59,2 73,5 87,8
a) Construya un diagrama de dispersin
b) Asuma que hay una relacin lineal entre peso y estatura y determine la ecuacin de la recta de
regresin. Trace la recta sobre el diagrama de dispersin.
Respuesta: y = 61,949 + 0,786x
c) Interprete el valor de la pendiente de la recta.
Respuesta: por cada centmetro ms que se tenga, se espera que el peso aumente 0,786 Kg.
d) Determine el coeficiente de determinacin e interprtelo.
Respuesta: r
2
= 0,7996; el 79,96% de la variacin del peso es explicada por la variacin de la
estatura.
e) Cunto se espera que pese otro alumno de quinto de secundaria, si mide 180 cm?
Respuesta: 79,53 Kg.
2. El dueo de un restaurante quiere averiguar si existe relacin entre los ingresos, en soles, que tiene
durante la semana (de lunes a viernes) y los ingresos del fin de semana (sbado y domingo). A
continuacin se muestran los datos que recopil durante las ltimas 12 semanas.
Lunes a viernes 150 120 133 181 98 125 154 166 170 129 105 192
Sbado y domingo 320 357 390 200 330 341 245 319 236 307 285 194
a) Construya un diagrama de dispersin.
b) Asuma que hay una relacin lineal entre los ingresos durante la semana y el fin de semana y
determine la ecuacin de la recta de regresin. Trace la recta sobre el diagrama de dispersin.
c) Cunto espera ingresar un fin de semana, si durante la semana ingres 165 soles?
d) Se puede afirmar que hay correlacin entre ambas variables? Considere = 0,05.
3. En un experimento sobre mtodos de enseanza de lectura se tomaron los siguientes datos a 36 ni-
os de primer grado de primaria que participaron.
Nivel de vocabulario
previo a primaria
Comprensin
lectora
Nivel de vocabulario
previo a primaria
Comprensin
lectora
28 29 22 28
27 30 18 11
14 10 7 4
23 21 12 7
24 24 9 5
14 11 8 3
14 12 27 25
18 8 24 23
14 7 24 22
10 5 17 10
5 3 12 7
14 6 18 15
30 28 14 6
18 12 18 18
15 9 17 18
20 20 10 6
16 16 16 10
8 2 12 2
a) Construya un diagrama de dispersin
b) Determine la ecuacin de la recta de regresin. Trace la recta sobre el diagrama de dispersin.
c) Interprete el valor de la pendiente de la recta.
Regresin lineal simple y correlacin 193


d) Determine el coeficiente de determinacin e interprtelo.
e) Se puede afirmar que hay correlacin entre ambas variables? Considere = 0,05

4. El encargado del laboratorio de una planta de jugos concentrados quiere determinar una ecuacin
que le pronostique la concentracin de azcar segn el tiempo que permanecen en el evaporador.
En la siguiente tabla se muestra las medidas que tom en su experimentacin.
Tiempo (minutos) 5 10 15 20 25 30 35 40 45 50 55
Grados Brix 22 48 52 57 43 48 34 36 43 58 89
a) Construya un diagrama de dispersin.
b) Asuma que hay una relacin lineal entre el tiempo de evaporacin y la concentracin y deter-
mine la ecuacin de la recta de regresin. Trace la recta sobre el diagrama de dispersin.
Respuesta: y = 31,982 + 0,54x
c) Le parece bueno el ajuste lineal?
Respuesta: No, pues se nota en el diagrama de dispersin y adems el coeficiente de determi-
nacin es r
2
= 0,2724.
d) Proponga otro tipo de ajuste y justifique si es mejor que el lineal.
Respuesta: Es mejor el ajuste polinomial: y = 12,106 + 8,8726x 0,36344x
2
+ 0,0043x
3
. Se
ajusta mucho ms al diagrama de dispersin; r
2
= 0,9637.
5. Una empresa de alquiler de videos quiere pronosticar cuntos videos alquilar de las pelculas que
disponga en las prximas semanas, con base en la cantidad de videos que alquil antes, de deter-
minadas pelculas, y las ganancias obtenidas por dichas pelculas (en millones de dlares). En la
siguiente tabla se muestran los datos de los que dispone.
Ganancia bruta 1,5 18,3 2,4 45,1 1,12 5,75 28,2 12,5 23,4 35,8 9,8 15,4
Videos alquilados 90 220 201 720 55 262 460 360 546 543 245 410

a) Construya un diagrama de dispersin.
b) Determine la ecuacin de la recta de regresin. Trace la recta sobre el diagrama de dispersin.
c) Le parece bueno el ajuste lineal?
d) Pronostique cuntos videos alquilar de una pelcula que tuvo una ganancia de 32 millones de
dlares.
6. En la siguiente tabla se muestra el residuo de cloro (en partes por milln) que hay en una piscina,
unas horas despus de haber sido tratada:
Horas 1 2 3 4 5 6 7 8
Residuo de cloro 1,80 1,75 1,64 1,52 1,44 1,38 1,27 1,10
a) Construya un diagrama de dispersin.
b) Determine la ecuacin de la recta de regresin. Trace la recta sobre el diagrama de dispersin.
c) Determine el coeficiente de correlacin e interprtelo
d) Se puede afirmar que hay correlacin entre ambas variables? Considere = 0,05
7. En la siguiente tabla se expresa el nmero de bacterias por litro que se encontr en un cultivo, se-
gn del nmero de horas que tiene dicho cultivo.
N de horas 0 1 2 3 4 5 6
N de bacterias 32 47 65 92 132 190 275
a) Construya un diagrama de dispersin.
b) Determine la ecuacin de la funcin potencial que ms se ajuste. Trace la curva sobre el dia-
grama de dispersin.
c) Cuntas bacterias se espera encontrar en un cultivo despus de 7 horas?
8. El encargado de hacer el inventario en un almacn debe comparar el nmero de unidades observa-
do para cada artculo con el nmero que figura en el archivo (terico). Compruebe, a partir de 10
194 Regresin lineal simple y correlacin

artculos observados, si el ajuste lineal entre los valores observados y los valores tericos es co-
rrecto.
Artculo N 1 2 3 4 5 6 7 8 9 10
Valor observado 9 14 7 29 45 109 40 238 60 170
Valor terico 10 12 9 27 47 112 36 241 59 167




Anlisis de series de tiempo 195


Captulo 14. Anlisis de series de tiempo
14.1 Introduccin
En cualquier diario o revista econmica es fcil encontrar proyecciones futuras de algunas va-
riables econmicas basndose en datos pasados. Heinz Kohler, autor de Estadstica para negocios y
economa, se refiere sarcsticamente a algunas proyecciones que se podran hacer si se siguiera fiel-
mente la tendencia que se ha venido dando hasta ahora. Por ejemplo, que dada la creciente participa-
cin comercial japonesa, es inevitable su dominio completo de la industria aeroespacial mundial; que
el gasto de salud pblica absorber todo el ingreso nacional; que nuestros nietos quedarn sepultados
por un volumen exponencialmente creciente de propaganda por correo, o que estarn en quiebra por el
mero inters de la deuda nacional; que la poblacin de las crceles incluir toda la poblacin del pas;
que la productividad laboral continuar decreciendo, llegar a cero, y se har negativa; que las reser-
vas de recursos naturales, una vez abundantes, habrn desaparecido hacia mediados del siglo XXI, y
as sucesivamente.
En conclusin, es necesario ser muy prudente cuando se requiera hacer un pronstico basndose
en datos pasados, pues ste puede resultar muy disparatado; pero para muchos es necesario e inevita-
ble tener que pronosticar, por ejemplo: los productores de energa elctrica, los fabricantes de ropa,
calzado o artculos deportivos, escolares; los encargados de los crditos bancarios, los encargados del
presupuesto de un departamento, de toda la empresa, o de un pas, etc.
14.2 Componentes de una serie de tiempo
Una serie de tiempo es un conjunto de datos numricos en orden cronolgico. El anlisis de se-
ries de tiempo es un procedimiento que analiza dichos datos con el propsito de explicar eventos ante-
riores o pronosticar eventos futuros.
Generalmente se analizan series de tiempo de variables econmicas, como las ventas mensuales
de una empresa, la cantidad de unidades vendidas, el precio de un producto o de unas acciones en la
bolsa de valores, las utilidades a fin de ao, etc.
En este captulo se ven los conceptos bsicos del anlisis de series de tiempo, suficientes para
hacer un diagnstico del comportamiento de una variable a lo largo del tiempo.
Una serie de tiempo puede tener cuatro componentes:
Tendencial (T)
Cclica (C)
Estacional (S)
Irregular (I)

Existen varios modelos que describen una serie de tiempo tpica. Los ms usados son:
Modelo multiplicativo: y = T C S I
Modelo aditivo: y = T + C + S + I
Modelos mixtos: y = T C + S I
y = T C I + S
De estos modelos, el modelo multiplicativo es el ms usado, pues se adapta bien a las caracters-
ticas de muchas variables econmicas y financieras.
196 Anlisis de series de tiempo

A continuacin se definen las componentes de una serie de tiempo, adecundolas al modelo
multiplicativo.
14.2.1 Componente tendencial (T)
Generalmente se presenta como un movimiento relativamente suave de una variable, progresi-
vamente hacia arriba o hacia abajo, en un periodo prolongado (varios aos).
Si los datos observados (valores de la variable que se est analizando) crecen o decrecen, se dice
que la tendencia es positiva o negativa, respectivamente.
La tendencia se puede representar, si fuera el caso, mediante una lnea recta (y = a + bt), con lo
cual se podra afirmar, por ejemplo, que los valores de una variable (y) crecen a razn de b unidades
por unidad de tiempo (t).
Por ejemplo, en la figura 14.1 se muestra la lnea recta que representa la tendencia de las ventas
trimestrales de un producto desde el primer trimestre de 1998 hasta el ltimo trimestre de 2004. (Las
ventas reales se muestran en la figura 14.7). Se aprecia que las ventas aumentan a razn de 7,1633
unidades por trimestre (28,65 unidades por ao). A partir de este grfico de tendencia, se hubiera pro-
nosticado unas ventas trimestrales de 262 unidades para el primer trimestre de 2003; sin embargo, esto
no fue as, como se ve en la figura 14.7.
0.00
50.00
100.00
150.00
200.00
250.00
300.00
350.00
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
V
e
n
t
a
s

t
r
i
m
e
s
t
r
a
l
e
s
1998 1999 2000 2001 2002 2003 2004
y = 7.1633x + 119
262.27

Figura 14.1. Componente tendencial
14.2.2 Componente cclica (C)
Se detecta por las alternancias amplias de la variable en estudio (y) alrededor de la tendencia,
que duran de uno a varios aos cada una, y que, por lo general, difieren en duracin y amplitud de un
ciclo al siguiente.
Generalmente dichas alternancias irregulares reflejan las fluctuaciones de la actividad econmi-
ca en general: el ciclo financiero de auge y recesin que afecta a todas las variables en la economa. En
estos ciclos suelen influir fenmenos naturales importantes.
La componente cclica se suele medir como una proporcin de la tendencia. Para una mejor
comprensin, en la figura 14.2 se traza la tendencia como una recta horizontal (para C = 1). La com-
ponente cclica vara alrededor de la tendencia. Por ejemplo, en el primer trimestre de 2003 la recesin
hizo que las ventas sean el 87,8% de lo esperado.
En la figura 14.3 se muestra la componente Tendencial-Cclica para las ventas. Se ve que, de las
262,27 unidades que se esperaba vender para el primer trimestre de 2003, por efecto de la componente
cclica las ventas caen a: 262,270,878 = 230,38 unidades.
Anlisis de series de tiempo 197


0.600
0.700
0.800
0.900
1.000
1.100
1.200
1.300
1.400
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
C
1998 1999 2000 2001 2002 2003 2004
Recesin
Recuperacin
Recesin
Recuperacin
0.878

Figura 14.2. Componente cclica
0
50
100
150
200
250
300
350
400
450
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
V
e
n
t
a
s

t
r
i
m
e
s
t
r
a
l
e
s
1998 1999 2000 2001 2002 2003 2004
Tendencial Tendencial-cclica
230.38

Figura 14.3. Componente tendencial-cclica
En conclusin, definiendo de esta forma la componente cclica, la componente combinada Ten-
dencial-Cclica de la serie de tiempo se encuentra multiplicando (T
i
C
i
) para cualquier instante.
14.2.3 Componente estacional (S)
Se detecta por alternancias de la variable en estudio (y) alrededor de la componente Tendencial-
Cclica, que se repiten en forma predecible dentro de periodos de un ao, de un mes, de una semana,
etc. Generalmente estas variaciones reflejan la influencia del clima y el calendario sobre la actividad
econmica. Se suele hablar de productos estacionales, refirindose a las estaciones del ao, como por
ejemplo: chompas, abrigos, helados, bebidas gaseosas, cerveza, carbn, kerosene, gas, panetones,
adornos de Navidad, tiles escolares, etc.
198 Anlisis de series de tiempo

La componente estacional se suele medir como una proporcin de la componente Tendencial-
Cclica. Para una mejor comprensin, en la figura 14.4 se traza la componente Tendencial-Cclica co-
mo una recta horizontal (para S = 1). La componente estacional vara con regularidad alrededor de la
componente Tendencial-Cclica. Por ejemplo, en el primer trimestre de 2003, por efecto de la compo-
nente estacional las ventas fueron el 81,7% de lo esperado.
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
S
1998 1999 2000 2001 2002 2003 2004
0.817

Figura 14.4. Componente estacional
0
50
100
150
200
250
300
350
400
450
500
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
V
e
n
t
a
s

t
r
i
m
e
s
t
r
a
l
e
s
1998 1999 2000 2001 2002 2003 2004
Tendencial
Tendencial-cclica
Tendencial-cclica-estacional
188,32

Figura 14.5. Componente Tendencial-Cclica-Estacional
En la figura 14.5 se muestra la componente Tendencial-Cclica-Estacional (a trazo continuo) pa-
ra las ventas. Se ve que, de las 230,38 unidades que se hubieran vendido para el primer trimestre de
2003, por efecto de la componente estacional las ventas caen a: 230,380,817 = 188,32 unidades.
En conclusin, definiendo de esta forma la componente estacional, la componente Tendencial-
Cclica-Estacional se encuentra multiplicando (T
i
C
i
S
i
) para cualquier instante.
Anlisis de series de tiempo 199


14.2.4 Componente irregular o aleatoria (I)
Se detecta por movimientos aleatorios de la variable en estudio alrededor de la componente
Tendencia-Cclica-Estacional. Generalmente estos movimientos se deben a factores impredecibles y
probablemente no recurrentes, como por ejemplo: modas, huelgas, desastres naturales (no cclicos),
guerras, etc.
Esta componente se expresa como una proporcin de la componente Tendencial-Cclica-
Estacional que, en la figura 14.6 se muestra como una recta horizontal (para I = 1).
0.860
0.880
0.900
0.920
0.940
0.960
0.980
1.000
1.020
1.040
1.060
1.080
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
I
1998 1999 2000 2001 2002 2003 2004
0.972

Figura 14.6. Componente irregular
En la figura 14.7 se muestra la componente Tendencial-Cclica-Estacional-Irregular, es decir, las
ventas reales del producto (y). Se ve que, de las 188,32 unidades que se esperaba vender para el primer
trimestre de 2003, por efecto de la componente irregular las ventas caen a: 188,320,972 = 183 unida-
des.
0
50
100
150
200
250
300
350
400
450
500
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
V
e
n
t
a
s

t
r
i
m
e
s
t
r
a
l
e
s
1998 1999 2000 2001 2002 2003 2004
183

Figura 14.7. Serie de tiempo: componente Tendencial-Cclica-Estacional-Irregular
200 Anlisis de series de tiempo

En conclusin, definiendo de esta forma la componente irregular, los valores de la variable en
estudio (y) se encuentran multiplicando (T
i
C
i
S
i
I
i
) para cualquier instante i.
14.3 Descomposicin de series de tiempo
Para analizar una serie de tiempo, ya sea con el propsito de pronosticar algunos valores de la
variable en estudio o de estudiar su comportamiento pasado, es necesario conocer cada una de sus
componentes; pero generalmente se dispone de un conjunto de datos a lo largo del tiempo, es decir, de
una serie de tiempo con todas sus componentes, y se hace necesario descomponer dicha serie.
14.3.1 Suavizacin de la serie de tiempo.
Para eliminar las fluctuaciones de una serie de tiempo se suelen emplear dos mtodos de suavi-
zacin: media mvil y suavizacin exponencial. Estos mtodos permiten aislar algunas componentes
de la serie de tiempo.
Medias mviles:
Se obtiene una serie de medias mviles calculando sucesivamente medias aritmticas de grupos
sobrepuestos de M valores de una serie de tiempo.
Por ejemplo, si M = 3:

3
3 2 1
2
y y y
y
+ +
= ;
3
4 3 2
3
y y y
y
+ +
= ; ...
3
1 1 +
+ +
=
t t t
t
y y y
y
Ntese que los subndices de las medias mviles coinciden con el subndice central de los datos.
Cuando M es impar no hay mayor complicacin en el clculo de las medias mviles; pero si M
es par, hace falta ajustar (centrar) las medias mviles obtenidas para conseguir valores de estas medias
mviles en los mismos tiempos en que estn los datos originales (y). En la tabla 14.1 se muestra parte
de una serie de tiempo donde se calculan las medias mviles con M = 4. Como se aprecia, la media
mvil de los primeros cuatro valores (132,00) se ha colocado entre los tiempos 2 y 3, la media mvil
de los siguientes cuatro valores (133,25) se ha colocado entre los tiempos 3 y 4, y as sucesivamente.
Para que estas medias mviles correspondan con los tiempos definidos, se calculan las medias mviles
de las medias mviles, pero esta vez con M = 2. As se obtienen las medias mviles ajustadas.
Tabla 14.1 Cculo de medias mviles con ajuste
Tiempo Y
Medias mviles
(M = 4)
Medias mviles
ajustadas
1 96

2 137
132,00
3 165 132,63
133,25
4 130 131,00
128,75
5 101 127,88
127,00
6 119 128,75
130,50
7 158

8 144
El principal inconveniente de este mtodo de suavizacin es que no se tiene un valor suavizado
correspondiente a cada valor de la serie original. Se pierden algunos valores al principio y al final de la
serie. Por ejemplo, para la serie de tiempos de la tabla 14.1 se han perdido cuatro datos: dos al princi-
pio y dos al final. Esta desventaja es poco notoria cuando se cuenta con una gran cantidad de datos.
Anlisis de series de tiempo 201


Suavizacin exponencial:
Es un procedimiento que genera pronsticos auto-corregidos por medio de un mecanismo de
ajuste que va corrigiendo los errores de pronstico anteriores. Este mtodo hace el pronstico del si-
guiente periodo f
i+1
a partir del valor real actual y
i
y del pronstico actual f
i
, empleando una constante
de suavizacin , de la siguiente manera:
f
i+1
= y
i
+ (1 ) f
i

El parmetro es un valor que est entre cero y uno, y se escoge para indicar el peso que se
desee dar al valor ms reciente de la serie de tiempo. Mientras mayor sea , ms peso se le da a la ex-
periencia actual y menos a la pasada.
14.3.2 Aislamiento de las componentes de la serie de tiempo.
El mtodo de las medias mviles, que suele eliminar las fluctuaciones irregulares, puede elimi-
nar tambin la componente estacional si se emplea M igual al nmero estaciones (una estacin puede
ser una semana, un mes, o un trimestre), con lo cual las medias mviles contendran slo las compo-
nentes cclica y tendencial.
Se podra eliminar tambin la componente cclica empleando un valor de M mayor que el nme-
ro de estaciones; pero esto se dificulta por el hecho de que la duracin de los ciclos que puede tener
una serie de tiempos no es la misma. Si se tuviesen datos suficientes (ms de 20 aos) se podra redu-
cir considerablemente la componente cclica suavizando la serie de tiempo original con M igual a la
duracin del ciclo ms duradero. De esta forma se eliminaran tres componentes: irregular, estacional
y cclica, con lo cual se obtendra la componente tendencial.
Si no se cuenta con la suficiente cantidad de datos como para emplear un valor de M muy gran-
de, que es lo ms probable, conviene calcular medias mviles con un valor de M mayor que el nmero
de estaciones; as se eliminar una parte de la componente cclica. Estas medias mviles estarn mu-
cho ms suavizadas, es decir, se parecern mucho ms a la tendencia. Entonces, empleando el mtodo
de los mnimos cuadrados, se puede determinar la tendencia, que puede ser una recta o una funcin no
lineal. Esto se puede hacer con la ayuda de Excel, tal como se vio en los apartados 13.10.1 y 13.10.2.
En conclusin, para aislar las componentes tendencial y cclica se siguen los siguientes pasos:
1. Construir una serie de medias mviles con M mayor que el nmero de estaciones. Por ejem-
plo, si se tienen datos mensuales, M > 12; si se tienen datos trimestrales, M > 4.
2. Si la tendencia es lineal, hallar la recta de mnimos cuadrados a partir de la serie hallada. En
caso contrario, hallar la lnea de tendencia que mejor se ajuste a esta serie de medias mvi-
les.
3. Aislar la componente cclica (C), dividiendo los valores T
i
C
i
/ T
i
.
Para aislar las componentes estacional e irregular se siguen los siguientes pasos.
1. Construir una serie de medias mviles con M igual al nmero de estaciones. Por ejemplo, si
se tienen datos mensuales, M = 12; si se tienen datos trimestrales, M = 4. Esta serie conten-
dr slo las componentes Tendencial-Cclica (TC).
2. Aislar la componente SI, dividiendo y
i
/(T
i
C
i
).
3. Aislar la componente estacional (S), promediando los valores SI de cada estacin. As, por
ejemplo, si hay cuatro estaciones (M = 4), se hallarn cuatro promedios SI; uno para cada
estacin.
4. Ajustar la componente estacional (S), considerando que las M componentes estacionales de-
ben promediar uno, y por lo tanto deben sumar M en vez de . Para conseguirlo, cada S
hallado debe multiplicarse por M/.
5. Aislar la componente irregular (I) dividiendo S
i
I
i
/ S
i
.
202 Anlisis de series de tiempo

14.4 Pronstico
Se denomina pronstico a una afirmacin que se hace sobre un evento futuro. Los pronsticos se
suelen hacer basndose en datos que se deducen del anlisis de series de tiempo. Conociendo la lnea
de tendencia, se puede pronosticar por extrapolacin (prolongando dicha lnea tendencial), y cono-
ciendo la componente estacional, se puede ajustar dicho pronstico multiplicando la componente ten-
dencial por la componente estacional.
En la sociedad actual es imprescindible pronosticar. Los gobernantes de un pas siempre estn
pronosticando la inflacin, el producto bruto interno, el desempleo, la recaudacin de impuestos, etc.,
para plantear adecuadamente las polticas de gobierno. Los empresarios siempre estn pronosticando
las ventas, la demanda, etc., con el propsito de tomar las decisiones oportunas que los lleven a opti-
mizar sus beneficios.
14.5 Anlisis del comportamiento de una serie de tiempo
Muchas veces conviene aislar una componente de una serie de tiempo para hacer un anlisis del
comportamiento de la variable en estudio sin considerar dicha componente, ya sea la estacional, la c-
clica o la irregular. Esto permitir evaluar el comportamiento de dicha variable sin la influencia de una
u otra componente.
Una serie desestacionalizada es aquella que contiene todas las componentes excepto la estacio-
nal. Sirve para sincerar los valores que toma la serie de tiempo. Por ejemplo, el gerente de una empre-
sa que produce bebidas gaseosas no tendra que entusiasmarse mucho si las ventas en el verano estn
por encima de lo esperado por la tendencia. Para desestacionalizar una serie de tiempo basta con divi-
dir cada valor de la variable en estudio entre la componente estacional: y
i
/ S
i
.
14.6 Anlisis de series de tiempo en Excel
Aunque Excel no cuenta con una herramienta que efecte el anlisis completo de una serie de
tiempo, s cuenta con los elementos suficientes para realizarlo paso a paso, de acuerdo al propsito que
se plantee.
14.6.1 Anlisis de series de tiempo con medias mviles
Para calcular las medias mviles en Excel, se debe ingresar al men Herramientas/Anlisis de
datos/ Media mvil. Excel abre el cuadro de dilogo que se muestra en la figura 14.8, donde ya se han
ingresado los datos para el ejemplo que se desarrolla a continuacin. Excel le denomina Intervalo al
valor de M que se considera al calcular las medias mviles.

Figura 14.8. Cuadro de dilogo de medias mviles
Anlisis de series de tiempo 203


Una vez que se han ingresado los datos y se acepta, Excel coloca las medias mviles en una co-
lumna que se inicia donde se defini el rango de salida. El nico inconveniente de este resultado es
que las medias mviles no las centra respecto a los datos de la serie de tiempo. El usuario debe trasla-
dar estas medias mviles a la posicin central. Si M es par, ser necesario hallar las medias mviles
ajustadas, a partir del resultado obtenido, considerando esta vez M = 2.
Con la ayuda de Excel se pueden aislar las cuatro componentes para hacer posteriormente algu-
nos pronsticos o anlisis de la serie de tiempos, como se muestra en el siguiente ejemplo.
Ejemplo:
Una empresa que se dedica a la elaboracin de cierto accesorio para autos ha registrado las si-
guientes ventas (en unidades) durante los ltimos aos:
Trimestre 1998 1999 2000 2001 2002 2003 2004
1 96 101 133 214 211 183 264
2 137 119 199 258 221 250 348
3 165 158 283 310 249 328 430
4 130 144 260 259 200 305 415
En primer lugar se calculan las medias mviles con M = 4 y luego las medias mviles ajustadas.
Despus de ingresar los datos al cuadro de dilogo (figura 14.8), Excel da el resultado en la co-
lumna D. Luego de ingresar los datos de la columna D y calcular nuevamente medias mviles,
esta vez con M = 2, Excel muestra el resultado de la siguiente tabla, donde los valores de la co-
lumna E han sido centrados por el usuario, pues Excel los coloca descentrados.
A B C D E
1
2


Trimestre
Ventas
(Y)
P.M.
P.M ajustado
(TC)
3 1998 1 96
4 2 137
5 3 165 132.00 132.63
6 4 130 133.25 131.00
7 1999 1 101 128.75 127.88
8 2 119 127.00 128.75
9 3 158 130.50 134.50
10 4 144 138.50 148.50
11 2000 1 133 158.50 174.13
12 2 199 189.75 204.25
13 3 283 218.75 228.88
14 4 260 239.00 246.38
15 2001 1 214 253.75 257.13
16 2 258 260.50 260.38
17 3 310 260.25 259.88
18 4 259 259.50 254.88
19 2002 1 211 250.25 242.63
20 2 221 235.00 227.63
21 3 249 220.25 216.75
22 4 200 213.25 216.88
23 2003 1 183 220.50 230.38
24 2 250 240.25 253.38
25 3 328 266.50 276.63
26 4 305 286.75 299.00
27 2004 1 264 311.25 324.00
28 2 348 336.75 350.50
29 3 430 364.25
30 4
Ntese que las medias mviles de la columna D no pueden colocarse en la posicin que les co-
rrespondera (sobre las lneas) pues esto no es posible en Excel.
204 Anlisis de series de tiempo

En la figura 14.9 se muestra el grfico de las medias mviles ajustadas sobre la serie de tiempo.
0
50
100
150
200
250
300
350
400
450
500
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
V
e
n
t
a
s

t
r
i
m
e
s
t
r
a
l
e
s
1998 1999 2000 2001 2002 2003 2004

Figura 14.9. Medias mviles para M = 4.
Las medias mviles de la columna E son las componentes T
i
C
i
. A continuacin se aslan las
componentes S
i
I
i
y posteriormente las componentes S
i
y las I
i
, siguiendo los pasos que se deta-
llan en la pgina 201. En la siguiente tabla se muestran los resultados:
A B C D E F G H
1
2


Trimestre
Ventas
(Y)
P.M.
P.M ajustado
(TC)
SxI =
Y/(TC)
SxI
promedio
S
3 1998 1 96 0,811 0,817
4 2 137 0,973 0,981
5 3 165 132,00 132,63 1,244 1,187 1,197
6 4 130 133,25 131,00 0,992 0,996 1,004
7 1999 1 101 128,75 127,88 0,790 0,817
8 2 119 127,00 128,75 0,924 0,981
9 3 158 130,50 134,50 1,175 1,197
10 4 144 138,50 148,50 0,970 1,004
11 2000 1 133 158,50 174,13 0,764 0,817
12 2 199 189,75 204,25 0,974 0,981
13 3 283 218,75 228,88 1,236 1,197
14 4 260 239,00 246,38 1,055 1,004
15 2001 1 214 253,75 257,13 0,832 0,817
16 2 258 260,50 260,38 0,991 0,981
17 3 310 260,25 259,88 1,193 1,197
18 4 259 259,50 254,88 1,016 1,004
19 2002 1 211 250,25 242,63 0,870 0,817
20 2 221 235,00 227,63 0,971 0,981
21 3 249 220,25 216,75 1,149 1,197
22 4 200 213,25 216,88 0,922 1,004
23 2003 1 183 220,50 230,38 0,794 0,817
24 2 250 240,25 253,38 0,987 0,981
25 3 328 266,50 276,63 1,186 1,197
26 4 305 286,75 299,00 1,020 1,004
27 2004 1 264 311,25 324,00 0,815 0,817
28 2 348 336,75 350,50 0,993 0,981
29 3 430 364,25 1,197
30 4 415 1,004
Anlisis de series de tiempo 205


Ntese que en la columna H se han repetido sucesivamente las cuatro componentes estacionales
halladas en la columna G.
Como ayuda al lector, a continuacin se muestran algunos ejemplos de las operaciones realiza-
das para hallar SI promedio y S:
Para calcular la componente SI promedio del primer trimestre del ao (celda G3):
=PROMEDIO(F3,F7,F11,F15,F19,F23,F27).
Para calcular la componente S del primer trimestre del ao (celda H3):
=G3*4/SUMA(G$3:G$6)
Luego puede aislarse fcilmente la componente I, dividiendo las celdas de la columna F entre
las celdas de la columna H.
Para hallar la lnea de tendencia (componente tendencial) es necesario hallar promedios mviles
con un valor de M suficientemente grande. Por ejemplo, para M = 9 se obtiene una serie que se
ajusta mucho a una recta, como se puede apreciar en la figura 14.10. Para hallar esta recta se
traza en primer lugar el diagrama de dispersin de la serie recientemente obtenida, y luego bas-
tar con seleccionar cualquier punto, hacer clic con el botn derecho del mouse y ejecutar el
comando Agregar lnea de tendencia, como ya se ha explicado en 13.10.1
y = 7.1633x + 119
0
50
100
150
200
250
300
350
400
450
500
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
V
e
n
t
a
s

t
r
i
m
e
s
t
r
a
l
e
s
1998 1999 2000 2001 2002 2003 2004
Serie de tiempo suavizada
con promedio mvil de 9 trimestres

Figura 14.10. Determinacin de la recta tendencial
Si se opta por hallar media mviles con un valor de M 9, se obtendr una recta tendencial evi-
dentemente distinta; pero muy aproximada a la que se acaba de obtener. Como se trata de esti-
mar la recta tendencial, las pequeas diferencias que se obtengan entre una u otra opcin care-
cen de importancia.
Una vez que se ha obtenido la componente tendencial, es fcil hallar la componente cclica, di-
vidiendo las celdas de la columna E entre las celdas donde se colocan los valores T
i
.
Los grficos de las cuatro componentes de este problema corresponden a los que se muestran en
las figuras 14.1; 14.2; 14.4 y 14.6. Vale la pena ver el grfico de la componente SI, que se
muestra en la figura 14.11. Se aprecia claramente cmo la componente irregular afecta a la
componente estacional. Se entiende as que para estimar las componentes estacionales de cada
trimestre haya que promediar las componentes los respectivos valores de SI de todos los tri-
mestres.

206 Anlisis de series de tiempo

0.600
0.700
0.800
0.900
1.000
1.100
1.200
1.300
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
S
x
I
1998 1999 2000 2001 2002 2003 2004

Figura 14.11. Componente SI
14.6.2 Suavizacin exponencial
Para hacer la suavizacin exponencial en Excel, se debe ingresar al men Herramientas/Anlisis
de datos/ Suavizacin exponencial. Excel abre el cuadro de dilogo que se muestra en la figura 14.11,
donde ya se han ingresado los datos del ejemplo que viene desarrollando.

Figura 14.11. Cuadro de dilogo para la suavizacin exponencial
Es necesario aclarar que el factor de suavizacin que considera Excel es 1 . Adems, si se
marca la opcin Crear grfico, Excel traza la serie suavizada con un desfase respecto a la serie de
tiempo. Es necesario entonces adelantar la serie suavizada una unidad de tiempo, como se hace en el
siguiente ejemplo.
Se va a hacer la suavizacin exponencial del mismo problema del apartado anterior, con = 0,5.
A continuacin se repite el texto para comodidad del lector.
Ejemplo:
Una empresa que se dedica a la elaboracin de cierto accesorio para autos ha registrado las si-
guientes ventas (en unidades) durante los ltimos aos:
Anlisis de series de tiempo 207


Trimestre 1998 1999 2000 2001 2002 2003 2004
1 96 101 133 214 211 183 264
2 137 119 199 258 221 250 348
3 165 158 283 310 249 328 430
4 130 144 260 259 200 305 415
Entrando al men Herramientas/Anlisis de datos/ Suavizacin exponencial aparece el cuadro
de dilogo de la figura 14.11; aceptando los datos que se han ingresado Excel da el resultado que
se muestra en la figura 14.12.
96.00
116.50
140.75
135.38
118.19
118.59
138.30
141.15
137.07
168.04
225.52
242.76
228.38
243.19
276.59
267.80
239.40
230.20
239.60
219.80
201.40
225.70
276.85
290.92
277.46
312.73
371.37
Suavizacin exponencial
0
50
100
150
200
250
300
350
400
450
500
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Punto de datos
V
a
l
o
r
Real
Pronstico

Figura 14.12. Suavizacin exponencial con = 0,5
208 Anlisis de series de tiempo

Problemas propuestos
1. Un pas registr las siguientes entradas de turistas (en millones) en el periodo 1997-2003:
1997 1998 1999 2000 2001 2002 2003
Trimestre 1 2,5 3,6 3,8 4,6 4,3 4,7 5,4
Trimestre 2 3,2 3,9 4,5 5,9 4,1 4,9 5,9
Trimestre 3 3,7 4,8 5,7 7,8 5,2 5,5 7,3
Trimestre 4 3,4 4,1 5,2 6,7 3,9 5,0 6,6
Haga un pronstico de la entrada de turistas que se espera para los cuatro trimestres del ao 2004.
Sugerencia: estime la recta tendencial a partir de las medias mviles con M = 9.
Respuesta: 5,27; 5,70; 6,96; 5,92.
2. Con qu componente de una serie de tiempos asociara cada uno de los siguientes hechos?
a) Un aumento en las ventas de tiles de escritorio durante el mes de marzo.
b) Un incremento de la produccin de mango debido a la incorporacin de nueva tecnologa.
c) Una huelga de trabajadores del sector agrario.
d) Una disminucin en el volumen de construccin de viviendas durante 2 aos.
3. La siguiente tabla muestra el producto bruto interno (PBI) del Per, en miles de millones de dla-
res. Trace una recta tendencial sobre la serie de promedios mviles de 7 aos y estime el producto
bruto interno para los aos 2003 y 2004.
Ao PBI Ao PBI Ao PBI Ao PBI
1981 25,4 1991 42,2 2001 72,3
1982 25,9 1992 41,4 2002 72,5
1983 19,9 1993 40,1
1974 12,2 1984 20,8 1994 49,5
1975 15,8 1985 18,3 1995 58,7
1976 15,5 1986 26,2 1996 61,2
1977 13,1 1987 35,7 1997 65,3
1978 11,9 1988 28,8 1998 62,8
1979 15,6 1989 33,3 1999 65,1
1980 20,2 1990 34,1 2000 72,1

4. Las ventas de un producto durante los ltimos aos se expresan en la siguiente tabla:
1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
1er trimestre 102 96 85 83 84 102 109 115 118 116 120
2do trimestre 111 105 94 90 89 106 119 122 126 123 131
3er trimestre 118 109 100 103 104 114 124 134 136 131 142
4to trimestre 111 99 91 97 96 107 120 127 121 120 132
Trace un grfico de cada componente de esta serie. Haga un pronstico para el ao 2004. Sugeren-
cia: estime la recta tendencial a partir de las medias mviles con M = 11
5. En la siguiente tabla se muestran las ventas del ao pasado de una empresa, y las componentes de
la serie de tiempo, aplicando el modelo multiplicativo.
a) Determine los valores faltantes.
b) Cunto varan las ventas anualmente?
c) Haga un comentario breve sobre la economa del pas durante el ao pasado.
d) Qu pronstico hara para los cuatro trimestres de este ao?
e) Haga un anlisis de las ventas del ao pasado.
Trimestre Ventas reales C.Tendencial C.Cclica C.Estacional C.Irregular
1 65 823,00 65 000 1,126 1,173
2 42 555,00 70 000 0,937 0,984
3 85 120,50 75 000 1
4 80 000 0,955 0,579 1,020
Anlisis de series de tiempo 209


6. Suponga que el CONAM (Consejo Nacional del Ambiente) ha registrado los siguientes niveles de
contaminacin por mercurio frente a las costas de Paita durante los ltimos cuatro aos.
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
2001 0,4 0,5 0,4 1,0 0,9 1,0 0,7 0,6 0,6 0,7 0,7 0,4
2002 0,3 0,4 0,3 0,7 0,8 0,7 0,5 0,6 0,5 0,6 0,5 0,4
2003 0,2 0,2 0,3 0,5 0,6 0,5 0,5 0,4 0,5 0,3 0,3 0,2
2004 0,2 0,2 0,3 0,6 0,6 0,5 0,5 0,3 0,4 0,3 0,4 0,2
Determine la componente estacional (para los 12 meses) y d una interpretacin.
Respuesta:
0,499 0,567 0,682 1,371 1,542 1,326 1,119 1,060 1,093 1,048 1,000 0,693
En diciembre, enero, febrero y marzo la contaminacin baja, especialmente en enero, por efecto de
la estacin; probablemente en esos meses las fbricas ubicadas en el litoral operan menos, hay
menos llegadas de buques, etc. En abril, mayo y junio la contaminacin aumenta, especialmente
en mayo, probablemente porque aumentan las actividades mencionadas.
7. El dueo de un restaurante ubicado junto a una universidad ha anotado los ingresos, en soles, du-
rante los tres primeros aos de funcionamiento:
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
2002 3210 3548 5893 8251 8469 5746 6583 7360 8214 8786 7056 6415
2003 4120 4598 6155 8961 9673 6028 6740 7695 8420 8284 7654 7158
2004 5244 6828 6238 9981 10687 7452 6940 9457 9214 10426 8493 8469
Haga un pronstico para los 6 primeros meses del ao 2005.
8. Un vendedor de autos usados ha registrado las siguientes ventas (en miles de soles) durante el l-
timo ao:
Mes Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Ventas 205 192 170 214 220 198 230 232 240 255 310 296
Componente estacional 0,95 0,74 0,52 0,86 0,96 1,02 1,05 1,08 1,12 1,16 1,22 1,32
Determine las ventas desestacionalizadas.
9. En la siguiente tabla se ha registrado el nmero de das soleados al mes que hubo en una ciudad,
durante 6 aos.
1996 1997 1998 1999 2000 2001 2002
Enero 30 26 14 26 25 25 25
Febrero 27 28 16 25 24 25 26
Marzo 29 28 12 18 24 16 20
Abril 27 29 16 24 26 20 21
Mayo 28 28 22 25 22 21 22
Junio 26 26 25 26 20 19 24
Julio 22 22 23 22 22 20 22
Agosto 20 20 18 20 17 18 19
Septiembre 24 24 21 24 22 23 23
Octubre 26 26 23 26 24 25 23
Noviembre 28 21 25 26 25 25 22
Diciembre 29 19 26 23 27 26 24
a) Determine las componentes estacionales.
b) Trace un grfico con la componente cclica y comntelo.
10. Con qu componente de una serie de tiempos asociara cada uno de los siguientes hechos?
a) Un aumento en las ventas de un producto debido al cierre de la principal empresa competido-
ra.
210 Anlisis de series de tiempo

b) Una disminucin en las ventas de un producto debido a la globalizacin.
c) Un aumento en las ventas de un producto debido a una crisis petrolera durante 2 aos.
d) Una disminucin en las ventas de un producto debido al cierre de la frontera con un pas veci-
no durante un mes, por un problema limtrofe.

Herramientas estadsticas para mejorar la calidad de los procesos


211
Captulo 15. Herramientas estadsticas para mejorar
la calidad de los procesos
15.1 Mejora de la calidad
15.1.1 Definiciones
Aunque existen muchas definiciones de calidad, quizs la ms simple y certera sea: Calidad es
lo que el cliente define como tal.
La calidad es un objeto mvil; siempre hay que estarla buscando. Nunca se podr afirmar que ya
se ha conseguido la mxima calidad posible, pues los clientes siempre estn cambiando de parecer, de
gusto, etc. Por lo tanto siempre hay que estar averiguando qu tan satisfechos estn los clientes con el
producto o servicio que se les brinda. Se concluye entonces que para conseguir la calidad se debe estar
en un proceso de mejora continua.
La calidad siempre se asocia con los defectos; si hay muy pocos defectos se dice que hay cali-
dad. Como los defectos siempre estarn presentes, se intenta disminuirlos; y para esto es fundamental
preguntarse: por qu ocurren los defectos?
Los defectos ocurren por una causa fundamental: la variabilidad en las personas, en los mate-
riales, en las mquinas y herramientas, en el medio ambiente, en la inspeccin, etc.
Para disminuir los defectos hay que buscar las causas. stas pueden ser:
Causas asignables: cuando se les puede atribuir a alguien o a algo (personas, materiales,
mquinas, herramientas, medio ambiente, inspectores, etc).
Causas no asignables: cuando la variabilidad se debe al azar. Se dice que es una variabili-
dad inherente a las personas, materiales, mquinas, herramientas, medio ambiente, inspecto-
res, etc. Generalmente es imposible evitar estas causas de forma econmica.
A la determinacin de las causas de los defectos en un proceso se le llama diagnstico. Para
hacer un buen diagnstico se puede recurrir a la intuicin de un experto, a la experimentacin o al an-
lisis estadstico de los datos. Aunque la ltima opcin es generalmente la ms acertada, no siempre es
aprovechada porque los encargados de tomar las decisiones en las empresas no creen en su efectivi-
dad.
Para poder creer que las herramientas estadsticas son efectivas es necesario aceptar que siempre
hay variabilidad, y que esta variabilidad siempre es posible medirla, y ms si se debe a causas asigna-
bles. As, evitando las causas asignables, se disminuye la variabilidad, y por lo tanto los defectos.
15.1.2 Breve historia de la calidad
Desde finales del siglo XIX, la gestin de la calidad ha pasado por cuatro grandes etapas:
Inspeccin de la calidad.
Control de la calidad.
Aseguramiento de la calidad.
Gestin de la calidad total.
La gestin de la calidad ha ido evolucionando hacia una visin cada vez ms global. Las etapas
Herramientas estadsticas para mejorar la calidad de los procesos

212
ms recientes abarcan las anteriores; de esta manera, por ejemplo, el aseguramiento de la calidad abar-
ca el control de la calidad y la gestin de la calidad total abarca tambin el aseguramiento de la cali-
dad.
Tradicionalmente la palabra calidad ha estado asociada a la calidad del producto. El objetivo que
se persegua era evitar que un producto defectuoso llegara al cliente. Para ello se efectuaba una ins-
peccin al 100% de todos los productos, separando los productos buenos de los defectuosos. La cali-
dad era un problema de los inspectores.
Al aumentar los volmenes de produccin, la inspeccin masiva era cada vez ms difcil, costo-
sa y menos fiable. Se pas de inspeccionar el 100 % de los productos terminados a controlar los proce-
sos. As, Shewart (1931) propuso el Control estadstico de procesos, CEP.
Pero esta forma de entender la calidad era reactiva, no prevena los errores; nicamente los de-
tectaba cuando ya haban aparecido. Entonces los especialistas centraron sus esfuerzos en disear m-
todos de trabajo que permitieran evitar los errores antes de que stos ocurrieran. ste es el enfoque del
aseguramiento de la calidad, que pretende proporcionar a los clientes la confianza de que un produc-
to o servicio satisface los requisitos de calidad. Pero este enfoque, aunque ya es proactivo, est limita-
do al mbito interno de la empresa.
La gestin de la calidad total, adems de garantizar que los productos o servicios satisfacen los
requisitos de la calidad, pretende involucrar a todos los miembros de la organizacin en la mejora de
todos los procesos. Este sistema de gestin de la calidad ha sido mejorado por Seis Sigma, que se ha
preocupado por mejorar continuamente el nivel de satisfaccin de los clientes, entre otras cosas.
A continuacin se presentan las herramientas estadsticas bsicas ms empleadas para el mejo-
ramiento de la calidad de los procesos, ya sean productivos o de servicio.
15.2 Interpretacin de histogramas y medicin de la capacidad de un proceso
15.2.1 Interpretacin de histogramas.
A continuacin se muestran diversos tipos de histogramas:
Histograma general: la media del histograma est en el centro
del rango de datos. La frecuencia es mayor en el centro y dismi-
nuye gradualmente hacia los extremos, ajustndose a una distri-
bucin normal. Se presenta en casi todos los casos en que se re-
presenta una medida en un proceso productivo.
Histograma con sesgo positivo o negativo: tie-
ne forma asimtrica. La media del histograma
est a la izquierda (o derecha) y la frecuencia
disminuye lentamente hacia la derecha (o iz-
quierda). Se presenta cuando el lmite inferior (o
superior) se controla tericamente o por un valor
de especificacin; o cuando no se presentan va-
lores inferiores (o superiores) a cierto lmite.
Histograma con precipicio: es similar al tipo con sesgo, pero
con un descenso ms brusco hacia un lado. Este tipo se presenta
frecuentemente cuando se ha hecho una inspeccin al 100% y se
han separado elementos que no cumplen con el lmite inferior o
superior de especificacin del producto.
Histograma multimodal: hace zigzag sobre la forma general. Se
presenta cuando no se ha elegido correctamente la longitud de
clase y el nmero de clases, ya sea porque el nmero de datos no
es suficiente para trazar el histograma (n < 50) o se han conside-
rado muchas clases para el nmero de datos que hay.
Sesgo positivo Sesgo negativo
General
Precipicio
Multimodal
Herramientas estadsticas para mejorar la calidad de los procesos


213
Histograma bimodal: se ven dos histogramas generales, uno
junto al otro. Se presenta cuando se mezclan dos distribuciones
con medias muy diferentes; por ejemplo cuando en el proceso
hay dos turnos, o dos mquinas, o dos operarios, etc. que traba-
jan de manera distinta.
Histograma con pico aislado: hay un pequeo pico, aislado de
un histograma de tipo general. Se presenta cuando se incluye una
pequea cantidad de datos con una distribucin diferente, ya sea
por una anormalidad en el proceso, por error de medicin o por
inclusin de datos de otro proceso.
Histograma planicie: las frecuencias forman una planicie. Se
presenta cuando se mezclan varios histogramas que tienen que
tienen medias diferentes y distribuciones diferentes, de tal mane-
ra que el conjunto forma la planicie.

15.2.2 Capacidad de un proceso
Se denominan especificaciones de un producto al rango de medidas dentro del cual se dice que
el producto es conforme. Por ejemplo, las especificaciones del dimetro de los pistones que se fabrican
en un taller son: 5,000 0,005 cm. A la media que se especifica se le llama valor nominal, y a la me-
dida entre la media y los lmites de especificacin (LEI y LES) se le denomina tolerancia. En este
ejemplo, la tolerancia es 0,005 cm.
Si se conocen las especificaciones de un producto, es posible medir si el proceso es capaz de
cumplir con dichas especificaciones.
Si se cuenta con un histograma, se pueden trazar dos lneas verticales sobre ste, correspondien-
tes a las medidas de las especificaciones. As se podr observar si el histograma se encuentra razona-
blemente entre dichos lmites. En la figura 15.1 se describen dos casos tpicos donde se cumplen las
especificaciones del producto. En el primer histograma se ve que el proceso es capaz de cumplir con
las especificaciones con holgura; pero en el segundo las cumple ajustadamente.
LEI LES LEI LES

Figura 15.1. Procesos capaces de cumplir con las especificaciones
En la figura 15.2 se describen dos casos tpicos donde no se cumplen las especificaciones del
producto.
LEI LES LEI LES

Figura 15.2. Procesos no capaces de cumplir con las especificaciones
Bimodal
Pico aislado
Planicie
Herramientas estadsticas para mejorar la calidad de los procesos

214
En el primer caso se ve que el proceso no es capaz de cumplir con las especificaciones porque
est descentrado. En el segundo caso tampoco cumple con las especificaciones, pero esta vez porque
el proceso tiene mucha variabilidad.
Si se conocen la media y la desviacin estndar de un conjunto de datos obtenidos en un proce-
so, se puede calcular el ndice de capacidad del proceso:

6
LEI LES
C
p

=
Como se ve, un ndice de capacidad exactamente igual a 1 (segundo caso de la figura 15.1) indi-
car que el proceso es capaz, pero que est a punto de no serlo.
Si la media del conjunto de datos no coincide con el punto medio de los lmites de especifica-
cin, es decir, si el proceso est descentrado respecto a las especificaciones, conviene emplear el si-
guiente ndice de capacidad:

6
2 ) ( d LEI LES
C
pk

=
En la figura 15.3 se aprecia que d representa la distancia entre la media del conjunto de datos y
el centro de los lmites de especificacin:

2
LEI LES
x d
+
=

En general, siempre conviene emplear esta ltima frmula para calcular el ndice de capacidad,
pues cuando el proceso no est descentrado d es igual a 0.
LEI LES
x
d
6

Figura 15.3. Medicin de la capacidad de un proceso
A continuacin se presenta una interpretacin de los valores que puede tomar el ndice de capa-
cidad de un proceso:

Si: 0 <C
pk
< 1 Proceso inadecuado
Si: 1 <C
pk
< 1,33 Proceso adecuado
Si: 1,33 <C
pk
< Proceso satisfactorio
Ejemplo:
En una planta procesadora de conservas de pescado, dos empleados A y B estn llenando latas
de conserva de dos tipos: en filetes y en trozos. El peso neto de las latas muestreadas durante 20
das se muestra en la siguiente tabla. Cada da se escogieron aleatoriamente 10 latas y se registr
su peso. El peso neto nominal es de 200 g. y la tolerancia es de 5 g.
A continuacin se muestran los nueve posibles histogramas que se pueden trazar, para que el
lector los analice y d sus conclusiones.
Herramientas estadsticas para mejorar la calidad de los procesos


215
Da Empleado En filete En trozos
1 A 198,55 197,08 199,37 200,91 200,80 201,60 195,72 201,43 203,65 200,35
2 A 198,65 200,64 197,37 194,96 196,46 196,23 197,53 202,21 194,17 204,05
3 B 197,84 195,82 198,15 198,39 197,20 198,45 198,51 201,16 194,55 198,74
4 B 199,45 197,27 200,19 198,72 196,23 201,96 200,30 199,22 198,08 199,03
5 A 202,07 193,18 198,36 196,58 199,81 200,35 201,88 196,81 200,66 201,47
6 A 200,67 196,77 195,49 198,43 200,14 196,83 197,73 201,73 195,04 199,51
7 B 195,92 197,43 197,00 199,04 194,52 202,29 196,39 200,60 197,21 202,14
8 B 195,19 199,19 196,09 197,08 193,02 200,14 199,70 201,06 198,36 198,36
9 A 197,23 197,35 197,13 197,33 200,04 199,48 197,59 200,76 200,02 201,61
10 A 196,94 198,74 199,86 199,21 197,63 201,83 199,73 201,76 202,82 202,32
11 B 199,44 199,12 196,50 198,05 193,62 197,67 197,20 202,23 197,23 201,93
12 B 199,95 199,08 201,27 195,31 201,17 200,96 199,17 196,84 199,47 199,11
13 A 198,11 197,53 199,50 197,42 196,34 200,24 199,67 201,80 197,60 202,83
14 A 199,93 199,32 197,46 200,86 198,53 197,74 197,77 204,66 201,16 201,40
15 B 198,36 196,32 198,21 200,27 192,77 194,09 200,96 202,82 200,21 202,18
16 B 196,36 199,83 198,83 196,06 197,02 198,18 200,27 199,60 203,33 202,95
17 A 200,20 199,68 200,04 201,45 199,46 199,88 201,78 201,19 201,37 199,79
18 A 198,50 200,56 199,22 200,71 198,78 197,83 200,61 200,77 198,33 200,81
19 B 198,13 199,80 199,82 198,53 198,34 196,95 201,99 203,08 202,86 202,68
20 B 198,15 199,13 198,65 194,25 200,88 200,32 201,00 201,49 201,44 200,49
0
5
10
15
20
25
30
35
40
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.4. Histograma total

0
5
10
15
20
25
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.5. Histograma del empleado A.
Herramientas estadsticas para mejorar la calidad de los procesos

216

0
2
4
6
8
10
12
14
16
18
20
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.6. Histograma del empleado B.
0
5
10
15
20
25
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.7. Histograma de la conserva en filete.
0
5
10
15
20
25
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.8. Histograma de la conserva en trozos.
Herramientas estadsticas para mejorar la calidad de los procesos


217
0
2
4
6
8
10
12
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.9. Histograma de empleado A conserva en filete.

0
2
4
6
8
10
12
14
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.10. Histograma de empleado B conserva en filete.
0
2
4
6
8
10
12
14
16
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.11. Histograma de empleado A conserva en trozos.
Herramientas estadsticas para mejorar la calidad de los procesos

218
0
2
4
6
8
10
12
193 194 195 196 197 198 199 200 201 202 203 204 205 206

Figura 15.12. Histograma de empleado B conserva en trozos.
15.3 Grficos de control
15.3.1 Definiciones
Un grfico de control est conformado por una lnea central, que suele medir un promedio, dos
lmites de control, uno por encima y otro por debajo de la lnea central, y una serie de valores caracte-
rsticos registrados en el grfico que representa el estado del proceso. Si todos los valores se encuen-
tran dentro de los lmites de control, y no se presenta ninguna situacin atpica (se explicar ms ade-
lante), se dice que el proceso est bajo control; en caso contrario se dice que el proceso est fuera de
control. En la figuras 15.13 y 15.14 se muestran estas dos situaciones.
Figura 15.13. Grfico de control de un proceso bajo control





Figura 15.14. Grfico de control de un proceso fuera de control
Lmite de
control superior
Lmite de
control inferior
Lnea
Central
Lmite de
control superior
Lnea
Central
Lmite de
control inferior
Herramientas estadsticas para mejorar la calidad de los procesos


219
15.3.2 Tipos de grficos de control
Grficos de control de variables: se aplican a caractersticas que se pueden medir. General-
mente los datos provienen de una poblacin que se puede describir con una distribucin normal.
Ventajas principales: la mayora de los procesos son medibles, la medicin proporciona ms in-
formacin que un atributo, emplea muestras ms pequeas, la accin correctiva es rpida, etc.
Grficos de control de atributos: se emplean cuando es posible establecer la ausencia o exis-
tencia de una caracterstica de calidad. Generalmente se asocian con distribuciones discretas, como la
binomial o Poisson. Proporcionan menos informacin que los grficos de control de variables.
Ventajas principales: los datos por atributos existen en todos los procesos y se pueden obtener
de manera rpida y econmica, un grfico puede controlar varias caractersticas, son fciles de cons-
truir e interpretar, etc.
Como desventaja importante se puede decir que el proceso de decisin es ms lento.
En la tabla 15.1 se presentan los tipos de grficos de control y las frmulas para determinar los
lmites de control. Estas frmulas han sido deducidas asumiendo que casi el 100% de los datos se en-
cuentran entre el valor medio 3 veces la desviacin estndar correspondiente.
Tabla 15.1. Grficos de control de variables: frmulas para calcular los lmites de control.
Tipo de grfico de control Lmites de control
Media ( x )
LCS = R A x
2
+
LCI = R A x
2

LCS = s A x
3
+
LCI = s A x
3

Mediana (M)
LCS = R A M
2
15 , 1 +
LCI = R A M
2
15 , 1
Rango (R)
LCS = R D
4

LCI = R D
3

Desviacin estndar (s)
LCS = s B
4

LCI = s B
3

D
e

v
a
r
i
a
b
l
e
s

Individual (con rango mvil, R
m
)
LCS =
m
R E x
2
+
LCI =
m
R E x
2

Proporcin de unidades defectuosas (p)
LCS = n p p p / ) 1 ( 3 +
LCI = n p p p / ) 1 ( 3
Nmero de unidades defectuosas (np)
LCS = ) 1 ( 3 p p n p n +
LCI = ) 1 ( 3 p p n p n
Nmero de defectos (c)
LCS = c c 3 +
LCI = c c 3
D
e

a
t
r
i
b
u
t
o
s

Nmero de defectos por unidad (u)
LCS = n u u / 3 +
LCI = n u u / 3
Los valores de los coeficientes A2, A3, D3, D4, B3, B4, E2 se encuentran en el apndice (pg. 270).
15.3.3 Interpretacin de los grficos de control.
Para que un grfico de control sea correctamente interpretado es recomendable que est confor-
mado por lo menos por 20 puntos.
Herramientas estadsticas para mejorar la calidad de los procesos

220
Una vez que ya se ha instalado un grfico de control, es decir, una vez que ya se han determina-
do la lnea central y los lmites de control superior e inferior, se podr afirmar que el proceso est fuera
de control en las siguientes situaciones:
Si hay al menos un punto ms all de los lmites de control.
Racha: si hay 7 puntos consecutivos a un lado de la lnea central, si 10 de 11 puntos con-
secutivos estn a un lado de la lnea central, 12 de 14, 16 de 20.
Tendencia: si hay 6 puntos consecutivos ascendentes o descendentes.
Acercamiento a los lmites de control: si 2 de 3 puntos consecutivos est comprendidos en-
tre 2 y 3.
Acercamiento a la lnea central: si la gran mayora de los puntos estn entre 1,5 y +1,5.
Esto se debe generalmente a que las muestras se han tomado en forma inapropiada, ya que
es poco probable que el proceso haya mejorado tan rpidamente.
Periodicidad: si hay tendencia ascendente y descendente para casi el mismo intervalo.

Estos criterios deben aplicarse con cierta flexibilidad, dependiendo de las circunstancias. En la
figura 15.15 se muestran algunas de las situaciones mencionadas.

Figura 15.15. Situaciones de procesos fuera de control
15.3.4 Elaboracin de los grficos de control.
Ahora que ya se sabe interpretar los grficos de control, se ver cmo elaborarlos. Una vez que
ya se ha decidido qu tipo de grfico se va a trazar, se requiere tomar una serie de muestras, anotar los
datos y calcular la medida central y los lmites de control.
En los grficos de control de variables es recomendable determinar, en primer lugar, los lmites
de control de las medidas de variabilidad, pues suelen ser los primeros en ser violados cuando un pro-
ceso se sale de control.
Existen diferentes criterios para aceptar o rechazar los lmites de control. Debe tenerse en cuenta
que si se presenta alguna de las situaciones mencionadas en el apartado anterior (racha, tendencia,
etc.), se deben buscar las causas asignables que deforman el proceso, ya que est fuera de control, y
corregirlo. Una vez que se hagan las correcciones oportunas, se intentar instalar el grfico de control.
Si no hay racha, tendencia, etc, se suele emplear el siguiente criterio:
Si todos los puntos que se han determinado a partir de las muestras estn dentro de los lmi-
tes de control, se instala el grfico de control.
Si uno o dos puntos estn fuera de los lmites de control, se eliminan dichos puntos y se re-
calcula la medida central y los lmites de control. Si ahora todos los puntos quedan dentro de
los lmites de control, se instala el grfico de control; en caso contrario, se deben buscar las
causas asignables que deforman el proceso y corregirlo. Una vez que se hagan las correccio-
nes oportunas, se vuelven a tomar muestras y se calcula la medida central y los lmites de
control.
Si tres o ms puntos estn fuera de los lmites de control, se deben buscar las causas asigna-
Racha:
siete
puntos
Tendencia positiva:
seis puntos
Acercamiento al lmite
de control superior: dos
de tres puntos
Herramientas estadsticas para mejorar la calidad de los procesos


221
bles que deforman el proceso y corregirlo. Una vez que se hagan las correcciones oportunas,
se vuelven a tomar muestras y se calcula la medida central y los lmites de control.
Este criterio slo se usa para instalar los grficos de control, es decir, para establecer el valor
central y los lmites de control. Luego, cuando ya se est controlando el proceso, un punto fuera de los
lmites de control indicar que el proceso est fuera de control.
Si un proceso est bajo control, no necesariamente hace lo que supuestamente tiene que hacer.
Que est bajo control significa que trabaja bien y da un servicio consistente, de acuerdo a sus posibili-
dades. Una vez que un proceso est bajo control ya conviene determinar qu tan capaz es.
A continuacin se muestran algunos ejemplos de elaboracin de grficos de control.
Ejemplo 1: *
Los datos de la siguiente tabla muestran los resultados de la medicin de temperatura de proce-
samiento de 20 lotes continuos. Las temperaturas fueron tomadas cada 15 minutos durante 20
horas de proceso. Elabore los grficos de control Media-Rango.
Muestra T
1
T
2
T
3
T
4
Media Rango
1 65 66 67 68 66,50 3
2 65 66 67 67 66,25 2
3 68 65 67 64 66,00 4
4 67 66 68 67 67,00 2
5 67 66 66 67 66,50 1
6 67 67 66 68 67,00 2
7 68 64 67 68 66,75 4
8 67 66 67 67 66,75 1
9 66 68 66 66 66,50 2
10 66 67 67 67 66,75 1
11 66 68 67 67 67,00 2
12 66 66 67 67 66,50 1
13 65 67 65 67 66,00 2
14 68 66 65 67 66,50 3
15 66 67 67 67 66,75 1
16 65 67 67 66 66,25 2
17 67 67 66 66 66,50 1
18 67 67 68 67 67,25 1
19 67 67 68 68 67,50 1
20 68 67 67 67 67,25 1
Total 1333,50 37

Para trazar los grficos de control se siguen los siguientes pasos:
Paso 1: Calcule la media y el rango de cada muestra.

=
=
n
k
k i
x
n
x
1
1

mn mx
i i
x x R =
Paso 2: Grafique las medias y los rangos por separado.
Paso 3: Calcule la media de las medias ( ) x y la media de los rangos ( ) R
675 , 66 50 , 1333
20
1 1
1

=
= = =
m
j
j
x
m
x ; 85 , 1 37
20
1 1
1

=
= = =
m
j
j
R
m
R
Paso 4: Calcule los lmites de control del grfico de rangos.
2 , 4 85 , 1 282 , 2
4
= = = R D LCS
R

0 85 , 1 0
3
= = = R D LCI
R

Sobre el grfico de rangos trazado en el paso 2 (figura 15.16), trace lneas horizontales que re-
presenten los lmites de control recin calculados. Verifique que no haya ningn punto ms all
Herramientas estadsticas para mejorar la calidad de los procesos

222
de los lmites de control. En este caso no hay.
Paso 5: Calcule los lmites de control del grfico de medias.
02 , 68 85 , 1 729 , 0 675 , 66
2
= + = + = R A x LCS
x

33 , 65 85 , 1 729 , 0 675 , 66
2
= = = R A x LCI
x

Sobre el grfico de medias trazado en el paso 2 (figura 15.17), trace lneas horizontales que re-
presenten los lmites de control que acaba de calcular. Verifique que no haya ningn punto ms
all de los lmites de control. En este caso no hay.
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
R
a
n
g
o
LCS = 4,2
LCI = 0
Media = 1,85

Figura 15.16. Grfico de control de rangos del ejemplo 1.
64.5
65
65.5
66
66.5
67
67.5
68
68.5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
T
e
m
p
e
r
a
t
u
r
a

m
e
d
i
a
LCS = 68,02
LCI = 65,33
Media = 66,675

Figura 15.17. Grfico de control de medias del ejemplo 1.
Como se ve, el proceso est bajo control, y se pueden instalar ambos grficos de control. Vale la
pena comentar que hubo un descenso en la variabilidad a lo largo del periodo en que se tomaron
las muestras, como se ve en el grfico de control de rangos. Esto, aunque sea positivo, no deja
de llamar la atencin pues no es un signo de aleatoriedad. Valdra la pena verificar si esto vuel-
ve a ocurrir en la siguiente toma de datos.
Herramientas estadsticas para mejorar la calidad de los procesos


223
Ejemplo 2: *
Se quiere controlar las ventas diarias de un grupo de vendedores de una empresa grande. Para
esto, durante 20 das se extrajeron aleatoriamente registros de ventas de tres vendedores. En la
siguiente tabla se muestran estos datos. Elabore los grficos de control Mediana-Rango.

Muestra V
1
V
2
V
3
Mediana Rango
1 133 138 148 138 15
2 147 131 131 131 16
3 134 128 145 134 17
4 134 143 147 143 13
5 128 128 143 128 15
6 143 137 134 137 9
7 133 129 129 129 4
8 124 127 130 127 6
9 128 125 126 126 23
10 134 151 146 146 17
11 147 135 128 135 19
12 123 140 127 127 17
13 130 126 129 129 4
14 122 128 134 128 12
15 144 124 141 141 20
16 124 124 135 124 11
17 135 125 128 128 10
18 130 136 134 134 6
19 125 123 121 123 4
20 125 128 125 125 3
Total 2633 241
Este caso de ventas es propicio para controlarlo mediante las medianas de las muestras, pues en
caso que un vendedor tenga una venta atpica, ya sea muy alta o muy baja respecto a las dems
ventas de la muestra, la mediana no registrar ese cambio brusco. Si se controlaran las medias,
en cambio, una venta alta atpica de un vendedor podra hacer pensar que las ventas en general
han subido.
Para trazar los grficos de control se siguen los siguientes pasos:
Paso 1: Calcule la mediana y el rango de cada muestra.
Paso 2: Grafique las medianas y los rangos por separado.
Paso 3: Calcule la media de las medianas ( ) M y la media de los rangos ( ) R .
65 , 131 2633
20
1 1
1
= = =

=
m
j
j
M
m
M ; 05 , 12 241
20
1 1
1
= = =

=
m
j
j
R
m
R
Paso 4: Calcule los lmites de control del grfico de rangos
02 , 31 05 , 12 574 , 2
4
= = = R D LCS
R

0 05 , 12 0
3
= = = R D LCI
R

Sobre el grfico de rangos trazado en el paso 2, trace lneas horizontales que representen los l-
mites de control que acaba de calcular. En este caso no hay ningn punto ms all de los lmites
de control.
Paso 5: Calcule los lmites de control del grfico de medianas.
83 , 145 05 , 12 023 , 1 15 , 1 65 , 131 15 , 1
2
= + = + = R A M LCS
M

47 , 117 05 , 12 023 , 1 15 , 1 65 , 131 15 , 1
2
= = = R A M LCI
M

Sobre el grfico de medianas trazado en el paso 2, trace lneas horizontales que representen los
Herramientas estadsticas para mejorar la calidad de los procesos

224
lmites de control que acaba de calcular. Verifique que no haya ningn punto ms all de los l-
mites de control. En este caso hay un punto (el dcimo) que est ligeramente por encima del l-
mite de control superior. Por lo tanto an no se puede instalar el grfico de control de medianas.
Paso 6: Elimine el punto que est fuera de los lmites y recalcule la media de las medianas, el
rango medio y los lmites de control.
76 , 144 79 , 11 023 , 1 15 , 1 89 , 130 15 , 1
2
= + = + = R A M LCS
M

02 , 117 79 , 11 023 , 1 15 , 1 89 , 130 15 , 1
2
= = = R A M LCI
M

En las figuras 15.18 y 15.19 se muestran los grficos de control de rangos y de medianas des-
pus de ejecutar el paso 6, donde se ha eliminado el dcimo punto.
0
5
10
15
20
25
30
35
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
R
a
n
g
o
LCS = 31.02
LCI = 0
Media = 12.05

Figura 15.18. Grfico de control de rangos del ejemplo 2.
110
115
120
125
130
135
140
145
150
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
M
e
d
i
a
n
a
LCS = 145.83
LCI = 117.47
131.65

Figura 15.19. Grfico de control de medianas del ejemplo 2.
Herramientas estadsticas para mejorar la calidad de los procesos


225
Ahora no hay ningn punto fuera de los nuevos lmites de control, y no se observa ninguna irre-
gularidad, por lo que se pueden instalar ambos grficos para controlar las ventas diarias. Quiz
valdra la pena verificar una posible tendencia de las ventas diarias a disminuir.
Ejemplo 3: *
Un vehculo de una empresa de transportes realiza un viaje diario llevando mercadera desde una
fbrica hasta un almacn. Con el propsito de controlar la calidad del servicio se tomaron los
tiempos de viaje durante 20 das. En la siguiente tabla se muestran estos tiempos en minutos.
Elabore un grfico de control individual con rango mvil.
Muestra Tiempo Rango mvil Muestra Tiempo Rango mvil
1 63 11 68 5
2 64 1 12 64 4
3 65 1 13 64 0
4 65 0 14 64 0
5 66 1 15 63 1
6 65 1 16 63 0
7 65 0 17 65 2
8 67 2 18 62 3
9 67 0 19 63 1
10 63 4 20 66 3
Total 1292 29
Es evidente que, si se quiere hacer un control diario de los tiempos de viaje, slo se podr tomar
un dato cada da, y no quedar ms remedio que emplear un grfico de control individual. Si se
quisiera hacer control cada tres das, s se podra usar un grfico de control de medias.
Para trazar estos grficos de control se siguen los siguientes pasos:
Paso 1: Calcule el rango mvil entre cada par de mediciones consecutivas (valores absolutos).
Paso 2: Grafique los valores individuales y los rangos mviles por separado.
Paso 3: Calcule la media de los valores individuales
( ) x
y el rango mvil promedio( )
m
R

=
= = =
20
1
6 , 64 1292
20
1
20
1
j
j
x x

=
= = =
20
2
53 , 1 29
19
1
19
1
j
j
R R
Paso 4: Calcule los lmites de control del grfico de rangos mviles. Ntese que para el clcu-
lo de los rangos mviles se han agrupado dos valores individuales (ste es el tamao de la mues-
tra). Se podran calcular rangos mviles agrupando tres o ms valores individuales.
00 , 5 53 , 1 267 , 3
4
= = =
m R
R D LCS
m

0 53 , 1 0
3
= = =
m R
R D LCI
m

Sobre el grfico de rangos mviles trazado en el paso 2 (figura 15.20), trace lneas horizontales
que representen los lmites de control que acaba de calcular. En este caso no hay ningn punto
ms all de los lmites de control ni otra irregularidad.
Paso 5: Calcule los lmites de control del grfico de control de valores individuales.
67 , 68 53 , 1 660 , 2 6 , 64
2
= + = + =
m x
R E x LCS
53 , 60 53 , 1 660 , 2 6 , 64
2
= = = R E x LCI
x

Sobre el grfico de valores individuales trazado en el paso 2 (figura 15.21), trace lneas horizon-
tales que representen los lmites de control que acaba de calcular. Verifique que no haya ningn
punto ms all de los lmites de control. En este caso no hay; pero se aprecia una racha desde el
punto 3 hasta el punto 9, por lo que se concluye que el proceso est fuera de control. Habra que
Herramientas estadsticas para mejorar la calidad de los procesos

226
investigar cules son las causas (asignables) para as mejorar el proceso. Luego se debern to-
mar ms datos para intentar instalar estos grficos de control.
0
1
2
3
4
5
6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
R
a
n
g
o

m

v
i
l
LCS = 5.00
LCI = 0
Media = 1.53

Figura 15.20. Grfico de control de rango mvil del ejemplo 3.
56
58
60
62
64
66
68
70
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
V
a
l
o
r
e
s

i
n
d
i
v
i
d
u
a
l
e
s
LCS = 68,67
LCI = 60,53
Media = 64,6

Figura 15.21. Grfico de control de valores individuales del ejemplo 3.
Ejemplo 4: *
Se ha inspeccionado 22 lotes semanales de envases plsticos. Los lotes son de tamao variable y
en cada uno se ha registrado el nmero de unidades defectuosas, como se muestra en la siguien-
te tabla. Elabore un grfico de proporcin de unidades defectuosas.
Paso 1: Calcule la proporcin defectuosa para cada lote.
Paso 2: Grafique la proporcin defectuosa.
Paso 3: Calcule la media de la proporcin defectuosa y la media del tamao de la muestra.
Herramientas estadsticas para mejorar la calidad de los procesos


227
073 , 0
16310
1183
= = p ; 36 , 741
22
16310
= = n
Semana
Tamao
de lote
Unidades
defectuosas
Proporcin
defectuosa
Semana
Tamao
de lote
Unidades
defectuosas
Proporcin
defectuosa
1 724 48 0,066 12 739 50 0,068
2 763 83 0,109 13 723 47 0,065
3 748 70 0,094 14 748 57 0,076
4 748 85 0,114 15 770 51 0,066
5 724 45 0,062 16 756 71 0,094
6 727 56 0,077 17 719 53 0,074
7 726 48 0,066 18 757 34 0,045
8 719 67 0,093 19 760 29 0,038
9 759 37 0,049 20 742 37 0,050
10 745 52 0,070 21 726 50 0,069
11 736 47 0,064 22 751 66 0,088
Total 16310 1183 0,073

Paso 4: Calcule los lmites de control
102 , 0 36 , 741 / ) 073 , 0 1 ( 073 , 0 3 073 , 0 / ) 1 ( 3 = + = + = n p p p LCS
p

044 , 0 36 , 741 / ) 073 , 0 1 ( 073 , 0 3 073 , 0 / ) 1 ( 3 = = = n p p p LCI
p

Sobre el grfico de proporcin defectuosa trazado en el paso 2 (figura 15.22), trace lneas hori-
zontales que representen los lmites de control que acaba de calcular. Verifique que no haya nin-
gn punto ms all de los lmites de control. En este caso se encuentran tres puntos fuera de los
lmites. Se concluye que el proceso est fuera de control. Conviene investigar cules son las
causas (asignables) para mejorar el proceso. Luego se debern tomar ms datos para intentar ins-
talar este grfico de control.
0.030
0.040
0.050
0.060
0.070
0.080
0.090
0.100
0.110
0.120
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
P
r
o
p
o
r
c
i

n

d
e
f
e
c
t
u
o
s
a
LCS = 0,102
LCI = 0,044
Media = 0,073

Figura 15.22. Grfico de control de proporciones defectuosas del ejemplo 4.
Ejemplo 5: *
En la siguiente tabla se muestra el nmero de tardanzas registradas durante 15 das en una em-
presa de vigilancia conformada por 400 trabajadores. El gerente ha tomado datos para ver si est
dando resultado el programa de factor humano que est implantando. Elabore un grfico de uni-
dades defectuosas. (Pase por alto el hecho de que slo haya 15 datos).
Herramientas estadsticas para mejorar la calidad de los procesos

228
Da Tardanzas Da Tardanzas Da Tardanzas
1 1 6 0 11 2
2 3 7 1 12 0
3 0 8 0 13 1
4 7 9 8 14 0
5 2 10 5 15 3
Total 33
Paso 1: Grafique el nmero de unidades defectuosas.
Paso 2: Calcule la media de unidades defectuosas y la media de las fracciones defectuosas.
2 , 2
15
33
= = p n ; 0055 , 0
15
400 / 33
= = p
Paso 3: Calcule los lmites de control.
6 , 6 ) 0055 , 0 1 ( 2 , 2 3 2 , 2 ) 1 ( 3 = + = + = p p n p n LCS
np

0 ) 0055 , 0 1 ( 2 , 2 3 2 , 2 ) 1 ( 3 = = = p p n p n LCI
np

El lmite inferior saldra negativo, por lo que toma el valor cero.
Sobre el grfico de unidades defectuosas trazado en el paso 1 (figura 15.23), trace lneas hori-
zontales que representen los lmites de control que acaba de calcular. Verifique que no haya nin-
gn punto ms all de los lmites de control.
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
U
n
i
d
a
d
e
s

d
e
f
e
c
t
u
o
s
a
s
LCS = 6,6
LCI = 0
Media = 2.2

Figura 15.23. Grfico de control de unidades defectuosas del ejemplo 5.
En este caso se encuentran dos puntos por encima de los lmites; por lo tanto an no se puede
instalar este grfico de control.
Paso 4: Elimine los dos puntos que estn fuera de los lmites y recalcule la media de unidades
defectuosas, la media de las fracciones defectuosas y los lmites de control.
385 , 1
13
18
= = p n ; 0035 , 0
13
400 / 18
= = p
25 , 6 ) 0035 , 0 1 ( 385 , 1 3 385 , 1 ) 1 ( 3 = + = + = p p n p n LCS
np

0 ) 0035 , 0 1 ( 2 , 2 3 385 , 1 ) 1 ( 3 = = = p p n p n LCI
np

Herramientas estadsticas para mejorar la calidad de los procesos


229
0
1
2
3
4
5
6
7
1 2 3 4 5 6 7 8 9 10 11 12 13
U
n
i
d
a
d
e
s

d
e
f
e
c
t
u
o
s
a
s
LCS = 6,25
Media = 1,385
LCI = 0

Figura 15.24. Grfico de control de unidades defectuosas (corregido) del ejemplo 5.
Ya no hay ningn punto fuera de los nuevos lmites de control, y, como se ve en el grfico de la
figura 15.24, no hay ninguna irregularidad, por lo que se puede instalar este grfico de control.
Ejemplo 6: *
En la siguiente tabla se muestran los resultados de una prueba realizada en muestras de papel
impermeable de tamao A4. Para determinar su impermeabilidad se ha utilizado el mtodo de la
tinta, de tal manera que cada mancha es considerada un defecto. Elabore un grfico de control
de nmero de defectos.
Muestra Defectos Muestra Defectos Muestra Defectos
1 8 10 7 19 7
2 9 11 6 20 8
3 5 12 4 21 18
4 8 13 7 22 6
5 5 14 6 23 9
6 9 15 14 24 10
7 9 16 6 25 5
8 11 17 4
9 8 18 11 Total 200
Paso 1: Grafique el nmero de defectos.
Paso 2: Calcule la media de defectos por muestra.
8
25
200
= = c
Paso 3: Calcule los lmites de control.
5 , 16 8 3 8 3 = + = + = c c LCS
c

0 8 3 8 3 = = = c c LCI
c

El lmite inferior saldra negativo, por lo que toma el valor cero.
Sobre el grfico de nmero de defectos trazado en el paso 1 (figura 15.25), trace lneas horizon-
tales que representen los lmites de control que acaba de calcular. Verifique que no haya ningn
punto ms all de los lmites de control. En este caso se encuentra un punto por encima del lmi-
te superior; por lo tanto an no se puede instalar este grfico de control.
Herramientas estadsticas para mejorar la calidad de los procesos

230
0
2
4
6
8
10
12
14
16
18
20
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
N

m
e
r
o

d
e

d
e
f
e
c
t
o
s
LCS = 16,5
LCI = 0
Media = 8

Figura 15.25. Grfico de control de nmero de defectos del ejemplo 6.
Paso 4: Elimine el punto que est fuera de los lmites y recalcule la media de defectos por
muestra y los lmites de control.
583 , 7
24
182
= = c
84 , 15 583 , 7 3 583 , 7 3 = + = + = c c LCS
c

0 583 , 7 3 583 , 7 3 = = = c c LCI
c

0
2
4
6
8
10
12
14
16
18
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
N

m
e
r
o

d
e

d
e
f
e
c
t
o
s
LCS = 15,84
LCI = 0
Media = 7,58

Figura 15.26. Grfico de control de nmero de defectos (corregido) del ejemplo 6.
Como se puede apreciar en la figura 15.26, ya no hay ningn punto fuera de los nuevos lmites
de control, y se puede constatar que no hay ninguna irregularidad. Se concluye que s se puede
instalar este grfico de control.
Ejemplo 7: *
Una empresa que ensambla piezas electrnicas ha registrado las desconexiones halladas en una
prueba. Se inspeccionaron muestras de 15 piezas, de 25 lotes consecutivos, encontrndose los
Herramientas estadsticas para mejorar la calidad de los procesos


231
nmeros de defectos que se muestran en la siguiente tabla. Elabore un grfico de control de de-
fectos por unidad.
Muestra Defectos
Defectos
por unidad
Muestra Defectos
Defectos
por unidad
Muestra Defectos
Defectos
por unidad
1 17 1,13 10 18 1,20 19 23 1,53
2 14 0,93 11 25 1,67 20 22 1,47
3 6 0,40 12 5 0,33 21 9 0,60
4 23 1,53 13 8 0,53 22 15 1,00
5 5 0,33 14 11 0,73 23 20 1,33
6 7 0,47 15 18 1,20 24 7 0,47
7 10 0,67 16 13 0,87 25 24 1,60
8 19 1,27 17 22 1,47
9 29 1,93 18 6 0,40 Total 376
Si se emplease un grfico de control de nmero de defectos como en el ejemplo 6, se tendra el
inconveniente que el nmero de defectos en cada pieza es muy bajo o cero, es decir, se tendra
que controlar una variable que toma valores cero, uno o dos. Mucho ms prctico resulta contro-
lar una variable que toma valores mayores, o valores promedio.
Paso 1: Grafique el nmero de defectos por unidad.
Paso 2: Calcule la media de defectos por unidad para el total de muestra.
003 , 1
15 25
376
=

=
Paso 3: Calcule los lmites de control
77 , 1 15 / 003 , 1 3 003 , 1 / 3 = + = + = n LCS


23 , 0 15 / 033 , 1 3 003 , 1 / 3 = = = n LCI


Sobre el grfico de nmero de defectos trazado en el paso 1 (figura 15.27), trace lneas horizon-
tales que representen los lmites de control que acaba de calcular. Verifique que no haya ningn
punto ms all de los lmites de control.
0
0.5
1
1.5
2
2.5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
N

m
e
r
o

d
e

d
e
f
e
c
t
o
s

p
o
r

u
n
i
d
a
d
LCS = 1,77
LCI = 0,23
Media = 1,003

Figura 15.27. Grfico de control de defectos por unidad del ejemplo 7.
En este caso se encuentra un punto por encima del lmite superior; por lo tanto an no se puede
instalar este grfico de control.
Herramientas estadsticas para mejorar la calidad de los procesos

232
Paso 4: Elimine el punto que est fuera de los lmites y recalcule la media de defectos por uni-
dad y los lmites de control.
964 , 0
15 24
347
=

=
72 , 1 15 / 964 , 0 3 964 , 0 / 3 = + = + = n LCS


20 , 0 15 / 964 , 0 3 964 , 0 / 3 = = + = n LCI


0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
N

m
e
r
o

d
e

d
e
f
e
c
t
o
s

p
o
r

u
n
i
d
a
d
LCS = 1,72
LCI = 0,20
Media = 0,964

Figura 15.28. Grfico de control de defectos por unidad (corregido) del ejemplo 7.
Como se aprecia en la figura 15.28, ya no hay ningn punto fuera de los nuevos lmites de con-
trol, y se puede constatar que no hay ninguna irregularidad. Se concluye que se puede instalar
este grfico de control.
(*) Ejemplos extrados del curso de Herramientas Estadsticas para el mejoramiento de procesos dictado por el
Ing. Federico Salvador en la Sociedad Nacional de Industrias del Per.
15.4 Muestreo de aceptacin
Es el proceso de evaluacin o inspeccin de una muestra extrada de un lote de productos, con el
propsito de juzgar la calidad del lote completo y tomar la decisin de aceptarlo o rechazarlo.
Las ventajas del muestreo de aceptacin respecto a la inspeccin del lote completo son:
Es ms econmico inspeccionar una parte del lote, a pesar del costo del diseo y administra-
cin de los planes de muestreo.
Es menos complejo y menos costoso administrar grupos pequeos de inspectores.
Existe menor dao a los productos, si es el caso.
Se dispone del lote ms rpidamente.
Se minimiza el problema de la monotona y de los errores de inspeccin, que suelen aumen-
tar cuando se inspecciona el 100% del lote.
El rechazo de los lotes no conformantes tiende a apremiar a las organizaciones a que bus-
quen medidas preventivas.

Las desventajas del muestreo de aceptacin son:
Trae consigo dos riesgos: cometer el error tipo I y cometer el error tipo II.
Herramientas estadsticas para mejorar la calidad de los procesos


233
Mayores costos administrativos.
Menor informacin sobre el producto.
Conviene usar el muestreo de aceptacin en las siguientes situaciones:
Cuando el costo de la inspeccin es alto respecto al costo del dao que resulta al aceptar
productos defectuosos.
Cuando la inspeccin es muy montona y/o causa errores de inspeccin.
Cuando la inspeccin es destructiva.
Evidentemente no vale la pena usar el muestreo de aceptacin cuando el fabricante tiene una
certificacin de calidad.
Es importante conocer los lmites del muestreo de aceptacin. Una manera prctica de hacerlo es
aclarando lo que no hace:
No proporciona estimaciones depuradas de la calidad de un lote.
No proporciona juicios sobre el producto rechazado respecto a si es adecuado para el uso.
15.4.1 Anlisis econmico de la inspeccin.
Para evaluar lotes de productos se cuenta con las siguientes alternativas:
No inspeccionar: no conviene inspeccionar ninguna unidad de un lote cuando laboratorios califi-
cados han hecho inspecciones anteriores sobre el mismo lote, ya sea en otras divisiones de la misma
empresa o en la empresa del proveedor.
Muestreo pequeo: conviene inspeccionar muestras pequeas cuando un proceso es inherente-
mente uniforme y cuando se puede preservar el orden de la produccin. Por ejemplo, en algunas ope-
raciones de impresin, las placas se hacen de manera que tengan un alto grado de estabilidad. Como
resultado de esto, las impresiones sucesivas hechas con estas placas tienen un alto grado de uniformi-
dad para ciertas caractersticas dimensionales. Para tales caractersticas, si la primera y la ltima uni-
dad del lote estn correctas, todo el resto estar tambin correcto, aun para lotes de miles de unidades.
Adems, conviene inspeccionar muestras pequeas cuando el producto es homogneo debido a su
fluidez (gases y lquidos) o debido a operaciones anteriores de mezclado. Una vez comprobado el
hecho de la homogeneidad, el muestreo que se necesita es mnimo.
Muestreo: conviene inspeccionar muestras grandes cuando la informacin sobre la calidad de un
lote debe derivarse nicamente a partir del muestreo. El tamao de la muestra depende principalmente
de dos variables: el porcentaje tolerable de productos defectuosos y los riesgos que se est dispuesto a
correr. El muestreo suele ser la mejor alternativa cuando se alternan lotes de alta y baja calidad, o
cuando el proceso de produccin est fuera de control.
Inspeccionar todo el lote: Conviene inspeccionar el 100% de un lote cuando los resultados del
muestreo indican que el nivel actual de defectos es demasiado alto para que el lote se enve a los clien-
tes o cuando la inspeccin es muy barata y rpida (automtica).
Para determinar cul de estas alternativas de inspeccin es la que conviene en determinadas si-
tuaciones, es necesario estimar los costos que genera la inspeccin. Sean:
N = el nmero de artculos del lote.
n = el nmero de artculos de la muestra.
p = la proporcin de artculos defectuosos del lote.
D = el costo de los daos en que se incurre si un artculo defectuoso pasa la inspeccin.
I = el costo por inspeccionar un artculo.
P
a
= la probabilidad de que un lote sea aceptado por el plan de muestreo.
Los costos esperados para cada alternativa de inspeccin sern entonces:
Por no inspeccionar: NpD
Por muestrear: nI + (N n)pDP
a
+ (N n)(1 P
a
)I
Por inspeccionar el 100%: NI
Herramientas estadsticas para mejorar la calidad de los procesos

234
Lgicamente, se escogera la alternativa que d el menor costo.
Se asume que el costo por reemplazar un artculo defectuoso encontrado en la inspeccin lo cu-
bre el fabricante, o que resulta muy pequeo comparado con el dao o inconveniente causado por el
defecto.
15.4.2 Riesgos del muestreo.
El muestreo siempre involucra el riesgo de que la muestra no refleje el contenido del lote. Evi-
dentemente, mientras ms grande sea la muestra, menor ser este riesgo; pero las muestras grandes
suelen ser costosas en tiempo y dinero. Los riesgos que se corre con el muestreo son dos:
Rechazar un lote bueno, es decir, rechazar un lote que s cumple la norma de calidad.
A este riesgo se le llama riesgo del productor, pues quien resulta perjudicado ante este error es
el productor. Tambin se le conoce como error tipo I. A la probabilidad de cometer el error ti-
po I se le denomina .
Aceptar un lote malo, es decir, aceptar un lote que no cumple la norma de calidad.
A este riesgo se le llama riesgo del consumidor, pues quien resulta perjudicado ante este error
es el consumidor. Tambin se le conoce como error tipo II. A la probabilidad de cometer el
error tipo II se le denomina .
Que un lote cumple la norma de calidad significa que el porcentaje de unidades defectuosas es
menor o igual al que especifica el productor.
Ejemplo:
Un productor asegura que el porcentaje de unidades defectuosas en su fbrica no supera el 2%.
Un cliente toma una muestra de 300 unidades para decidir si acepta un lote muy grande del pro-
ductor. Qu porcentaje de unidades defectuosas tendra que encontrar en la muestra para re-
chazar el lote? Considere = 5%.
H
0
: p 0,02
H
1
: p > 0,02







p = 0,02 p
1
*
Regin de aceptacin Regin de rechazo
Para determinar el lmite entre las regiones de aceptacin y rechazo:

300
98 , 0 02 , 0
) 300 ( 2
1
02 , 0 *
645 , 1 *
1


= =
p
z

p
1
* = 0,035 = 3,5% x* = 300(0,035) = 10,5
P
1
Herramientas estadsticas para mejorar la calidad de los procesos


235
Por lo tanto, se rechazar el lote cuando en la muestra haya 11 ms unidades defectuosas, es
decir, cuando el porcentaje de unidades defectuosas sea 11/300 = 3,66% ms.
Si realmente el lote tuviese un 5% de unidades defectuosas. Cul sera la probabilidad de acep-
tar el lote? (Se dice que un lote con esta caracterstica no est cumpliendo con la norma de cali-
dad, o que no es conformante).
Se aceptar ese lote cuando el porcentaje de unidades defectuosas de la muestra caiga en la
regin de aceptacin:

192 , 1
300
95 , 0 05 , 0
) 300 ( 2
1
05 , 0
300
10
=

+
= z
= 0,1170
La probabilidad de aceptar el lote con 5% de unidades defectuosas (creyendo que tiene 2% de
unidades defectuosas) ser 0,1170.
15.4.3 Plan de muestreo
Un plan de muestreo es un conjunto de lineamientos especficos elaborados para examinar un lo-
te de productos, con el propsito de aceptarlo o rechazarlo. Esta decisin depender de la calidad de la
muestra tomada.
Para definir un plan de muestreo se emplean los siguientes parmetros:
n = tamao de la muestra.
c = nmero de aceptacin, es decir, el mximo de artculos defectuosos permitido en la mues-
tra para aceptar el lote.
N = tamao del lote.
15.4.4 Curva caracterstica de operacin (Curva CO)
Es una curva que muestra, para un plan de muestreo determinado y para valores hipotticos de la
proporcin de artculos defectuosos, la probabilidad de que el lote sea aceptado.
Curva CO ideal:
Si se diseara un plan de muestreo ideal, se eliminaran los riesgos del fabricante y del consumi-
dor. Esto slo sera posible si se inspeccionase el 100% del lote, es decir, si n = N.
Supngase que se decide aceptar un lote si ste cumple con lo especificado por el productor, es
decir, si son defectuosos p
0
% de los artculos o menos; y rechazar el lote en caso contrario. En la figu-
ra 15.29 se muestra la curva CO ideal para esta situacin.
p
0
1
p
P
A

15.29 Curva caracterstica de operacin ideal
Como se ve en la figura 15.29, slo se aceptar un lote si el porcentaje de artculos defectuosos
es 1% menos. Por lo tanto, la probabilidad (P
a
) de aceptar un lote con 1% menos de artculos de-
Herramientas estadsticas para mejorar la calidad de los procesos

236
fectuosos es 1. En cambio, la probabilidad (P
a
) de aceptar un lote con ms del 1% de artculos defec-
tuosos es 0.
Curva CO real:
Cuando un lote s cumple la norma de calidad, es decir, cuando se cumple la hiptesis nula, cabe
la posibilidad de que sea rechazado. La probabilidad de que esto ocurra () es cero si p = 0; pero
comienza a aumentar conforme aumenta p. Por lo tanto, P
a
comienza a disminuir desde 1, tal como se
muestra en la figura 15.30.
p
0
= NCA
1
P
A

NCL
= 0,10

Figura 15.30. Curva caracterstica de operacin
En la curva CO real se identifican dos puntos caractersticos:
NCA: Nivel de calidad aceptable.
Es el mximo valor de p que se debera aceptar, es decir, el mximo valor de p que anuncia
el fabricante. La probabilidad de rechazar este nivel de calidad es .
NCL: Nivel de calidad lmite.
Es el nivel de calidad que sera mejor no aceptar. La probabilidad de aceptar este nivel es ,
y suele establecerse en 0,10.
Trazo de la curva CO:
Para trazar la curva CO de un plan de muestreo se calculan algunos pares de valores P
a
, p`.
Para calcular P
a
, en caso que el lote sea lo suficientemente grande (N >> n) como para asumir
que el porcentaje de artculos defectuosos se mantiene constante a medida que se extrae cada unidad
de la muestra, se puede usar la frmula de probabilidad binomial:

|
|
.
|

\
|
= =
c
x
x n x
a
q p
x
n
c x P P
0
) (
Si n es grande y p muy pequeo, puede resultar buena la aproximacin de las probabilidades bi-
nomiales a probabilidades de Poisson. En el apndice se presenta una tabla con probabilidades P
a
(de
Poisson) para determinados valores de np y c (pgina 271).
Si np>5 y nq>5; se puede aproximar la distribucin binomial a la distribucin normal.
Forma de la curva CO:
En un plan de muestreo es importante que los riesgos de muestreo sean lo menor posible, es de-
cir, que se consigan los valores tpicos de y : 0,05 y 0,10, respectivamente, para el NCA que anun-
cia el productor y para un valor de NCL que no perjudique al consumidor.
Si se aumenta el nmero de aceptacin c en un plan de muestreo, manteniendo constante el valor
de n, lgicamente aumentar la probabilidad de aceptacin, como se muestra en la figura 15.31.
Herramientas estadsticas para mejorar la calidad de los procesos


237
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60
P
r
o
b
a
b
i
l
i
d
a
d

d
e

a
c
e
p
t
a
c
i

n
c = 0 c = 1 c = 2 c = 3 c = 4 c = 5

Figura 15.30. Curvas CO para n constante
Si se aumenta el tamao de la muestra n en un plan de muestreo, manteniendo constante el valor
de c, lgicamente disminuir la probabilidad de aceptacin, como se muestra en la figura 15.31.
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40
P
r
o
b
a
b
i
l
i
d
a
d

d
e

a
c
e
p
t
a
c
i

n
n = 60
n = 50
n = 40
n = 30
n = 20

Figura 15.30. Curvas CO para c constante
En conclusin, para elegir un buen plan de muestreo se debe escoger una adecuada combinacin
del nmero de aceptacin c y del tamao de la muestra n. Dado un valor de NCA y definido un valor
de , se debe elegir un plan de muestreo que haga que y NCL sean tan pequeos como se desee.

Herramientas estadsticas para mejorar la calidad de los procesos

238
Problemas propuestos.
1. Una empresa de manufactura recibe componentes de un proveedor, cuyas dimensiones ha repre-
sentado mediante el histograma de la siguiente figura:
LEi LEs

Segn se aprecia, el proveedor slo enva los componentes que cumplen con las especificaciones
establecidas, descartando los defectuosos. Qu ventajas puede tener la empresa si exige a su pro-
veedor que centre el proceso?
a) Ninguna, pues lo que importa es que cumpla con las especificaciones.
b) Puede exigir precios ms bajos a su proveedor.
c) Puede ahorrarse los costos de inspeccin.
d) Todas las respuestas anteriores son correctas, excepto (a).
e) No se puede saber, pues faltan datos.
2. Suponga que usted es el gerente de una empresa que fabrica discos metlicos recubiertos con pls-
tico. El jefe de produccin tiene una muestra que fue extrada durante 3 das de produccin. En la
siguiente figura se muestra el histograma que representa dicha muestra. Qu le dira al jefe de
produccin?
Espesor del recubrimiento
(milsimas de pulgada)
2
4
12 20 28 36 44

3. Una empresa, que quiere analizar las ventas de sus productos en esta campaa navidea, ha toma-
do datos de las ventas (en soles) realizadas en sus dos tiendas durante este mes de diciembre. Para
hacer un mejor anlisis, ha construido el siguiente histograma:





Qu comentarios puede hacer al respecto?
4. Un fabricante de un compuesto est preocupado por la densidad de su producto. Anlisis previos
han demostrado que dicho compuesto tiene las caractersticas requeridas slo si la densidad se en-
cuentra entre 5,40 g/cm
2
y 6,02 g/cm
2
. Si una muestra de 100 piezas da un promedio de 5,69 g. y
una desviacin estndar de 0,1 g. Se puede afirmar que su proceso es capaz? Qu recomendara
al jefe de produccin?
Respuesta: no es capaz, pues c
pk
= 0,967. Convendra centrar el proceso, y ms an, reducir la va-
riabilidad del proceso.
Venta
Herramientas estadsticas para mejorar la calidad de los procesos


239
5. Se afirma que un proceso cuya tolerancia es de 45 mm. no es capaz, a pesar de que la desviacin
estndar es igual a 13,11 mm. Es posible esto?
6. Cmo cree que debera ser el histograma de la longitud de los trozos de madera de desecho en un
taller de carpintera?
Respuesta: con sesgo positivo; esto revelara que se desechan pocos trozos grandes.
7. Explique qu implicara calcular el ndice de capacidad de un proceso si se emplea 8 en vez de
6.
Respuesta: Empleando 8 se medira un ndice de capacidad menor; por lo tanto se estara siendo
ms estricto al valorar qu tan capaz es un proceso.
8. Las especificaciones para cierta dimensin de un producto elaborado mediante un proceso son:
3,000 0,006 pulgadas. Una muestra grande indica un promedio de 2,998 pulgadas y una desvia-
cin estndar de 0,002 pulgadas. Suponga que se puede ajustar el proceso, con un gasto de $750,
para cambiar el promedio a la especificacin nominal, es decir, a 3,000 pulgadas. Cada producto
fuera de los lmites de especificacin significa una prdida de $5.
a) Determine en cunto mejora el ndice de capacidad del proceso si se hace el ajuste especifica-
do.
Respuesta: mejora en 0,3333
b) Si se hace el ajuste del proceso para producir un lote de 10 000 unidades, se lograra un aho-
rro?
Respuesta: S, se espera ahorrar $254,10.
9. Conteste verdadero (V) o falso (F).
a) El muestreo de aceptacin determina si un proceso funciona correctamente.
b) Un proceso productivo que est bajo control suele generar histogramas simtricos.
c) Si se van obteniendo puntos fuera de los lmites de control, es casi seguro que no se cumpla
con los lmites de especificacin.
d) Para detectar posibles fallas en un proceso conviene emplear los grficos de control en lugar
de estudiar la capacidad del proceso.
e) es la probabilidad P
a
cuando la proporcin de productos defectuosos es indeseable.
f) es la probabilidad (1 P
a
) cuando la proporcin de productos defectuosos no corresponde
con la especificada por el productor.
10. Se observa que el grfico de medias aritmticas de un proceso ha estado bajo control. Si el rango
disminuye repentina y significativamente, entonces la media:
a) siempre aumentar.
b) se mantendr igual.
c) siempre disminuir.
d) ocasionalmente hay una indicacin de fuera de control para cualquiera de los lmites.
e) ninguno de los anteriores.
11. En la siguiente tabla se presentan medidas extradas de 13 lotes producidos sucesivamente. De ca-
da lote se ha extrado una muestra de 5 medidas. Trace los grficos de control de media, mediana y
de rangos, y comente los resultados obtenidos.

Lote N 1 2 3 4 5 6 7 8 9 10 11 12 13
47 19 13 29 28 40 15 25 37 23 28 31 22
32 37 31 29 12 35 30 44 37 45 44 25 37
44 31 24 42 45 11 12 32 26 26 40 24 19
35 25 46 59 36 38 33 11 20 37 31 32 47

Valores
medidos
20 34 44 38 25 33 26 38 35 32 18 22 14

Herramientas estadsticas para mejorar la calidad de los procesos

240
12. Se desea controlar el proceso de llenado de bolsitas con cocoa, mediante grficos de control me-
diadesviacin estndar, para lo cual se han tomado muestras de seis bolsitas durante 20 horas
consecutivas, como se muestra en la siguiente tabla. Determine si se pueden instalar dichos grfi-
cos de control.
Hora
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
74,86 74,84 73,82 75,15 74,79 75,18 75,46 74,91 76,49 74,45 75,93 75,03 74,70 75,40 74,27 74,44 74,69 75,41 74,44 75,12
76,31 74,95 73,91 74,67 75,87 74,79 74,09 74,78 74,40 75,25 74,34 74,51 75,26 74,17 75,50 74,83 73,71 75,40 75,05 75,08
76,08 75,60 76,62 74,87 74,35 74,82 75,27 74,95 75,37 75,28 73,62 75,56 74,74 74,78 75,68 74,37 75,80 74,57 75,21 74,44
75,84 74,96 74,90 74,93 75,17 74,55 75,11 76,32 75,29 75,25 74,93 75,15 75,94 74,01 75,03 74,77 75,09 74,43 74,21 73,94
74,78 75,16 75,63 73,90 75,46 76,17 75,31 75,03 75,48 74,36 75,84 74,89 75,38 74,16 74,68 74,09 74,36 74,79 73,43 75,41
74,94 74,65 73,73 74,77 75,52 74,95 75,87 74,76 75,43 75,40 75,58 76,14 74,73 74,95 74,32 74,32 75,63 75,67 74,17 75,99
Respuesta: no se pueden instalar, pues hay una racha de 9 puntos en el grfico de medias.
13. Una biblioteca universitaria considera que ordenar entre 200 y 400 libros cada mes. Se han ras-
treado las rdenes de los ltimos 23 meses, con los siguientes resultados:

1 2 3 4 5 6 7 8 9 10 11 12
275 335 336 363 319 400 376 245 240 300 210 363
13 14 15 16 17 18 19 20 21 22 23
368 325 400 491 500 400 175 297 170 271 250

a) El proceso de rdenes se encuentra bajo control?
b) El proceso de rdenes cumple con las especificaciones?
14. El jefe de una biblioteca universitaria quiere medir y controlar el nivel de satisfaccin de los alum-
nos usuarios respecto a la rapidez con que se les entrega los libros para prstamo. Para esto ha en-
cuestado diariamente a 10 alumnos que salan de la biblioteca con algn libro prestado, durante 22
das del mes pasado, pidindoles que escojan una alternativa para la siguiente afirmacin:
Usted considera que la rapidez con que se le ha entregado el libro que ha solicitado es:
1) Muy baja. 2) Baja. 3) Ni baja ni alta. 4) Alta. 5) Muy alta.
A cada una de estas respuestas se les da el puntaje 1, 2, 3, 4, 5, respectivamente. De esta manera,
un promedio alto indicar un alto nivel de satisfaccin de los usuarios.
En la siguiente tabla se muestran los promedios de los puntajes obtenidos durante los 22 das.
Das
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
3 1 2 1 3 2 1 1 1 1 1 2 1 1 1 1 1 1 1 2 1 2
4 1 1 3 1 1 1 1 2 1 2 1 2 1 1 2 3 2 1 2 1 2
2 2 2 3 1 2 2 4 5 2 2 2 3 1 1 1 4 1 3 1 3 5
1 3 1 1 3 1 3 1 1 1 1 1 3 3 3 3 1 4 2 2 2 4
2 3 2 1 1 1 2 1 3 1 1 1 2 5 2 1 1 3 1 1 1 1
1 3 3 1 3 1 2 4 5 2 2 2 2 1 4 1 3 2 1 1 1 1
2 2 1 1 3 1 1 3 2 2 2 3 3 1 1 1 4 1 2 1 2 2
3 4 2 2 1 2 3 1 2 1 1 2 4 1 1 2 5 3 2 1 2 3
1 2 1 1 4 2 2 2 1 1 3 1 1 2 4 4 3 4 1 1 3 1
2 1 3 1 2 2 4 3 2 1 1 5 1 2 2 2 1 2 2 1 2 1
Determine si se pueden instalar grficos de control mediarango.
15. Una distribuidora recibe diariamente paquetes de 400 tuercas de un fabricante, que luego vende a
ferreteras locales. El porcentaje de tuercas defectuosas es, en promedio, 2,75%.
a) En qu rango puede considerarse estadsticamente aceptable la variacin del porcentaje de
tuercas defectuosas?
Herramientas estadsticas para mejorar la calidad de los procesos


241
b) En qu rango puede considerarse estadsticamente aceptable la variacin del nmero de tuer-
cas defectuosas?
16. Qu hara si, luego de tomar datos para instalar un grfico de control de una variable de calidad:
a) tres puntos se encuentran fuera de los lmites de control?
b) dos puntos se encuentran fuera de los lmites de control?
c) hay una racha?
17. Por qu es ms pequea la distancia entre los lmites de control de un grfico de control de me-
dias, que la distancia entre los lmites de especificacin?
18. Cundo conviene instalar un grfico de control de proporcin de unidades defectuosas en vez de
nmero de unidades defectuosas? Cundo conviene instalar un grfico de control de nmero de
defectos en vez de nmero de defectos por unidad?
19. Se toman muestras de n = 8 de un proceso de manufactura a intervalos regulares. Se mide cierta
caracterstica de calidad (distribuida normalmente) y se calculan los valores de x y R para cada
muestra. Despus de 50 muestras se tiene:
1000
50
1
=

= i
i
x ; 250
50
1
=

= i
i
R
a) Calcule los lmites de control para los grficos de control de medias y de rangos.
Respuesta: LC
x
= 20 1,865; LCI
R
= 0,68; LCS
R
= 9,32.
b) Si los lmites de especificacin son: 21 5,0. Cul es su conclusin acerca de la capacidad
del proceso?
Respuesta: el proceso no es capaz, pues c
pk
= 0,785.
20. Un plan de muestreo n = 25; c = 0 para un lote muy grande implica un alto riesgo para un produc-
tor que afirma que tiene un mximo de 2% de productos defectuosos.
a) Explique por qu y determine dicho riesgo.
b) Qu porcentaje de defectuosos tendra que afirmar que tiene el productor para que su riesgo
no supere el 10%?
21. Una empresa recibe lotes de 1 000 productos, los cuales se pueden inspeccionar a $0,70/unidad. Si
acepta material defectuoso, se incurre en un costo de $14 /unidad. Se propone un plan de muestreo
n = 75; c = 2. Si el porcentaje de productos defectuosos es aproximadamente 2,2%, se justifica el
plan de muestreo?
22. Defina un plan de muestreo con n = 100 para un lote muy grande enviado por un productor que
afirma que p = 0,02; tratando que el riesgo del productor no supere el 10% y el nivel de calidad
lmite sea el menor posible. Determine adems el nivel de calidad lmite. Considere el valor usual
de = 0,10.
Respuesta: n = 100; c = 4; NCL = 0,0797.
23. Un fabricante vende su producto en lotes grandes a un cliente que utiliza un plan de muestreo n =
180, c = 2. Si un lote es rechazado se regresar al fabricante, quien ha decidido arriesgarse y en-
viar el mismo lote rechazado al cliente, sin revisarlo, con la esperanza de que la segunda vez el
muestreo lo lleve a aceptar el lote. Cul es la probabilidad de que esto ocurra, es decir, de que un
lote sea rechazado y luego aceptado, si p = 0,02?
24. Cmo influye la pendiente de la curva CO en la proteccin para el productor y para el consumi-
dor?
25. Se establece el siguiente plan de muestreo: n = 250; c = 5.
a) Determine NCA si el riesgo del productor es 0,025.
Respuesta: 0,88%
b) Determine NCA si el riesgo del productor es 0,05.
Respuesta: 1,04%
Herramientas estadsticas para mejorar la calidad de los procesos

242
26. La probabilidad de aceptar un producto con un nivel de calidad aceptable se define como:
a) NCA
b)
c)
d) 1
e) 1
27. Defina un plan de muestreo con n > 100 para un lote muy grande enviado por un fabricante que
afirma que p = 3%, tratando que el riego del productor est entre el 5% y el 10% y el nivel de cali-
dad lmite no supere el 9%.
28. Para calificar la bondad de un plan de muestreo debe tenerse en cuenta:
a) NCA y c
b) NCA
c) NCA y NCL
d) NCL y
29. Un fabricante nacional de equipo de navegacin compra partes de una compaa alemana, en lotes
de 5 000 unidades. El fabricante planea un muestreo de 50 piezas por lote.
a) Construya la curva CO para c = 0; 2 y 5.
b) Determine y NCL en cada caso, si NCA = 0,02 y = 0,10.
30. Determine P
a
para un plan de muestreo n = 110; c = 3 para lotes muy grandes con:
a) 1% de productos defectuosos.
Respuesta: 0,974
b) 2% de productos defectuosos.
Respuesta: 0,580
c) 5% de productos defectuosos.
Respuesta: 0,058208





Teora de decisiones 243


Captulo 16. Teora de decisiones.
16.1 Introduccin.
En todas las empresas, fbricas, tiendas, etc., se toman decisiones continuamente. Se tiene que
decidir, por ejemplo:
Cuntas horas-hombre contratar el prximo mes.
Cunto gastar en publicidad de un producto el prximo ao.
Cuntas mochilas comprar para la campaa escolar.
Si conviene introducir un nuevo producto en el mercado.
Si conviene comprar una mquina para elaborar un componente de un producto final, o seguir
comprando el componente a un proveedor.
Si conviene reemplazar o reconstruir un equipo.
En cada uno de estos ejemplos se ve que son posibles dos o ms cursos de accin. Generalmente
las decisiones se toman con base en la intuicin de personas expertas; pero existe el peligro de equivo-
carse por no hacer un anlisis profundo de las decisiones posibles y sus consecuencias.
16.2 Definiciones
16.2.1 Decisor
Es un ente individual o colectivo capaz de tomar decisiones. Se asocia al decisor un conjunto de
decisiones posibles {a
i
}.
16.2.2 Alternativas de decisin
Es el conjunto de decisiones o acciones {a
i
} entre las cuales el decisor debe elegir una.
16.3 Estados de la naturaleza
Son las circunstancias que influyen en el beneficio que va a recibir el decisor y sobre los cuales
l no puede influir. A los distintos estados de la naturaleza se les denomina {b
j
}.
Segn el conocimiento que se tenga de los posibles estados de la naturaleza, se puede tener:
16.3.1 Ambiente de certeza
Cuando el decisor conoce perfectamente el estado de la naturaleza para la decisin que tome.
16.3.2 Ambiente de riesgo
Cuando no se dispone de informacin perfecta como el caso anterior, pero se conocen las proba-
bilidades de ocurrencia de los diferentes estados de la naturaleza. En este captulo se analizarn situa-
ciones de este tipo.
16.3.3 Ambiente de incertidumbre
Cuando no se dispone de ninguna informacin sobre las probabilidades con que pueden ocurrir
los estados de la naturaleza. El decisor debe elaborar un criterio que depender mucho de su criterio
particular.
244 Teora de decisiones

16.3.4 Ambiente de competencia
Cuando influyen causas promovidas por otro decisor, pudiendo sus decisiones influir negativa-
mente en el beneficio. Esto significa que lo que suponga un beneficio para un decisor, ser un perjui-
cio para el otro. La teora de juegos, que es parte de la Investigacin de Operaciones, se encarga de
analizar situaciones como sta.
16.4 Consecuencias
Son los resultados asociados a cada accin. Dependen de la decisin que tome el decisor y del
estado de la naturaleza que se presente. No est dems aclarar que un estado de la naturaleza se pre-
sentar despus de que el decidor haya escogido una accin.
A los resultados se les suele cuantificar con un valor (v
ij
), que representa el costo o beneficio que
se obtiene cuando se toma la decisin i y ocurre el estado de la naturaleza j.
En la siguiente tabla se pueden identificar los conceptos ya explicados:

Estados de la naturaleza

b
1
b
2


b
n
a
1
v
11
v
12
v
1n

a
2
v
21
v
22
V
2n

...
...
Alternativas
de decisin
a
m
v
m1
v
m2
v
mn

16.5 Criterios de decisin
Para una mejor comprensin de los criterios de decisin que se pueden adoptar, se aplicar cada
uno de stos al ejemplo 1. El lector debe decidir cul de los criterios le conviene emplear, lo cual de-
pender de la situacin especfica que se presente y de su nivel de aversin al riesgo.
Ejemplo 1:
Diariamente, un vendedor de peridicos (se puede suponer cualquier producto perecedero) debe
decidir cuntos peridicos comprar. Cada peridico lo compra a S/.2 y lo vende a S/.2.50. Los
peridicos que no vende durante el da los pierde. Por experiencia, ha encontrado que puede
vender entre 6 y 10 peridicos, con la misma probabilidad de ocurrencia. Cuntos peridicos le
conviene comprar cada da?
En la siguiente tabla se representan los posibles beneficios de este problema de decisin, que se
calculan fcilmente a partir de los datos:

Posible demanda

6 7 8 9 10
6 3 3 3 3 3
7 1 3,50 3,50 3,50 3,50
8 -1 1,50 4 4 4
9 -3 -0,50 2 4,50 4,50
Posible
pedido
10 -5 -2,50 0 2,50 5
16.5.1 Criterio Maximin
Es un criterio muy pesimista. Elige la accin que maximiza el peor resultado; es decir, de los
peores resultados de cada accin posible, se escoge el mejor. As se asegura que, en el peor de los ca-
sos, el resultado sea lo mejor posible.
Aplicando este criterio al ejemplo 1, habra que escoger el mayor beneficio entre los menores
de cada pedido posible: 3, 1, -1, -3 y -5. El mayor es 3; por lo tanto se pediran 6 peridicos.
Teora de decisiones 245


16.5.2 Criterio Maximax
Es un criterio muy optimista. Elige la accin que determina el mejor resultado entre los mejores
de cada accin posible.
Aplicando este criterio al ejemplo 1, habra que escoger el mayor beneficio entre los siguientes:
3; 3,50; 4; 4,50; 5. El mayor es 5; por lo tanto se pediran 10 peridicos.
16.5.3 Criterio realista
Es un criterio que se sita entre el optimismo del criterio maximax y el pesimismo del criterio
maximin. El decisor debe elegir un coeficiente de optimismo () comprendido entre 0 y 1. As, para
cada accin posible, la medida de realismo ser:
r = (beneficio mximo) + (1 ) (beneficio mnimo)
Como se trata de obtener el mximo beneficio posible, el decisor elegir el mayor valor de r.
Aplicando este criterio al ejemplo 1, para = 0,6:
r
6
= 0,6 (3) + (1 0,6) (3) = 3 mnimo
r
7
= 0,6 (3,50) + (1 0,6) (1) = 2,50
r
8
= 0,6 (4) + (1 0,6) (-1) = 2
r
9
= 0,6 (4,50) + (1 0,6) (-3) =1,50
r
10
= 0,6 (5) + (1 0,6) (-5) =1
Por lo tanto, se decide comprar 6 peridicos.
16.5.4 Criterio minimax del costo de oportunidad
Elige la accin que minimiza el mayor costo de oportunidad posible. El costo de oportunidad es
lo que se podra haber ganado adicionalmente si se hubiese elegido la mejor accin posible. Por ejem-
plo, si se piden 6 peridicos y la demanda es de 8 peridicos, la ganancia es de S/.3; pero, siendo la
demanda de 8 peridicos, si hubiese pedido 8 la ganancia hubiera sido S/.4. El costo de oportunidad
es: 4 3 = S/.1.
En resumen, este criterio trata de minimizar lo que se deja de ganar.
Para el ejemplo 1, la matriz de costos de oportunidad se puede calcular fcilmente:

Posible demanda

6 7 8 9 10
6 0 0,50 1 1,50 2
7 2 0 0,50 1 1,50
8 4 2 0 0,50 1
9 6 4 2 0 0,50
Posible
pedido
10 8 6 4 2 0

Aplicando este criterio, habra que escoger el menor costo entre los siguientes: 2 ,2 ,4 ,6 ,8; por
lo tanto pedira 6 7 peridicos; pues en ambos casos el costo es mnimo: S/.2.
16.5.5 Criterio del valor esperado (de Bayes)
Elige la accin que produce la mxima ganancia esperada. Para el ejemplo 1, las ganancias espe-
radas para cada accin posible son:
G
6
= 0,2(3) + 0,2(3) + 0,2(3) + 0,2(3) + 0,2(3) = 3
G
7
= 0,2(1) + 0,2(3,50) + 0,2(3,50) + 0,2(3,50) + 0,2(3,50) = 3
G
8
= 2,50
G
9
= 1,50
G
10
= 0
Aplicando este criterio, pedira 6 7 peridicos.
246 Teora de decisiones

16.5.6 Criterio del costo de oportunidad esperado
Elige la accin que produce el mnimo costo de oportunidad esperado. Para el ejemplo 1, los
costos de oportunidad esperados son:
C
6
= 0,2(0) + 0,2(0.50) + 0,2(1) + 0,2(1,50) + 0,2(2) = 1
C
7
= 1
C
8
= 1,50
C
9
= 2,50
C
10
= 4
Aplicando este criterio, pedira 6 7 peridicos.
16.5.7 Criterio de mxima verosimilitud
Elige el estado de la naturaleza que tiene la mayor probabilidad de ocurrencia, y, despus, asu-
miendo que ocurrir dicho estado, elige la accin que da el mayor beneficio.
En el ejemplo 1 no se puede aplicar este criterio, pues todos los estados de la naturaleza tienen la
misma probabilidad de ocurrencia.
16.6 rboles de decisin
Las tablas de decisin elaboradas en el apartado anterior son muy tiles para representar pro-
blemas de una sola etapa. Existen problemas con dos o ms etapas, en donde hay una sucesin de ac-
ciones y eventos, que conviene representar mediante rboles para poder hacer un mejor anlisis.
A continuacin se resuelve el ejemplo 2 empleando un rbol de decisin que se dibuja expresa-
mente para esa situacin.
En los rboles se suele seguir el siguiente convenio tcito: las acciones posibles se ramifican a
partir de un cuadrado, y los estados de la naturaleza a partir de un crculo (ver figura 16.1).
Ejemplo 2:
Una editorial est considerando lanzar una revista mensual con artculos e informacin de inte-
rs para economistas y empresarios. Con base en su experiencia pasada y en sus percepciones, el
gerente de la editorial ha estimado las siguientes ganancias anuales (en soles), considerando tres
niveles distintos de demanda de su revista.
Si no edita la revista Si edita la revista
Demanda baja 0 150 000
Demanda regular 0 50 000
Demanda alta 0 200 000
El gerente estima adems que las probabilidades de estos tres niveles de demanda son:
P(baja) = 0,5; P(regular) = 0,2; P(alta) = 0,3
Adems, el gerente pronostica que la competencia para su revista ser muy grande, por lo que
piensa en la posibilidad de hacer un sondeo de mercado sobre la aceptacin que tendr su revis-
ta. Suponga que este sondeo, que le costara S/.5 000 a la editorial, slo indicar si el diagnsti-
co es favorable o si es desfavorable, con lo que se decidir si editar o no la revista. Con base en
experiencias previas en relacin a otras publicaciones, el gerente ha establecido las siguientes
probabilidades condicionales, dadas las posibles demandas:
P(diagnstico favorable \ demanda baja) = 0,10
P(diagnstico favorable \ demanda regular) = 0,60
P(diagnstico favorable \ demanda pobre) = 0,90
Cul es la mejor decisin para la editorial?
En la siguiente tabla se introducen las probabilidades dadas y se calculan las probabilidades
condicionales, procediendo tal como se explic en 1.7.4 y 1.7.5.
Teora de decisiones 247


Demanda baja Demanda regular Demanda alta
Diagnstico favorable 5 12 27 44
Diagnstico desfavorable 45 8 3 56
50 20 30 100
En la figura 16.1 se representa un rbol con todas las posibles decisiones, los posibles estados
de la naturaleza, sus probabilidades condicionales de ocurrencia y las ganancias esperadas de
los estados finales posibles. Por ejemplo, si el diagnstico es favorable, se tendra una ganancia
de -155 000 soles.
Hacer
sondeo
No hacer
sondeo
Favorable
Desfavorable
Editar
No editar
D. baja
D. regular
D. alta
D. baja
D. regular
D. alta
D. baja
D. regular
D. alta
Editar
No editar
Editar
No editar
27/44
5/44
12/44
3/56
45/56
8/56
-155 000
45 000
195 000
0,44
0,56
47 500
-155 000
45 000
195 000
-150 000
50 000
200 000
0,50
0,20
0,30
114 318,18
-5 000
-107 678,57
-5 000
-5 000
114 318,18
-5 000
0
0

Figura 16.1. rbol de decisin del ejemplo 2.
Ntese que la primera decisin que debe tomar el gerente de la editorial es si hace o no el son-
deo; esta decisin le ayudar a decidir luego si edita o no la revista, con base en el resultado del
sondeo. Adems, en el rbol se han expresado las probabilidades condicionales calculadas a par-
tir de la tabla anterior, por ejemplo:
P(demanda baja \ diagnstico favorable) = 5/44
P(demanda regular \ diagnstico favorable) = 12/44
P(demanda pobre \ diagnstico favorable) = 27/44
248 Teora de decisiones

Una vez expresadas las probabilidades en el rbol, resulta fcil calcular las ganancias esperadas
para cada decisin, utilizando el criterio de Bayes. Con base en estas ganancias esperadas se de-
cide si editar o no editar, escogiendo la accin que d la mayor ganancia. Por ejemplo, si el re-
sultado del sondeo es favorable, por editar la revista se espera ganar 114 318,18 soles y por no
editarla se espera perder 5 000 soles. Evidentemente se elige editarla. Siguiendo este mismo pro-
cedimiento se elige no editar la revista para el caso en que el diagnstico sea desfavorable, con
una prdida esperada de 5 000 soles. Como se conoce la probabilidad de que el sondeo d un
diagnstico favorable y que d un diagnstico desfavorable, aplicando el criterio de Bayes se
calcula la ganancia que se espera tener si se hace sondeo, que resulta 47 500. Siguiendo este
mismo procedimiento se llega a obtener la ganancia esperada si no se hace sondeo: cero.
Por lo tanto se decide hacer el sondeo, pues reporta mayor ganancia esperada. Si el sondeo da un
diagnstico favorable, convendr editar la revista; y si el diagnstico es desfavorable, convendr
no editarla.
Teora de decisiones 249


Problemas propuestos
1. Un fabricante de discos est considerando varios mtodos alternativos de expandir su produccin
para adecuar una demanda creciente. A continuacin se muestra una tabla de beneficios (en miles
de dlares) que le ha elaborado un consultor de empresas para los prximos 5 aos. Diga qu deci-
sin tomara siguiendo cada uno de los criterios: maximin, maximax, minimax del costo de opor-
tunidad, Bayes, costo de oportunidad esperado y mxima verosimilitud.
Demanda
DECISIN POSIBLE Alta Moderada Baja Nula
Expandir 500 250 -250 -450
Construir nueva planta 700 300 -400 -800
Subcontratar 300 150 -10 -100
PROBABILIDAD 0,25 0,40 0,30 0,05

2. El propietario de un terreno ha recibido una oferta de una compaa para explorar su terreno pues
es muy probable que haya petrleo. La oferta es de $450 000, con la posibilidad de recibir $500
000 ms si encuentran petrleo y les cede los derechos de explotacin. El propietario del terreno
piensa en la posibilidad de explorar l mismo, y ha averiguado que le costara $100 000, los cuales
los perdera si no encuentra petrleo; pero si encuentra, sus ingresos seran de $1 300 000. Un ex-
perto ha estimado que la probabilidad de que haya petrleo es 0,6.
a) Diga qu decisin aconsejara al propietario siguiendo cada uno de los siguientes criterios:
maximin, maximax, minimax del costo de oportunidad, Bayes, costo de oportunidad esperado,
mxima verosimilitud.
b) Supngase que existe la posibilidad de realizar una prueba para estimar mejor la probabilidad
de que haya petrleo, con un costo de $20 000. La empresa que realiza estas pruebas acepta
que el 20% de las veces indica que no hay petrleo cuando s hay; y que cuando no hay petr-
leo, la prueba lo indica el 90% de las veces. Qu aconsejara usted al propietario?
3. Daniel puede usar su lancha durante el verano para la pesca o puede alquilarla para recreacin a
los veraneantes de La Punta, a $100 diarios. Cuando el clima es bueno, la alquila un promedio de
80 das; pero cuando el clima no es bueno, slo la alquila un promedio de 55 das. Daniel ha calcu-
lado que por cada da de alquiler tiene unos gastos de $25. Cuando el clima es bueno, las utilida-
des de la pesca son en promedio $6 200. Cuando el clima no es bueno, la pesca le da un promedio
de $3 100 de utilidad. Para este verano, Daniel ha averiguado en un reporte meteorolgico gratuito
que la probabilidad de tener buen clima es 0,70. Su amigo Alejo, que dirige un servicio privado de
pronstico meteorolgico afirma que en el 80% de las temporadas que hubo buen clima pronostic
buen clima y en el 90% de las temporadas en que hubo mal clima pronostic mal clima. Cunto
pagara a Alejo por el pronstico meteorolgico para la temporada?
Respuesta: Pagara menos de $81,25.
4. Fernando, un joven ingeniero, quiere construir un edificio con 10, 20 30 habitaciones para alqui-
lar a estudiantes de la UDEP, para lo cual debe decidir cunto invertir. En las urbanizaciones veci-
nas a la UDEP ya hay edificios con habitaciones para estudiantes, por lo que Fernando no est
muy seguro de qu tan fuerte ser la demanda para su proyecto. Si fuese conservador y construye
pocas habitaciones, perdera utilidades potenciales si la demanda resulta ser alta. Por otra parte, re-
sultara poco rentable tener muchas habitaciones sin alquilar. En la siguiente tabla se muestran las
posibles utilidades anuales (en dlares), sobre la base de tres niveles de demanda.
Demanda baja Demanda mediana Demanda alta
Construir 10 5000 5000 5000
Construir 20 0 10000 10000
Construir 30 6000 4000 15000
Probabilidad 0,2 0,5 0,3
250 Teora de decisiones

Para reducir la incertidumbre sobre el nmero de habitaciones que debe construir, Fernando puede
realizar una encuesta que dar como resultado una de las tres medidas de demanda: baja, mediana
o alta. Esta encuesta se la puede realizar una pequea empresa consultora de Piura, (ECP) que pre-
senta el siguiente historial:
La empresa consultora pronostic
Cuando la demanda result Demanda baja Demanda mediana Demanda alta
Baja 0,7 0,2 0,1
Mediana 0,3 0,4 0,3
Alta 0,1 0,3 0,6
El costo de la encuesta depende de la confiabilidad y del mximo error muestral que se fije, y de-
be discutirse. Qu decisin debe tomar Fernando?
Respuesta: debe solicitar la encuesta a ECP, slo si sta cobra menos de 1 970 dlares. Si ECP
pronostica demanda baja, le conviene construir 10 habitaciones (espera ganar 5 000 dlares); si
pronostica demanda mediana, le conviene construir 20 habitaciones (espera ganar 7 000 dlares);
y si pronostica demanda alta, le conviene construir 30 habitaciones (espera ganar 9 600 dlares).
5. En un taller de manufactura se est considerando la posibilidad de inspeccionar pequeas muestras
extradas de unos lotes de artculos que le llegan de un proveedor, con el propsito de determinar
si se acepta o se rechaza cada lote. En el pasado le han llegado tres tipos de lotes de artculos de
dicho proveedor: A, B y C, que contenan 90%, 80% y 70% de artculos de ptima calidad, respec-
tivamente. Estos porcentajes han ocurrido en el 50%, 30% y 20% de los casos, respectivamente.
Debido a las caractersticas del proceso de manufactura, se puede tomar una muestra de slo 2 ar-
tculos de cada lote. Esta inspeccin tendra un costo de $5. Un detallado anlisis de costos de
oportunidad (expresan lo que se deja de ganar) ha permitido elaborar la siguiente tabla:
Accin
Tipo de lote
Rechazar el lote Aceptar el lote
A $200 $0
B $0 $100
C $0 $200
Como resultado del muestreo de cada lote, se puede tener: 0, 1 2 artculos de ptima calidad. Se-
gn el resultado del muestreo, el jefe del taller decidir si acepta o rechaza el lote Qu decisin
debe tomarse?
Respuesta: Le conviene hacer la inspeccin, con un costo esperado de $62,78. Si en la muestra los
dos artculos son de ptima calidad, conviene aceptar el lote; en caso contrario, conviene rechazar-
lo.
6. Una empresa comercializadora debe clasificar los lotes de cierta fruta que le llegan de un agricul-
tor, en uno de dos tipos: A o B. Para hacer esta clasificacin tiene dos posibilidades: una simple
inspeccin ocular, sin costo alguno, o una revisin de una muestra de 10 unidades, que le costara
$10. Generalmente, de los lotes que le han llegado, el 70% han sido tipo A y el 30% de tipo B.
Adems, haciendo esta revisin de 10 unidades, cuando le han llegado lotes tipo A los ha clasifi-
cado bien en el 90% de los casos, y cuando le han llegado lotes tipo B los ha clasificado bien en el
80% de los casos. Las utilidades que ha tenido con estos dos tipos de lote, segn como los clasifi-
c, se resumen en la siguiente tabla. Qu debe hacer la empresa comercializadora para lograr el
mximo beneficio?


Clasificacin del lote de frutas
Tipo del lote
de frutas
Tipo A Tipo B
A $460 $380
B $290 $370
Teora de decisiones 251


7. Christian, un joven ingeniero de sistemas ha desarrollado un novedoso software que puede vender
a una conocida empresa de desarrollo de softwares, a $20 000. Tambin lo puede comercializar l
mismo, con estos posibles resultados: que no tenga aceptacin, lo cual significara una prdida de
$5 200; que s tenga aceptacin, que significara una utilidad de $52 000. Un compaero, experto
en este tipo de negocios, estima que las probabilidades de aceptacin y rechazo del software son
0,6 y 0,4. Christian se entera que podra pedirle a una empresa consultora un pronstico sobre la
posible reaccin del mercado, a un costo de $1 000. El gerente de la empresa consultora afirma
que cuando ha hecho este tipo de pronsticos ha acertado en el 90% de los casos en que el produc-
to no fue aceptado, y en el 80% de los casos en que el producto fue aceptado. Qu le aconsejara
usted a Christian?
8. El propietario de un terreno ha hecho un contrato por 30 das con una inmobiliaria para su venta,
estipulando un precio de $25 000. La inmobiliaria cobra el 4% de comisin sobre lo vendido.
Adems, ha estimado que necesitara gastar $800 para efectuar la venta en el plazo estipulado. La
probabilidad de vender el terreno en el tiempo estipulado es 0,7. Diga si a la inmobiliaria le con-
viene aceptar la oferta para la venta del terreno siguiendo los siguientes criterios:
a) Maximin; b) Maximax; c) Realista ( = 0.8); d) Bayes; e) Mnimax del costo de oportunidad; f)
Costo de oportunidad esperado; g) Mxima verosimilitud.
9. El propietario del terreno del problema 8 le ha ofrecido a la inmobiliaria, en caso que venda el te-
rreno durante esos 30 das, una de dos propiedades que tiene: una casa en la Urbanizacin Santa
Mara del Pinar a $50 000 y otra en la Urbanizacin Los Geranios a $100 000, ambas por 90 das.
La inmobiliaria ha estimado que los gastos que necesitara hacer para efectuar las ventas de las ca-
sas de Santa Mara del Pinar y Los Geranios en el plazo estipulado ascienden a $200 y $400, res-
pectivamente. Adems, ha estimado que las probabilidades de vender dichas casas en el tiempo es-
tipulado son 0,6 y 0,5; respectivamente. Qu le aconsejara a la inmobiliaria?
Respuesta: Le aconsejara aceptar el terreno (espera ganar $1 020). Si vende el terreno, le aconse-
jara aceptar la casa de Los Geranios (espera ganar $1 800).

252 Apndice

Apndice

Las tablas estadsticas que se incluyen en este apndice han sido elaboradas con la ayuda de Excel.





Apndice

253
Tabla de probabilidades binomiales acumulativas

|
|
.
|

\
|
n
k x
x n x
q p
x
n

p
n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,0975 0,1900 0,2775 0,3600 0,4375 0,5100 0,5775 0,6400 0,6975 0,7500 2
2 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,1426 0,2710 0,3859 0,4880 0,5781 0,6570 0,7254 0,7840 0,8336 0,8750
2 0,0073 0,0280 0,0608 0,1040 0,1563 0,2160 0,2818 0,3520 0,4253 0,5000
3
3 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,1855 0,3439 0,4780 0,5904 0,6836 0,7599 0,8215 0,8704 0,9085 0,9375
2 0,0140 0,0523 0,1095 0,1808 0,2617 0,3483 0,4370 0,5248 0,6090 0,6875
3 0,0005 0,0037 0,0120 0,0272 0,0508 0,0837 0,1265 0,1792 0,2415 0,3125
4
4 0,0000 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 0,0256 0,0410 0,0625
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,2262 0,4095 0,5563 0,6723 0,7627 0,8319 0,8840 0,9222 0,9497 0,9688
2 0,0226 0,0815 0,1648 0,2627 0,3672 0,4718 0,5716 0,6630 0,7438 0,8125
3 0,0012 0,0086 0,0266 0,0579 0,1035 0,1631 0,2352 0,3174 0,4069 0,5000
4 0,0000 0,0005 0,0022 0,0067 0,0156 0,0308 0,0540 0,0870 0,1312 0,1875
5
5 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,2649 0,4686 0,6229 0,7379 0,8220 0,8824 0,9246 0,9533 0,9723 0,9844
2 0,0328 0,1143 0,2235 0,3446 0,4661 0,5798 0,6809 0,7667 0,8364 0,8906
3 0,0022 0,0158 0,0473 0,0989 0,1694 0,2557 0,3529 0,4557 0,5585 0,6563
4 0,0001 0,0013 0,0059 0,0170 0,0376 0,0705 0,1174 0,1792 0,2553 0,3438
5 0,0000 0,0001 0,0004 0,0016 0,0046 0,0109 0,0223 0,0410 0,0692 0,1094
6
6 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,3017 0,5217 0,6794 0,7903 0,8665 0,9176 0,9510 0,9720 0,9848 0,9922
2 0,0444 0,1497 0,2834 0,4233 0,5551 0,6706 0,7662 0,8414 0,8976 0,9375
3 0,0038 0,0257 0,0738 0,1480 0,2436 0,3529 0,4677 0,5801 0,6836 0,7734
4 0,0002 0,0027 0,0121 0,0333 0,0706 0,1260 0,1998 0,2898 0,3917 0,5000
5 0,0000 0,0002 0,0012 0,0047 0,0129 0,0288 0,0556 0,0963 0,1529 0,2266
6 0,0000 0,0000 0,0001 0,0004 0,0013 0,0038 0,0090 0,0188 0,0357 0,0625
7
7 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,3366 0,5695 0,7275 0,8322 0,8999 0,9424 0,9681 0,9832 0,9916 0,9961
2 0,0572 0,1869 0,3428 0,4967 0,6329 0,7447 0,8309 0,8936 0,9368 0,9648
3 0,0058 0,0381 0,1052 0,2031 0,3215 0,4482 0,5722 0,6846 0,7799 0,8555
4 0,0004 0,0050 0,0214 0,0563 0,1138 0,1941 0,2936 0,4059 0,5230 0,6367
5 0,0000 0,0004 0,0029 0,0104 0,0273 0,0580 0,1061 0,1737 0,2604 0,3633
6 0,0000 0,0000 0,0002 0,0012 0,0042 0,0113 0,0253 0,0498 0,0885 0,1445
7 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0085 0,0181 0,0352
8
8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0017 0,0039
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,3698 0,6126 0,7684 0,8658 0,9249 0,9596 0,9793 0,9899 0,9954 0,9980
2 0,0712 0,2252 0,4005 0,5638 0,6997 0,8040 0,8789 0,9295 0,9615 0,9805
3 0,0084 0,0530 0,1409 0,2618 0,3993 0,5372 0,6627 0,7682 0,8505 0,9102
4 0,0006 0,0083 0,0339 0,0856 0,1657 0,2703 0,3911 0,5174 0,6386 0,7461
5 0,0000 0,0009 0,0056 0,0196 0,0489 0,0988 0,1717 0,2666 0,3786 0,5000
6 0,0000 0,0001 0,0006 0,0031 0,0100 0,0253 0,0536 0,0994 0,1658 0,2539
7 0,0000 0,0000 0,0000 0,0003 0,0013 0,0043 0,0112 0,0250 0,0498 0,0898
8 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0038 0,0091 0,0195
9
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0008 0,0020
254 Apndice

p
n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,4013 0,6513 0,8031 0,8926 0,9437 0,9718 0,9865 0,9940 0,9975 0,9990
2 0,0861 0,2639 0,4557 0,6242 0,7560 0,8507 0,9140 0,9536 0,9767 0,9893
3 0,0115 0,0702 0,1798 0,3222 0,4744 0,6172 0,7384 0,8327 0,9004 0,9453
4 0,0010 0,0128 0,0500 0,1209 0,2241 0,3504 0,4862 0,6177 0,7340 0,8281
5 0,0001 0,0016 0,0099 0,0328 0,0781 0,1503 0,2485 0,3669 0,4956 0,6230
6 0,0000 0,0001 0,0014 0,0064 0,0197 0,0473 0,0949 0,1662 0,2616 0,3770
7 0,0000 0,0000 0,0001 0,0009 0,0035 0,0106 0,0260 0,0548 0,1020 0,1719
8 0,0000 0,0000 0,0000 0,0001 0,0004 0,0016 0,0048 0,0123 0,0274 0,0547
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0017 0,0045 0,0107
10
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,4312 0,6862 0,8327 0,9141 0,9578 0,9802 0,9912 0,9964 0,9986 0,9995
2 0,1019 0,3026 0,5078 0,6779 0,8029 0,8870 0,9394 0,9698 0,9861 0,9941
3 0,0152 0,0896 0,2212 0,3826 0,5448 0,6873 0,7999 0,8811 0,9348 0,9673
4 0,0016 0,0185 0,0694 0,1611 0,2867 0,4304 0,5744 0,7037 0,8089 0,8867
5 0,0001 0,0028 0,0159 0,0504 0,1146 0,2103 0,3317 0,4672 0,6029 0,7256
6 0,0000 0,0003 0,0027 0,0117 0,0343 0,0782 0,1487 0,2465 0,3669 0,5000
7 0,0000 0,0000 0,0003 0,0020 0,0076 0,0216 0,0501 0,0994 0,1738 0,2744
8 0,0000 0,0000 0,0000 0,0002 0,0012 0,0043 0,0122 0,0293 0,0610 0,1133
9 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0020 0,0059 0,0148 0,0327
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0022 0,0059
11
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0005
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,4596 0,7176 0,8578 0,9313 0,9683 0,9862 0,9943 0,9978 0,9992 0,9998
2 0,1184 0,3410 0,5565 0,7251 0,8416 0,9150 0,9576 0,9804 0,9917 0,9968
3 0,0196 0,1109 0,2642 0,4417 0,6093 0,7472 0,8487 0,9166 0,9579 0,9807
4 0,0022 0,0256 0,0922 0,2054 0,3512 0,5075 0,6533 0,7747 0,8655 0,9270
5 0,0002 0,0043 0,0239 0,0726 0,1576 0,2763 0,4167 0,5618 0,6956 0,8062
6 0,0000 0,0005 0,0046 0,0194 0,0544 0,1178 0,2127 0,3348 0,4731 0,6128
7 0,0000 0,0001 0,0007 0,0039 0,0143 0,0386 0,0846 0,1582 0,2607 0,3872
8 0,0000 0,0000 0,0001 0,0006 0,0028 0,0095 0,0255 0,0573 0,1117 0,1938
9 0,0000 0,0000 0,0000 0,0001 0,0004 0,0017 0,0056 0,0153 0,0356 0,0730
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0008 0,0028 0,0079 0,0193
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0011 0,0032
12
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,4867 0,7458 0,8791 0,9450 0,9762 0,9903 0,9963 0,9987 0,9996 0,9999
2 0,1354 0,3787 0,6017 0,7664 0,8733 0,9363 0,9704 0,9874 0,9951 0,9983
3 0,0245 0,1339 0,3080 0,4983 0,6674 0,7975 0,8868 0,9421 0,9731 0,9888
4 0,0031 0,0342 0,1180 0,2527 0,4157 0,5794 0,7217 0,8314 0,9071 0,9539
5 0,0003 0,0065 0,0342 0,0991 0,2060 0,3457 0,4995 0,6470 0,7721 0,8666
6 0,0000 0,0009 0,0075 0,0300 0,0802 0,1654 0,2841 0,4256 0,5732 0,7095
7 0,0000 0,0001 0,0013 0,0070 0,0243 0,0624 0,1295 0,2288 0,3563 0,5000
8 0,0000 0,0000 0,0002 0,0012 0,0056 0,0182 0,0462 0,0977 0,1788 0,2905
9 0,0000 0,0000 0,0000 0,0002 0,0010 0,0040 0,0126 0,0321 0,0698 0,1334
10 0,0000 0,0000 0,0000 0,0000 0,0001 0,0007 0,0025 0,0078 0,0203 0,0461
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0013 0,0041 0,0112
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0017
13
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001





Apndice

255
p
n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,5123 0,7712 0,8972 0,9560 0,9822 0,9932 0,9976 0,9992 0,9998 0,9999
2 0,1530 0,4154 0,6433 0,8021 0,8990 0,9525 0,9795 0,9919 0,9971 0,9991
3 0,0301 0,1584 0,3521 0,5519 0,7189 0,8392 0,9161 0,9602 0,9830 0,9935
4 0,0042 0,0441 0,1465 0,3018 0,4787 0,6448 0,7795 0,8757 0,9368 0,9713
5 0,0004 0,0092 0,0467 0,1298 0,2585 0,4158 0,5773 0,7207 0,8328 0,9102
6 0,0000 0,0015 0,0115 0,0439 0,1117 0,2195 0,3595 0,5141 0,6627 0,7880
7 0,0000 0,0002 0,0022 0,0116 0,0383 0,0933 0,1836 0,3075 0,4539 0,6047
8 0,0000 0,0000 0,0003 0,0024 0,0103 0,0315 0,0753 0,1501 0,2586 0,3953
9 0,0000 0,0000 0,0000 0,0004 0,0022 0,0083 0,0243 0,0583 0,1189 0,2120
10 0,0000 0,0000 0,0000 0,0000 0,0003 0,0017 0,0060 0,0175 0,0426 0,0898
11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0039 0,0114 0,0287
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0022 0,0065
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0009
14
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,5367 0,7941 0,9126 0,9648 0,9866 0,9953 0,9984 0,9995 0,9999 1,0000
2 0,1710 0,4510 0,6814 0,8329 0,9198 0,9647 0,9858 0,9948 0,9983 0,9995
3 0,0362 0,1841 0,3958 0,6020 0,7639 0,8732 0,9383 0,9729 0,9893 0,9963
4 0,0055 0,0556 0,1773 0,3518 0,5387 0,7031 0,8273 0,9095 0,9576 0,9824
5 0,0006 0,0127 0,0617 0,1642 0,3135 0,4845 0,6481 0,7827 0,8796 0,9408
6 0,0001 0,0022 0,0168 0,0611 0,1484 0,2784 0,4357 0,5968 0,7392 0,8491
7 0,0000 0,0003 0,0036 0,0181 0,0566 0,1311 0,2452 0,3902 0,5478 0,6964
8 0,0000 0,0000 0,0006 0,0042 0,0173 0,0500 0,1132 0,2131 0,3465 0,5000
9 0,0000 0,0000 0,0001 0,0008 0,0042 0,0152 0,0422 0,0950 0,1818 0,3036
10 0,0000 0,0000 0,0000 0,0001 0,0008 0,0037 0,0124 0,0338 0,0769 0,1509
11 0,0000 0,0000 0,0000 0,0000 0,0001 0,0007 0,0028 0,0093 0,0255 0,0592
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0019 0,0063 0,0176
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0011 0,0037
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005
15
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,5599 0,8147 0,9257 0,9719 0,9900 0,9967 0,9990 0,9997 0,9999 1,0000
2 0,1892 0,4853 0,7161 0,8593 0,9365 0,9739 0,9902 0,9967 0,9990 0,9997
3 0,0429 0,2108 0,4386 0,6482 0,8029 0,9006 0,9549 0,9817 0,9934 0,9979
4 0,0070 0,0684 0,2101 0,4019 0,5950 0,7541 0,8661 0,9349 0,9719 0,9894
5 0,0009 0,0170 0,0791 0,2018 0,3698 0,5501 0,7108 0,8334 0,9147 0,9616
6 0,0001 0,0033 0,0235 0,0817 0,1897 0,3402 0,5100 0,6712 0,8024 0,8949
7 0,0000 0,0005 0,0056 0,0267 0,0796 0,1753 0,3119 0,4728 0,6340 0,7728
8 0,0000 0,0001 0,0011 0,0070 0,0271 0,0744 0,1594 0,2839 0,4371 0,5982
9 0,0000 0,0000 0,0002 0,0015 0,0075 0,0257 0,0671 0,1423 0,2559 0,4018
10 0,0000 0,0000 0,0000 0,0002 0,0016 0,0071 0,0229 0,0583 0,1241 0,2272
11 0,0000 0,0000 0,0000 0,0000 0,0003 0,0016 0,0062 0,0191 0,0486 0,1051
12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0049 0,0149 0,0384
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0009 0,0035 0,0106
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0021
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003
16
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000







256 Apndice

p
n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,5819 0,8332 0,9369 0,9775 0,9925 0,9977 0,9993 0,9998 1,0000 1,0000
2 0,2078 0,5182 0,7475 0,8818 0,9499 0,9807 0,9933 0,9979 0,9994 0,9999
3 0,0503 0,2382 0,4802 0,6904 0,8363 0,9226 0,9673 0,9877 0,9959 0,9988
4 0,0088 0,0826 0,2444 0,4511 0,6470 0,7981 0,8972 0,9536 0,9816 0,9936
5 0,0012 0,0221 0,0987 0,2418 0,4261 0,6113 0,7652 0,8740 0,9404 0,9755
6 0,0001 0,0047 0,0319 0,1057 0,2347 0,4032 0,5803 0,7361 0,8529 0,9283
7 0,0000 0,0008 0,0083 0,0377 0,1071 0,2248 0,3812 0,5522 0,7098 0,8338
8 0,0000 0,0001 0,0017 0,0109 0,0402 0,1046 0,2128 0,3595 0,5257 0,6855
9 0,0000 0,0000 0,0003 0,0026 0,0124 0,0403 0,0994 0,1989 0,3374 0,5000
10 0,0000 0,0000 0,0000 0,0005 0,0031 0,0127 0,0383 0,0919 0,1834 0,3145
11 0,0000 0,0000 0,0000 0,0001 0,0006 0,0032 0,0120 0,0348 0,0826 0,1662
12 0,0000 0,0000 0,0000 0,0000 0,0001 0,0007 0,0030 0,0106 0,0301 0,0717
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0025 0,0086 0,0245
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0019 0,0064
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0012
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
17
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,6028 0,8499 0,9464 0,9820 0,9944 0,9984 0,9996 0,9999 1,0000 1,0000
2 0,2265 0,5497 0,7759 0,9009 0,9605 0,9858 0,9954 0,9987 0,9997 0,9999
3 0,0581 0,2662 0,5203 0,7287 0,8647 0,9400 0,9764 0,9918 0,9975 0,9993
4 0,0109 0,0982 0,2798 0,4990 0,6943 0,8354 0,9217 0,9672 0,9880 0,9962
5 0,0015 0,0282 0,1206 0,2836 0,4813 0,6673 0,8114 0,9058 0,9589 0,9846
6 0,0002 0,0064 0,0419 0,1329 0,2825 0,4656 0,6450 0,7912 0,8923 0,9519
7 0,0000 0,0012 0,0118 0,0513 0,1390 0,2783 0,4509 0,6257 0,7742 0,8811
8 0,0000 0,0002 0,0027 0,0163 0,0569 0,1407 0,2717 0,4366 0,6085 0,7597
9 0,0000 0,0000 0,0005 0,0043 0,0193 0,0596 0,1391 0,2632 0,4222 0,5927
10 0,0000 0,0000 0,0001 0,0009 0,0054 0,0210 0,0597 0,1347 0,2527 0,4073
11 0,0000 0,0000 0,0000 0,0002 0,0012 0,0061 0,0212 0,0576 0,1280 0,2403
12 0,0000 0,0000 0,0000 0,0000 0,0002 0,0014 0,0062 0,0203 0,0537 0,1189
13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0014 0,0058 0,0183 0,0481
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0049 0,0154
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0038
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0007
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001
18
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000


















Apndice

257
p
n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,6226 0,8649 0,9544 0,9856 0,9958 0,9989 0,9997 0,9999 1,0000 1,0000
2 0,2453 0,5797 0,8015 0,9171 0,9690 0,9896 0,9969 0,9992 0,9998 1,0000
3 0,0665 0,2946 0,5587 0,7631 0,8887 0,9538 0,9830 0,9945 0,9985 0,9996
4 0,0132 0,1150 0,3159 0,5449 0,7369 0,8668 0,9409 0,9770 0,9923 0,9978
5 0,0020 0,0352 0,1444 0,3267 0,5346 0,7178 0,8500 0,9304 0,9720 0,9904
6 0,0002 0,0086 0,0537 0,1631 0,3322 0,5261 0,7032 0,8371 0,9223 0,9682
7 0,0000 0,0017 0,0163 0,0676 0,1749 0,3345 0,5188 0,6919 0,8273 0,9165
8 0,0000 0,0003 0,0041 0,0233 0,0775 0,1820 0,3344 0,5122 0,6831 0,8204
9 0,0000 0,0000 0,0008 0,0067 0,0287 0,0839 0,1855 0,3325 0,5060 0,6762
10 0,0000 0,0000 0,0001 0,0016 0,0089 0,0326 0,0875 0,1861 0,3290 0,5000
11 0,0000 0,0000 0,0000 0,0003 0,0023 0,0105 0,0347 0,0885 0,1841 0,3238
12 0,0000 0,0000 0,0000 0,0000 0,0005 0,0028 0,0114 0,0352 0,0871 0,1796
13 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0031 0,0116 0,0342 0,0835
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0007 0,0031 0,0109 0,0318
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0028 0,0096
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0022
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
19
19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50
1 0,6415 0,8784 0,9612 0,9885 0,9968 0,9992 0,9998 1,0000 1,0000 1,0000
2 0,2642 0,6083 0,8244 0,9308 0,9757 0,9924 0,9979 0,9995 0,9999 1,0000
3 0,0755 0,3231 0,5951 0,7939 0,9087 0,9645 0,9879 0,9964 0,9991 0,9998
4 0,0159 0,1330 0,3523 0,5886 0,7748 0,8929 0,9556 0,9840 0,9951 0,9987
5 0,0026 0,0432 0,1702 0,3704 0,5852 0,7625 0,8818 0,9490 0,9811 0,9941
6 0,0003 0,0113 0,0673 0,1958 0,3828 0,5836 0,7546 0,8744 0,9447 0,9793
7 0,0000 0,0024 0,0219 0,0867 0,2142 0,3920 0,5834 0,7500 0,8701 0,9423
8 0,0000 0,0004 0,0059 0,0321 0,1018 0,2277 0,3990 0,5841 0,7480 0,8684
9 0,0000 0,0001 0,0013 0,0100 0,0409 0,1133 0,2376 0,4044 0,5857 0,7483
10 0,0000 0,0000 0,0002 0,0026 0,0139 0,0480 0,1218 0,2447 0,4086 0,5881
11 0,0000 0,0000 0,0000 0,0006 0,0039 0,0171 0,0532 0,1275 0,2493 0,4119
12 0,0000 0,0000 0,0000 0,0001 0,0009 0,0051 0,0196 0,0565 0,1308 0,2517
13 0,0000 0,0000 0,0000 0,0000 0,0002 0,0013 0,0060 0,0210 0,0580 0,1316
14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0015 0,0065 0,0214 0,0577
15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0016 0,0064 0,0207
16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0015 0,0059
17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013
18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002
19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
20
20 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000



258 Apndice

Tabla de probabilidades acumulativas de Poisson

i
x
x
x
e
0 !





i 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
0 0,9048 0,8187 0,7408 0,6703 0,6065 0,5488 0,4966 0,4493 0,4066 0,3679
1 0,9953 0,9825 0,9631 0,9384 0,9098 0,8781 0,8442 0,8088 0,7725 0,7358
2 0,9998 0,9989 0,9964 0,9921 0,9856 0,9769 0,9659 0,9526 0,9371 0,9197
3 1,0000 0,9999 0,9997 0,9992 0,9982 0,9966 0,9942 0,9909 0,9865 0,9810
4 1,0000 1,0000 1,0000 0,9999 0,9998 0,9996 0,9992 0,9986 0,9977 0,9963
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9997 0,9994
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

i 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0
0 0,3329 0,3012 0,2725 0,2466 0,2231 0,2019 0,1827 0,1653 0,1496 0,1353
1 0,6990 0,6626 0,6268 0,5918 0,5578 0,5249 0,4932 0,4628 0,4337 0,4060
2 0,9004 0,8795 0,8571 0,8335 0,8088 0,7834 0,7572 0,7306 0,7037 0,6767
3 0,9743 0,9662 0,9569 0,9463 0,9344 0,9212 0,9068 0,8913 0,8747 0,8571
4 0,9946 0,9923 0,9893 0,9857 0,9814 0,9763 0,9704 0,9636 0,9559 0,9473
5 0,9990 0,9985 0,9978 0,9968 0,9955 0,9940 0,9920 0,9896 0,9868 0,9834
6 0,9999 0,9997 0,9996 0,9994 0,9991 0,9987 0,9981 0,9974 0,9966 0,9955
7 1,0000 1,0000 0,9999 0,9999 0,9998 0,9997 0,9996 0,9994 0,9992 0,9989
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9998 0,9998
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

i 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0
0 0,1225 0,1108 0,1003 0,0907 0,0821 0,0743 0,0672 0,0608 0,0550 0,0498
1 0,3796 0,3546 0,3309 0,3084 0,2873 0,2674 0,2487 0,2311 0,2146 0,1991
2 0,6496 0,6227 0,5960 0,5697 0,5438 0,5184 0,4936 0,4695 0,4460 0,4232
3 0,8386 0,8194 0,7993 0,7787 0,7576 0,7360 0,7141 0,6919 0,6696 0,6472
4 0,9379 0,9275 0,9162 0,9041 0,8912 0,8774 0,8629 0,8477 0,8318 0,8153
5 0,9796 0,9751 0,9700 0,9643 0,9580 0,9510 0,9433 0,9349 0,9258 0,9161
6 0,9941 0,9925 0,9906 0,9884 0,9858 0,9828 0,9794 0,9756 0,9713 0,9665
7 0,9985 0,9980 0,9974 0,9967 0,9958 0,9947 0,9934 0,9919 0,9901 0,9881
8 0,9997 0,9995 0,9994 0,9991 0,9989 0,9985 0,9981 0,9976 0,9969 0,9962
9 0,9999 0,9999 0,9999 0,9998 0,9997 0,9996 0,9995 0,9993 0,9991 0,9989
10 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Apndice

259





i 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0
0 0,0450 0,0408 0,0369 0,0334 0,0302 0,0273 0,0247 0,0224 0,0202 0,0183
1 0,1847 0,1712 0,1586 0,1468 0,1359 0,1257 0,1162 0,1074 0,0992 0,0916
2 0,4012 0,3799 0,3594 0,3397 0,3208 0,3027 0,2854 0,2689 0,2531 0,2381
3 0,6248 0,6025 0,5803 0,5584 0,5366 0,5152 0,4942 0,4735 0,4532 0,4335
4 0,7982 0,7806 0,7626 0,7442 0,7254 0,7064 0,6872 0,6678 0,6484 0,6288
5 0,9057 0,8946 0,8829 0,8705 0,8576 0,8441 0,8301 0,8156 0,8006 0,7851
6 0,9612 0,9554 0,9490 0,9421 0,9347 0,9267 0,9182 0,9091 0,8995 0,8893
7 0,9858 0,9832 0,9802 0,9769 0,9733 0,9692 0,9648 0,9599 0,9546 0,9489
8 0,9953 0,9943 0,9931 0,9917 0,9901 0,9883 0,9863 0,9840 0,9815 0,9786
9 0,9986 0,9982 0,9978 0,9973 0,9967 0,9960 0,9952 0,9942 0,9931 0,9919
10 0,9996 0,9995 0,9994 0,9992 0,9990 0,9987 0,9984 0,9981 0,9977 0,9972
11 0,9999 0,9999 0,9998 0,9998 0,9997 0,9996 0,9995 0,9994 0,9993 0,9991
12 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998 0,9997
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

i 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0
0 0,0166 0,0150 0,0136 0,0123 0,0111 0,0101 0,0091 0,0082 0,0074 0,0067
1 0,0845 0,0780 0,0719 0,0663 0,0611 0,0563 0,0518 0,0477 0,0439 0,0404
2 0,2238 0,2102 0,1974 0,1851 0,1736 0,1626 0,1523 0,1425 0,1333 0,1247
3 0,4142 0,3954 0,3772 0,3594 0,3423 0,3257 0,3097 0,2942 0,2793 0,2650
4 0,6093 0,5898 0,5704 0,5512 0,5321 0,5132 0,4946 0,4763 0,4582 0,4405
5 0,7693 0,7531 0,7367 0,7199 0,7029 0,6858 0,6684 0,6510 0,6335 0,6160
6 0,8786 0,8675 0,8558 0,8436 0,8311 0,8180 0,8046 0,7908 0,7767 0,7622
7 0,9427 0,9361 0,9290 0,9214 0,9134 0,9049 0,8960 0,8867 0,8769 0,8666
8 0,9755 0,9721 0,9683 0,9642 0,9597 0,9549 0,9497 0,9442 0,9382 0,9319
9 0,9905 0,9889 0,9871 0,9851 0,9829 0,9805 0,9778 0,9749 0,9717 0,9682
10 0,9966 0,9959 0,9952 0,9943 0,9933 0,9922 0,9910 0,9896 0,9880 0,9863
11 0,9989 0,9986 0,9983 0,9980 0,9976 0,9971 0,9966 0,9960 0,9953 0,9945
12 0,9997 0,9996 0,9995 0,9993 0,9992 0,9990 0,9988 0,9986 0,9983 0,9980
13 0,9999 0,9999 0,9998 0,9998 0,9997 0,9997 0,9996 0,9995 0,9994 0,9993
14 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

260 Apndice





i 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6,0
0 0,0061 0,0055 0,0050 0,0045 0,0041 0,0037 0,0033 0,0030 0,0027 0,0025
1 0,0372 0,0342 0,0314 0,0289 0,0266 0,0244 0,0224 0,0206 0,0189 0,0174
2 0,1165 0,1088 0,1016 0,0948 0,0884 0,0824 0,0768 0,0715 0,0666 0,0620
3 0,2513 0,2381 0,2254 0,2133 0,2017 0,1906 0,1800 0,1700 0,1604 0,1512
4 0,4231 0,4061 0,3895 0,3733 0,3575 0,3422 0,3272 0,3127 0,2987 0,2851
5 0,5984 0,5809 0,5635 0,5461 0,5289 0,5119 0,4950 0,4783 0,4619 0,4457
6 0,7474 0,7324 0,7171 0,7017 0,6860 0,6703 0,6544 0,6384 0,6224 0,6063
7 0,8560 0,8449 0,8335 0,8217 0,8095 0,7970 0,7841 0,7710 0,7576 0,7440
8 0,9252 0,9181 0,9106 0,9027 0,8944 0,8857 0,8766 0,8672 0,8574 0,8472
9 0,9644 0,9603 0,9559 0,9512 0,9462 0,9409 0,9352 0,9292 0,9228 0,9161
10 0,9844 0,9823 0,9800 0,9775 0,9747 0,9718 0,9686 0,9651 0,9614 0,9574
11 0,9937 0,9927 0,9916 0,9904 0,9890 0,9875 0,9859 0,9841 0,9821 0,9799
12 0,9976 0,9972 0,9967 0,9962 0,9955 0,9949 0,9941 0,9932 0,9922 0,9912
13 0,9992 0,9990 0,9988 0,9986 0,9983 0,9980 0,9977 0,9973 0,9969 0,9964
14 0,9997 0,9997 0,9996 0,9995 0,9994 0,9993 0,9991 0,9990 0,9988 0,9986
15 0,9999 0,9999 0,9999 0,9998 0,9998 0,9998 0,9997 0,9996 0,9996 0,9995
16 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9998
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
18 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

i 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7,0
0 0,0022 0,0020 0,0018 0,0017 0,0015 0,0014 0,0012 0,0011 0,0010 0,0009
1 0,0159 0,0146 0,0134 0,0123 0,0113 0,0103 0,0095 0,0087 0,0080 0,0073
2 0,0577 0,0536 0,0498 0,0463 0,0430 0,0400 0,0371 0,0344 0,0320 0,0296
3 0,1425 0,1342 0,1264 0,1189 0,1118 0,1052 0,0988 0,0928 0,0871 0,0818
4 0,2719 0,2592 0,2469 0,2351 0,2237 0,2127 0,2022 0,1920 0,1823 0,1730
5 0,4298 0,4141 0,3988 0,3837 0,3690 0,3547 0,3406 0,3270 0,3137 0,3007
6 0,5902 0,5742 0,5582 0,5423 0,5265 0,5108 0,4953 0,4799 0,4647 0,4497
7 0,7301 0,7160 0,7017 0,6873 0,6728 0,6581 0,6433 0,6285 0,6136 0,5987
8 0,8367 0,8259 0,8148 0,8033 0,7916 0,7796 0,7673 0,7548 0,7420 0,7291
9 0,9090 0,9016 0,8939 0,8858 0,8774 0,8686 0,8596 0,8502 0,8405 0,8305
10 0,9531 0,9486 0,9437 0,9386 0,9332 0,9274 0,9214 0,9151 0,9084 0,9015
11 0,9776 0,9750 0,9723 0,9693 0,9661 0,9627 0,9591 0,9552 0,9510 0,9467
12 0,9900 0,9887 0,9873 0,9857 0,9840 0,9821 0,9801 0,9779 0,9755 0,9730
13 0,9958 0,9952 0,9945 0,9937 0,9929 0,9920 0,9909 0,9898 0,9885 0,9872
14 0,9984 0,9981 0,9978 0,9974 0,9970 0,9966 0,9961 0,9956 0,9950 0,9943
15 0,9994 0,9993 0,9992 0,9990 0,9988 0,9986 0,9984 0,9982 0,9979 0,9976
16 0,9998 0,9997 0,9997 0,9996 0,9996 0,9995 0,9994 0,9993 0,9992 0,9990
17 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998 0,9998 0,9997 0,9997 0,9996
18 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
19 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
20 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000



Apndice

261

i 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9 8,0
0 0,0008 0,0007 0,0007 0,0006 0,0006 0,0005 0,0005 0,0004 0,0004 0,0003
1 0,0067 0,0061 0,0056 0,0051 0,0047 0,0043 0,0039 0,0036 0,0033 0,0030
2 0,0275 0,0255 0,0236 0,0219 0,0203 0,0188 0,0174 0,0161 0,0149 0,0138
3 0,0767 0,0719 0,0674 0,0632 0,0591 0,0554 0,0518 0,0485 0,0453 0,0424
4 0,1641 0,1555 0,1473 0,1395 0,1321 0,1249 0,1181 0,1117 0,1055 0,0996
5 0,2881 0,2759 0,2640 0,2526 0,2414 0,2307 0,2203 0,2103 0,2006 0,1912
6 0,4349 0,4204 0,4060 0,3920 0,3782 0,3646 0,3514 0,3384 0,3257 0,3134
7 0,5838 0,5689 0,5541 0,5393 0,5246 0,5100 0,4956 0,4812 0,4670 0,4530
8 0,7160 0,7027 0,6892 0,6757 0,6620 0,6482 0,6343 0,6204 0,6065 0,5925
9 0,8202 0,8096 0,7988 0,7877 0,7764 0,7649 0,7531 0,7411 0,7290 0,7166
10 0,8942 0,8867 0,8788 0,8707 0,8622 0,8535 0,8445 0,8352 0,8257 0,8159
11 0,9420 0,9371 0,9319 0,9265 0,9208 0,9148 0,9085 0,9020 0,8952 0,8881
12 0,9703 0,9673 0,9642 0,9609 0,9573 0,9536 0,9496 0,9454 0,9409 0,9362
13 0,9857 0,9841 0,9824 0,9805 0,9784 0,9762 0,9739 0,9714 0,9687 0,9658
14 0,9935 0,9927 0,9918 0,9908 0,9897 0,9886 0,9873 0,9859 0,9844 0,9827
15 0,9972 0,9969 0,9964 0,9959 0,9954 0,9948 0,9941 0,9934 0,9926 0,9918
16 0,9989 0,9987 0,9985 0,9983 0,9980 0,9978 0,9974 0,9971 0,9967 0,9963
17 0,9996 0,9995 0,9994 0,9993 0,9992 0,9991 0,9989 0,9988 0,9986 0,9984
18 0,9998 0,9998 0,9998 0,9997 0,9997 0,9996 0,9996 0,9995 0,9994 0,9993
19 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998 0,9998 0,9997
20 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999
21 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

i 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9 9,0
0 0,0003 0,0003 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0001 0,0001
1 0,0028 0,0025 0,0023 0,0021 0,0019 0,0018 0,0016 0,0015 0,0014 0,0012
2 0,0127 0,0118 0,0109 0,0100 0,0093 0,0086 0,0079 0,0073 0,0068 0,0062
3 0,0396 0,0370 0,0346 0,0323 0,0301 0,0281 0,0262 0,0244 0,0228 0,0212
4 0,0940 0,0887 0,0837 0,0789 0,0744 0,0701 0,0660 0,0621 0,0584 0,0550
5 0,1822 0,1736 0,1653 0,1573 0,1496 0,1422 0,1352 0,1284 0,1219 0,1157
6 0,3013 0,2896 0,2781 0,2670 0,2562 0,2457 0,2355 0,2256 0,2160 0,2068
7 0,4391 0,4254 0,4119 0,3987 0,3856 0,3728 0,3602 0,3478 0,3357 0,3239
8 0,5786 0,5647 0,5507 0,5369 0,5231 0,5094 0,4958 0,4823 0,4689 0,4557
9 0,7041 0,6915 0,6788 0,6659 0,6530 0,6400 0,6269 0,6137 0,6006 0,5874
10 0,8058 0,7955 0,7850 0,7743 0,7634 0,7522 0,7409 0,7294 0,7178 0,7060
11 0,8807 0,8731 0,8652 0,8571 0,8487 0,8400 0,8311 0,8220 0,8126 0,8030
12 0,9313 0,9261 0,9207 0,9150 0,9091 0,9029 0,8965 0,8898 0,8829 0,8758
13 0,9628 0,9595 0,9561 0,9524 0,9486 0,9445 0,9403 0,9358 0,9311 0,9261
14 0,9810 0,9791 0,9771 0,9749 0,9726 0,9701 0,9675 0,9647 0,9617 0,9585
15 0,9908 0,9898 0,9887 0,9875 0,9862 0,9848 0,9832 0,9816 0,9798 0,9780
16 0,9958 0,9953 0,9947 0,9941 0,9934 0,9926 0,9918 0,9909 0,9899 0,9889
17 0,9982 0,9979 0,9977 0,9973 0,9970 0,9966 0,9962 0,9957 0,9952 0,9947
18 0,9992 0,9991 0,9990 0,9989 0,9987 0,9985 0,9983 0,9981 0,9978 0,9976
19 0,9997 0,9997 0,9996 0,9995 0,9995 0,9994 0,9993 0,9992 0,9991 0,9989
20 0,9999 0,9999 0,9998 0,9998 0,9998 0,9998 0,9997 0,9997 0,9996 0,9996
21 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998
22 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999
23 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
262 Apndice







i 9,1 9,2 9,3 9,4 9,5 9,6 9,7 9,8 9,9 10,0
0 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0000
1 0,0011 0,0010 0,0009 0,0009 0,0008 0,0007 0,0007 0,0006 0,0005 0,0005
2 0,0058 0,0053 0,0049 0,0045 0,0042 0,0038 0,0035 0,0033 0,0030 0,0028
3 0,0198 0,0184 0,0172 0,0160 0,0149 0,0138 0,0129 0,0120 0,0111 0,0103
4 0,0517 0,0486 0,0456 0,0429 0,0403 0,0378 0,0355 0,0333 0,0312 0,0293
5 0,1098 0,1041 0,0986 0,0935 0,0885 0,0838 0,0793 0,0750 0,0710 0,0671
6 0,1978 0,1892 0,1808 0,1727 0,1649 0,1574 0,1502 0,1433 0,1366 0,1301
7 0,3123 0,3010 0,2900 0,2792 0,2687 0,2584 0,2485 0,2388 0,2294 0,2202
8 0,4426 0,4296 0,4168 0,4042 0,3918 0,3796 0,3676 0,3558 0,3442 0,3328
9 0,5742 0,5611 0,5479 0,5349 0,5218 0,5089 0,4960 0,4832 0,4705 0,4579
10 0,6941 0,6820 0,6699 0,6576 0,6453 0,6329 0,6205 0,6080 0,5955 0,5830
11 0,7932 0,7832 0,7730 0,7626 0,7520 0,7412 0,7303 0,7193 0,7081 0,6968
12 0,8684 0,8607 0,8529 0,8448 0,8364 0,8279 0,8191 0,8101 0,8009 0,7916
13 0,9210 0,9156 0,9100 0,9042 0,8981 0,8919 0,8853 0,8786 0,8716 0,8645
14 0,9552 0,9517 0,9480 0,9441 0,9400 0,9357 0,9312 0,9265 0,9216 0,9165
15 0,9760 0,9738 0,9715 0,9691 0,9665 0,9638 0,9609 0,9579 0,9546 0,9513
16 0,9878 0,9865 0,9852 0,9838 0,9823 0,9806 0,9789 0,9770 0,9751 0,9730
17 0,9941 0,9934 0,9927 0,9919 0,9911 0,9902 0,9892 0,9881 0,9870 0,9857
18 0,9973 0,9969 0,9966 0,9962 0,9957 0,9952 0,9947 0,9941 0,9935 0,9928
19 0,9988 0,9986 0,9985 0,9983 0,9980 0,9978 0,9975 0,9972 0,9969 0,9965
20 0,9995 0,9994 0,9993 0,9992 0,9991 0,9990 0,9989 0,9987 0,9986 0,9984
21 0,9998 0,9998 0,9997 0,9997 0,9996 0,9996 0,9995 0,9995 0,9994 0,9993
22 0,9999 0,9999 0,9999 0,9999 0,9999 0,9998 0,9998 0,9998 0,9997 0,9997
23 1,0000 1,0000 1,0000 1,0000 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
24 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
25 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

Apndice

263




i 11 12 13 14 15 16 17 18 19 20
0 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
2 0,0012 0,0005 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
3 0,0049 0,0023 0,0011 0,0005 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000
4 0,0151 0,0076 0,0037 0,0018 0,0009 0,0004 0,0002 0,0001 0,0000 0,0000
5 0,0375 0,0203 0,0107 0,0055 0,0028 0,0014 0,0007 0,0003 0,0002 0,0001
6 0,0786 0,0458 0,0259 0,0142 0,0076 0,0040 0,0021 0,0010 0,0005 0,0003
7 0,1432 0,0895 0,0540 0,0316 0,0180 0,0100 0,0054 0,0029 0,0015 0,0008
8 0,2320 0,1550 0,0998 0,0621 0,0374 0,0220 0,0126 0,0071 0,0039 0,0021
9 0,3405 0,2424 0,1658 0,1094 0,0699 0,0433 0,0261 0,0154 0,0089 0,0050
10 0,4599 0,3472 0,2517 0,1757 0,1185 0,0774 0,0491 0,0304 0,0183 0,0108
11 0,5793 0,4616 0,3532 0,2600 0,1848 0,1270 0,0847 0,0549 0,0347 0,0214
12 0,6887 0,5760 0,4631 0,3585 0,2676 0,1931 0,1350 0,0917 0,0606 0,0390
13 0,7813 0,6815 0,5730 0,4644 0,3632 0,2745 0,2009 0,1426 0,0984 0,0661
14 0,8540 0,7720 0,6751 0,5704 0,4657 0,3675 0,2808 0,2081 0,1497 0,1049
15 0,9074 0,8444 0,7636 0,6694 0,5681 0,4667 0,3715 0,2867 0,2148 0,1565
16 0,9441 0,8987 0,8355 0,7559 0,6641 0,5660 0,4677 0,3751 0,2920 0,2211
17 0,9678 0,9370 0,8905 0,8272 0,7489 0,6593 0,5640 0,4686 0,3784 0,2970
18 0,9823 0,9626 0,9302 0,8826 0,8195 0,7423 0,6550 0,5622 0,4695 0,3814
19 0,9907 0,9787 0,9573 0,9235 0,8752 0,8122 0,7363 0,6509 0,5606 0,4703
20 0,9953 0,9884 0,9750 0,9521 0,9170 0,8682 0,8055 0,7307 0,6472 0,5591
21 0,9977 0,9939 0,9859 0,9712 0,9469 0,9108 0,8615 0,7991 0,7255 0,6437
22 0,9990 0,9970 0,9924 0,9833 0,9673 0,9418 0,9047 0,8551 0,7931 0,7206
23 0,9995 0,9985 0,9960 0,9907 0,9805 0,9633 0,9367 0,8989 0,8490 0,7875
24 0,9998 0,9993 0,9980 0,9950 0,9888 0,9777 0,9594 0,9317 0,8933 0,8432
25 0,9999 0,9997 0,9990 0,9974 0,9938 0,9869 0,9748 0,9554 0,9269 0,8878
26 1,0000 0,9999 0,9995 0,9987 0,9967 0,9925 0,9848 0,9718 0,9514 0,9221
27 1,0000 0,9999 0,9998 0,9994 0,9983 0,9959 0,9912 0,9827 0,9687 0,9475
28 1,0000 1,0000 0,9999 0,9997 0,9991 0,9978 0,9950 0,9897 0,9805 0,9657
29 1,0000 1,0000 1,0000 0,9999 0,9996 0,9989 0,9973 0,9941 0,9882 0,9782
30 1,0000 1,0000 1,0000 0,9999 0,9998 0,9994 0,9986 0,9967 0,9930 0,9865
31 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9993 0,9982 0,9960 0,9919
32 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9996 0,9990 0,9978 0,9953
33 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9995 0,9988 0,9973
34 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9994 0,9985
35 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9997 0,9992
36 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998 0,9996
37 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9998
38 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
39 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999
40 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000



264 Apndice

z

Tabla de reas bajo la curva normal estandarizada
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,500000 0,496011 0,492022 0,488033 0,484047 0,480061 0,476078 0,472097 0,468119 0,464144
0,1 0,460172 0,456205 0,452242 0,448283 0,444330 0,440382 0,436441 0,432505 0,428576 0,424655
0,2 0,420740 0,416834 0,412936 0,409046 0,405165 0,401294 0,397432 0,393580 0,389739 0,385908
0,3 0,382089 0,378281 0,374484 0,370700 0,366928 0,363169 0,359424 0,355691 0,351973 0,348268
0,4 0,344578 0,340903 0,337243 0,333598 0,329969 0,326355 0,322758 0,319178 0,315614 0,312067
0,5 0,308538 0,305026 0,301532 0,298056 0,294598 0,291160 0,287740 0,284339 0,280957 0,277595
0,6 0,274253 0,270931 0,267629 0,264347 0,261086 0,257846 0,254627 0,251429 0,248252 0,245097
0,7 0,241964 0,238852 0,235762 0,232695 0,229650 0,226627 0,223627 0,220650 0,217695 0,214764
0,8 0,211855 0,208970 0,206108 0,203269 0,200454 0,197662 0,194894 0,192150 0,189430 0,186733
0,9 0,184060 0,181411 0,178786 0,176186 0,173609 0,171056 0,168528 0,166023 0,163543 0,161087
1 0,158655 0,156248 0,153864 0,151505 0,149170 0,146859 0,144572 0,142310 0,140071 0,137857
1,1 0,135666 0,133500 0,131357 0,129238 0,127143 0,125072 0,123024 0,121001 0,119000 0,117023
1,2 0,115070 0,113140 0,111233 0,109349 0,107488 0,105650 0,103835 0,102042 0,100273 0,098525
1,3 0,096801 0,095098 0,093418 0,091759 0,090123 0,088508 0,086915 0,085344 0,083793 0,082264
1,4 0,080757 0,079270 0,077804 0,076359 0,074934 0,073529 0,072145 0,070781 0,069437 0,068112
1,5 0,066807 0,065522 0,064256 0,063008 0,061780 0,060571 0,059380 0,058208 0,057053 0,055917
1,6 0,054799 0,053699 0,052616 0,051551 0,050503 0,049471 0,048457 0,047460 0,046479 0,045514
1,7 0,044565 0,043633 0,042716 0,041815 0,040929 0,040059 0,039204 0,038364 0,037538 0,036727
1,8 0,035930 0,035148 0,034379 0,033625 0,032884 0,032157 0,031443 0,030742 0,030054 0,029379
1,9 0,028716 0,028067 0,027429 0,026803 0,026190 0,025588 0,024998 0,024419 0,023852 0,023295
2 0,022750 0,022216 0,021692 0,021178 0,020675 0,020182 0,019699 0,019226 0,018763 0,018309
2,1 0,017864 0,017429 0,017003 0,016586 0,016177 0,015778 0,015386 0,015003 0,014629 0,014262
2,2 0,013903 0,013553 0,013209 0,012874 0,012545 0,012224 0,011911 0,011604 0,011304 0,011011
2,3 0,010724 0,010444 0,010170 0,009903 0,009642 0,009387 0,009137 0,008894 0,008656 0,008424
2,4 0,008198 0,007976 0,007760 0,007549 0,007344 0,007143 0,006947 0,006756 0,006569 0,006387
2,5 0,006210 0,006037 0,005868 0,005703 0,005543 0,005386 0,005234 0,005085 0,004940 0,004799
2,6 0,004661 0,004527 0,004397 0,004269 0,004145 0,004025 0,003907 0,003793 0,003681 0,003573
2,7 0,003467 0,003364 0,003264 0,003167 0,003072 0,002980 0,002890 0,002803 0,002718 0,002635
2,8 0,002555 0,002477 0,002401 0,002327 0,002256 0,002186 0,002118 0,002052 0,001988 0,001926
2,9 0,001866 0,001807 0,001750 0,001695 0,001641 0,001589 0,001538 0,001489 0,001441 0,001395
3 0,001350 0,001306 0,001264 0,001223 0,001183 0,001144 0,001107 0,001070 0,001035 0,001001
3,1 0,000968 0,000936 0,000904 0,000874 0,000845 0,000816 0,000789 0,000762 0,000736 0,000711
3,2 0,000687 0,000664 0,000641 0,000619 0,000598 0,000577 0,000557 0,000538 0,000519 0,000501
3,3 0,000483 0,000467 0,000450 0,000434 0,000419 0,000404 0,000390 0,000376 0,000362 0,000350
3,4 0,000337 0,000325 0,000313 0,000302 0,000291 0,000280 0,000270 0,000260 0,000251 0,000242
3,5 0,000233 0,000224 0,000216 0,000208 0,000200 0,000193 0,000185 0,000179 0,000172 0,000165
3,6 0,000159 0,000153 0,000147 0,000142 0,000136 0,000131 0,000126 0,000121 0,000117 0,000112
3,7 0,000108 0,000104 0,000100 0,000096 0,000092 0,000088 0,000085 0,000082 0,000078 0,000075
3,8 0,000072 0,000070 0,000067 0,000064 0,000062 0,000059 0,000057 0,000054 0,000052 0,000050
3,9 0,000048 0,000046 0,000044 0,000042 0,000041 0,000039 0,000037 0,000036 0,000034 0,000033
4 0,000032 0,000030 0,000029 0,000028 0,000027 0,000026 0,000025 0,000024 0,000023 0,000022
4,1 0,000021 0,000020 0,000019 0,000018 0,000017 0,000017 0,000016 0,000015 0,000015 0,000014
4,2 0,000013 0,000013 0,000012 0,000012 0,000011 0,000011 0,000010 0,000010 0,000009 0,000009
4,3 0,000009 0,000008 0,000008 0,000007 0,000007 0,000007 0,000007 0,000006 0,000006 0,000006
4,4 0,000005 0,000005 0,000005 0,000005 0,000005 0,000004 0,000004 0,000004 0,000004 0,000004
4,5 0,000003 0,000003 0,000003 0,000003 0,000003 0,000003 0,000003 0,000002 0,000002 0,000002
4,6 0,000002 0,000002 0,000002 0,000002 0,000002 0,000002 0,000002 0,000002 0,000001 0,000001
4,7 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001
4,8 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001 0,000001
4,9 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000
Apndice

265
z
(z)

Tabla de ordenadas de la curva normal estandarizada
z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,398942 0,398922 0,398862 0,398763 0,398623 0,398444 0,398225 0,397966 0,397668 0,397330
0,1 0,396953 0,396536 0,396080 0,395585 0,395052 0,394479 0,393868 0,393219 0,392531 0,391806
0,2 0,391043 0,390242 0,389404 0,388529 0,387617 0,386668 0,385683 0,384663 0,383606 0,382515
0,3 0,381388 0,380226 0,379031 0,377801 0,376537 0,375240 0,373911 0,372548 0,371154 0,369728
0,4 0,368270 0,366782 0,365263 0,363714 0,362135 0,360527 0,358890 0,357225 0,355533 0,353812
0,5 0,352065 0,350292 0,348493 0,346668 0,344818 0,342944 0,341046 0,339124 0,337180 0,335213
0,6 0,333225 0,331215 0,329184 0,327133 0,325062 0,322972 0,320864 0,318737 0,316593 0,314432
0,7 0,312254 0,310060 0,307851 0,305627 0,303389 0,301137 0,298872 0,296595 0,294305 0,292004
0,8 0,289692 0,287369 0,285036 0,282694 0,280344 0,277985 0,275618 0,273244 0,270864 0,268477
0,9 0,266085 0,263688 0,261286 0,258881 0,256471 0,254059 0,251644 0,249228 0,246809 0,244390
1 0,241971 0,239551 0,237132 0,234714 0,232297 0,229882 0,227470 0,225060 0,222653 0,220251
1,1 0,217852 0,215458 0,213069 0,210686 0,208308 0,205936 0,203571 0,201214 0,198863 0,196520
1,2 0,194186 0,191860 0,189543 0,187235 0,184937 0,182649 0,180371 0,178104 0,175847 0,173602
1,3 0,171369 0,169147 0,166937 0,164740 0,162555 0,160383 0,158225 0,156080 0,153948 0,151831
1,4 0,149727 0,147639 0,145564 0,143505 0,141460 0,139431 0,137417 0,135418 0,133435 0,131468
1,5 0,129518 0,127583 0,125665 0,123763 0,121878 0,120009 0,118157 0,116323 0,114505 0,112704
1,6 0,110921 0,109155 0,107406 0,105675 0,103961 0,102265 0,100586 0,098925 0,097282 0,095657
1,7 0,094049 0,092459 0,090887 0,089333 0,087796 0,086277 0,084776 0,083293 0,081828 0,080380
1,8 0,078950 0,077538 0,076143 0,074766 0,073407 0,072065 0,070740 0,069433 0,068144 0,066871
1,9 0,065616 0,064378 0,063157 0,061952 0,060765 0,059595 0,058441 0,057304 0,056183 0,055079
2 0,053991 0,052919 0,051864 0,050824 0,049800 0,048792 0,047800 0,046823 0,045861 0,044915
2,1 0,043984 0,043067 0,042166 0,041280 0,040408 0,039550 0,038707 0,037878 0,037063 0,036262
2,2 0,035475 0,034701 0,033941 0,033194 0,032460 0,031740 0,031032 0,030337 0,029655 0,028985
2,3 0,028327 0,027682 0,027048 0,026426 0,025817 0,025218 0,024631 0,024056 0,023491 0,022937
2,4 0,022395 0,021862 0,021341 0,020829 0,020328 0,019837 0,019356 0,018885 0,018423 0,017971
2,5 0,017528 0,017095 0,016670 0,016254 0,015848 0,015449 0,015060 0,014678 0,014305 0,013940
2,6 0,013583 0,013234 0,012892 0,012558 0,012232 0,011912 0,011600 0,011295 0,010997 0,010706
2,7 0,010421 0,010143 0,009871 0,009606 0,009347 0,009094 0,008846 0,008605 0,008370 0,008140
2,8 0,007915 0,007697 0,007483 0,007274 0,007071 0,006873 0,006679 0,006491 0,006307 0,006127
2,9 0,005953 0,005782 0,005616 0,005454 0,005296 0,005143 0,004993 0,004847 0,004705 0,004567
3 0,004432 0,004301 0,004173 0,004049 0,003928 0,003810 0,003695 0,003584 0,003475 0,003370
3,1 0,003267 0,003167 0,003070 0,002975 0,002884 0,002794 0,002707 0,002623 0,002541 0,002461
3,2 0,002384 0,002309 0,002236 0,002165 0,002096 0,002029 0,001964 0,001901 0,001840 0,001780
3,3 0,001723 0,001667 0,001612 0,001560 0,001508 0,001459 0,001411 0,001364 0,001319 0,001275
3,4 0,001232 0,001191 0,001151 0,001112 0,001075 0,001038 0,001003 0,000969 0,000936 0,000904
3,5 0,000873 0,000843 0,000814 0,000785 0,000758 0,000732 0,000706 0,000681 0,000657 0,000634
3,6 0,000612 0,000590 0,000569 0,000549 0,000529 0,000510 0,000492 0,000474 0,000457 0,000441
3,7 0,000425 0,000409 0,000394 0,000380 0,000366 0,000353 0,000340 0,000327 0,000315 0,000303
3,8 0,000292 0,000281 0,000271 0,000260 0,000251 0,000241 0,000232 0,000223 0,000215 0,000207
3,9 0,000199 0,000191 0,000184 0,000177 0,000170 0,000163 0,000157 0,000151 0,000145 0,000139
4 0,000134 0,000129 0,000124 0,000119 0,000114 0,000109 0,000105 0,000101 0,000097 0,000093
4,1 0,000089 0,000086 0,000082 0,000079 0,000076 0,000073 0,000070 0,000067 0,000064 0,000061
4,2 0,000059 0,000057 0,000054 0,000052 0,000050 0,000048 0,000046 0,000044 0,000042 0,000040
4,3 0,000039 0,000037 0,000035 0,000034 0,000032 0,000031 0,000030 0,000028 0,000027 0,000026
4,4 0,000025 0,000024 0,000023 0,000022 0,000021 0,000020 0,000019 0,000018 0,000017 0,000017
4,5 0,000016 0,000015 0,000015 0,000014 0,000013 0,000013 0,000012 0,000012 0,000011 0,000011
4,6 0,000010 0,000010 0,000009 0,000009 0,000008 0,000008 0,000008 0,000007 0,000007 0,000007
4,7 0,000006 0,000006 0,000006 0,000006 0,000005 0,000005 0,000005 0,000005 0,000004 0,000004
4,8 0,000004 0,000004 0,000004 0,000003 0,000003 0,000003 0,000003 0,000003 0,000003 0,000003
4,9 0,000002 0,000002 0,000002 0,000002 0,000002 0,000002 0,000002 0,000002 0,000002 0,000002
266 Apndice

Tabla de valores de t de Student
rea de la cola derecha
0,45 0,40 0,35 0,20 0,15 0,10 0,05 0,025 0,01 0,005
1 0,1584 0,3249 0,5095 1,3764 1,9626 3,0777 6,3137 12,7062 31,8210 63,6559
2 0,1421 0,2887 0,4447 1,0607 1,3862 1,8856 2,9200 4,3027 6,9645 9,9250
3 0,1366 0,2767 0,4242 0,9785 1,2498 1,6377 2,3534 3,1824 4,5407 5,8408
4 0,1338 0,2707 0,4142 0,9410 1,1896 1,5332 2,1318 2,7765 3,7469 4,6041
5 0,1322 0,2672 0,4082 0,9195 1,1558 1,4759 2,0150 2,5706 3,3649 4,0321
6 0,1311 0,2648 0,4043 0,9057 1,1342 1,4398 1,9432 2,4469 3,1427 3,7074
7 0,1303 0,2632 0,4015 0,8960 1,1192 1,4149 1,8946 2,3646 2,9979 3,4995
8 0,1297 0,2619 0,3995 0,8889 1,1081 1,3968 1,8595 2,3060 2,8965 3,3554
9 0,1293 0,2610 0,3979 0,8834 1,0997 1,3830 1,8331 2,2622 2,8214 3,2498
10 0,1289 0,2602 0,3966 0,8791 1,0931 1,3722 1,8125 2,2281 2,7638 3,1693
11 0,1286 0,2596 0,3956 0,8755 1,0877 1,3634 1,7959 2,2010 2,7181 3,1058
12 0,1283 0,2590 0,3947 0,8726 1,0832 1,3562 1,7823 2,1788 2,6810 3,0545
13 0,1281 0,2586 0,3940 0,8702 1,0795 1,3502 1,7709 2,1604 2,6503 3,0123
14 0,1280 0,2582 0,3933 0,8681 1,0763 1,3450 1,7613 2,1448 2,6245 2,9768
15 0,1278 0,2579 0,3928 0,8662 1,0735 1,3406 1,7531 2,1315 2,6025 2,9467
16 0,1277 0,2576 0,3923 0,8647 1,0711 1,3368 1,7459 2,1199 2,5835 2,9208
17 0,1276 0,2573 0,3919 0,8633 1,0690 1,3334 1,7396 2,1098 2,5669 2,8982
18 0,1274 0,2571 0,3915 0,8620 1,0672 1,3304 1,7341 2,1009 2,5524 2,8784
19 0,1274 0,2569 0,3912 0,8610 1,0655 1,3277 1,7291 2,0930 2,5395 2,8609
20 0,1273 0,2567 0,3909 0,8600 1,0640 1,3253 1,7247 2,0860 2,5280 2,8453
21 0,1272 0,2566 0,3906 0,8591 1,0627 1,3232 1,7207 2,0796 2,5176 2,8314
22 0,1271 0,2564 0,3904 0,8583 1,0614 1,3212 1,7171 2,0739 2,5083 2,8188
23 0,1271 0,2563 0,3902 0,8575 1,0603 1,3195 1,7139 2,0687 2,4999 2,8073
24 0,1270 0,2562 0,3900 0,8569 1,0593 1,3178 1,7109 2,0639 2,4922 2,7970
25 0,1269 0,2561 0,3898 0,8562 1,0584 1,3163 1,7081 2,0595 2,4851 2,7874
26 0,1269 0,2560 0,3896 0,8557 1,0575 1,3150 1,7056 2,0555 2,4786 2,7787
27 0,1268 0,2559 0,3894 0,8551 1,0567 1,3137 1,7033 2,0518 2,4727 2,7707
28 0,1268 0,2558 0,3893 0,8546 1,0560 1,3125 1,7011 2,0484 2,4671 2,7633
29 0,1268 0,2557 0,3892 0,8542 1,0553 1,3114 1,6991 2,0452 2,4620 2,7564
30 0,1267 0,2556 0,3890 0,8538 1,0547 1,3104 1,6973 2,0423 2,4573 2,7500
31 0,1267 0,2555 0,3889 0,8534 1,0541 1,3095 1,6955 2,0395 2,4528 2,7440
32 0,1267 0,2555 0,3888 0,8530 1,0535 1,3086 1,6939 2,0369 2,4487 2,7385
33 0,1266 0,2554 0,3887 0,8526 1,0530 1,3077 1,6924 2,0345 2,4448 2,7333
34 0,1266 0,2553 0,3886 0,8523 1,0525 1,3070 1,6909 2,0322 2,4411 2,7284
35 0,1266 0,2553 0,3885 0,8520 1,0520 1,3062 1,6896 2,0301 2,4377 2,7238
36 0,1266 0,2552 0,3884 0,8517 1,0516 1,3055 1,6883 2,0281 2,4345 2,7195
37 0,1265 0,2552 0,3883 0,8514 1,0512 1,3049 1,6871 2,0262 2,4314 2,7154
38 0,1265 0,2551 0,3882 0,8512 1,0508 1,3042 1,6860 2,0244 2,4286 2,7116
39 0,1265 0,2551 0,3882 0,8509 1,0504 1,3036 1,6849 2,0227 2,4258 2,7079
40 0,1265 0,2550 0,3881 0,8507 1,0500 1,3031 1,6839 2,0211 2,4233 2,7045
41 0,1264 0,2550 0,3880 0,8505 1,0497 1,3025 1,6829 2,0195 2,4208 2,7012
42 0,1264 0,2550 0,3880 0,8503 1,0494 1,3020 1,6820 2,0181 2,4185 2,6981
43 0,1264 0,2549 0,3879 0,8501 1,0491 1,3016 1,6811 2,0167 2,4163 2,6951
44 0,1264 0,2549 0,3878 0,8499 1,0488 1,3011 1,6802 2,0154 2,4141 2,6923
45 0,1264 0,2549 0,3878 0,8497 1,0485 1,3007 1,6794 2,0141 2,4121 2,6896
46 0,1264 0,2548 0,3877 0,8495 1,0482 1,3002 1,6787 2,0129 2,4102 2,6870
47 0,1263 0,2548 0,3877 0,8493 1,0480 1,2998 1,6779 2,0117 2,4083 2,6846
48 0,1263 0,2548 0,3876 0,8492 1,0478 1,2994 1,6772 2,0106 2,4066 2,6822
49 0,1263 0,2547 0,3876 0,8490 1,0475 1,2991 1,6766 2,0096 2,4049 2,6800
50 0,1263 0,2547 0,3875 0,8489 1,0473 1,2987 1,6759 2,0086 2,4033 2,6778
60 0,1262 0,2545 0,3872 0,8477 1,0455 1,2958 1,6706 2,0003 2,3901 2,6603
0,1257 0,2533 0,3853 0,8416 1,0364 1,2816 1,6449 1,9600 2,3264 2,5759
Apndice

267



Tabla de valores de ji-cuadrado

P(rea de la cola derecha bajo la funcin ji-cuadrada)
n 0,99 0,98 0,95 0,90 0,50 0,10 0,05 0,025 0,02 0,01
1 0,0002 0,0006 0,0039 0,0158 0,4549 2,7055 3,8415 5,0239 5,4119 6,6349
2 0,0201 0,0404 0,1026 0,2107 1,3863 4,6052 5,9915 7,3778 7,8241 9,2104
3 0,1148 0,1848 0,3518 0,5844 2,3660 6,2514 7,8147 9,3484 9,8374 11,3449
4 0,2971 0,4294 0,7107 1,0636 3,3567 7,7794 9,4877 11,1433 11,6678 13,2767
5 0,5543 0,7519 1,1455 1,6103 4,3515 9,2363 11,0705 12,8325 13,3882 15,0863
6 0,8721 1,1344 1,6354 2,2041 5,3481 10,6446 12,5916 14,4494 15,0332 16,8119
7 1,2390 1,5643 2,1673 2,8331 6,3458 12,0170 14,0671 16,0128 16,6224 18,4753
8 1,6465 2,0325 2,7326 3,4895 7,3441 13,3616 15,5073 17,5345 18,1682 20,0902
9 2,0879 2,5324 3,3251 4,1682 8,3428 14,6837 16,9190 19,0228 19,6790 21,6660
10 2,5582 3,0591 3,9403 4,8652 9,3418 15,9872 18,3070 20,4832 21,1608 23,2093
11 3,0535 3,6087 4,5748 5,5778 10,3410 17,2750 19,6752 21,9200 22,6179 24,7250
12 3,5706 4,1783 5,2260 6,3038 11,3403 18,5493 21,0261 23,3367 24,0539 26,2170
13 4,1069 4,7654 5,8919 7,0415 12,3398 19,8119 22,3620 24,7356 25,4715 27,6882
14 4,6604 5,3682 6,5706 7,7895 13,3393 21,0641 23,6848 26,1189 26,8727 29,1412
15 5,2294 5,9849 7,2609 8,5468 14,3389 22,3071 24,9958 27,4884 28,2595 30,5780
16 5,8122 6,6142 7,9616 9,3122 15,3385 23,5418 26,2962 28,8453 29,6332 31,9999
17 6,4077 7,2550 8,6718 10,0852 16,3382 24,7690 27,5871 30,1910 30,9950 33,4087
18 7,0149 7,9062 9,3904 10,8649 17,3379 25,9894 28,8693 31,5264 32,3462 34,8052
19 7,6327 8,5670 10,1170 11,6509 18,3376 27,2036 30,1435 32,8523 33,6874 36,1908
20 8,2604 9,2367 10,8508 12,4426 19,3374 28,4120 31,4104 34,1696 35,0196 37,5663
21 8,8972 9,9145 11,5913 13,2396 20,3372 29,6151 32,6706 35,4789 36,3434 38,9322
22 9,5425 10,6000 12,3380 14,0415 21,3370 30,8133 33,9245 36,7807 37,6595 40,2894
23 10,1957 11,2926 13,0905 14,8480 22,3369 32,0069 35,1725 38,0756 38,9683 41,6383
24 10,8563 11,9918 13,8484 15,6587 23,3367 33,1962 36,4150 39,3641 40,2703 42,9798
25 11,5240 12,6973 14,6114 16,4734 24,3366 34,3816 37,6525 40,6465 41,5660 44,3140
26 12,1982 13,4086 15,3792 17,2919 25,3365 35,5632 38,8851 41,9231 42,8558 45,6416
27 12,8785 14,1254 16,1514 18,1139 26,3363 36,7412 40,1133 43,1945 44,1399 46,9628
28 13,5647 14,8475 16,9279 18,9392 27,3362 37,9159 41,3372 44,4608 45,4188 48,2782
29 14,2564 15,5745 17,7084 19,7677 28,3361 39,0875 42,5569 45,7223 46,6926 49,5878
30 14,9535 16,3062 18,4927 20,5992 29,3360 40,2560 43,7730 46,9792 47,9618 50,8922

Para n > 30 conviene emplear el ajuste normal: 1 2 2
2
= n z





268 Apndice

Tabla de valores de F (P = 0,05)

P = 0,05
n
2
\n
1
1 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 50 60 120
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,0 243,9 245,9 248,0 249,1 250,1 251,1 251,8 252,2 253,3 254,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,70 8,66 8,64 8,62 8,59 8,58 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,86 5,80 5,77 5,75 5,72 5,70 5,69 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,62 4,56 4,53 4,50 4,46 4,44 4,43 4,40 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,94 3,87 3,84 3,81 3,77 3,75 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,51 3,44 3,41 3,38 3,34 3,32 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,22 3,15 3,12 3,08 3,04 3,02 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,01 2,94 2,90 2,86 2,83 2,80 2,79 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,85 2,77 2,74 2,70 2,66 2,64 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,72 2,65 2,61 2,57 2,53 2,51 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,62 2,54 2,51 2,47 2,43 2,40 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,53 2,46 2,42 2,38 2,34 2,31 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,46 2,39 2,35 2,31 2,27 2,24 2,22 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,40 2,33 2,29 2,25 2,20 2,18 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,35 2,28 2,24 2,19 2,15 2,12 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,31 2,23 2,19 2,15 2,10 2,08 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,27 2,19 2,15 2,11 2,06 2,04 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,23 2,16 2,11 2,07 2,03 2,00 1,98 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,20 2,12 2,08 2,04 1,99 1,97 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,18 2,10 2,05 2,01 1,96 1,94 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,15 2,07 2,03 1,98 1,94 1,91 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,13 2,05 2,01 1,96 1,91 1,88 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,11 2,03 1,98 1,94 1,89 1,86 1,84 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,09 2,01 1,96 1,92 1,87 1,84 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,07 1,99 1,95 1,90 1,85 1,82 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13 2,06 1,97 1,93 1,88 1,84 1,81 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,04 1,96 1,91 1,87 1,82 1,79 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,03 1,94 1,90 1,85 1,81 1,77 1,75 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09 2,01 1,93 1,89 1,84 1,79 1,76 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00 1,92 1,84 1,79 1,74 1,69 1,66 1,64 1,58 1,51
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95 1,87 1,78 1,74 1,69 1,63 1,60 1,58 1,51 1,44
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92 1,84 1,75 1,70 1,65 1,59 1,56 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,87 1,83 1,75 1,66 1,61 1,55 1,50 1,46 1,43 1,35 1,25
3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75 1,67 1,57 1,52 1,46 1,39 1,35 1,32 1,22 1,00
Apndice

269
Tabla de valores de F (P = 0,01)

P = 0,01
n
2
\n
1
1 2 3 4 5 6 7 8 9 10 11 12 15 20 24 30 40 50 60 120
1 4052,2 4999,3 5403,5 5624,3 5764,0 5859,0 5928,3 5981,0 6022,4 6055,9 6083,4 6106,7 6157,0 6208,7 6234,3 6260,4 6286,4 6302,3 6313,0 6339,5 6365,6
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42 99,43 99,45 99,46 99,47 99,48 99,48 99,48 99,49 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05 26,87 26,69 26,60 26,50 26,41 26,35 26,32 26,22 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37 14,20 14,02 13,93 13,84 13,75 13,69 13,65 13,56 13,46
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89 9,72 9,55 9,47 9,38 9,29 9,24 9,20 9,11 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7,56 7,40 7,31 7,23 7,14 7,09 7,06 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47 6,31 6,16 6,07 5,99 5,91 5,86 5,82 5,74 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67 5,52 5,36 5,28 5,20 5,12 5,07 5,03 4,95 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11 4,96 4,81 4,73 4,65 4,57 4,52 4,48 4,40 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71 4,56 4,41 4,33 4,25 4,17 4,12 4,08 4,00 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40 4,25 4,10 4,02 3,94 3,86 3,81 3,78 3,69 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16 4,01 3,86 3,78 3,70 3,62 3,57 3,54 3,45 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96 3,82 3,66 3,59 3,51 3,43 3,38 3,34 3,25 3,17
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80 3,66 3,51 3,43 3,35 3,27 3,22 3,18 3,09 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67 3,52 3,37 3,29 3,21 3,13 3,08 3,05 2,96 2,87
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55 3,41 3,26 3,18 3,10 3,02 2,97 2,93 2,84 2,75
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46 3,31 3,16 3,08 3,00 2,92 2,87 2,83 2,75 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,43 3,37 3,23 3,08 3,00 2,92 2,84 2,78 2,75 2,66 2,57
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30 3,15 3,00 2,92 2,84 2,76 2,71 2,67 2,58 2,49
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23 3,09 2,94 2,86 2,78 2,69 2,64 2,61 2,52 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17 3,03 2,88 2,80 2,72 2,64 2,58 2,55 2,46 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12 2,98 2,83 2,75 2,67 2,58 2,53 2,50 2,40 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,14 3,07 2,93 2,78 2,70 2,62 2,54 2,48 2,45 2,35 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03 2,89 2,74 2,66 2,58 2,49 2,44 2,40 2,31 2,21
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,06 2,99 2,85 2,70 2,62 2,54 2,45 2,40 2,36 2,27 2,17
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96 2,81 2,66 2,58 2,50 2,42 2,36 2,33 2,23 2,13
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,99 2,93 2,78 2,63 2,55 2,47 2,38 2,33 2,29 2,20 2,10
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,96 2,90 2,75 2,60 2,52 2,44 2,35 2,30 2,26 2,17 2,06
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,93 2,87 2,73 2,57 2,49 2,41 2,33 2,27 2,23 2,14 2,03
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,91 2,84 2,70 2,55 2,47 2,39 2,30 2,25 2,21 2,11 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66 2,52 2,37 2,29 2,20 2,11 2,06 2,02 1,92 1,80
50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,63 2,56 2,42 2,27 2,18 2,10 2,01 1,95 1,91 1,80 1,68
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50 2,35 2,20 2,12 2,03 1,94 1,88 1,84 1,73 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,40 2,34 2,19 2,03 1,95 1,86 1,76 1,70 1,66 1,53 1,38
6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,25 2,18 2,04 1,88 1,79 1,70 1,59 1,52 1,47 1,32 1,01
270 Apndice



Tabla de factores para el clculo de lmites de control

Tamao de
la muestra
A
2
A
3
E
2
B
3
B
4
D
3
D
4

2 1,880 2,659 2,660 0,000 3,267 0,000 3,267
3 1,023 1,954 1,772 0,000 2,568 0,000 2,574
4 0,729 1,628 1,457 0,000 2,266 0,000 2,282
5 0,557 1,427 1,290 0,000 2,089 0,000 2,114
6 0,483 1,287 1,184 0,030 1,970 0,000 2,004
7 0,419 1,182 1,109 0,118 1,882 0,076 1,924
8 0,373 1,099 1,054 0,185 1,815 0,136 1,864
9 0,337 1,032 1,010 0,239 1,761 0,184 1,816
10 0,308 0,975 0,975 0,284 1,716 0,223 1,777
11 0,285 0,927 0,946 0,321 1,679 0,256 1,744
12 0,266 0,886 0,921 0,354 1,646 0,283 1,717
13 0,249 0,850 0,899 0,382 1,618 0,307 1,693
14 0,235 0,817 0,881 0,406 1,594 0,328 1,672
15 0,223 0,789 0,864 0,428 1,572 0,347 1,653
16 0,212 0,763 0,448 1,552 0,363 1,637
17 0,203 0,739 0,466 1,534 0,378 1,622
18 0,194 0,718 0,482 1,518 0,391 1,608
19 0,187 0,698 0,497 1,503 0,403 1,597
20 0,180 0,680 0,510 1,490 0,415 1,585
21 0,173 0,663 0,523 1,477 0,425 1,575
22 0,167 0,647 0,534 1,466 0,434 1,566
23 0,162 0,633 0,545 1,455 0,443 1,557
24 0,157 0,619 0,555 1,445 0,451 1,548
25 0,153 0,606 0,565 1,435 0,459 1,541

Tabla extrada del curso de Herramientas Estadsticas para el mejoramiento de procesos
dictado por el Ing. Federico Salvador en la Sociedad Nacional de Industrias del Per.
















Apndice 271

Tabla de probabilidades de aceptacin (P
a
)
np \ c 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
0,01 0,990 1,000
0,02 0,980 1,000
0,03 0,970 1,000
0,04 0,961 0,999 1,000
0,05 0,951 0,999 1,000
0,06 0,942 0,998 1,000
0,07 0,932 0,998 1,000
0,08 0,923 0,997 1,000
0,09 0,914 0,996 1,000
0,10 0,905 0,995 1,000
0,15 0,861 0,990 0,999 1,000
0,20 0,819 0,982 0,999 1,000
0,25 0,779 0,974 0,998 1,000
0,30 0,741 0,963 0,996 1,000
0,35 0,705 0,951 0,994 1,000
0,40 0,670 0,938 0,992 0,999 1,000
0,45 0,638 0,925 0,989 0,999 1,000
0,50 0,607 0,910 0,986 0,998 1,000
0,55 0,577 0,894 0,982 0,998 1,000
0,60 0,549 0,878 0,977 0,997 1,000
0,65 0,522 0,861 0,972 0,996 0,999 1,000
0,70 0,497 0,844 0,966 0,994 0,999 1,000
0,75 0,472 0,827 0,959 0,993 0,999 1,000
0,80 0,449 0,809 0,953 0,991 0,999 1,000
0,85 0,427 0,791 0,945 0,989 0,998 1,000
0,90 0,407 0,772 0,937 0,987 0,998 1,000
0,95 0,387 0,754 0,929 0,984 0,997 1,000
1,00 0,368 0,736 0,920 0,981 0,996 0,999 1,000
1,10 0,333 0,699 0,900 0,974 0,995 0,999 1,000
1,20 0,301 0,663 0,879 0,966 0,992 0,998 1,000
1,30 0,273 0,627 0,857 0,957 0,989 0,998 1,000
1,40 0,247 0,592 0,833 0,946 0,986 0,997 0,999 1,000
1,50 0,223 0,558 0,809 0,934 0,981 0,996 0,999 1,000
1,60 0,202 0,525 0,783 0,921 0,976 0,994 0,999 1,000
1,70 0,183 0,493 0,757 0,907 0,970 0,992 0,998 1,000
1,80 0,165 0,463 0,731 0,891 0,964 0,990 0,997 0,999 1,000
1,90 0,150 0,434 0,704 0,875 0,956 0,987 0,997 0,999 1,000
2,00 0,135 0,406 0,677 0,857 0,947 0,983 0,995 0,999 1,000
2,10 0,122 0,380 0,650 0,839 0,938 0,980 0,994 0,999 1,000
2,20 0,111 0,355 0,623 0,819 0,928 0,975 0,993 0,998 1,000
2,30 0,100 0,331 0,596 0,799 0,916 0,970 0,991 0,997 0,999 1,000
2,40 0,091 0,308 0,570 0,779 0,904 0,964 0,988 0,997 0,999 1,000
2,50 0,082 0,287 0,544 0,758 0,891 0,958 0,986 0,996 0,999 1,000
2,60 0,074 0,267 0,518 0,736 0,877 0,951 0,983 0,995 0,999 1,000
2,70 0,067 0,249 0,494 0,714 0,863 0,943 0,979 0,993 0,998 0,999 1,000
2,80 0,061 0,231 0,469 0,692 0,848 0,935 0,976 0,992 0,998 0,999 1,000
2,90 0,055 0,215 0,446 0,670 0,832 0,926 0,971 0,990 0,997 0,999 1,000
3,00 0,050 0,199 0,423 0,647 0,815 0,916 0,966 0,988 0,996 0,999 1,000
3,10 0,045 0,185 0,401 0,625 0,798 0,906 0,961 0,986 0,995 0,999 1,000
3,20 0,041 0,171 0,380 0,603 0,781 0,895 0,955 0,983 0,994 0,998 1,000
3,30 0,037 0,159 0,359 0,580 0,763 0,883 0,949 0,980 0,993 0,998 0,999 1,000
3,40 0,033 0,147 0,340 0,558 0,744 0,871 0,942 0,977 0,992 0,997 0,999 1,000
3,50 0,030 0,136 0,321 0,537 0,725 0,858 0,935 0,973 0,990 0,997 0,999 1,000
3,60 0,027 0,126 0,303 0,515 0,706 0,844 0,927 0,969 0,988 0,996 0,999 1,000
3,70 0,025 0,116 0,285 0,494 0,687 0,830 0,918 0,965 0,986 0,995 0,998 1,000
3,80 0,022 0,107 0,269 0,473 0,668 0,816 0,909 0,960 0,984 0,994 0,998 0,999 1,000
3,90 0,020 0,099 0,253 0,453 0,648 0,801 0,899 0,955 0,981 0,993 0,998 0,999 1,000
4,00 0,018 0,092 0,238 0,433 0,629 0,785 0,889 0,949 0,979 0,992 0,997 0,999 1,000
4,10 0,017 0,085 0,224 0,414 0,609 0,769 0,879 0,943 0,976 0,990 0,997 0,999 1,000
4,20 0,015 0,078 0,210 0,395 0,590 0,753 0,867 0,936 0,972 0,989 0,996 0,999 1,000
4,30 0,014 0,072 0,197 0,377 0,570 0,737 0,856 0,929 0,968 0,987 0,995 0,998 0,999 1,000
4,40 0,012 0,066 0,185 0,359 0,551 0,720 0,844 0,921 0,964 0,985 0,994 0,998 0,999 1,000
4,50 0,011 0,061 0,174 0,342 0,532 0,703 0,831 0,913 0,960 0,983 0,993 0,998 0,999 1,000
4,60 0,010 0,056 0,163 0,326 0,513 0,686 0,818 0,905 0,955 0,980 0,992 0,997 0,999 1,000
4,70 0,009 0,052 0,152 0,310 0,495 0,668 0,805 0,896 0,950 0,978 0,991 0,997 0,999 1,000
4,80 0,008 0,048 0,143 0,294 0,476 0,651 0,791 0,887 0,944 0,975 0,990 0,996 0,999 1,000
4,90 0,007 0,044 0,133 0,279 0,458 0,634 0,777 0,877 0,938 0,972 0,988 0,995 0,998 0,999 1,000
5,00 0,007 0,040 0,125 0,265 0,440 0,616 0,762 0,867 0,932 0,968 0,986 0,995 0,998 0,999 1,000
272 Apndice


ndice i

NDICE
CAPTULO 1. PROBABILIDADES................................................................................................................... 1
1.1 MODELOS MATEMTICOS ..................................................................................................................... 1
1.1.1 Definiciones: ................................................................................................................................... 1
1.1.2 Caractersticas de un fenmeno probabilstico: ............................................................................. 1
1.2 PERMUTACIONES Y COMBINACIONES.................................................................................................... 2
1.2.1 Teoremas relativos a permutaciones y combinaciones ................................................................... 2
1.3 EXPERIMENTOS Y EVENTOS .................................................................................................................. 7
1.4 ESPACIO MUESTRA................................................................................................................................ 7
1.5 VARIABLE ALEATORIA.......................................................................................................................... 7
1.6 PROBABILIDAD ..................................................................................................................................... 9
1.6.1. Probabilidad a priori:..................................................................................................................... 9
1.6.2. Probabilidad experimental............................................................................................................ 10
1.6.3 Probabilidad subjetiva.................................................................................................................. 11
1.7 TEOREMAS DE PROBABILIDAD. ........................................................................................................... 11
1.7.1 Suma de probabilidades:............................................................................................................... 11
1.7.2 Probabilidad condicional y regla de la multiplicacin: ............................................................... 14
1.7.3 Eventos independientes ................................................................................................................. 16
1.7.4 Teorema de suma y multiplicacin: particiones............................................................................ 17
1.7.5 Teorema de Bayes ......................................................................................................................... 21
PROBLEMAS PROPUESTOS. ................................................................................................................................ 23
CAPTULO 2. INTRODUCCIN A LA ESTADSTICA.............................................................................. 34
2.1 DEFINICIN DE ESTADSTICA.............................................................................................................. 34
2.2 DEFINICIN DE ALGUNOS TRMINOS BSICOS .................................................................................... 34
2.2.1 Universo o poblacin:................................................................................................................... 34
2.2.2 Muestra ......................................................................................................................................... 34
2.3 ESTADSTICA DESCRIPTIVA E INFERENCIAL......................................................................................... 35
2.4 IMPORTANCIA DE LA ESTADSTICA ..................................................................................................... 35
CAPTULO 3. ESTADSTICA DESCRIPTIVA............................................................................................. 37
3.1 INTRODUCCIN................................................................................................................................... 37
3.2 MEDIDAS DESCRIPTIVAS..................................................................................................................... 37
3.2.1 Media aritmtica ........................................................................................................................... 37
3.2.2 La mediana.................................................................................................................................... 38
3.2.3 La moda......................................................................................................................................... 38
3.2.4 La amplitud ................................................................................................................................... 39
3.2.5 La desviacin media...................................................................................................................... 39
3.2.6 La varianza ................................................................................................................................... 39
3.2.7 La desviacin estndar.................................................................................................................. 39
3.2.8 El coeficiente de variacin............................................................................................................ 39
3.2.9 Los cuartiles.................................................................................................................................. 40
3.2.10 Los percentiles.......................................................................................................................... 40
3.2.11 Coeficiente de asimetra........................................................................................................... 40
3.2.12 Curtosis .................................................................................................................................... 41
3.3 EXACTITUD Y PRECISIN .................................................................................................................... 41
3.4 MEDIDAS DESCRIPTIVAS EN EXCEL .................................................................................................... 42
3.5 REPRESENTACIONES DE DATOS........................................................................................................... 44
3.5.1 Distribucin de frecuencias: diagrama de barras ........................................................................ 44
3.5.2 Representaciones tallo-hoja.......................................................................................................... 45
3.5.3 Diagrama de caja-bigote.................................................................................................................... 45
3.6 DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS................................................................................. 46
3.6.1 Agrupacin de datos...................................................................................................................... 46
3.6.2 Histograma, polgono de frecuencias y ojiva................................................................................ 48
3.6.3 Clculo de algunas medidas descriptivas. .................................................................................... 50
3.7 TABLAS Y GRFICAS PARA LA REPRESENTACIN DE DATOS EN EXCEL............................................... 50
3.7.1 Tabla y grfico de distribucin de frecuencias no agrupadas ...................................................... 50
3.7.2 Tabla de distribucin de frecuencias agrupadas e histogramas en Excel .................................... 50
PROBLEMAS PROPUESTOS. ................................................................................................................................ 54
ii ndice

CAPTULO 4. FUNCIN DE PROBABILIDAD........................................................................................... 58
4.1 DEFINICIN DE FUNCIN DE PROBABILIDAD. ...................................................................................... 58
4.2 LA FUNCIN DE DISTRIBUCIN (ACUMULATIVA). ............................................................................... 59
4.3 EL VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA. ........................................................ 59
4.4 VARIANZA Y DESVIACIN ESTNDAR DE UNA VARIABLE ALEATORIA DISCRETA ................................ 60
4.5 TEOREMAS SOBRE EL VALOR ESPERADO Y LA VARIANZA.................................................................... 61
4.6 LA DESIGUALDAD DE TCHEBYCHEFF. ................................................................................................. 62
4.7 LA FUNCIN BIVARIANTE DE PROBABILIDAD. ..................................................................................... 63
4.7.1 Definicin de funcin bivariante de probabilidad. ....................................................................... 63
4.7.2 El valor esperado de funciones de dos variables. ......................................................................... 64
4.7.3 Varianza y covarianza de dos variables aleatorias....................................................................... 64
4.8 DISTRIBUCIONES DE PROBABILIDAD EN EXCEL................................................................................... 65
PROBLEMAS PROPUESTOS. ................................................................................................................................ 68
CAPTULO 5. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD.................................................... 71
5.1 LA DISTRIBUCIN UNIFORME DISCRETA.............................................................................................. 71
5.2 LA DISTRIBUCIN BINOMIAL............................................................................................................... 71
5.2.1 Probabilidad binomial .................................................................................................................. 71
5.2.2 La funcin binomial de probabilidad. ........................................................................................... 72
5.2.3 El valor esperado y la varianza .................................................................................................... 73
5.2.4 Clculo de probabilidades binomiales acumulativas.................................................................... 74
5.2.5 La proporcin muestral como estimacin de la proporcin poblacional. .................................... 76
5.2.6 La distribucin binomial en Excel................................................................................................. 76
5.3 LA DISTRIBUCIN BINOMIAL NEGATIVA.............................................................................................. 76
5.4 LA DISTRIBUCIN DE POISSON. ........................................................................................................... 77
5.4.1 La funcin de probabilidad de Poisson......................................................................................... 77
5.4.2 El valor esperado y la varianza. ................................................................................................... 78
5.4.3 Clculo de probabilidades acumulativas de Poisson.................................................................... 79
5.4.4 Aproximacin de la distribucin binomial a la distribucin de Poisson. ..................................... 80
5.4.5 La distribucin de Poisson en Excel ............................................................................................. 80
5.5 LA DISTRIBUCIN HIPERGEOMTRICA................................................................................................. 81
5.5.1 La probabilidad hipergeomtrica ................................................................................................. 81
5.5.2 La distribucin hipergeomtrica................................................................................................... 82
5.5.2 La media y la varianza.................................................................................................................. 82
PROBLEMAS PROPUESTOS. ................................................................................................................................ 83
CAPTULO 6. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD................................................... 86
6.1 LA FUNCIN DENSIDAD DE PROBABILIDAD. ........................................................................................ 86
6.1.1 Introduccin.................................................................................................................................. 86
6.1.2 La funcin densidad de probabilidad............................................................................................ 86
6.1.3 La media y la varianza. ................................................................................................................. 87
6.2 LA DISTRIBUCIN NORMAL................................................................................................................. 87
6.2.1 La funcin densidad normal de probabilidad ............................................................................... 87
6.2.2 La forma estandarizada. ............................................................................................................... 89
6.2.3 reas bajo la curva normal........................................................................................................... 90
6.2.4 Ordenadas de la curva normal...................................................................................................... 90
6.2.5 Propiedades de la curva normal. .................................................................................................. 91
6.2.6 Aproximacin a la distribucin binomial...................................................................................... 92
6.2.7 Ajuste de la curva normal. ............................................................................................................ 94
6.3 LA DISTRIBUCIN UNIFORME CONTINUA............................................................................................. 96
PROBLEMAS PROPUESTOS. ................................................................................................................................ 98
CAPTULO 7. DISTRIBUCIONES DE PROPORCIONES......................................................................... 101
7.1 LA DISTRIBUCIN MULTINOMIAL. ..................................................................................................... 101
7.2 LA DISTRIBUCIN DE UNA PROPORCIN. ........................................................................................... 101
7.3 DETERMINACIN DEL TAMAO DE UNA MUESTRA EN POBLACIONES INFINITAS................................ 103
7.3.1 Determinacin del tamao de una muestra para estimar una proporcin de una poblacin
infinita 103
7.3.2 Determinacin del tamao de una muestra estratificada para estimar proporciones de los estratos de
una poblacin infinita................................................................................................................................ 106
ndice iii

7.4 DETERMINACIN DEL TAMAO DE UNA MUESTRA EN POBLACIONES FINITAS ................................... 109
7.5 LA DISTRIBUCIN DE LA DIFERENCIA DE DOS PROPORCIONES. .......................................................... 109
PROBLEMAS PROPUESTOS. .............................................................................................................................. 111
CAPTULO 8: DISTRIBUCIN DE LAS MEDIAS MUESTRALES........................................................ 113
8.1 INTRODUCCIN................................................................................................................................. 113
8.2 DISTRIBUCIN DE LA MEDIA MUESTRAL ........................................................................................... 113
8.3. DISTRIBUCIN DE LA DIFERENCIA DE LAS MEDIAS MUESTRALES ...................................................... 114
8.4. LA DISTRIBUCIN T DE STUDENT: APLICACIONES A LAS MEDIAS POBLACIONALES ........................... 115
8.4.1 La distribucin t de Student ........................................................................................................ 115
8.4.2 Distribucin t de la media muestral ............................................................................................ 115
8.4.3 Distribucin t de la diferencia de las medias muestrales............................................................ 116
PROBLEMAS PROPUESTOS ............................................................................................................................... 117
CAPTULO 9: CONTRASTES DE HIPTESIS .......................................................................................... 118
9.1. INTRODUCCIN................................................................................................................................. 118
9.2. HIPTESIS NULA E HIPTESIS ALTERNATIVA..................................................................................... 118
9.3. REGIONES DE ACEPTACIN Y DE RECHAZO ....................................................................................... 118
9.4. ERROR TIPO I Y ERROR TIPO II........................................................................................................... 119
9.5. CONTRASTES DE HIPTESIS SOBRE PROPORCIONES ........................................................................... 120
9.6. CONTRASTES DE HIPTESIS SOBRE MEDIAS MUESTRALES ................................................................. 124
9.7 LA DISTRIBUCIN F: COMPARACIN DE VARIANZAS. ........................................................................ 127
9.8 CONTRASTES DE HIPTESIS EN EXCEL ............................................................................................. 128
9.8.1 Prueba t para medias de dos muestras suponiendo varianzas iguales. ...................................... 128
9.8.2 Prueba t para medias de dos muestras suponiendo varianzas desiguales. ................................. 129
9.8.3 Prueba z para medias de dos muestras cuando se conocen la varianzas de las poblaciones..... 130
9.8.4 Prueba de una media cuando se conoce o no la varianza de la poblacin................................. 131
9.8.5 Comparacin de varianzas.......................................................................................................... 132
PROBLEMAS PROPUESTOS ............................................................................................................................... 134
CAPTULO 10. LA DISTRIBUCIN JI-CUADRADA (
2
)........................................................................ 139
10.1 INTRODUCCIN. ................................................................................................................................ 139
10.2 LA FUNCIN DENSIDAD DE PROBABILIDAD JI-CUADRADA. ................................................................ 139
10.3 PRUEBAS DE BONDAD DE AJUSTE. ..................................................................................................... 140
10.3.1 Distribucin multinomial................................................................................................................ 141
10.3.2 Distribucin de Poisson.................................................................................................................. 142
10.3.3 Distribucin normal. ...................................................................................................................... 143
10.4 PRUEBAS DE INDEPENDENCIA: TABLAS DE CONTINGENCIA. .............................................................. 144
10.5 PRUEBAS DE HIPTESIS RESPECTO A LA VARIANZA........................................................................... 146
10.6 LA DISTRIBUCIN JI-CUADRADA EN EXCEL ...................................................................................... 147
PROBLEMAS PROPUESTOS. .............................................................................................................................. 148
CAPTULO 11. ESTIMACIN PUNTUAL Y DE INTERVALO............................................................... 150
11.1 INTRODUCCIN................................................................................................................................. 150
11.2 ESTIMACIN PUNTUAL...................................................................................................................... 150
11.3 ESTIMACIN POR INTERVALOS.......................................................................................................... 151
11.3.1 Intervalo de confianza para la media poblacional. ........................................................................ 151
11.3.2 Intervalo de confianza para la diferencia de medias...................................................................... 152
11.3.3 Intervalo de confianza para la proporcin p.................................................................................. 152
11.3.4 Intervalo de confianza para la diferencia de proporciones............................................................ 154
11.3.5 Intervalo de confianza para la varianza......................................................................................... 154
11.4 INTERVALO DE CONFIANZA PARA LA MEDIA EN EXCEL..................................................................... 155
PROBLEMAS PROPUESTOS. .............................................................................................................................. 157
CAPTULO 12. DISEO DE EXPERIMENTOS Y ANLISIS DE VARIANZA..................................... 158
12.1 INTRODUCCIN. ................................................................................................................................ 158
12.2 DISEO DE EXPERIMENTOS. .............................................................................................................. 158
12.2.1 Definiciones.................................................................................................................................... 158
12.2.2 Diseo completamente aleatorizado............................................................................................... 159
12.2.3 Diseo aleatorizado por bloques.................................................................................................... 159
iv ndice

12.2.4 Errores en los datos de los experimentos ....................................................................................... 159
12.3 ANLISIS DE VARIANZA: ANOVA.................................................................................................... 159
12.3.1 Anlisis de varianza de un factor ................................................................................................... 161
12.3.2 Anlisis de varianza de dos factores, sin interaccin entre los factores. ....................................... 163
12.3.3 Anlisis de varianza de dos factores, con interaccin entre los factores. ...................................... 166
12.4 ANLISIS DE VARIANZA EN EXCEL ................................................................................................... 170
12.4.1 Anlisis de varianza de un factor ................................................................................................... 170
12.4.2 Anlisis de varianza de dos factores, sin interaccin. .................................................................... 171
12.4.3 Anlisis de varianza de dos factores, con interaccin.................................................................... 173
PROBLEMAS PROPUESTOS. .............................................................................................................................. 177
CAPTULO 13. REGRESIN LINEAL SIMPLE Y CORRELACIN. .................................................... 179
13.1 INTRODUCCIN. ................................................................................................................................ 179
13.2 REGRESIN. ...................................................................................................................................... 179
13.3 LA RECTA DE REGRESIN DE LA POBLACIN..................................................................................... 180
13.4 MTODO DE LOS MNIMOS CUADRADOS............................................................................................ 181
13.5 PROPIEDADES DE LA RECTA DE MNIMOS CUADRADOS...................................................................... 182
13.6 MEDIDAS DE VARIABILIDAD ............................................................................................................. 183
13.7 ESTIMACIONES DE INTERVALO PARA LA REGRESIN......................................................................... 185
13.8 CORRELACIN LINEAL. ..................................................................................................................... 185
13.9 REGRESIN SIMPLE NO LINEAL ......................................................................................................... 187
13.10 REGRESIN LINEAL, NO LINEAL Y CORRELACIN EN EXCEL ............................................................. 188
13.10.1 Diagrama de dispersin y tendencia lineal. ................................................................................. 188
13.10.2 Tendencia no lineal. ..................................................................................................................... 190
13.10.3 Regresin lineal con funciones de Excel ...................................................................................... 190
PROBLEMAS PROPUESTOS ............................................................................................................................... 192
CAPTULO 14. ANLISIS DE SERIES DE TIEMPO................................................................................. 195
14.1 INTRODUCCIN................................................................................................................................. 195
14.2 COMPONENTES DE UNA SERIE DE TIEMPO ......................................................................................... 195
14.2.1 Componente tendencial (T)............................................................................................................. 196
14.2.2 Componente cclica (C) .................................................................................................................. 196
14.2.3 Componente estacional (S) ............................................................................................................. 197
14.2.4 Componente irregular o aleatoria (I)............................................................................................. 199
14.3 DESCOMPOSICIN DE SERIES DE TIEMPO........................................................................................... 200
14.3.1 Suavizacin de la serie de tiempo................................................................................................... 200
14.3.2 Aislamiento de las componentes de la serie de tiempo. .................................................................. 201
14.4 PRONSTICO..................................................................................................................................... 202
14.5 ANLISIS DEL COMPORTAMIENTO DE UNA SERIE DE TIEMPO............................................................. 202
14.6 ANLISIS DE SERIES DE TIEMPO EN EXCEL........................................................................................ 202
14.6.1 Anlisis de series de tiempo con medias mviles............................................................................ 202
14.6.2 Suavizacin exponencial................................................................................................................. 206
PROBLEMAS PROPUESTOS ............................................................................................................................... 208
CAPTULO 15. HERRAMIENTAS ESTADSTICAS PARA MEJORAR LA CALIDAD DE LOS
PROCESOS....................................................................................................................................................... 211
15.1 MEJORA DE LA CALIDAD................................................................................................................... 211
15.1.1 Definiciones.................................................................................................................................... 211
15.1.2 Breve historia de la calidad............................................................................................................ 211
15.2 INTERPRETACIN DE HISTOGRAMAS Y MEDICIN DE LA CAPACIDAD DE UN PROCESO....................... 212
15.2.1 Interpretacin de histogramas........................................................................................................ 212
15.2.2 Capacidad de un proceso ............................................................................................................... 213
15.3 GRFICOS DE CONTROL .................................................................................................................... 218
15.3.1 Definiciones.................................................................................................................................... 218
15.3.2 Tipos de grficos de control ........................................................................................................... 219
15.3.3 Interpretacin de los grficos de control. ...................................................................................... 219
15.3.4 Elaboracin de los grficos de control........................................................................................... 220
15.4 MUESTREO DE ACEPTACIN.............................................................................................................. 232
15.4.1 Anlisis econmico de la inspeccin. ............................................................................................. 233
15.4.2 Riesgos del muestreo. ..................................................................................................................... 234
ndice v

15.4.3 Plan de muestreo ............................................................................................................................ 235
15.4.4 Curva caracterstica de operacin (Curva CO) ............................................................................. 235
PROBLEMAS PROPUESTOS. .............................................................................................................................. 238
CAPTULO 16. TEORA DE DECISIONES................................................................................................. 243
16.1 INTRODUCCIN. ................................................................................................................................ 243
16.2 DEFINICIONES................................................................................................................................... 243
16.2.1 Decisor ........................................................................................................................................... 243
16.2.2 Alternativas de decisin.................................................................................................................. 243
16.3 ESTADOS DE LA NATURALEZA .......................................................................................................... 243
16.3.1 Ambiente de certeza........................................................................................................................ 243
16.3.2 Ambiente de riesgo ......................................................................................................................... 243
16.3.3 Ambiente de incertidumbre............................................................................................................. 243
16.3.4 Ambiente de competencia ............................................................................................................... 244
16.4 CONSECUENCIAS............................................................................................................................... 244
16.5 CRITERIOS DE DECISIN................................................................................................................... 244
16.5.1 Criterio Maximin............................................................................................................................ 244
16.5.2 Criterio Maximax ........................................................................................................................... 245
16.5.3 Criterio realista.............................................................................................................................. 245
16.5.4 Criterio minimax del costo de oportunidad.................................................................................... 245
16.5.5 Criterio del valor esperado (Bayes) ............................................................................................... 245
16.5.6 Criterio del costo de oportunidad esperado................................................................................... 246
16.5.7 Criterio de mxima verosimilitud................................................................................................... 246
16.6 RBOLES DE DECISIN...................................................................................................................... 246
PROBLEMAS PROPUESTOS ............................................................................................................................... 249
APNDICE........................................................................................................................................................ 252
TABLA DE PROBABILIDADES BINOMIALES ACUMULATIVAS............................................................................. 253
TABLA DE PROBABILIDADES ACUMULATIVAS DE POISSON.............................................................................. 258
TABLA DE REAS BAJO LA CURVA NORMAL ESTANDARIZADA......................................................................... 264
TABLA DE ORDENADAS DE LA CURVA NORMAL ESTANDARIZADA................................................................... 265
TABLA DE VALORES DE T DE STUDENT............................................................................................................ 266
TABLA DE VALORES DE JI-CUADRADO............................................................................................................. 267
TABLA DE VALORES DE F (P = 0,05)................................................................................................................ 268
TABLA DE VALORES DE F (P = 0,01)................................................................................................................ 269
TABLA DE FACTORES PARA EL CLCULO DE LMITES DE CONTROL.................................................................. 270
TABLA DE PROBABILIDADES DE ACEPTACIN (PA).......................................................................................... 271





Prlogo

En las ltimas dcadas ha cobrado especial importancia el anlisis estadstico de datos para mejorar la
calidad de todo tipo de procesos, y para mejorar finalmente el nivel de satisfaccin de los clientes, ya
sea que stos adquieran un determinado producto o reciban un servicio. Grandes empresas transnacio-
nales estn implementando sistemas de gestin de la calidad, que presentan como principales argu-
mentos las herramientas estadsticas.

Quienes necesiten hacer anlisis de datos deben conocer un mnimo de herramientas estadsticas bsi-
cas para abordar con xito un problema real. Ms importante que saber usar dichas herramientas, es
saber cules son las apropiadas para cada situacin. En este libro se pone especial nfasis en los con-
ceptos, con el propsito de capacitar al lector para que sepa elegir con criterio las herramientas estads-
ticas que le resuelvan los problemas que aborde en su vida profesional.

El rpido desarrollo que estn alcanzando las computadoras personales ha ocasionado que en las lti-
mas dcadas hayan aparecido en el mercado mundial una gran cantidad de softwares estadsticos. Sin
embargo, stos no sern nada tiles si los usuarios no tienen los conocimientos mnimos de Estadsti-
ca.

En casi todos los captulos de este libro se explica, con ejemplos, el uso de las herramientas estadsti-
cas de Microsoft Excel para anlisis de datos, casi desconocidas por la gran mayora de usuarios de
Excel. Se explica adems cmo emplear las principales funciones estadsticas de este software. La
gran ventaja de Excel sobre los softwares de Estadstica como Statgraphics, Statistics, Minitab, SPSS,
etc, es evidente: Excel est prcticamente al alcance de todos y requiere muy poca capacitacin para su
empleo. A esto se suma la gran versatilidad que se puede lograr siendo un buen usuario de Excel.

Aunque ste es un libro de Estadstica bsica, que puede ser tomado como texto para carreras profe-
sionales de Ingeniera, Administracin de Empresas y Economa, incluye al final algunos captulos de
Estadstica Aplicada, con algunas herramientas bsicas para el mejoramiento de la calidad en procesos
de diversa ndole.

Quiero agradecer a Susana Vegas y a Eduardo Snchez, por sus comentarios constructivos durante el
desarrollo de este libro, y a Don Rafael Estarts, por revisarlo tan cuidadosamente. El buen ambiente
de trabajo que comparto con mis amigos del rea de Ingeniera Industrial y el rea de Sistemas, ha
contribuido a que haya podido escribir este libro. stos ltimos han conseguido que sea un buen usua-
rio de las computadoras personales y especialmente de Excel, tan importantes en el anlisis estadstico.
Finalmente agradezco a mis padres, Zoila y Augusto, a mi esposa, Careen, y a mi hijo, Csar, por su
constante apoyo y por el tiempo que me cedieron para que pudiera escribir este libro. Se lo dedico a
ellos.



Csar Angulo Bustos.
Agosto de 2005.

Potrebbero piacerti anche