Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Distribuciones
Muestrales
.....................................................................................
OBJETIVOS
Es una distribución teórica que expresa la relación funcional entre cada uno de los distintos valores
del estadístico y la correspondiente probabilidad para todas las muestras diferentes posibles de tamaño
n , tomadas de la misma población y se designa por X
MEDIA DE LA DISTRIBUCIÓN MUESTRAL DE MEDIAS
n
n
Xi X i
X i 1
E X E i 1
n
X X 2 X 3 .... X n
E X E 1
n n
EX
1
n
E X 1 X 2 X 3 .... X n
EX
1
n
E X 1 E X 2 .... E X n
EX
1
n
.....
EX
n
n
Por tanto:
EX
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se
calcula la media muestral X para cada muestra; la colección de todas estas medias muestrales
recibe el nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente
figura:
n
X i 1
VAR X VAR i 1 = 2 VARX 1 X 2 X 3 ..... X 4
n n
1 nVAR( X )
VAR( X ) = 2 VAR( X 1 ) VAR( X 2 ) .... VAR( X n ) =
n n2
VAR( X )
Por tanto: VAR( X ) o lo que es lo mismo: x x
n n
Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la
desviación estándar de cada una. La colección de todas estas desviaciones estándar muestrales se
llama distribución muestral de la desviación estándar, y lo podemos ver en la siguiente figura:
Ejemplo
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6.
Encuentre:
a) La media poblacional ( ).
c) La media de la distribución muestral de medias E X x .
0 2 4 6 12
3
4 4
x
0 2 4 6
Gráfica de frecuencias para la población
b) La desviación estándar de la población es:
x
0 32 2 32 4 32 6 32
9 11 9
2.236
4 4
Medias
0 1 2 3
1 2 3 4
2 3 4 5
3 4 5 6
1
x
0 1 2 3 4 5 6
Gráfica de Frecuencias para las medias muestrales
E X x = (0)(0.0625) + (1)(0.125) + (2)(0.1875) + (3)(0.25) + (4)(0.1875) + (5)(0.125) + (6)(0.0625)
x
2
f
x x
x
0 32 1 1 32 2 2 32 3 3 32 4 4 32 3 5 32 2 6 32 1
16
9830389
x 1.58
16
Observe que la desviación estándar de las distribuciones muestrales es menor que la desviación
estándar de la población. Esta relación también es intuitiva. Es razonable suponer que las medias de
las muestras de dos valores tenderían a estar más cerca de la media de la población de lo que estarían
los valores individuales. Sin embargo, no es intuitivamente obvio el hecho que la desviación estándar
de la distribución muestral sea 1.58.
x
La ecuación x , muestra cómo calcular la desviación estándar de la distribución muestral
n
de las medias sin requerir una lista de todas las medias muestrales posibles. Por tanto la desviación
estándar quedará de la siguiente manera
x 2.236
x 1.58
n 2
En conclusión:
Después de haber realizado el ejercicio anterior se puede ver que una distribución muestral se
genera extrayendo todas las posibles muestras del mismo tamaño de la población y calculándoles
a éstas su estadístico.
Si la población de la que se extraen las muestras es normal, la distribución muestral de medias
será normal sin importar el tamaño de la muestra.
Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la muestra
debe ser mayor o igual a 30, para que la distribución muestral tenga una forma acampanada.
Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución muestral de ser
normal.
Para muchos propósitos, la aproximación normal se considera buena si se cumple n=30. La forma
de la distribución muestral de medias sea aproximadamente normal, aún en casos donde la
población original es bimodal, es realmente notable.
Solución:
a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muestrales:
(0,0) 0 0 - 3 = -3
(0,2) 1 1 - 3 = -2
(0,4) 2 2 - 3 = -1
(0,6) 3 3–3=0
(2,0) 1 1 – 3 = -2
(2,2) 2 2 – 3 = -1
(2,4) 3 3–3=0
(2,6) 4 4–3=1
(4,0) 2 2 – 3 = -1
(4,2) 3 3–3=0
(4,4) 4 4–3=1
(4,6) 5 5–3=2
(6,0) 3 3–3=0
(6,2) 4 4–3=1
(6,4) 5 5–3=2
(6,6) 6 6–3=3
e
3 2 1 ....... 1 2 3 0
16
x N n
x
n N 1
Donde x es la desviación estándar de la población de donde se toman las muestras, n es el tamaño
de la muestra y N el tamaño de la población.
n
Como regla de cálculo, si el muestreo se hace sin reemplazo y 0.05 , entonces se puede usar
N
la fórmula.
N n
El factor se denomina factor de corrección para una población finita.
N 1
Ejemplo:
Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de tres maestros
universitarios de matemáticas:
A 6
B 4
C 2
Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule la
antigüedad media para cada muestra, la media de la distribución muestral y el error estándar, o la
desviación estándar de la distribución muestral.
Solución:
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles de tamaño 2,
con sus respectivas medias muestrales.
A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
x
6 42 4 42 2 42
404
1.63
3 3
El error estándar o la desviación estándar de la distribución muestral es:
x
5 42 4 42 3 42
1 0 1
0.816
3 3
Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que:
x 1.63
x 1.152
n 2
n
Por lo que observamos que este valor no es el verdadero. Si es mayor que el 5%,
N
2
aplicaremos el factor de corrección. Por tanto: 0.67 , agregamos el factor de corrección y
3
obtendremos el valor correcto:
x N n 1.63 3 2
x 0.816
n N 1 2 3 1
Si recordamos a la distribución normal, esta es una distribución continua, en forma de campana
en donde la media, la mediana y la moda tienen un mismo valor y es simétrica.
Con esta distribución podíamos calcular la probabilidad de algún evento relacionado con la
variable aleatoria, mediante la siguiente fórmula:
x
Z
x
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta
fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio, utilizando la tabla
de la distribución z.
Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño de
una población normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la formula de la distribución normal con
y x x , entonces la fórmula para calcular la probabilidad del comportamiento del
estadístico, en este caso la media de la muestra, quedaría de la siguiente manera:
x
Z
x
n
y para poblaciones finitas y muestro con reemplazo:
x
Z
x N n
n N 1
Ejemplo 1:
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproximadamente
en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la
probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775
horas.
Solución:
P z 25 Pz 2.5
Px 775 P z
775 800
40 10
16
Este valor se busca en la tabla de z y es 0.0062
La interpretación sería: La probabilidad que la media de la muestra de 16 focos sea menor a 775
horas es de 0.0062.
Ejemplo 2:
El salario por hora en una planta de producción para 500 empleados tiene un promedio de $8,5,
con una desviación típica de $2,20. Determine la probabilidad de que el salario medio de una muestra
de 100 trabajadores esté $8.15 y $8.40.
Número de
Proporción maneras en las
Artículos Artículos
de artículos que se puede
Buenos Malos
defectuoso obtener la
muestra
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8 C5 * 4 C 0 =56
Total 792
Para calcular la media de la distribución muestral de proporciones se tendría que hacer la sumatoria
de la frecuencia por el valor de la proporción muestral y dividirla entre el número total de muestras.
Esto es:
p
0.8 * 8 0.6 *112 0.4 * 336 0.2 * 280 0 * 56 264 0.3333
792 792
Como podemos observar la media de la distribución muestral de proporciones es igual a la
Proporción de la población.
x 1
E Pˆ E E x np E pˆ p
n n
1
n
También se puede calcular la desviación estándar de la distribución muestral de proporciones:
VAR pˆ
0.8 1 / 32 * 8 0.6 1 / 32 *112 0.4 1 / 32 * 336 0.2 1 / 32 * 280 0 1 / 32 * 56
792
VAR pˆ
22.4
0.1682
792
La varianza de la distribución binomial es VAR pˆ p2ˆ , por tanto se tendrá que:
x 1 p(1 p)
VAR pˆ VAR 2 VARx 2 np(1 p) VAR pˆ
1
n n n n
Si se sustituyen los valores en esta fórmula tenemos que:
pˆ
0.33330.6667 0.22221111
0.2108
5 5
Este valor no coincide con el de 0.1682, ya que nos falta agregar el factor de corrección para una
población finita y un muestreo sin reemplazo:
pˆ 1 pˆ N n
pˆ
n n 1
pˆ
0.33330.6667 12 5
0.2108132390.797724035 0.16817 0.1682
5 12 1
P pˆ 0.55 ?
pˆ p 0.55 0.60 0.05
P Z P Z P Z PZ 2.89 0.0019
p1 p 0.61 .06 0.0173
n 800
La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo que
diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa universidad,
la proporción de estudiantes que fuman cigarrillos sea menor que 55% es del 0.19%.
Ejemplo 2:
Alrededor del 20% de 200 tiendas de comestibles independientes ofrecen cupones-obsequio. En una
muestra aleatoria de 50 tiendas elegidas sin reemplazo. Averigüe la probabilidad de que el porcentaje
de tiendas que ofrecen cupones – obsequios esté entre 15% y el 19%.
n 50
N 200 Tiendas n 50 0.25
N 200
p 0.20 pˆ 0.15 A 0.19
0.15 p pˆ p 0.19 p
P0.15 pˆ 0.19 P
pˆ ˆ
p ˆ
p
____________________________________________________________________________
REFERENCIAS
2. Freund, John E. y Simon Gary A., Estadística Elemental, 8ª Ed. México, 1.994
3. Hanke, J. E. Estadística Para Negocios 2/Ed., España, 1997
4. Mason/Lind/Marchal, Estadística para administración y economía 10ª Ed. Alfaomega-2.001
5. Mendenhall, William, Beaver, Robert J. Beaver, Barbara M., Introducción a la Probabilidad
y Estadística, Thomson, 2.002
6. Canavos, George C., Probabilidad y Estadística, Aplicaciones y Métodos, Mc Graw Hill, 1.999
7. Walpole, Ronald E. y Myers, Raymond H., Probabilidad y Estadística 4ª Ed Mc Graw Hill, 1992
8. Devore, Jay l., Probabilidad y Estadística para Ingeniería y Ciencias, 5ª Ed. Thomson, 2.001
EJERCICIOS PROPUESTOS
1. Un cierto tipo de tornillo se fabrica con una resistencia de tensión promedio de 78.3 kilogramos y
una desviación estándar de 5.6 kilogramos. ¿Cómo cambia la varianza de la media muestral cuando
el tamaño de la muestra a) Aumenta de 64 a 196? b) Disminuye de 784 a 49?
2. Si el error estándar de la media para la distribución muestral de las muestras aleatorias de tamaño
36 de una población grande o infinita es 2, ¿qué tan grande debe ser el tamaño de la muestra si el
error estándar debe reducirse a 1.2?
3. Cierta máquina fabrica resistencias eléctricas que tienen un promedio de 40 ohms y una desviación
estándar de 2 ohms, asumiendo que las resistencias se distribuyen normalmente, ¿Cuál es la
probabilidad de que una muestra aleatoria de 36 de estas resistencias tenga una resistencia promedio
de más de 40,78 ohms?
4. la duración promedio del mezclador de un cierto fabricante es de 5 años, con una desviación
estándar de 1 año. Asumiendo que las duraciones de estos mezcladores siguen aproximadamente una
distribución normal, encuentre la probabilidad de que la vida promedio de una muestra aleatoria de 9
de tales mezcladores caiga entre 4.4 y 5.2 años
5. Una compañía manufacturera asegura que las baterías Utilizadas en sus juegos electrónicos duran
en promedio 30 horas. La duración de estas baterías se distribuye normalmente. En una muestra
aleatoria de 25 baterías, se encontró una desviación estándar de 1,5 horas. ¿Cuál es la probabilidad
de encontrar en la muestra una duración promedio de al menos 30,53 horas?
6. Una población consiste en 300 artículos, con una media 36 y una desviación típica de 5. Se
selecciona una muestra aleatoria de 36 artículos, ¿Cuál es la media muestral y la desviación de la
media muestral?
7. Una población consta de 500 elementos, con una media de 40 y una desviación típica de 9. En una
muestra de 40 elementos. ¿Cuál es la probabilidad que la media de la muestra esté a más o menos
cinco puntos de la media poblacional?
8. Las alturas de 500 estudiantes están distribuidas aproximadamente en forma normal con una media
de 174.5 centímetros y Una desviación estándar de 6,9 centímetros. Se saca una muestra aleatoria de
tamaño 30, determine: a) La media y el error estándar de la distribución muestral de X b) El número
de medias muéstrales que caen entre 1 72.5 y 175.8 centímetros inclusive;
c) El número de medias muestras que caen abajo de 172.0 centímetros.
9. La media de una población de 500 elementos con distribución normal es 175 y la desviación típica
es 19. Se selecciona una muestra de 81 elementos de esta población. Determine la probabilidad de
que:
10. Una máquina de refrescos se ajusta de tal manera que la cantidad de líquido despachada es en
promedio de 240 mililitros con una desviación estándar de 15 mililitros. Periódicamente, la máquina
se verifica tomando una muestra de 40 refrescos y calculando el contenido promedio. Si el promedio
de los 40 refrescos arroja un valor dentro del intervalo 2 x , se considera
que la máquina está trabajando normalmente; de otra manera se realizan los ajustes necesarios. El
oficial de la compañía encontró que la media de los 40 refrescos era X = 236 mililitros y llegó a la
conclusión de que la máquina no necesitaba ajustes. ¿Es razonable esta conclusión?
11. Se sabe que aproximadamente el 82% de todos los habitantes del valle del Cauca están
preocupados por los actos de terrorismo que se están presentando en los últimos días en esta región.
En una muestra aleatoria de 120 habitantes. ¿Cuál es la probabilidad de encontrar más del 87% de
personas preocupadas por los actos de terrorismo que se están presentando en los últimos días en esta
región?
12. Un estudio de mercadeo realizado el mes pasado en la ciudad de Cali mostró que el 45% de todas
las mujeres casadas están adelantando estudios universitarios. En una muestra aleatoria de 68
mujeres: a) ¿Cuál es la probabilidad de encontrar más del 48% de mujeres casadas que estén
adelantando estudios universitarios? b) ¿Cuál es la probabilidad de encontrar al menos el
39,78% de mujeres casadas que estén adelantando estudios universitarios? c) ¿Cuál es la probabilidad
de encontrar más del 52% de mujeres casadas que estén adelantando estudios universitarios, si
sabemos que menos del 56,7% de mujeres casadas están adelantando estudios universitarios?
13. Suponga que un especialista en Mercadotecnia considera que el 46% de los hogares del sector
norte de Cali prefieren comprar sus productos alimenticios en el Éxito. En una muestra aleatoria de
100 hogares, a) ¿Cuál es la probabilidad de encontrar más del 50% de hogares del sector norte de Cali
que prefieren comprar sus productos alimenticios en el Éxito? b) ¿Cuál es la probabilidad de encontrar
menos del 41% de hogares del sector norte de Cali que prefieren comprar sus productos alimenticios
en el Éxito? c) ¿Cuál es la probabilidad de encontrar entre el 42% y 54% de hogares del sector norte
de Cali que prefieren comprar sus productos alimenticios en el Éxito?
14. Cerca del 20% de las tiendas de comestibles independientes de cierta ciudad ofrece cupones-
obsequios. Si se elige una muestra de 50 tiendas, encuentre la probabilidad de que:
a) La proporción de tiendas que ofrecen cupones-obsequios sea mayor que 25%
b) La proporción de tiendas que ofrecen cupones-obsequios sea menor que 22%
c) La proporción de tiendas que ofrecen cupones-obsequios esté entre el 17% y el 23%
16. El 17% de las personas que declaran impuestos tienen unos ingresos brutos gravables de más de
$50.000.oo. Si se elige una muestra de 400 declarantes. ¿Cuál es la probabilidad de que más del
12% de estas personas tengan unos ingresos brutos gravables superiores a $50.000.oo?
17. El 70% de una población de empleados es masculina. En una muestra de 10 empleados, ¿Cuál
es la media y la desviación de la distribución muestral para la proporción de hombres?
18. ¿En qué afecta un aumento a 100 en el tamaño de muestra del problema anterior a la media y la
desviación estándar de la distribución muestral? Calcule el nuevo error estándar de la proporción
19. En una industria metalúrgica hay 300 soldadores. Una muestra de 30, reveló que 18 se gradúan
en un curso técnico especial. ¿Cuál es la desviación de la proporción muestral?
20. Alrededor del 20% de 200 tiendas de comestibles independientes ofrecen cupones-obsequio. En
una muestra de 50 tiendas elegidas sin reemplazo, averigüe la probabilidad de que: