Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
UNIDAD 5
MUESTREO SISTEMÁTICO
El muestreo irrestricto aleatorio (m.i.a) y el muestreo aleatorio estratificado (m.a.e) requieren
de un trabajo detallado en el proceso de selección de la muestra. Porque las unidades de
muestreo en el marco adecuado deben de ser numeradas de modo que un mecanismo de
aleatorización, como una tabla de números aleatorios, pueda utilizarse para seleccionar
unidades específicas de la muestra. Un diseño de muestreo que se utiliza frecuentemente
porque simplifica el proceso de selección de la muestra es el muestreo sistemático (m.s).
muestra.
Las muestras sistemáticas se seleccionan de 1 en 3 o de 1 en 5 en general de 1 en k, ahora
¿cómo se selecciona el número k? Sabiendo que N es conocido y se puede determinar el
tamaño de “n”, entonces k debe de ser un número aleatorio menor o igual que N/n o sea:
N
k ≤
n
Posteriormente se selecciona cada k-esimo elemento a partir del punto de inicio hasta
completar el tamaño de muestra n
Cuando N es desconocido la selección de k generalmente se supone para poder obtener una
muestra de tamaño “n” pero si “k” se selecciona muy grande, el tamaño de “n” que se
requiere no se podrá obtener utilizando una muestra sistemática de 1 en k de la población.
Ejemplo.
En una preparatoria de 2998 estudiantes repartidos en tres grados se desea conocer la
opinión de los estudiantes sobre la utilidad del evento “feria del libro” que se realiza cada fin
de curso. Se puede tener la lista de los estudiantes ordenados por grado, si optamos por un
muestreo irrestricto aleatorio, posiblemente obtengamos mayor cantidad de estudiantes de
primer grado cuya opinión será muy diferente a la de los estudiantes del segundo y del tercer
grado, ya que por las fechas en las que se realiza el evento, los estudiantes del primer grado
no tienen ninguna experiencia previa y esto daría una estimación deficiente y alejada de la
realidad, en cambio con un muestreo sistemático se tendrían elementos proporcionales de
los tres grados.
Si seleccionamos una muestra del 10% de los estudiantes, tendremos un intervalo muestral
de k=10. Si el número al azar entre 1 y 10 es 4 los estudiantes con los números:
4, 14, 24, 34, 44, 54,……2994
conformarán la muestra. Si el número seleccionado al azar es el 9, entonces la muestra se
integraría con los estudiantes listados con los números
9, 19, 29, 39, 49, 59,……2989
En la primera muestra se tienen 300 estudiantes y en la segunda solamente 299. El tamaño
de la muestra puede diferir en una unidad cuando N no es exactamente divisible entre k.
Observe que no se podrá seleccionar exactamente a k cuando el tamaño de la población es
desconocido. Podemos determinar un tamaño de muestra n aproximada, pero debemos
Técnicas de Muestreo
la población. Para estimar una media poblacional se puede utilizar la media muestral y de
∑ y i
µ ˆ = y s = i=1
ˆ
V ( y s ) = en donde
n
s 2 = i =1
n N n −1
n
∑ y i
2
− n y 2
o también s 2 = i =1
n −1
Cuando N se desconoce se elimina el factor de corrección por población finita (c.p.f) de las
ecuaciones anteriores.
Técnicas de Muestreo
∑ y
i =1
i
pˆ s = y s =
n
Técnicas de Muestreo
esto no implica que las varianzas poblacionales sean iguales, ya que la varianza de y esta
σ 2 N − n
V ( y ) =
n N − 1
σ 2
V ( y s ) = [1 + (n − 1) ρ ]
n
en donde ρ es una medida de la correlación entre los pares de elementos dentro de la
solamente los datos de una muestra sistemática, sin que esto implique que nunca se pueda
estimar la V ( y s ) , ya que en ocasiones el muestreo sistemático es equivalente al irrestricto
heterogénea con ρ ≤ 0 y si N es grande puede demostrarse que V ( y s ) ≤ V ( y ) por lo que una
muestra sistemática de una población ordenada proporciona mas información que una
muestra irrestricta aleatoria por unidad de costo. Por ejemplo una lista de las cuentas por
cobrar pueden estar ordenadas de mayor a menor cantidad, así la estimación de la muestra
sistemática podría tener una varianza menor (generalmente inestimable) que la de de una
m.i.a; ya que barre con todos los valores de las cuentas.
Como no podemos obtener una estimación de V ( y s ) con base en los datos de una muestra,
s N − n
2
V ( y s ) =
n N
La población periódica es aquella cuyos elementos tienen variación cíclica.
Cuando una muestra sistemática es seleccionada de una población periódica, la efectividad
del muestreo sistemático depende del valor de k.
Los elementos de este tipo de muestra pueden ser homogéneos ( ρ > 0 ) y cuando esto se da
V ( y s ) ≥ V ( y ) y en este caso el muestreo sistemático proporciona menos información que el
relación:
es par, la muestra sistemática solo tendrá hombres o solo mujeres, por lo que la estimación
no sería representativa del parámetro.
Técnicas de Muestreo
Ejercicio 1
La sección de control de calidad de una empresa usa el muestreo sistemático para estimar la
cantidad promedio de llenado de latas de 12 onzas que sale de una línea de producción. Los
datos de la tabla adjunta representan una muestra sistemática de 1-en-50 de la producción
de un día. Estime µ y establezca un límite para el error de estimación. Suponga que N =
1800
Cantidad de llenado (en onzas)
12.00 11.97 12.01 12.03 12.01 11.80
11.91 11.98 12.03 11.98 12.00 11.83
11.87 12.01 11.98 11.87 11.90 11.88
12.05 11.87 11.91 11.93 11.94 11.89
11.72 11.93 11.95 11.97 11.93 12.05
11.85 11.98 11.87 12.05 12.02 12.04
Solución:
La estimación de µ esta dada por
n
∑ y
i =1
i
430.01
y s = = = 11.94onzas
n 36
2
Para estimar el límite para el error de estimación, primero se calcula s
2
n
n ∑ yi
∑ y − i =1
2
5136.57 − 184908 .6
i =1
i
n 36 = 0.2199 = .0063
s = =
2
n −1 35 35
Suponemos que la población de latas en una línea de producción, es una población aleatoria,
entonces la varianza la estimaremos con:
ˆ ( N y ) = 2 N 2V
2 V ˆ ( y ) = 2 (1800) 2 (0.00017) = 46.94
s s
Ejercicio3
La gerencia de una compañía constructora está interesada en estimar la proporción de sus
empleados de albañilería que favorecen una nueva política de la empresa de realizar los
pagos de sus salarios mensualmente, a diferencia de la política anterior de pagos
semanales. Se cuenta con una lista de los empleados referidos, en orden alfabético por lo
que suponen que el comportamiento es el de una población aleatoria. Realizan una muestra
sistemática de 1 en 10 de los empleados y los resultados de la encuesta para conocer
quienes son los que favorecen la nueva política se dan en la tabla adjunta; estime la
proporción de ellos sabiendo que se cuenta con 2000 trabajadores de albañilería y
establezca un límite para el error de estimación.
∑ y
i =1
i = 132
Técnicas de Muestreo
B = 2 V (θ ˆ s )
Para cualquiera de los estimadores θ ˆ s (media, total o proporción poblacional) basados en un
muestreo sistemático. Pero esta ecuación involucra a σ s2 y ρ que deben de ser conocidas o
al menos poderlas estimar de estudios previos, en estas notas utilizaremos la fórmula para
calcular n que se uso en el muestreo irrestricto aleatorio, pero considerando que esta fórmula
podría dar una muestra muy grande cuando la población es ordenada y una muestra muy
pequeña para poblaciones periódicas. Recuérdese que las varianzas de y s y de y son
N σ 2 B 2
n= en donde: D =
( N − 1) D + σ 2 4
Nota: σ2 puede aproximarse con s 2, a partir de una muestra piloto o por estudios previos
Rango
similares o bien σ 2 ≈ . En cualquier caso n será un valor aproximado. Si N es grande,
4
como comúnmente ocurre, el (N-1) puede ser reemplazado por N.
Para determinar el tamaño de muestra requerido para estimar un total poblacional τ con un
límite para el error de estimación de B:
N σ 2 B 2
n= D =
( N − 1) D + σ 2 en donde: 4 N 2
El tamaño de muestra requerido para estimar una proporción poblacional p con un límite
para el error de estimación de B, será:
Técnicas de Muestreo
Npq B 2
n= en donde: q = 1- p y D =
( N − 1) D + pq 4
Hay ocasiones en donde se desconoce el valor de p y se estima de estudios previos pero
cuando estos no existen lo ideal es suponer un valor de p=0.5 que nos proporcionará un
tamaño de muestra conservador, que será probablemente mayor que el requerido.
En general para determinar el tamaño de muestra n se necesita conocer el error de
estimación B, la varianza σ 2 y el nivel de confianza 1-α.
Ejercicio 4.
Usando la información del ejercicio 1 determine el tamaño de muestra requerido para estimar
µ con un límite para el error de estimación de 0.015 unidades.
Solución:
B2 (0 .015 ) 2
Si B= 0.015 entonces: D = = = 0 .00005625
4 4
Como σ2 No se conoce se estima con s 2
N σ 2 1800(0.0063)
Asi: n= = = 105.49 ≈ 106 latas
( N − 1) D + σ 2 (1799)(0.00005625) + 0.0063
Ejercicio 5.
Determine el tamaño de muestra requerido para estimar τ , con los datos del ejercicio 2, con
un límite para el error de estimación de 30 unidades. Resp. n=87 latas
Ejercicio 6.
Para la situación referida en el ejercicio 3, determine el tamaño de muestra requerido para
estimar p con un límite para el error de estimación del 5%. ¿Qué tipo de muestra sistemática
deberá de obtenerse? Resp. n=305 albañiles
replicado.
Este método consiste en seleccionar varias muestras sistemáticas o replicas y así poder
estimar la media poblacional �, como el promedio de todas las medias muestrales , la
estimación de la varianza V ( y S ) utilizando el cuadrado de las desviaciones de cada una de
Es común que n S=10 ya que permite obtener suficientes medias muestrales para obtener una
estimación satisfactoria de V (µ
ˆ)
N − n
∑ ( y i − µ
ˆ )2
ˆ ( µ
V ˆ) = i =1
N n s (n s − 1)
El límite para el error de estimación al 95% de confianza es:
B = 2 V ˆ ( µ
ˆ)
Técnicas de Muestreo
También se puede utilizar el muestreo sistemático replicado para estimar un total poblacional
Varianza estimada de :
n s
N − n
∑ ( y − µ
ˆ) i
2
ˆ (τ ˆ) = N 2V
V ˆ ( µ
ˆ ) = N 2 i=1
N n s (n s − 1)
El límite para el error de estimación al 95% de confianza es:
B = 2 V ˆ (τ ˆ)
Ejercicio 7
Un parque estatal cobra la admisión por automóvil en lugar de por persona y un funcionario
del parque quiere estimar el número promedio de personas por automóvil para un día
efectivo en particular durante el verano. El funcionario sabe por experiencia que entrarán al
parque alrededor de 400 automóviles y quiere muestrear 80 de ellos. Para obtener una
estimación de la varianza, utiliza el muestreo sistemático replicado con 10 muestras de 8
automóviles cada una. Usando los datos que se presentan en la tabla, estime el número
promedio de personas por automóvil y establezca un límite para el error de estimación
Punto de
Segundo Tercer Cuarto Quinto Sexto Séptimo Octavo
inicio
elemento elemento elemento elemento elemento elemento elemento
aleatorio
2(3) 52(4) 102(5) 152(3) 202(6) 252(1) 302(4) 352(4) 3.75 14.06
5(5) 55(3) 105(4) 155(2) 205(4) 255(2) 305(3) 355(4) 3.38 11.42
7(2) 57(4) 107(6) 157(2) 207(3) 257(2) 307(1) 357(3) 2.88 8.29
13(6) 63(4) 113(6) 163(7) 213(2) 263(3) 313(2) 363(7) 4.62 21.34
26(4) 76(5) 126(7) 176(4) 226(2) 276(6) 326(2) 376(6) 4.50 20.25
31(7) 81(6) 131(4) 181(4) 231(3) 281(6) 331(7) 381(5) 5.25 27.56
35(3) 85(3) 135(2) 185(3) 235(6) 285(5) 335(6) 385(8) 4.50 20.25
40(2) 90(6) 140(2) 190(5) 240(5) 290(4) 340(4) 390(5) 4.12 16.97
45(2) 95(6) 145(3) 195(6) 245(4) 295(4) 345(5) 395(4) 4.25 18.06
Técnicas de Muestreo
46(6) 96(5) 146(4) 196(6) 246(3) 296(3) 346(5) 396(3) 4.38 19.18
Totales 41.63 177.41
∑
i =1
( − ˆ
y i µ ) 2
= ∑
i =1
y i2
−
∑ y i
n s i =1
Sustituyendo:
n s
1
∑ ( y
i =1
i − µ
ˆ ) 2 = 177 .41 −
10
( 41 .63) 2 = 4.104
N − n
∑ ( y − µ
ˆ )2
400 − 80 4.104
i
ˆ ( µ
V ˆ) = i=1 = = 0.0365
N n s (n s − 1) 400 10(9)
Entonces el límite para el error de estimación sería:
B = 2 0.0365 = 0.38
Técnicas de Muestreo
Por lo que decimos que nuestra mejor estimación del promedio de personas por automóvil es
de 4.16 personas, por lo que con un 95% de confianza podemos decir que el verdadero valor
del parámetro se encuentra en el intervalo (4.16±0.38)