Sei sulla pagina 1di 15

MUESTREO SISTEMATICO

1. Definición
El muestreo sistemático, es aquel que se realiza en un lugar donde pasan las unidades muéstrales
y se selecciona una unidad cada k elementos que pasan, hasta cumplir los n necesarios.

Ejemplos:

 Se muestrean latas de atún de una línea de producción cada 50 unidades.


 A la salida de un supermercado se encuesta una persona después de que han
salido 10.
 En una línea de empaque se muestrean bolsas de carne de pollo tomando uno
de cada 35 que pasan.
 En una oficina se muestrean los registro contables, tomando uno de cada 40
que se ingresan al archivero.

Ventajas
 Es más económico, ya que se evita el proceso de la selección aleatoria y evita
la movilidad del encuestador.
 Es más preciso cuando se tiene una movilidad constante de elementos
muéstrales, ya que muestrea uniformemente.

Procedimiento
 Si se conoce N, el tamaño de la población, y si por experiencias anteriores, se
puede estimar n, entonces = N/n
 El muestreo se realizará cada que pasen k elementos, es decir 1 en k.
 Antes de iniciar el muestreo, se selecciona aleatoriamente un número entre 1 y
k, que ese será la primera muestra, después se sigue la regla de 1 en k.
 En caso de desconocer N, se escoge n como un valor exploratorio y luego se
determina el valor de la muestra

Estimación de la media
El estimador de la media poblacional es la media muestral.

∑𝑦𝑖
𝑌̅ =
𝑛
INTERVALO DE CONFIANZA DE LA MEDIA
Para encontrar el intervalo de confianza para la media primero se encuentra la varianza
de la muestra:

̅)𝟐
∑(𝒚𝒊 − 𝒚
𝑺𝟐 =
𝒏−𝟏

Luego se obtiene la varianza de la media, que es menor que la varianza muestral, así que
se obtiene el estimador de la varianza de la media. Donde N es el tamaño de la población
y n es el tamaño de la muestra. Cuando N es muy grande, el factor del paréntesis se
puede eliminar

𝑆 2 𝑁−𝑛
𝑉̂ (𝑌̅)= ( )
𝑛 𝑁

La varianza de la media se le obtiene la raiz cuadrada (se convierte a desviación estándar) y se


multiplica por 2, se le resta y se le suma a ala media y se conforma el intervalo con el 95% de
seguridad.

𝑌̅-2√𝑉̂ (𝑌̅) < 𝑌̅ < 𝑌̅+2√𝑉̂ (𝑌̅)


Ejemplo

 En una productora de chorizos se desea conocer el contenido de grasa promedio de la


producción diaria. Al día se producen 200 productos y se seleccionaron 15
sistemáticamente. Indique la media estimada y su intervalo de confianza al 95% de
seguridad. Los datos son en gramos (datos ficticios): 21 14 13 12 14 13 16 20 23 22 20 19
25 25 23
a) Calculamos la media

∑𝑦𝑖 280
̅
𝑌= ̅
𝑌= = 18.67
𝑛 15
b) la varianza muestral es:

2
∑(𝑦𝑖− 𝑦)
𝑠2 =
𝑛−1
2
297.3335
𝑠 =
14
𝑠 2 = 21.24
c) la varianza de la media es:

𝑆 2 𝑁−𝑛
𝑉̂ (𝑌̅)= ( )
𝑛 𝑁
21.24 200−15
𝑉̂ (𝑌̅)= ( )
15 200

𝑉̂ (𝑌̅)=1.31
d) el limite del error es :

𝑌̅-2√𝑉̂ (𝑌̅) < 𝑌̅ < 𝑌̅+2√𝑉̂ (𝑌̅)

18.67-2√1.31 < 𝑌̅ < 18.67+2√1.31


16.38< 𝑌̅ < 20.96
Tamaño de la muestra para estimar la media
Entre mas grande sea la muestra, el intervalo de confianza para la media será más pequeño,
entonces, para definir el tamaña de la muestra primero se define el tamaño del intervalo
esperado. Se define B como la distancia que se desea entre la media y el límite superior de la
media, según las unidades utilizadas.

𝐵2
Se calcula el valor de D D= 4

𝑁ơ2
Se calcula n: n= (𝑁−1)𝐷+ơ2
Donde σ2 es la varianza poblacional o s2, que es su estimador

Desafortunadamente, para encontrar el tamaño de la muestra, se requiere conocer de antemano


la varianza poblacional, la cual se puede hacer de la siguiente manera:

a) Investigar pruebas anteriores donde se haya calculado la varianza

b) Si se conoce el valor mínimo y el máximo, el rango dividido entre cuatro puede ser un
estimador.

c) Obtener una pequeña muestra, luego calcular el tamaño de la muestra correcta utilizando los
datos ya recopilados.

Ejemplo
En una productora de chorizos se desea conocer el contenido de grasa promedio de la producción
diaria. Si al día se producen 200 productos y por experimentos previos se sabe que la varianza es
de 21.24 grs. Encontrar el tamaño de la muestra necesaria si se permite un error máximo de 1 grs.

El valor B = 1

12
El valor D es: D= = 0.25
4

200(21.24)
El valor de n es: n= (
200−1)0.25+(21.24)

El resultado se redondea a 60. La cantidad es muy alta porque el límite de error se seleccionó
muy pequeño.

En algunas condiciones es difícil conocer el valor de N, por ejemplo, el número de plantas


pequeñas en una parcela, el número de árboles de cierta región o el número de fauna
silvestre de un área. En tal caso el tamaño de la muestra se calcula con la siguiente ecuación

1.96𝑠
n= ( )
𝐵
Donde s es la desviación estándar muestral y B es el error máximo permitido. Esta ecuación es
con el 95% de seguridad
Estimación del total de una variable

El estimador del total es: ˆ Ny


Para encontrar el intervalo de confianza del total primero se encuentra la varianza de la
muestra:

2
∑(𝑦𝑖− 𝑦)
𝑠2 =
𝑛−1
Luego se obtiene la varianza del estimador del total, se le agrega el término N porque se
multiplica por el total de elementos t etá al cuadrado porque está dentro de la varianza.

𝑆 𝑁−𝑛 2
𝑉̂ (𝑡̂)=𝑁 2 ( )
𝑛 𝑁
La varianza de la media se le obtiene la raiz cuadrada (se convierte a desviación estándar) y se
multiplica por 2, se le resta y se le suma a ala media y se conforma el intervalo con el 95% de
seguridad.

𝑡̂-2√𝑉̂ (𝑡̂) < 𝑡̂ < 𝑡̂ +2√𝑉̂ (𝑡̂)


Ejemplo
En una huerta de 600 manzanos de primer año de producción se desea estimar el total de la
producción, la muestra se realizó sistemáticamente muestreando 1 de cada 30 árboles,
además se desea conocer el intervalo de confianza del total al 95% de seguridad. Los datos
son en kilos (datos ficticios): 25 24 18 26 32 26 22 23 24 26 24 24 32 28 26 21 20 26 20

La media es 24.45

El total es: 24.45(600) = 14,670 kg.

La varianza muestral es: 13

La varianza de del total es:

13 600−20
𝑉̂ (𝑡̂)=6002 ( )=226.154
20 600
El límite del error es:

2√𝑉̂ (𝑡̂)= 2√225.154 = 951.11


Sumando y restando 951.11 del total se obtiene el intervalo de confianza

13,719 < τ < 15,629

Tamaño de la muestra para estimar el total


Se define B como la distancia que se desea entre el total y el límite superior, según las
unidades utilizadas.

𝐵2
Se calcula el valor de D D=
4𝑁2

𝑁ơ2
Se calcula n: n= (𝑁−1)𝐷+ơ2
Donde σ2 es la varianza poblacional o su estimador s2

EJEMPLO

En una huerta de 600 manzanos de primer año de producción se desea estimar el total de la
producción, pero primero se desea saber el tamaño de la muestra. En una muestra previa se
encontró una varianza de 13 kilos. El error máximo permitido es de 1000 kg.

El valor B = 1000

10002
El valor D es: D= =0.694
4(600)2

600(13)
El valor de n es: n= ( =18.8
600−1)0.694+13
nótese que el resultado se redondea al límite superior.
Para calcular el total se debe conocer N, es por eso que no existe ecuación simplificada para el
tamaño de la muestra.
MUESTREO POR CONGLOMERADOS
Por algunas razones naturales, los elementos muestral es se encuentran formando grupos, como
por ejemlo, las personas que viven en colonias de una ciudad, lo elementos de una caja de una
línea de producción, los clubes de personas, las áreas arboladas de un terreno, etc.

Como el objetivo del muestreo es levantar la mayor cantidad de información al menor costo, en
este tipo de casos lo más económico el encuestar a un elemento muestral y a todos sus vecinos,
así se ahorran los costos de un traslado del encuestador.

A este modelo de muestreo se llama “Por conglomerados”, ya que una vez seleccionado un
elemento para la muestra, se incluyen también a todos los elementos que estén alrededor de él.

A diferencia del muestreo estratificado, este muestreo no requiere que los elementos tengan
características homogéneas.

Características
Población N conglomerados

Conglomerado 1 conglomerado 2

Conglomerado 3 conglomerado 4

Se tienen N conglomerados
De los N conglomerados se obtiene una muestra de n conglomerado
Conglomerado 1 tamaño 𝑚1

Conglomerado 2 tamaño 𝑚2

Conglomerado 3 tamaño 𝑚3

El promedio del tamaño de los conglomerados de la muestra se calcula de la siguiente manera

1
m= ∑𝑛𝑖=1 𝑚𝑖
𝑛
El tamaño de toda la población se calcula de la siguiente manera:

M= ∑𝑁
𝑖=1 𝑚𝑖
Nótese que los parámetros marcados con “M” mayúscula se refieren a toda la población.

El tamaño promedio de los conglomerados de toda la población se calcula de la siguiente


manera:

𝑀
̅=
𝑀
𝑁
Selección de la muestra.
Si los conglomerados son evidentes, se sigue un proceso aleatorio para su
selección, de lo contrario se selecciona aleatoriamente los elementos y
muestrear y después se identifica su conglomerado.
En cada conglomerado se obtiene una suma de la variable que se va a medir
(en este método se trabaja con la suma más que con la media)
A la suma de la variable de cada conglomerado se llamará 𝑌𝐼

Estimación de la media
Una vez seleccionados los conglomerados a muestrear, se obtiene de cada
uno su tamaño (mi) y la suma de la variable que se desea analizar (yi). Nótece
que es la suma de las variables, no la media.
CONGLOMERADO 𝑚𝑖 𝑦𝑖
1 32 125
2 28 136
3 25 145
4 27 134
5 26 135
6 30 128
Total 168 803

Después se suma cada una de las columnas y se aplica la siguiente ecuación:

∑𝑛
𝑖=1 𝑦𝑖
Y=∑𝑛
𝑖=1 𝑚𝑖

803
Y= = 4.7797
168

Estimación de la varianza de la media


Para el cálculo de la varianza de la media es conveniente agregar dos columnas a la tabla, en la
primera se multiplica la media general por el tamaño de cada conglomerado; en la siguiente
columna se resta el total de cada conglomerado menos el la columna anterior y se eleva al
cuadrado. La columna se suma.

CONGLOMERADO 𝑚𝑖 𝑦𝑖 𝑦̅𝑚𝑖 (𝑦𝑖 − 𝑦̅𝑚𝑖 )2


1 32 125 152.95 781.336
2 28 136 133.83 4.694
3 25 145 119.49 650.554
4 27 134 129.05 24.467
5 26 135 124.27 115.051
6 30 128 143.39 236.940
168 803 802.98 1813.042

La varianza se calcula con la siguiente ecuación:

𝑁−𝑛 ∑𝑛 ̅ 𝑚𝑖 )2
𝑖=1(𝑦𝑖 −𝑦
V(𝑦̅) = ( 𝑀 2
)
𝑁𝑛( ) 𝑛−1
𝑁

Si N=81 conglomerados y M=2268 elementos en la población. Nótece que se la sumatoria ya


está calculada en la tabla anterior.
81−6 1813.04
V(𝑦̅) = ( 2268 2) = 0.0713
81(6)( ) 6−1
81

Intervalo de confianza de la media


El intervalo de confianza para la media es la siguiente:

𝑌̅-2√𝑉(𝑌̅) < 𝜇 < 𝑌̅+2√𝑉(𝑌̅)

4.77-2√0.071 < 𝜇 < 4.77+2√0.071


4.24 < 𝜇 < 5.31
Tamaño de la muestra para estimar la media
Para realizar los cálculos es necesario encontrar la varianza del total en la muestra con la
siguiente ecuación:

𝑛 2
2 ∑𝑖=1(𝑦𝑖 −𝑦𝑚𝑖 )
𝑆𝐶 = 𝑆𝐶2 =362.61
𝑛−1
Se determina el error máximo que se permite en los resultados. A este valor se le llamará B.
Las ecuaciones para encontrar el tamaño de la muestra son las siguientes:

𝐵2 𝑀
̅2 𝑁𝑆2𝐶
D= n=
4 𝑁2 𝐷+𝑆2𝐶
Si B=0.4

2268 2
(0.4)2 ( )
81
D= =31.36
4
El resultado es el número de conglomerados que se deben muestrear. El resultado se
redondea al entero superior

(81)(362.61)
n= ( =10.11 n=(11)
81)31.36+362.61
Ejemplo
Con el fin de determinar si es conveniente instalar una productora de yogurt
en cierto poblado, se desea conocer el consumo mensual por persona al mes.
De un total de 120 conglomerados detectados se establecieron 8
conglomerados con los resultados que se muestran. Estimar la media, su
intervalo de confianza y el tamaño adecuado de la muestra si el error máximo
es 0.2. El total de de personas estimado es de 10,000.

CONGLOMERADO PERSONAS SUMA LITROS


1 85 78
2 65 59
3 78 70
4 79 70
5 56 52
6 82 73
7 74 66
8 82 72

CONGLOMERDADO 𝑚𝑖 𝑦𝑖 𝑦̅𝑚𝑖 𝑦𝑖 − 𝑦̅𝑚𝑖 )2


1 85 78 406.28 107767.602
2 65 59 310.68 63345.100
3 78 70 267.67 39072.111
4 79 70 391.94 103645.670
5 56 52 353.7 91024.327
6 82 73 391.94 101723.027
7 74 66 353.7 82772.660
8 82 72 391.94 102361.908
Total 601 540 691712.405

𝑁−𝑛 ∑𝑛 ̅ 𝑚𝑖 )2
𝑖=1(𝑦𝑖 −𝑦
V(𝑦̅) = ( 𝑀 2
)
𝑁𝑛( ) 𝑛−1
𝑁

120−8 691712.4
V(𝑦̅) = ( 10000 2) =1.66
120(8)( ) 8−1
120

La varianza es alta porque es un estimador sesgado para muestras menores a 20


conglomerados
La media:

∑𝑛
𝑖=1 𝑦𝑖
Y=∑𝑛
𝑖=1 𝑚𝑖

540
Y= = 0.89
601
El intervalo de confianza:

𝑌̅-2√𝑉(𝑌̅) < 𝜇 < 𝑌̅+2√𝑉(𝑌̅)

0.89-2√1.66 < 𝜇 < 0.89+2√1.66


-1.69 < 𝜇 < 3.47
Tamaño de la muestra :

𝑛 2
2 ∑𝑖=1(𝑦𝑖 −𝑦𝑚𝑖 )
𝑆𝐶 = 𝑆𝐶2 = 138.342
𝑛−1
10000 2
𝐵2 𝑀
̅2 (0.2)2 ( )
120
D= D= =69.44
4 4

𝑁𝑆2𝐶 (120)(138.342)
n= n=( = 113.18
𝑁2 𝐷+𝑆2𝐶 120)69.44+138.342

n=114

Potrebbero piacerti anche