Sei sulla pagina 1di 21

MUESTREO

1.1 Muestreo y distribución de muestreo aplicados a situaciones cotidianas

Una meta común e importante de la materia de estadística es la siguiente: aprender acerca de un grupo
grande examinando los datos de algunos de sus miembros. En dicho contexto los términos muestra y
población adquieren importancia. Las definiciones formales de términos básicos se presentan a
continuación:1

a. Datos son las observaciones recolectadas (como mediciones, géneros, respuestas de encuestas)
b. Estadística es un conjunto de métodos para planear estudios y experimentos, obtener datos y
luego organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los
datos
c. Población es el conjunto completo de todos los elementos (puntuaciones, personas, medidas,
etc.) que se va a estudiar. El conjunto es completo porque incluye a todos los sujetos que se
estudiarán.
d. Censo es el conjunto de datos de cada uno de los miembros de la población
e. Muestra es un subconjunto de miembros seleccionados de una población

Se trata de utilizar datos muestrales para hacer inferencias (o generalizaciones) sobre una población
completa.

Los datos cuantitativos consisten en números que representan conteos o mediciones, se pueden clasificar
en:

Datos discretos: Resultan cuando el número de valores posibles es un número finito o un número
que “puede contarse”, ejemplo: número de huevos que ponen las gallinas, número de latas.

Datos continuos: Resultan de un infinito de posibles valores que corresponden a alguna escala
continua que cubre un rango de valores sin huecos, interrupciones o saltos, ejemplo: cantidades de leche
que producen las vacas, el volumen real de la bebida de coca cola.

Los datos cualitativos (o categóricos o de atributo) se dividen en diferentes categorías que se distinguen
por algunas características no numéricas.

Otra forma de común de clasificar los datos consiste en usas 4 niveles de medición: nominal, ordinal, de
intervalo y de razón.2

La escala nominal: en algunos casos los atributos de interés o las variables consisten en nombres o
etiquetas, y las observaciones (mediciones) únicamente se puede clasificar, los datos no se pueden
acomodar en un esquema de orden. En esta escala consiste en asignar símbolos que pueden ser letras,
nombre o incluso números (sin que haya relaciones matemáticas), sin embargo, se puede contar el número
de observaciones de cada clase o categoría, y utilizar las frecuencias o porcentajes de las categorías en
alguna actividad de presentación o análisis.

La escala ordinal: al igual que en la escala nominal, la medición consiste en asignar símbolos que pueden
ser letras, nombres o incluso números. Ejemplos de datos que corresponden a esta escala son las
encuestas que hacen los sitios de internet, en las que se pide categorizar una película, un artículo
publicado por ellos o una opinión respecto de una propuesta de ley. En esta escala se puede distinguir una
relación entre las clasificaciones ya que un excelente es mejor que muy bueno y así sucesivamente, por

1Triola, Mario. Estadística Décima edición. Pearson education. México. 2009


2Nieves, Antonio y Domínguez, Federico. Probabilidad y estadística para ingeniería. McGraw-
Hill. México. 2010
consiguiente no es posible determinar diferencias entre los valores de los datos o tales diferencias carecen
de significado.

La escala de intervalo: posee todas las características de la escala ordinal, con la propiedad adicional de
que los nombres o símbolos asignados son generalmente números, y la diferencia entre dos de ellos da
resultados significativos, ya que hay una unidad de medida común y constante. Un ejemplo de medición
con escala de intervalo es la lectura de temperaturas, que se pueden ordenar fácilmente pero también se
pueden determinar las diferencias y darle un sentido, mas sin embargo, los datos en este nivel no tienen
punto de partida cero natural inherente.

La escala de razón: es el nivel de medición más alto; tiene todas las características de la escala de
intervalo, pero, además, tiene un punto cero natural o teórico. Por consiguiente, además de las diferencias
y las sumas, la multiplicación y división de los datos tienen significado numérico racional, el punto cero
refleja la ausencia de esa característica.

Un censo comprende el examen de todos los elementos de un determinado grupo mientras que el
muestreo comprende el análisis de una pequeña parte de ellos. El objeto del muestreo es establecer
generalizaciones con respecto a un grupo total de elementos sin tener que examinarlos uno por uno.

La parte del grupo de elementos que se examinan recibe el nombre de muestra, y el grupo total a partir del
cual se seleccionó la muestra se conoce como población o universo. Los elementos que forman una
población pueden ser personas, empresas, productos manufacturados, inventarios, escuelas, ciudades,
calificaciones escolares, precios o cualquier otra cosa que se pueda medir, contar o jerarquizar.3

Las ventajas del muestreo con respecto al censo son:

a. Que es más económico


b. Se realiza con mayor rapidez
c. Se puede realizar más frecuente y detalladamente
d. Se puede estimar la confiabilidad de la información

Limitaciones:

a. Lleva implícito un riesgo de error


b. Requiere mayor preparación del personal, pues usa instrumentos más refinados

Las poblaciones de tamaño limitado se conocen como poblaciones finitas, ejemplo: los alumnos de una
clase determinada, los productos de un supermercado, los libros de una biblioteca, y los automóviles del
estado de California.3

En tanto que las que tienen tamaño ilimitado se conocen como poblaciones infinitas, estas generalmente
son de cierto tipo de proceso que produce elementos o resultados, como la tirada de monedas, en la cual el
número de resultados (cara o cruces) que se pueden obtener es ilimitado. Otros ejemplos de procesos de
poblaciones infinitas con la producción futura de una máquina, la extracción de canicas de una urna
regresando cada canica a su lugar antes de sacar otra, `y el nacimiento de insecto (o de cualquier otra
especie).3

Existen ciertas situaciones en las que es más ventajoso inspeccionar todos los elementos de una población
(efectuar un censo), y son3:

a) La población puede ser tan pequeña

3 Stevenson, William. Estadística par administración y economía conceptos y aplicaciones.


Alfaomega Grupo Editor, S.A DE C.V. México. 2008
b) Si el tamaño de la muestra es relativamente grande con respecto al tamaño de la población (por
ejemplo: si existe mucha variabilidad entre los elementos de una población, se considera
necesario tomar una muestra muy grande)
c) Si se requiere una exactitud completa
d) Ocasionalmente se dispone de la información completa

El problema de regresar o no un elemento muestreado a una población antes de sacar otro de ésta, surge
cuando se muestrea una población infinita, ya que la probabilidad de incluir elementos de una población
en una muestra dependerá de si estamos muestreando con reposición o sin reposición 3.

Existen varias razones del por qué el muestreo sin reposición se lleva a cabo en la práctica real3:

a. Los efectos suelen ser insignificantes, y puede ser más conveniente hacerlo así (Si el tamaño de
muestra es pequeño en relación con el de la población).
b. Si se realizan ensayos destructivos, será imposible regresar los elementos muestreados a la
población.
c. En el muestreo industrial será difícil persuadir a los inspectores carentes de adiestramiento en
estadística de que regresen los elementos muestreados a ala población, particularmente si éstos
están defectuosos.
d. Cuando se regresa un objeto muestreado a la población, existe una posibilidad de que sea
incluido en un ensayo subsecuente.

La representación de una muestra se ve influida por el tamaño de la muestra y la forma de seleccionarla.


El número de elementos a tomar de la población depende de cierto conocimiento previo de la misma. A
continuación se presenta los tipos de técnicas de muestreo.2

Muestreo no probabilístico:

 Por facilidad de acceso: cuando se muestra solo aquellos elementos a los que se puede accesar
fácilmente, con lo que los de difícil acceso nunca serán elegidos.
 Intencional: si la muestra se elige por un experto conocedor de la población de manera objetiva
tendrá generalmente una precisión muy alta. Es muy difícil medir si existen tendencias
personales. Cuando se tiene una población pequeña pero heterogénea, el investigador
inspecciona la totalidad de ésta y selecciona una muestra que considera representativa. El
investigardor selecciona una muestra que considera representativa; es decir, elementos que a su
parecer están cercanos al promedio de la población.
 Por cuotas: Se eligen elementos hasta completar una cuota preestablecida sin seguir ningún
método especificado de selección, con lo que solo se incluirán solo los n primeros elementos o
solo los que existan en determinado lugar. Se utiliza para sondeos de intención de voto y en las
investigaciones de mercado.
 Autoselectivo: La muestra se toma con la gente que voluntariamente responde a un periódico,
una revista, internet, radio o televisión.

Muestreo probabilístico:

MUESTREO ALEATORIO SIMPLE

 Es el proceso por el cual, los elementos de la muestra son escogidos en forma individual y
directamente a través de un procedimiento aleatorio en el cual todos y cada uno de los elementos
de la población tienen la misma probabilidad de ser seleccionados.
 Se recomienda su uso para poblaciones relativamente pequeñas y distribuidas en un
área reducida para evitar los gastos de traslado
 Técnica del muestreo:
 Identificar a todos los elementos del marco del muestreo (población), asociándoles un
número único.
 A través de un procedimiento que garantice la obtención de una muestra aleatoria,
elegir a los elementos de la población que conformarán la muestra
 Revisar a los elementos seleccionados, para obtener de ellos los datos relevantes que
permitan cumplir el objetivo del muestreo
 Realizar los cálculos necesario para poder establecer las conclusiones
 Los mecanismos que se utilizan para garantizar la aleatorización son:
 La urna y su técnica es la siguiente:
 Colocar en una urna tantos papelitos o pelotitas marcados con los números del
uno al tamaño de la población (N)
 Revolver muy bien el contenido de la urna
 Extraer tantos papelitos o pelotitas que se deseen en la muestra
 Tabla de número aleatorios y su técnica es la siguiente:
 Determinar el número de dígitos a utilizar

 Establecer el punto de inicio: Se establece sin intención tanto la columna como


el renglón a partir del cual se iniciará a leer los números. Usualmente es el
primer renglón y columna
 Establecer la dirección de inicio: La dirección común de la lectura es de arriba
hacia abajo y de izquierda a derecha, pero se puede leer en cualquier dirección.
No se debe cambiar la dirección hasta terminar de completar el tamaño de la
muestra.
 Leer los números que serán los elementos que conformarán la muestra:
 Se leen ignorando todos aquellos que sean mayores de N
 Existe un método mejorado que para no ignorarlos le resta un
múltiplo de N dependiendo del valor que tengan:

 Los mecanismos electrónicos: son las calculadoras y computadoras, las cuáles debido a
su naturaleza de funcionamiento sólo pueden general números pseudoaleatorios, los
cuáles requieren de un valor inicial llamado semilla, si se da el mismo valor se general
la misma secuencia de números.
 Se recomienda utilizar como último recurso y en problemas donde la
aleatorización no sea un elemento crítico dentro del estudio que se esté
realizando.
 Determinar el tamaño de la muestra
 Cuando deseamos estimar el tamaño de la muestra se debe tener en cuenta que los
objetivos de la encuesta suelen requerir varias estadísticas y que al considerar cada una
de ellas pueden llevar a un diseño diferente, por lo tanto, para determinar el tamaño de
la muestra se debe elegir el principal objetivo y calcular el tamaño de muestra necesario
para cumplir dicho objetivo. En caso de ser varios los objetivos principales se
determina un tamaño de muestra para cumplir cada objetivo y entre todos ellos, se elige
el mayor.
 El tamaño de la muestra depende básicamente del tamaño de la población, del nivel de
confianza o confiabilidad de las estimaciones, del grado de variación o dispersión de la
variable a estudiar y del error de estimación.
 El nivel de confianza o confiabilidad lo fija arbitrariamente quien esté calculando el
tamaño de la muestra, teniendo en cuenta que dicha confiabilidad debe estar entre el
noventa y el noventa y nueve por ciento. A mayor confiabilidad mayor tamaño de
muestra.
 El grado de variación o dispersión de la variable se mide a través de la desviación
estándar, la cual puede ser estimada a partir de una muestra piloto o a partir de la
información recopilada en una investigación similar, realizada anteriormente.
 El error de estimación es la máxima diferencia en valor absoluto, que se está dispuesto
a aceptar, entre el valor del estimador y el valor del parámetro, a éste error de
estimación se le nota como B. El valor del error de estimación depende del estimador
que se desee obtener y de la magnitud de la variable. Por ejemplo si se va a estimar la
proporción de desempleados, un error de estimación lógico puede ser del 3 por ciento;
pero si se va a estimar el peso promedio de un grupo de estudiantes, un error de
estimación lógico puede ser de 7 kilos. A mayor error de estimación menor tamaño de
muestra.
 Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una fórmula
diferente para calcular el tamaño de la muestra.
 Tamaño de la muestra para estimar el promedio aritmético

Una empresa tiene 98 operarios y desea determinar el tamaño de muestra necesario para
estimar el tiempo promedio que requiere un operario para completar una labor, con un
error de estimación máximo de medio minuto y una confiabilidad del 95 por ciento.

Se toma una muestra piloto, con la cual se estima una desviación estándar de 1.2
minutos

Solución

El error de estimación es 0.5 minutos (B=0.5). Para una confiabilidad del 95 por ciento,
en la tabla de la distribución normal el valor de k es 1.96:

Debe seleccionar una muestra aleatoria de 18 obreros.

 Tamaño de muestra para estimar el total

Si la misma empresa del ejemplo anterior, desea estimar el tiempo total que necesitan
sus obreros para terminar la labor, con un error máximo de 35 minutos y una
confiabilidad del 95 por ciento; por lo tanto, (B = 35), y para una confiabilidad del 95
por ciento k=1.96. El tamaño de muestra requerido es:

Debe seleccionar una muestra aleatoria de 30 operarios, para estimar el tiempo total con
un error máximo de 35 minutos y una confiabilidad del 95 por ciento.

 Tamaño de muestra para estimar la proporción


Cuando no se conoce la proporción (p), se puede suponer un valor para p de 0.5, ya que éste valor,
siempre y cuando permanezcan constantes las demás condiciones, es el que nos proporciona el mayor
tamaño de muestra posible.

Se desea estimar el porcentaje de empleados en una ciudad que tiene una fuerza de trabajo de 35.250
personas. Por un trabajo realizado anteriormente se sabe que el porcentaje de empleados es del 75 por
ciento. Qué tamaño de muestra será necesario para estimar la proporción con un error de estimación
máximo del 8 por ciento.

Solución

Por lo tanto se debe seleccionar una muestra aleatoria de 112 personas para estimar el porcentaje de
empleados.

MUESTREO ALEATORIO ESTRATIFICADO

 Es el proceso de dividir la población en subgrupos o estratos para llevar a cabo submuestreos en


cada uno de ellos
o El criterio que se tendrá para llevar a efecto la división, será buscando que dentro del estrato
exista homogeneidad y que los estratos sean heterogéneos entre ellos en cuanto a la
característica de interés
o Cada elemento de la población pertenece a un solo estrato, por lo que la suma de todos dará
la población, con lo que los estratos no tendrán traslapes
o Se recomienda su uso en poblaciones grandes y muy heterogéneas, donde existe la
posibilidad de clasificarla en subconjuntos mas homogéneos en función a la característica de
interés
 Técnica del muestreo
o Definir el criterio de clasificación o estratificación
o Clasificar a la población en estratos de acuerdo al criterio anterior
o Decidir la técnica de submuestreo o emplear en cada estrato
o Muestrear cada estrato
 Distribución de la muestra entre los estratos
o Afijación proporcional: el tamaño de la muestra en cada estrato, es proporcional al tamaño
del estrato en la población.
o Afijación óptima: Se establece el tamaño de muestra en función de criterios como (los
cuales establece el usuario):
 Precisión
 Variabilidad del estimador
 Interés en cada estrato
 Costo de muestrear
 Tamaño del estrato entre otras
 Tamaño de la muestra
o Cuando se utiliza muestreo estratificado se debe seleccionar al menos un elemento de
muestreo de cada estrato. Así que primero se determina el tamaño de la muestra y después
se determina cuántos elementos se deben seleccionar de cada estrato. Dependiendo de los
criterios que se tengan en cuenta para distribuir la muestra entre los estratos se tienen
diferentes tipos de asignación o afijación y ellos son: proporcional, de Neyman y óptima.
o Muestreo estratificado con asignación proporcional: la muestra se reparte entre los estratos
proporcionalmente a los tamaños de éstos. Este tipo de asignación se utiliza cuando los
costos y las varianzas de los estratos no son muy diferentes.

 Tamaño de muestra para estimar el promedio aritmético con asignación proporcional.

Una vez determinado el tamaño de la muestra, para repartirla proporcionalmente al tamaño de los estratos
se utiliza la siguiente expresión:

Se desea estimar la nota promedio de los estudiantes de administración de empresas diurna y nocturna en
una universidad. En la carrera diurna (estrato 1) hay 280 estudiantes y en la nocturna (estrato 2) hay 200
estudiantes. Determine el tamaño de muestra necesario para cumplir el objetivo con un error máximo de
0.15 y una confiabilidad del 95 por ciento.

Por un estudio realizado tiempo atrás se conocen las varianzas de las notas de administración diurna y
nocturna, las que respectivamente son: 0.31 y 0.28.

Solución

Considerando que las varianzas son similares, se trabaja con muestreo estratificado con asignación
proporcional. El error (B) es 0.15 y para una confiabilidad del 95 por ciento el valor correspondiente en
la distribución normal es 1.96, entonces, k = 1.96:

Se deben seleccionar 27 estudiantes de administración de empresas diurna y 19 de la nocturna.

 Tamaño de muestra para estimar el total con asignación proporcional


Se desea hacer un estudio para estimar el consumo total de gasolina en una ciudad, halle el tamaño de
muestra necesario para cumplir éste objetivo. Los vehículos se clasificaron en tres grupos o estratos,
particulares (1), públicos (2) y oficiales (3). En la oficina de circulación y tránsito se obtuvo la siguiente
información sobre los vehículos matriculados en la ciudad; vehículos particulares 7,627, públicos
2,392 y oficiales 534.

Solución

Como no se dispone de estudios similares, se toma una muestra piloto, con la cual se obtienen las
siguientes varianzas sobre el consumo semanal en galones:

Considerando que las varianzas en los tres estratos son similares, se trabaja con muestreo estratificado
con asignación proporcional

Para estimar el consumo total de gasolina con un error máximo de 15,000 galones/semana, se debe
seleccionar una muestra de 255 autos repartida así: 184 autos particulares, 58 públicos y 13 oficiales.

Recuerde que si se desea, se puede disminuir el error máximo admisible, pero esto conlleva a un aumento
en el tamaño de la muestra.

 Tamaño de muestra para estimar la proporción con asignación proporcional

En vista de la recesión económica existente, una empresa textil pretende reducir el número de dias
laborables por semana a cuatro. Otra alternativa consiste en clausurar una de sus tres plantas y despedir a
los trabajadores. Para tener una idea de la opinión de los trabajadores, el gerente de personal de la
empresa desea seleccionar una muestra de empleados de las tres plantas para estimar la proporción de
trabajadores que prefieren la reducción de la semana de trabajo, con un error de estimación máximo de
0.1.
La empresa emplea 150 personas en la planta 1, 65 en la planta 2 y 40 en la 3. Se estima que cerca del
75 por ciento de los de la planta tres están a favor de la reducción de la semana de trabajo, mientras que
en las otras plantas este porcentaje parece corresponder al 50 por ciento. Encuentre el tamaño de muestra
y la asignación necesaria en cada estrato.

 Muestreo estratificado con asignación de Neyman . Cuando existen marcadas


diferencias en la variabilidad de las observaciones dentro de los estratos, es
recomendable utilizar la asignación de Neyman, ya que además de tener en cuenta el
tamaño de los estratos se tiene en cuenta la dispersión de los datos dentro de cada
estrato. De ésta manera se obtendrá una muestra más grande de aquellos estratos que
sean más heterogéneos.
 Tamaño de muestra para estimar la media con asignación de Neyman

Para repartir la muestra entre los estratos se utiliza la siguiente expresión:

Se desea hacer un estudio sobre producción media de madera aserrada en los E.U.

Todos los aserraderos han sido agrupados en estratos, de acuerdo con la producción. Hace 5 años se hizo
un estudio similar en donde se estimó la desviación estándar de la producción (en miles de pies de tabla).
Por lo tanto, se dispone de la siguiente información:

Determine el tamaño de muestra necesario para estimar la producción media de madera con un error
máximo de 25.000 pies de tabla y una confiabilidad del 95 por ciento.
Solución

El error máximo es de 25.000 pies, pero se debe tener en cuenta que la producción está dada en miles, por
lo tanto se divide por 1000, es decir que B = 25.

Considerando la diferencia en el tamaño de los estratos y en las desviaciones estándar se trabaja con
muestreo estratificado con la asignación de Neyman.

Se debe tomar una muestra de 1.473 aserraderos, repartidos así: 360 en el estrato uno, 424 en el estrato
dos y 690 en el estrato tres.

 Tamaño de muestra para estimar el total con asignación de Neyman

La fábrica de tapas desea determinar el tamaño de muestra necesario para estimar la producción semanal
total, con un error máximo de 90.000 tapas y una confiabilidad del 95 por ciento.

Solución

Se realiza una muestra piloto, de la cual se utilizan las varianzas obtenidas que son:

Teniendo en cuenta la gran diferencia presentada en las varianzas de los tres estratos y la diferencia en el
tamaño de dichos estratos, el tipo de muestreo adecuado es el estratificado con asignación de Neyman.
Por lo tanto, para estimar la producción total con un error máximo de 90000 tapas y una confiabilidad del
95 por ciento, se debe seleccionar una muestra de 69 máquinas, repartidas así: 15 manuales, 24
semiautomáticas y 30 automáticas.

 Tamaño de muestra para estimar la proporción con asignación de Neyman

Para repartir la muestra entre los estratos se utiliza la expresión:

 Muestreo estratificado con asignación óptima: Cuando además de tener marcadas


diferencias en la dispersión o variabilidad dentro de los estratos, el costo para obtener la
información de un estrato a otro varía, se recomienda utilizar la asignación óptima. Con
ésta asignación se tiene en cuenta el tamaño de los estratos, la dispersión o variabilidad
dentro de ellos y el costo para recopilar la información.

 Tamaño de muestra para obtener la media con asignación óptima

Donde: ch = costo de hacer una observación individual en el estrato h.


Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión

 Tamaño de muestra para obtener el total con asignación óptima

Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión

 Tamaño de muestra para estimar la proporción con asignación óptima

Donde: ch = costo de hacer una observación individual en el estrato h.

La muestra se reparte entre los distintos estratos, utilizando la expresión

MUESTREO ALEATORIO SISTEMÁTICO


 Es una técnica de muestreo ampliamente usada debido a que simplifica el proceso de selección
de los elementos que conforman la muestra.
o Consiste en seleccionar aleatoriamente un elemento de los primeros k elementos del
marco muestral, y a partir de él cada k-ésimo elemento.
 Técnica del muestreo
o Determinar el valor de k, la constante con la cual se elegirán a los elementos de la
muestra
o Obtener un número aleatorio entre 1 y k, el cuál será el punto de arranque y el primer
elemento de la muestra: r
o Elegir al resto de los elementos de la muestra a partir de r así:
r, r + k, r + 2k, r + 3k, etc
 Determinación de k
o En general si se desea una muestra sistemática de n elementos de una población de
tamaño N, se debe elegir k menor o igual a la fracción N/n. Pueden considerarse
algunos casos particulares
 Fijarla en base a una fracción de muestreo deseada

 Fijarla de modo que el tamaño de muestra sea exactamente de n

 Fijarla para que el tamaño de muestra sea aproximadamente n

o Si se debe trabajar con un k fraccionario, ya sea porque se debe tener un valor de f o


de n fijo, se puede proceder de dos formas:
1. Muestra cíclica
2. Intervalos fraccionarios

El trabajar con alguno de los métodos establecidos anteriormente garantiza el


insesgamiento de los estimadores, pero complica el trabajo de campo por lo que en
muchas ocasiones se prefiere usar k redondeado al entero más próximo.

 Las fórmulas empleadas para determinar los tamaños de muestra son las mismas que se utilizan
en el muestreo aleatorio simple.
 El único cuidado que se debe tener es lo ya explicado en cuanto a la estimación de la varianza de
los estimadores a partir de una sola muestra sistemática que solo se puede hacer por
equivalencias entre las dos técnicas, si se desea evaluar con mayor precisión estas varianzas se
debe usar una variante de esta técnicas que es el muestreo sistemático replicado
MUESTREO ALEATORIO CONGLOMERADO

 En el conglomerado se agrupan los conglomerados en elementos lo más heterogéneos posibles y


procurando que entre sí los conglomerados sean lo más homogéneos posibles
 Razón para su uso:
o No existe disponible un marco de muestreo que contenga a los elementos de la
población pero existe o se puede construir fácilmente un marco de muestreo que
contenga a todos los conglomerados
o El costo de muestrear por transportarse dentro de la población se incrementa mucho en
la medida que sus elementos se encuentran separados físicamente
 Técnica del muestreo:
o Se establecen los criterios para la especificación de los conglomerados
o Se seleccionan al azar los conglomerados que conformarán la muestra
o Se analizan a todos los elementos de cada conglomerado seleccionado, es decir, se
censan.
 Tamaño de la muestra:
o Tamaño de muestra por conglomerados para la media y el total poblacional.
1. Tamaño de muestra por conglomerados para la proporción poblacional.

DISTRIBUCIÓN DE MUESTRAS
Para distinguir la medida descriptiva de una población con la de una muestra, se llamará al primero
parámetro y al segundo estadístico.
El objetivo de la estadística inferencial es emplear los estadísticos para hacer inferencias respecto a los
parámetros poblacionales correspondientes. Los principales tipos de inferencias que se realizan son:
1. Estimación puntual o por intervalo: en este tipo de inferencia, se estima el valor de un
parámetro poblacional mediante un número o un intervalo numérico
2. Prueba de hipótesis: en este tipo de inferencia se formula una hipótesis acerca del valor de un
parámetro poblacional.

Es una lista de todos los valores posibles de un estadístico y la probabilidad asociada a cada valor. Se
considerarán la distribución muestral de medias y la de proporciones.

La distribución de muestras de un estadístico es la presentación tabular y/o gráfica de las probabilidades


de todos los valores de algún estadístico, calculados en muestras del mismo tamaño, extraídas
aleatoriamente de la misma población.

Distribución de medias de muestras

 Método teórico para una población


a. Se elige el tamaño de muestras n, donde 2 ≤ n ≤ N
b. Se establecen todas las muestras de tamaño n y se calculan sus medias y sus probabilidades
teóricas correspondientes
c. Se tabulan y grafican los valores de la media estadística versus sus probabilidades
correspondientes

Media de las medias muestrales: es el promedio de todos los valores posibles de las medias que se pueden
generar mediante las diversas muestras aleatorias simples. Se puede demostrar que el valor esperado de
las medias muestrales es igual a la media poblacional; es decir,

También se tiene que (k es el número de muestras):

Error estándar de la media: es la desviación estándar de la distribución de muestreo de la media, por lo


que mide el grado en que se espera que varíen las medias de las diferentes muestras de la media de la
población, debido al error aleatorio en el proceso de muestreo. Al disminuir el error estándar, el valor de
cualquier media de muestra probablemente se acercará al valor de la media de la población. (efecto del
tamaño de la muestra sobre el error típico, es decir, a medida que aumenta el tamaño de la muestra, se
incrementa la precisión con la que se puede usar la media de muestra para estimar la media de la
población, sin embargo, rara vez vale la pena tomar muestras excesivamente grandes ya que el error
estándar de la media varía inversamente con , por lo que hay una utilidad decreciente en el muestreo).

Usos: indica el tamaño del error de azar que se ha cometido, y además señala la probable precisión que
obtendremos si utilizamos una estadística de muestra para estimar un parámetro de población.

La distribución muestral de medias tienen un error estándar igual a:

 Para población infinita con n>30, muestreo con reemplazo o población normal:

 Para población finita o muestreo sin reemplazo con

Donde se le denomina factor de corrección

Teorema del límite central: es un teorema a través del cual se asegura que la distribución de muestreo de
la media se aproxima a la normal, al incrementarse el tamaño de la muestra. Este teorema permite usar
estadística de muestra para hacer inferencias con respecto a los parámetros de la población, sin saber nada
sobre la forma de la distribución de frecuencias de esa población más que lo que podamos obtener de la
muestra. Para efectos prácticos el tamaño de la muestra debe ser n ≥ 30

Nota: si la distribución de la población es bastante simétrica, la distribución muestral de la media se


aproxima a la normal si se seleccionan muestras pequeñas.
Aplicaciones:

Una aplicación muy corriente y útil de la distribución muestral es determinar la probabilidad de que la
media de una muestra caiga dentro de un intervalo determinado. Puesto que la distribución muestral
seguirá una distribución normal (ya sea porque la muestra se toma de una distribución normal, o porque n
≥ 30 y el teorema del límite central garantice la normalidad en el proceso de muestreo), se podrá utilizar
la variable tipificada para obtener la información necesaria en la toma de decisiones.

Distribución muestral de proporción

1. Definición: es la distribución de probabilidad de todos los valores posibles de la proporción muestral (


pˆ ).

2. Media de las proporciones muestrales: es la media de todos los valores posibles de las proporciones
que se pueden generar mediante las diversas muestras aleatorias simples. Se puede demostrar que la
media de las proporciones muestrales p será igual a π (proporción de la población). El valor esperado de
las proporciones muestrales es igual a la proporción poblacional; es decir, E( pˆ ) = p .

3. Error estándar de la proporción: es la desviación estándar de la distribución de muestreo de la


proporción, por lo que mide el grado en que se espera que varíen las proporciones de las diferentes
muestras de la proporción de la población, debido al error aleatorio en el proceso de muestreo.

La distribución de muestreo tiene un error estándar igual a:

Para población infinita con n>30 o muestreo con reemplazo:

n
Para población finita y muestreo sin reemplazo con > 0,05
N

Aplicaciones: una aplicación muy corriente y útil de distribución muestral es determinar la probabilidad
de que la proporción de una muestra caiga dentro de un intervalo determinado. Puesto que la distribución
muestral seguirá una distribución normal (ya sea porque la muestra se toma de una distribución normal, o
porque n ≥ 30 y tanto npˆ como n(1- pˆ ) deben ser mayores a 5, (el teorema del límite central garantiza la
normalidad en el proceso de muestreo), se podrá utilizar la variable tipificada para obtener la información
necesaria en la toma de decisiones.

Observación:
En la terminología estadística, la distribución de muestreo que se obtendría al tomar todas las muestras de
un tamaño dado constituye una distribución teórica de muestreo. En la práctica, el tamaño y el carácter de
la mayor parte de las poblaciones impiden que los responsables de las decisiones tomen todas las
muestras posibles de una distribución de población, sin embargo, se han desarrollado fórmulas para
estimar las características de estas distribuciones teóricas de muestreo, haciendo innecesario que se
recolecten grandes números de muestras. En casi todos los casos, los responsables de las decisiones sólo
toman una muestra de la población, calculan estadísticas para esa muestra y de esas estadísticas infieren
algo sobre los parámetros de toda la población.

Potrebbero piacerti anche