Sei sulla pagina 1di 96

Estadística para la investigación

Modulo: Muestreo
Ms. Sc. Lic. Jorge Luis Medrano llano
Universidad publica de el alto

1
¿De que se trata el modulo?

Definir elementos para la elaboración de estudios basados en


muestreo. Selección y determinación del tamaño de muestra,
cálculo de errores de muestreo e inferencia a la población.

Competencias buscadas

Conoce y usa procedimientos estadísticos para la selección


de la muestra y la inferencia a la población.

2
Programa mínimo
1. Muestreo y distribuciones muéstrales:
2. Tipos de muestreo aleatorio
Muestreo Aleatorio Simple
Muestreo Aleatorio Estratificado
Muestreo Aleatorio por Conglomerados
3. Errores de muestreo
4. Estimaciones de los parámetros poblacionales
5. Diseños de investigación por muestreo

Organización de la asignatura
Clases teóricas:
Fundamentos teóricos del muestreo
Clases prácticas con SPSS y Excel:
Desarrollo de casos de aplicación

3
Bibliografía
-Gorgas – Cardiel - Zamorano: Estadística Básica para Estudiantes de
Ciencias. UCM, Madrid-España. 2011..

- Córdova, Manuel. Estadística. 5ta. Ed. Moshera. Lima-Perú, 2003.

Bibliografía Complementaria
- Ritchey, Ferris J.: Estadística para las Ciencias Sociales. 2da. Ed. Mc. Graw
Hill. México, 2006.

- Lázaro, C. Moisés: Inferencia Estadística. Moshera.Lima-Perú,2007

4
INTRODUCCIÓN

¿Qué es la estadística?
Estadística es la ciencia de recolectar,
organizar, presentar, analizar e interpretar
datos con el propósito de ayudar a una toma
de decisiones más efectiva.

Es una herramienta para generar


conocimiento.

5
ESTADISTICA DESCRIPTIVA E INFERENCIAL

Estadística Descriptiva: Estadística Inferencial:

Conjunto de técnicas y Conjunto de métodos


métodos que permiten utilizados para saber “algo”
organizar, resumir y
acerca de una población
presentar datos.
basándose en una muestra.

Se usa para transformar Se usa para transformar


datos en información. información en
conocimiento.
Contribuyen a la toma de decisiones

6
INFERENCIA ESTADÍSTICA

Extraer conclusiones y/o


tomar decisiones
concernientes a una
población basándose en
los resultados de una
muestra.

ESTIMACIÓN: PRUEBA DE HIPOTESIS:


En una muestra de 300 Probar que el 40% de hombres
personas se estima que el de 18 a 24 años tiene ese nivel
40% de hombres de 18 a 24 de consumo de cerveza.
consumen cerveza al menos
una vez a la semana.
7
Esquema de las etapas de un estudio estadístico

AREA DE INTERES DATOS

ORGANIZACIÓN
Y RESUMEN
Tema de Investigación ESTADÍSTICA
-Antecedentes Previos DESCRIPTIVA
-Objetivos INTERPRETACIÓN
-Preguntas de Investigación Muestra
-Posibles Hipótesis ¿Población o Muestra?
-Unidad de Análisis INFERENCIA
Población
-Población ESTADISTÍCA
-Variables
CONCLUSIONES
Probabilidad
INFORMACIÓN

8
RECORDEMOS

Un estadístico (estadígrafo)
Es una medida que describe las
características de una muestra.

Un parámetro
Es una medida que describe las
características de la población.

9
ESTADISTICOS Y PARAMETROS

Muestra Población
MEDIDA
(Estadístico) (Parámetro)
Variables Cuantitativas

Media 𝒙 
Desviación Estándar 𝒔 
Varianza 𝒔𝟐 2
Variables Cualitativas o Categorizadas

Proporción 𝑝=𝑝 
10
MUESTREO

MEDIA ARITMETICA
MEDIANA
POBLACION ESTIMACIONES VARIANZA
MUESTRA
OBJETIVO PROPORCION
RAZON

¿QUÉ TANTO SE
INFERENCIA APROXIMA ESTA
¿ES LA MUESTRA ESTIMACION AL
REPRESENTATIVA VERDADERO VALOR EN LA
DE LA POBLACION?
POBLACIÓN?

11
¿Qué es el muestreo?

• Es la parte de la estadística que estudio el


conjunto de métodos, técnicas y
procedimientos para:

 Seleccionar y obtener una muestra.

 Realizar inferencias a partir de la muestra.

12
DISEÑO DE LA INVESTIGACIÓN
METODOLOGIA DE PLANIFICACIÓN DE
INVESTIGACIÓN CIENTÍFICA

13
MAPIC
MATRIZ DE PLANIFICACIÓN EN
INVESTIGACIÓN CIENTÍFICA
ESTUDIOS POR ESTUDIOS POR
OBSERVACIÓN EXPERIMENTACIÓN
• Estudios basados en la • Estudios basados en la
observación de las unidades experimentación sobre las
de investigación, se pueden unidades de investigación.
realizar mediante:

• Censos
• Encuestas
• Revisión de registros
administrativos

14
MAPIC
ESTUDIOS POR OBSERVACIÓN

1.Definición de objetivos - Resultados Esperados


2.Definición de las Unidades de Observación y de la
Población
3.Definición de las Variables
4.Selección de un Método de Colecta de datos
(Cualitativo – Cuantitativo)
5.Selección del Plan de Muestreo
6.Definición del Tamaño de la Muestra
7.Selección y esbozo del Método Estadístico

15
MAPIC
ESTUDIOS POR EXPERIMENTACIÓN

1.Definición de Resultados Esperados y condiciones


experimentales.
2.Definición de Factores.
3.Definición de las Unidades Experimentales
4.Definición de Observaciones (variable de
respuesta)
5.Definición del Diseño Experimental.
6.Definición del Método Matemático.

16
ESTUDIOS POR OBSERVACIÓN

17
1. Definición de los resultados esperados

¿Qué se quiere determinar?


¿Cuál es el objetivo de la investigación?
¿Cuál es la necesidad de información?

El resultado esperado puede estar formulado bajo la forma de:


Pregunta
Respuesta (Hipótesis)

• Al finalizar esta etapa se dispone: Lista de resultado esperados

18
Definición de los resultados esperados
Ejemplos
Estimar la demanda de un producto y proyectarla para un
periodo de 5 años:
Estadísticamente: Estimar una cantidad (promedio)
Estimar la concentración de calcio en mujeres embarazadas
Estadísticamente: Estimar una cantidad (promedio)
Identificar factores que inciden en la cartera en mora de
las instituciones de microcrédito.
Estadísticamente: Estimar porcentajes (proporciones)
 Estimar la prevalencia de Hepatitis B
Estadísticamente: Estimar porcentaje (proporción)

19
2. Definición de la población y unidades de
observación

Población
Conjunto de “individuos” sobre los que existe una
interés de analizar
Población finita o infinita

Unidades de observación
Elementos de la población que serán observados o
estudiados. Por ejemplo: personas, familias, empresas,
productos, marcas, etc.

20
3. Definición de las variables

Variables categóricas o cualitativas


Son aquellas que toman un número limitado de modalidades:
sexo, estado civil, etc.
A cada modalidad corresponde una categoría de individuos;
estas categorías forman una partición de la población.

Variables reales o cuantitativas


son las que toman valores reales para los cuales podemos
calcular resúmenes numéricos ( media, varianza,... ): edad,
ingreso, gasto, rendimiento, etc.

21
3. Definición de las variables
Tipos de datos

Datos cuantitativos
Datos de medición – continuos
Datos de conteo - discreta

Datos cualitativos
Datos binarios
Datos ordinales
Datos nominales

22
4. Métodos de colecta

Primarias Cualitativas Reuniones de grupo


Entrevistas en profundidad
Observación

Cuantitativas Encuestas
Experimentos

Secundarias Internas Registros


Informes Internos

Externas Publicaciones
Estadísticas sectoriales
Informes Externos

23
4. Métodos de colecta
Métodos de colecta primarios
INVESTIGACIÓN INVESTIGACION
CUANTITATIVA CUALITATIVA
Busca las causas sin recurrir a la Interés por comprender el
interpretación subjetiva comportamiento humano
Aproximación lógico-positivista Aproximación fenomenológica
Medición controlada Medición observacional natural, sin
control
Objetivismo, perspectiva externa Subjetivismo, perspectiva iterna
Orientación verificacionista, Orientación hacia el descubrimiento,
confirmatoria, reduccionista, inferencial exploratoria, descriptiva, inductiva
Orientación hacia el resultado Orientación hacia el proceso
Importancia de la formalidad, datos Importancia del contenido, datos reales
exactos y rigurosos
Particular – Intenta analizar General – Intenta sintetizar 24
4. Métodos de colecta
Métodos de investigación cualitativos

Directos Entrevistas en profundidad


Reuniones de grupo (Grupos focales)

Semidirectos Phillips 66
Delphi

Indirectos Técnicas proyectivas


Técnicas de creatividad

Observación Personal
Análisis de Contenido
Auditoria
25
4. Métodos de colecta
Métodos de investigación cualitativos

Encuestas/Censos Personal (cara a cara)


Postal
Telefónicas
En redes sociales

26
7. Análisis de datos

Población - Problema “complejo” que depende


del objetivo de la investigación.

- Debe ser capaz de representar a la


Muestra población y hacer inferencias.

-Criterios para el tamaño:


Muestreo
 Resultados esperados,
 Variables que participan en el
resultado
 Tipo de dato
 Método estadístico. 27
5. Definición del plan de muestreo

El plan de muestreo se refiere a los procedimientos de selección


de “individuos” de la población
Población Población

Muestra

Censo Muestreo

En el caso de un plan de muestreo se plantean dos preguntas:


1. ¿cómo elegir la muestra?
2. ¿cómo extrapolar a la población entera los resultados que se
observaron sobre la muestra? 28
6. Tamaño de la muestra

Población - Problema “complejo” que depende


del objetivo de la investigación.

- Debe ser capaz de representar a la


Muestra población y hacer inferencias.

-Criterios para el tamaño:


Muestreo
 Resultados esperados,
 Variables que participan en el
resultado
 Tipo de dato
 Método estadístico. 29
7. Análisis de los datos

Análisis exploratorio de los datos


Análisis descriptivo de los datos:
CONTROL DE CALIDAD DE
RESUMEN DE LOS DATOS
LOS DATOS

Análisis inferencial de los datos:


GENERALIZACIÓN DE
LOS DATOS

30
7. Análisis de los datos
Análisis exploratorio
Unidimensional Bidimensional Multidimensional

Datos Box Plot Scatter Plot Diagrama de


cuantitativos individuos
(Análisis de
componentes
principales)
Datos Tablas de Tablas de Tablas de
cualitativos frecuencia frecuencia frecuencia
unidimensional unidimensional unidimensional

Datos mixtos - Box Plot : Análisis de


Cuantitativa- Componentes
nominal Principales
Scatter Plot:
Cuantitativa - Análisis Factorial
Ordinal
7. Análisis de los datos
Análisis descriptivo
Unidimensional Bidimensional Multidimensional

Datos Gráficas Gráficas, Análisis de


cuantitativos Parametros de Covarianza Componentes
posición, Correlación Principales
dispersión, forma Regresión Cluster
Datos Gráficas Análisis
Gráficas Tablas de
cualitativos Factorial
Tablas de frecuencia
frecuencia
7. Análisis de los datos
Análisis inferencial
Unidimensional Bidimensional Multidimensional

Estimación Promedios Correlación ANOVA


Varianzas Regresión Regresión múltiple
Proporciones Contingencia

Test de Test Conformidad Test de ANOVA


hipotesis comparación Discriminante
Test Significación Test de Canónico
significación
Métodos no
parametricos Run test Kernell
Spearman
Wilcoxon Redes
Kendall
Mann-Whitney neuronales
Kruskall
Construcción de la MAPIC

1. Resultados Esperados
2. Población y Unidades de Observación
3. Variable y tipo de dato
4. Método de colecta
5. Plan de muestreo (selección de la muestra)
6. Método Estadístico
7. Determinación del tamaño de la muestra

34
Ejemplo

OBJETIVO POBLACIÓN Y Variables de Método de Método de Muestreo


UNIDADES DE Respuesta Colecta Análisis
ANÁLISIS
Determinación Hogares de la Preferencia de Encuesta por Estimación de Muestreo
del porcentaje zona sur de la consumo muestreo en proporciones Aleatorio por
Conglomerados
de aceptación ciudad de La hogares mediante
de una Paz. Disposición a seleccionados intervalos de
mermelada pagar de la zona sur confianza.
elaborada con Jefes/as de
estevia. hogar Frecuencia de Pronóstico de
responsable de consumo la demanda
las compras de
la Canasta de Presupuesto de
Consumo compras

Nivel de
ingreso

35
MUESTREO Y DISTRIBUCIONES
MUESTRALES
MUESTREO ALEATORIO SIMPLE

36
¿Qué es el muestreo?

• Es la parte de la estadística que estudio el


conjunto de métodos, técnicas y
procedimientos para:

 Seleccionar y obtener una muestra.

 Realizar inferencias a partir de la muestra.

37
¿Por qué muestrear?

• Menor costo

• Mayor rapidez (menor tiempo)

• Mayor exactitud

Si la Población es muy grande, pero uniforme


(homogénea), se puede obtener conclusiones de
la población con el muestreo.

38
Limitaciones

• Cuando se necesita información de cada uno de los


elementos poblacionales, el muestreo nos puede
llevar a conclusiones erróneas.
• Cuando sea difícil de superar la dificultad del uso
del muestreo, por el tipo de población.
• El muestreo exige más refinamiento y preparación
(diseño de los instrumentos y preparación de los
entrevistadores, y supervisores).
• Cuando el costo por unidad de muestreo es muy
alto, es mejor no utilizar métodos de muestreo.
39
Errores de muestreo

• Error de cobertura (marcos incompletos)


• Error por mala calidad del marco (marcos
imperfectos)
• Error de respuesta (del entrevistado)
• Error de no respuesta (omisiones o sustituciones)
• Error de cuestionario (Indefinición del cuestionario)
• Error de entrevista (métodos de entrevista
inadecuados)
• Error de digitación o de cálculo en el procesamiento
de los datos.
40
Términos técnicos

Unidad de observación (elemento): Unidad sobre la cual se realizara


las observaciones.
Población o Universo: Conjunto total de las unidades que se quiere
investigar.

Muestra: Subconjunto de la población o universo

Población muestreada: Es la población de donde se extrae la muestra

Unidad de muestreo: Es la unidad sobre la que se selecciona la


muestra

Marco muestral: Lista de las unidades de muestreo. 41


Tipos de muestreo

PROBABILISTICO NO PROBABILISTICO
(Aleatorio) (No aleatorio)
• Toda unidad de muestreo (y en • La selección se realiza por
consecuencia toda unidad de conveniencia o por criterio del
la población) tiene una investigador, por lo tanto no
probabilidad positiva y existe una probabilidad
conocida de pertenecer a la conocida de pertenecer a la
muestra. muestra.
• Generalmente son menos
• Permiten realizar el estudio de exactos que los métodos
las características de la probabilísticos y menos
población mediante la costosos; sin embargo no
inferencia estadística. existe forma de medir su
precisión.
42
Planes de muestreo

PROBABILISTICO NO PROBABILISTICO
(Aleatorio) (No aleatorio)

• Es posible medir el error • No es posible medir el error.

• No existe un buen • Existe un buen conocimiento


conocimiento de la población de la población

• La selección de “individuos” se • La selección de “individuos” se


responsabiliza al azar responsabiliza al investigador.

43
METODOS NO
PROBABILISTICOS
 Muestreo indiscriminado
 Muestra de voluntarios
 Muestreo al juicio
 Muestreo por cuotas
 Muestreo por bola de nieve

44
Muestreo indiscriminado

 No tiene un tamaño definido, se


ajusta por lo general al tiempo y Ejemplos:
al presupuesto, por lo tanto no
suele responder a una Investigaciones sobre
planificación definida. preferencias de marca, en
la calle.
 Supone que la población es
homogénea. Investigaciones sobre
algún tema de debate
político.
 Se puede usar para
investigaciones preliminares.
Muestreo de voluntarios

 No tiene un tamaño definido, se


fija por lo general en un periodo Ejemplos:
de tiempo en el que participan
solo voluntarios.
Degustación de
productos a través de
 Supone que la población es más o impulsadoras (es)
menos homogénea.
Pruebas de algún tipo de
 Se puede usar para perfume.
investigaciones de percepción,
degustación o algunos
experimentos médicos.
Muestreo al juicio (por juicio)

 No tiene un tamaño definido,


pero se define en ideas previas de
la composición y del Ejemplos:
comportamiento de la población,
es un muestreo direccional. Estudios de hábitos de
consumo.
 Esta influenciado por el juicio del
investigador y puede sesgarse por Percepciones sobre
seleccionar solo casos típicos. temas especiales.

 Se puede usar para estudios


cualitativos.
Muestreo por cuotas

 La muestra reunida es separada


en cuotas y tiene la misma
proporción de individuos que Ejemplos:
toda la población con respecto al
fenómeno enfocado, las
características o los rasgos Estudios de mercado.
conocidos.
Sondeos de opinión
 Se definen los tamaños de
muestra en cada cuota. pública
 Se seleccionan los individuos
hasta completar las cuotas.
Muestreo por cuotas:
Procedimiento
1. Segmentación
División de la población en “estratos diferenciados” por ejemplo sexo, edad
área de residencia, ciudad, departamento. .
2. Determinación del tamaño de las cuotas:
• Se definen los objetivos de individuos para las encuestas, generalmente de
forma proporcional al tamaño del grupo en la población. Por ejemplo si
queremos un estudio para las ciudades de La Paz y El Alto y sabemos que
las proporciones poblacionales son 55% y 45%, respectivamente. Para una
muestra de 100 personas se entrevistaran 55 residentes de La Paz y 45
residentes de El Alto.
Nota:
A veces las cuotas no son proporcionales a la población, es posible que
se quiera profundizar el análisis en uno de los estratos.
3. Selección de participantes y comprobación de cuotas
• Se buscan a los participantes para cubrir las cuotas (aquí el muestreo deja
de ser probabilístico) pudiendo ser la selección no aleatoria por ejemplo
se puede seleccionar por conveniencia, hasta completar el tamaño de la
cuota.
Muestreo Bola de Nieve

 La muestra va creciendo según las Ejemplos:


unidades de muestreo son
contactadas. Permite aumentar la Estudios de prevalencia
muestra de individuos en una
de VIH, ITS en
población cuyo tamaño y
atributos son desconocidos poblaciones de difícil
acceso.
 Se usa en poblaciones pequeñas o
poblaciones con características
particulares: artistas, usuarios de Algunos estudios de
drogas, personas discapacitadas, mercado basados en
trabajadoras sexuales, población degustación.
gay, bisexual, trans,
Muestreo bola de nieve:
Procedimiento
1. Crecimiento de la muestra
• Empezar las encuestas con la lista de los miembros conocidos de la
población, luego ir pidiendo nombres de otros que se califican para el
grupo para contactarlos y entrevistarlos para luego ir pidiendo nuevos
nombres hasta que no surjan muchos nombres nuevos.

2. Saturación de la muestra
• Con cada interacción, la lista crece como bola de nieve, hasta que se
puede lograr un cuasi-censo, existe el riesgo de no tomar en cuenta a
individuos o sub-grupos que nadie menciona, ni conoce.

Algunas variantes cuasi – probabilísticas:


 Muestreo RDS (Respondent Driven Sampling): Muestreo conducido por
entrevistados.
 Muestreo TLS (Time Location Sampling): Muestreo por tiempo y lugar.
 Mapeos programáticos y sociales.
METODOS PROBABILISTICOS
Muestras de probabilidad simple
 Muestreo Aleatorio Simple (MAS)
 Muestreo Aleatorio Sistemático (MASIS)
 Muestreo Aleatorio Estratificado (MAE)
 Muestreo por Conglomerados (MAC)
 Muestreo Aleatorio Multietápico (MAM)

52
Muestreo Aleatorio Simple

•Dada una población de tamaño N, se obtiene


una muestra de tamaño n, con MAS cuando
cualquier subconjunto de la población tiene
la misma probabilidad de ser elegida en la
muestra.

•Es la forma más simple de muestreo, sirve de


base para diseños de muestra más
complejos.
Muestreo Aleatorio Simple
Muestreo Aleatorio Sistemático

•Dada una población de tamaño N, se obtiene


una muestra de tamaño n, con MAS o MASIS
cuando cualquier subconjunto de la
población tiene la misma probabilidad de ser
elegida en la muestra.

•Es la forma más simple de muestreo, sirve de


base para diseños de muestra más
complejos.
Muestreo Aleatorio Estratificado

•Dada una población de tamaño N, esta se


subdivide en subgrupos llamados estratos,
que tienen características diferenciadas. La
estratificación permite aumentar la precisión
de la estimaciones.

•En cada estrato se realiza una selección por


MAS o MASIS.
Muestreo Aleatorio por Conglomerados

•Dada una población de tamaño N, las


unidades de observación se reúnen en
unidades de muestreo de mayor tamaño,
denominadas conglomerados.

•El muestreo se realiza seleccionando


conglomerados y al interior se eligen las
unidades de observación.
Procedimiento de selección aleatoria

•El MAS, el MASIS, el MAE y el MAC implican


una selección aleatoria de las unidades que
forman parte de la muestra.
•En una MAS o una MASIS se eligen al azar los
elementos de la población.
•En una MAE se eligen al azar los elementos
dentro de cada estrato de la población.
•En una MAC se eligen al azar los
conglomerados entre toda la población.
Determinación estadística de la población y
la unidad muestral

La definición, estadística de la población a la


que pertenece la base de la encuesta
permitirá:

1. Seleccionar la muestra (muestrear).


2. Elevar (extrapolar) los resultados de la
muestra a la población total.
Coeficiente de elevación
(Factor de expansión)

Suponga que de una población de 20.000


personas, se obtiene una muestra aleatoria de
500 personas.

𝑁 20.000
Coeficiente de elevación = 𝑛
= 500
= 40

Cada persona de la muestra representa a 40


personas de la población.
Coeficiente de elevación
(Factor de expansión)

Suponga que en la muestra se ha encontrado


que 200 personas, consumen habitualmente
café en el desayuno:

Se inferencia que:

Entonces: 200 * 40 = 8.000 personas de la


población total consumen café
Fracción de muestreo

Es el porcentaje de la población que ha sido


muestreada:

𝑛 500
Fracción de muestreo = = = 2,5%
𝑁 20000

Se han elegido 2,5 personas de cada 100 en


la muestra.
Se han elegido 25 por cada 1000 personas
en la muestra.
MUESTREO
ALEATORIO
SIMPLE
MAS

62
Características

Cada unida de la población (N) tiene la


misma probabilidad de ser elegido.
Se tiene una lista de la población identificada
con un número, por lo tanto se tiene una lista
de los n sujetos de la muestra rotulados o
identificados con un número.
Se utilizan métodos de selección tipo urna o
al azar, tablas o generadores de números
aleatorios.
Puede ser con reemplazo o sin reemplazo.
Muestreo Aleatorio Simple
N = 48
n=5

Números
aleatorios:

20
27
29
32
40
MUESTREO
ALEATORIO
SISTEMATICO
MASIS

65
Características

Se usa este muestreo cuando se tiene una lista


de los N miembros de la población.
Se llama sistemático porque se selecciona
sistemáticamente cada k-ésimo miembro de la
lista de la población.
Si k es 5, se selecciona cada 5-ésimo sujeto o
unidad de la lista
El primer sujeto de la muestra se halla al azar,
por ejemplo con un número aleatorio.
Luego, se determina la fracción que nos da el
número k.
Muestreo Aleatorio Sistemático

N = 48
n=5

k = N/n
k = 48/5
k  10

Comenzando
por la unidad
17
MUESTREO
ALEATORIO
ESTRATIFICADO
MAE

68
Características

Se usa cuando la población estudiada tiene


características diferentes y se puede
estratificar, por ejemplo:
Área de residencia
Sexo
Departamento
Grupos de Edad
Productos
Marcas
Características

En el muestreo estratificado, determina un


tamaño de muestra en cada estrato
identificado, de manera que la muestra sea
representativa para cada estrato pero
también para la población total.
Una vez determinado el tamaño de muestra
de cada estrato, los elementos al interior de
los mismos se pueden obtener por MAS o
por MASIS
Afijación de la muestra

En el MAE, la muestra total debe distribuirse


entre los estratos identificados, mediante un
proceso que se llama afijación de la muestra:

Afijación simple
Afijación proporcional
Afijación óptima
Muestreo Aleatorio Estratificado
Afijación simple

Afijación simple:

La muestra se reparte en partes iguales entre los


N = 10.000 estratos
N1 = 3.000
N2 = 5.000 ni = 300/3 = 100 unidades por estrato
N3 = 2.000
Desventajas:
n = 300 No se toma en cuenta el peso poblacional de los
estratos, por lo que algunos estratos podrían
estar mas (o menos representados que otros)
Muestreo Aleatorio Estratificado
Afijación simple: Coeficiente de elevación

Es diferente en cada estrato:

3.000
N = 10.000 𝐶𝐸1 = = 300
100
N1 = 3.000
N2 = 5.000 5.000
N3 = 2.000 𝐶𝐸1 = = 500
100

n = 300 2.000
𝐶𝐸1 = = 200
100

Para hacer las inferencias a la población total se


debe ponderar los resultados de la muestra en
cada estrato por el Coeficiente de Elevación
Muestreo Aleatorio Estratificado
Afijación proporcional
Afijación proporcional:

La muestra se reparte de acuerdo con el peso de


N = 10.000 cada estrato en la población total.
N1 = 3.000
N2 = 5.000 3.000
𝑛1 = 300 = 90
N3 = 2.000 10.000

n = 300 5.000
𝑛2 = 300 =150
10.000

2.000
𝑛3 = 300 = 60
10.000
Muestreo Aleatorio Estratificado
Afijación proporcional: Coeficiente de elevación

Es igual en cada estrato:

3.000
N = 10.000 𝐶𝐸1 = = 33,33
90
N1 = 3.000
N2 = 5.000 5.000
N3 = 2.000 𝐶𝐸1 = = 33,33
150

n = 300 2.000
𝐶𝐸1 = = 33,33
60

Para hacer las inferencias a la población se usa


el mismo coeficiente de elevación.
Muestreo Aleatorio Estratificado
Afijación optima
Afijación optima

La muestra se reparte de acuerdo con el peso de


N = 10.000 cada estrato en la población total y la dispersión
N1 = 3.000 de resultados.
N2 = 5.000
N3 = 2.000 Considerando t: Estratos

n = 300 𝑁𝑖 ∗ 𝑆𝑖 ∗ 𝑛
𝑛𝑖 = 𝑡
𝑖=1 𝑁𝑖 ∗ 𝑆𝑖

Es necesario conocer el valor de la Desviación


Estándar
Muestreo Aleatorio Estratificado
Afijación optima: Cálculo de S
a) Se puede disponer de estimaciones de la
desviación estándar de estudios similares o de
líneas de base realizadas en los mismos estratos
o estratos similares.
N = 10.000
N1 = 3.000
N2 = 5.000
N3 = 2.000

n = 300
Muestreo Aleatorio Estratificado
Afijación optima: Cálculo de S
b) Se puede hacer una encuesta piloto, en una
muestra pequeña, respecto de la variable que
interesa analizar, por ejemplo salario de las
personas:
N = 10.000
N1 = 3.000
Supongamos tres muestras pequeñas, para medir el
N2 = 5.000 salario promedio
N3 = 2.000
Estrato 1 Estrato 2 Estrato 3
3.240 3.182 7.343
n = 300 4.543 5.996 6.279
2.961 6.857 6.832
3.242 6.808 3.977
Promedio 3.497 5.711 6.108
Desviación 710 1.731 1.485
Muestreo Aleatorio Estratificado
Afijación optima: Cálculo de S
3000 ∗ 710 ∗ 300
N = 10.000 𝑛1 = = 46
3000 ∗ 710 + 5000 ∗ 1731 + 2000 ∗ 1485

N1 = 3.000 5000 ∗ 1.731 ∗ 300


N2 = 5.000 𝑛2 = = 189
3000 ∗ 710 + 5000 ∗ 1731 + 2000 ∗ 1485
N3 = 2.000
2000 ∗ 1.485 ∗ 300
𝑛3 = = 65
S1 = 710 3000 ∗ 710 + 5000 ∗ 1731 + 2000 ∗ 1485
S2 = 1.731
S3 = 1.485

n = 300
Muestreo Aleatorio Estratificado
Afijación óptima: Coeficiente de elevación

N = 10.000 Es diferente en cada estrato:

N1 = 3.000 3.000
𝐶𝐸1 = = 65,21
N2 = 5.000 46
N3 = 2.000
5.000
𝐶𝐸2 = = 26,46
S1 = 710 189
S2 = 1.731 2.000
S3 = 1.485 𝐶𝐸3 = = 30,77
65
n = 300 Para hacer las inferencias a la población se debe
ponderar el resultado muestral por el
coeficiente de cada estrato.
Se quiere estimar el gasto mensual de transporte en
2.000 hogares.

N = 2.000 Afijación Proporcional:

N1 = 800 𝟖𝟎𝟎
𝒏𝟏 = 𝟏𝟐𝟎 ∗ = 𝟒𝟖
N2 = 1.200 𝟐𝟎𝟎𝟎

𝟖𝟎𝟎
Coeficiente de elevación = 𝟒𝟖
= 𝟏𝟔, 𝟔𝟕
n = 120
𝟏𝟐𝟎𝟎
S1 = 200 𝒏𝟏 = 𝟏𝟐𝟎 ∗ = 𝟕𝟐
S2 = 320 𝟐𝟎𝟎𝟎

𝟏𝟐𝟎𝟎
Coeficiente de elevación = = 𝟏𝟔, 𝟔𝟕
𝟕𝟐
Se quiere estimar el gasto mensual de transporte en
2.000 hogares.

N = 2.000 En el estrato 1 se obtiene que el 80% de la


muestra tiene un gasto promedio superior a 500
N1 = 800 Bs.; mientras que en el estrato 2 este porcentaje
N2 = 1.200 es del 90%.
 Estrato 1: 80%*48 = 38 hogares de la muestra
38 * 16,67 = 633 hogares de la población
n = 120  Estrato 2: 90%* 72=65 hogares de la muestra
65*16,67 = 1084 hogares en la población
n1 = 48
n2 = 72 En la población total (633+1084) = 1717
hogares, es decir el 86% tiene un gasto mensual
mayor a 500 Bs.
Se quiere estimar el gasto mensual de transporte en
2.000 hogares.

N = 2.000 Afijación óptima:

N1 = 800 𝟖𝟎𝟎 ∗ 𝟐𝟎𝟎


𝒏𝟏 = 𝟏𝟐𝟎 ∗ = 𝟑𝟓
N2 = 1.200 𝟓𝟒𝟒. 𝟎𝟎𝟎

𝟖𝟎𝟎
Coeficiente de elevación = 𝟑𝟓
=22,86
n = 120
𝟏𝟐𝟎𝟎∗𝟑𝟐𝟎
S1 = 200 𝒏𝟏 = 𝟏𝟐𝟎 ∗ 𝟓𝟒𝟒.𝟎𝟎𝟎
= 85
S2 = 320
𝟏𝟐𝟎𝟎
Coeficiente de elevación = = 𝟏𝟒, 𝟏𝟏
𝟖𝟓
Se quiere estimar el gasto mensual de transporte en
2.000 hogares.

N = 2.000 En el estrato 1 se obtiene que el 82% de la


muestra tiene un gasto promedio superior a 500
N1 = 800 Bs.; mientras que en el estrato 2 este porcentaje
N2 = 1.200 es del 88%.

Estrato 1: 82%*35 = 29 hogares de la muestra


n = 120 29 * 22,86 = 663 hogares de la población

n1 = 35 Estrato 2: 88%* 85 = 75 hogares de la muestra


n2 = 85 75*14,11 = 1058 hogares en la población

En la población total: (663+1058) = 1721


hogares, es decir 86,05% tienen un gasto
superior a los 500 Bs.
MUESTREO
ALEATORIO POR
CONGLOMERADO
S
MAC

85
Características

Se usa cuando la población estudiada se


suele encontrar concentrada, en ciertas áreas
o cúmulos de población:

Escuelas
Iglesias
Edificios
Almacenes
Características

En el muestreo por conglomerados se


muestrean primero los conglomerados, se
puede usar por MAS o MASIS y si fuera el
caso se separa por estratos.

Una vez seleccionados los conglomerados, se


puede muestrear al interior de cada
conglomerado, también por MAS o MASIS.
Muestreo por etapas

En el MAC, se puede ir aplicando el muestreo


por etapas:

Primero municipios urbanos


Segundo Barrios
Tercero manzanos
Cuarto viviendas.
Cálculo del tamaño de la muestra

1. Defina el objetivo:
1. Cuantitativo (media)
2. Cualitativo (proporción)
2. Defina el tipo de Población:
1. Finita (Numerable)
2. Infinita (No enumerable)
3. Defina el nivel de confianza (1-)
1. 99% Se usa para controles de calidad.
2. 95% Se usa para estudios de mercado de negocios
3. 90% Se usa para investigaciones sociales
4. Defina el error de estimación
1. Si es cuantitativo, el error es un número
2. Si es cualitativo, el error es un porcentaje
89
+

90
91
Determinación del error, considerando la
amplitud del intervalo

• Estimación de proporciones • Estimación de promedios


Población Infinita Población Infinita

𝑝·𝑞 𝜎
𝑒 ≤∙ 𝑍1−𝛼/2 · 𝑒 ≤ 𝑍1−𝛼/2 ·
𝑛 𝑛

Población Finita Población Finita

𝑝·𝑞 𝑁−𝑛
𝑒 ≤ 𝑍1−𝛼/2 · 𝜎 𝑁−𝑛
𝑛 𝑛−1 𝑒 ≤ 𝑍1−𝛼/2 ·
𝑛 𝑛−1

El error máximo es 2 veces la desviación de la media muestra


Determinación del tamaño de la muestra

• Estimación de proporciones • Estimación de promedios


Población Infinita Población Infinita
2 2
𝑍1−𝛼/2 ·𝑝·𝑞 𝑍1−𝛼/2 · 𝜎2
𝑛= 𝑛=
𝑒2 𝑒2

Población Finita Población Finita


2
𝑍1−𝛼/2 ·𝑝·𝑞·𝑁 2
𝑛= 𝑍1−𝛼/2 · 𝜎2 · 𝑁
𝑍 2 · 𝑝 · 𝑞 + (𝑁 − 1)𝑒 2 𝑛=
𝑍 2 · 𝑆 2 + (𝑁 − 1)𝑒 2

Si no se conoce la desviación 𝑥𝑖 − 𝑥
𝜎=𝑠=
poblacional: 𝑛−1
Tamaño de la muestra
Estimación de proporciones

POBLACIÓN INFINITA POBLACIÓN FINITA


𝑒 𝑍 𝑝 𝑞 + (𝑁 1
Datos de entrada Datos de entrada
Probabilidad de éxito (p) 70% Tamaño de la población (N) 300
Probabilidad de fracaso (q) 30% Probabilidad de éxito (p) 60%
Probabilidad de fracaso (q) 40%
Nivel de confianza (1 - α) 95%
Nivel de confianza (1 - α) 95%
Error estimado ( e ) 5%
Error estimado ( e ) 10%

Nivel de significación (α ) 5% Nivel de significación (α ) 5%


Buscar en tablas (1- α/2) 0,975 Buscar en tablas (1- α/2) 0,975
Valor de Z en tablas (Z) 1,96 Valor de Z en tablas (Z) 1,96
Tamaño de la muestra 323 Tamaño de la muestra 71
94
Tamaño de la muestra
Estimación de promedios

POBLACIÓN INFINITA POBLACIÓN FINITA


𝑒 +( )
Datos de entrada Datos de entrada
Desviación estándar (S) 5,0 Tamaño de la población (N) 2000
Varianza (S2) 25,0 Desviación estándar (S) 2
Varianza (S2) 2,76
Nivel de confianza (1 - α) 95%
Nivel de confianza (1 - α) 90%
Error estimado ( e ) 1,0
Error estimado ( e ) 0,20

Nivel de significación (α ) 5% Nivel de significación (α ) 1%


Buscar en tablas (1- α/2) 0,975 Buscar en tablas (1- α/2) 0,995
Valor de Z en tablas (Z) 1,96 Valor de Z en tablas (Z) 2,58
Tamaño de la muestra 96 Tamaño de la muestra 372

95
Calculo del tamaño de la muestra

Obtener una muestra para estimar el consumo de pan en La Paz, sabiendo que a nivel
nacional la media es de 10 panes por semana con una desviación de 2 panes. Se quiere
asumir un error de 5% sobre la desviación estándar.

Determinar la muestra necesaria para estimar la proporción de personas que todavía


mantienen la preferencia con el gobierno actual, sabiendo que hace un año la
preferencia era del 65%, con un error del 5%.

Sabiendo que la población universitaria en la UPEA alcanza a 35.000 estudiantes,


obtenga una muestra con un 99% de confianza, para conocer la proporción de
estudiantes que beben al menos una vez por semana, con un error del 5%.

Calcular la muestra para estimar el consumo de sal por año. Si en un pequeño sondeo se
ha encontrado un promedio de 500 gramos con una desviación de 100 gramos. Asuma
un error de 10% sobre la desviación estándar.

96

Potrebbero piacerti anche