Sei sulla pagina 1di 55

MUESTREO BÁSICO

MUESTREO ALEATORIO SIMPLE


(M.A.S.)
MUESTREO ALEATORIO
SIMPLE (M.A.S.)
• Método de selección de la muestra en un paso
• El marco muestral debe ser una lista completa
• Cada unidad tiene la misma probabilidad de
selección
• Esta probabilidad es p = n/N
– donde n es el tamaño de la muestra
– y N es el tamaño de la población
• Cada muestra (de n) tiene la misma
probabilidad de selección
Muestreo Aleatorio Simple
• Población N = 54 viviendas
• Muestra n = 18
• Fracción muestral p = n / N = 18 / 54 = 1/3
• Cada vivienda tiene probabilidad de selección 1/3
• Se seleccionan 18 números aleatorios entre 1 y 54
• Se seleccionan las viviendas correspondientes
Muestreo
Muestreo Aleatorio
Aleatorio Simple
Simple

San José

Av 28 de Julio San Luis Av. circunvalación

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo domingo

San Pedro
Muestreo
Muestreo Aleatorio
Aleatorio Simple
Simple

San José

Av. 28 de Julio San Luis Av Circunvalación

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo Domingo

San Pedro
Muestreo
Muestreo Aleatorio
Aleatorio Simple
Simple

San José

Av. 28 de Julio San Luis Av Circunvalación

San Pablo

San Carlos

San Ricardo

San Roberto

San Benito

Santo Domingo

San Pedro
Muestreo Aleatorio Simple

Ventajas del MAS


• Sencillez conceptual
• Necesita como marco muestral sólo una
lista de todos los elementos de la
población
• Es fácil calcular las estimaciones de
valores poblacionales
• Es fácil calcular las estimaciones de
precisión (varianza muestral)
Muestreo Aleatorio Simple
Desventajas del MAS
• Tedioso eligir todos los números aleatorios si
n es grande
• No utiliza información auxiliar sobre la
población
• Necesita una lista completa de los
elementos de la población
• Puede tener baja precisión comparado con
otros métodos
Muestreo Aleatorio Simple

El MAS se puede realizar:

• Con reposición (MASCR)

• Sin reposición (MASSR)


Muestreo Aleatorio Simple
MASCR
• Seleccionar una unidad
• “Reemplazarla” en la población
• Seleccionar otra, de la población completa
• Continuar hasta obtener una muestra de
tamaño n
• Se puede seleccionar la misma unidad
más que una vez
Muestreo Aleatorio
Simple
MASSR:

• Seleccionar una unidad


• “Sacarla” de la población
• Seleccionar otra unidad de las que quedan y sacarla
• Continuar hasta obtener n unidades distintas
• Cada unidad puede estar incluida una sola vez
• Es más eficiente que el MASCR
• Se usa en la práctica
Ejemplo del MAS
Encuesta de las empresas sobre
Gastos en insumos
•Población de seis empresas (N = 6)
•Propósito: estimar gastos para compras
de insumos
•Presupuesto permite sólo una muestra
de dos empresas (n = 2)
Ejemplo del MAS
Población completa
Empresa Gastos
1 $ 26,000
2 470,000
3 63,800
4 145,000
5 230,000
6 12,500
Total 947,300
Muestras Gastos Estimación
posibles observados del total
(1,2) 496,000 1,488,000
(1,3) 89,800 269,400
(1,4) 171,000 513,000
(1,5) 256,000 768,000
(1,6) 38,500 115,500
(2,3) 533,800 1,601,400
(2,4) 613,000 1,845,000
(2,5) 700,000 2,100,000
(2,6) 482,500 1,447,500
(3,4) 208,800 626,400
(3,5) 293,800 881,400
(3,6) 76,300 228,900
(4,5) 375,000 1,125,000
(4,6) 157,500 472,500
(5,6) 252,500 727,500
15 muestras posibles promedio 947,300/6 : insesgado
ESTIMACION DEL TAMAÑO DE MUESTRA - “MAS”
VARIABLES CUANTITATIVAS

Elementos para calcular un tamaño de muestra


1. Información anterior de promedios y varianzas de variables
relacionadas con la investigación (Censos, encuestas,
pilotos).
2. Elegir un nivel de confianza
( 90%, 95%, 99%) . Generalmente
para estudios macroregionales,
regionales, locales se elige 95%.
Es decir: Z = K =
1.96 (abscisa de la distribución
Normal)
3. Decidir sobre el margen de error (e ) que estamos dispuestos
a tolerar (Error máximo permisible = Error Absoluto
aceptado).
( e=d. Donde : d = Error Relativo Aceptado).
4. Tamaño de la Población ( N )
Fórmula para estimar el
tamaño de la muestra (M.A.S.)
no
n 2 2
ZS
no , donde : no 
1 e 2

e = Margen de error. Es el error absoluto


del Promedio Poblacional ( e = d .  )

d = Es el error relativo aceptado (precisión)


MUESTREO ALEATORIO PARA PROPORCIONES
VARIABLES CUALITATIVAS O DE ATRIBUTOS

POBLACIÓN X
(N) NX  P
X
 Proporción poblacional
 N

= Número de elementos en la población, que tienen alguna


característica o atributo, o que caen dentro de alguna clase.
n

 Proporción muestral: pˆ 
 xi

Xˆ ESTIMADOR DE
LA PROPORCION

i 1
n POBLACIONAL
n

 Estimador del Total de
Xˆ  N pˆ
n
 Clase Poblacional
VARIANZA DE LA PROPORCION Y DEL TOTAL DE CLASE
MUESTRALES - “MAS”

En el muestreo aleatorio sin reposición las varianzas de la


Proporción muestral y del Estimador del Total de Clase
están dadas respectivamente por:

PQ  N  n  pˆ qˆ  N  n 
  V  pˆ   n  N  1 
VARIANZA DE LA
V ( pˆ )  ˆ
PROPORCION 
MUESTRAL n  N 1   

PQ  N  n 
 
2
N ˆ qˆ  N  n 
 
2 p
VARIANZA DEL
ˆ
V X   ˆ ˆ
V X N
ESTIMADOR DEL    
TOTAL DE CLASE n  N 1  n  N 1 

n
donde:  f es la tasa muestral o fracción de muestreo
N
ESTIMACION DEL TAMAÑO DE MUESTRA - “MAS”
(VARIABLES CUALITATIVAS O DE ATRIBUTOS)

 PQ  N  n  
Tenemos que: P  pˆ  P  Z     1
 n  N  1  

Tal que, el error de estimación no debe ser mayor que un valor


dado “e” ( ERROR MAXIMO PERMISIBLE O ERROR ABSOLUTO ACEPTADO):

 PQ  N  n  
 Z  pˆ  e  Z   e
2 2

2
 Z 2
   e 2

 n  N  1 
no
n
 1   no  1 , donde : no  PQ
2
Z
e = d.P
N e 2
d = error relativo
aceptado (precisión)
ERROR RELATIVO ACEPTADO

COEFICIENTE
DE VARIACIÓN

PRECISION NIVEL DE CONFIANZA: (1   )


MODELO
Error Máximo DE
MATRIZ PARA
Z = 1.645 Z = 1.96 Z = 2.38
Permisible (%)
d 90% 95% 98%
ESTIMAR EL
TAMAÑO DE
MUESTRA
10% 74
7% 152
5% 296
1% 890
ERROR RELATIVO ACEPTADO

COEFICIENTE
DE VARIACIÓN

PRECISION NIVEL DE CONFIANZA: (1   )


MODELO
Error Máximo DE
MATRIZ PARA
Z = 1.645 Z = 1.96 Z = 2.38
Permisible (%)
d 90% 95% 98%
ESTIMAR EL
TAMAÑO DE
MUESTRA
10% 53 74 105
7% 107 152 214
5% 210 296 418
2% 325 890 1370
MUESTREO SISTEMATICO
¿QUÉ ES UN MUESTREO
SISTEMATICO?
• Es otro muestreo que también le asigna
igual probabilidad de inclusión uniforme
para todos, como el simple al azar.
• Nuevamente esta probabilidad es n/N.
• Es conveniente por su simplicidad ya
que se necesita sólo un número
aleatorio.
• Fácil de seleccionar en campo o durante
el operativo
• Se logra en general una muestra más
“representativa” de la población.
¿QUÉ ES UN MUESTREO
SISTEMATICO? (cont.)

• No es necesario conocer el tamaño


de la población N si se conoce la
fracción de muestreo.
• Origina muestras bien dispersas
desde el punto de vista geográfico.
• Se emplea generalmente en las
últimas etapas en diseños en
varias etapas o más complejos.
¿Cómo se selecciona una muestra
sistemática?
• Paso 1: Fijar el tamaño de la muestra, n.
• Paso 2: Determinar un paso o intervalo,I=N/n.
• Seleccionar un número al azar entre 1 y I; sea
ese número igual a k.
• Seleccionar las unidades k, k+I, k+2I, k+3I,
k+4I,...... Hasta llegar a completar las n
necesarias.

1 2 3 N
¿Cómo se selecciona una muestra
sistemática?(cont.)
Muestreo Sistemático Circular, útil
cuando n no es múltiplo de N.
1 1
1 2
1
0 3
9
4
8 5
Arranque
aleatorio
7 6
MUESTREO SISTEMATICO: Ejem. 1
Población de tamaño N = 30, muestras
posibles sistemáticas de tamaño n = 6.
Intervalo selección k = N / n = 30/6 = 5
Muestras posibles de tamaño n = 6 :
1ra muestra: 1 6 11 16 21 26
2da muestra: 2 7 12 17 22 27

3ra muestra: 3 8 13 18 23 28
4ta muestra: 4 9 14 19 24 29
5ta muestra: 5 10 15 20 25 30
Ejem. 2: Seleccionar muestra de n = 20
empresas de lista de N = 500 empresas
• Esto significa que 1 de cada 25 empresas de la
población se seleccionará
• Utilizando # al azar seleccionamos un número entre 1
y 25.
• Suponga que el # seleccionado es 7.
• Entonces la 1ra empresa. selecc. es el # 7.
7
• Las otras 19 empresas de la muestra se obtienen
sumando al 7 el intervalo de selección 25.
• Es decir: 07, 32, 57 , ..........
Ejem.2 : La muestra de n = 20 empresas
seleccionadas de N = 500 empresas es:
07 32 57 82 107
132 157 182 207 232
257 282 307 332 357
382 407 432 457 482
 Una ventaja del método sistemático es que la
muestra se distribuye por igual en los diversas
empresas.
 Una M.A.S. tomada de la población no posee esta
propiedad.
Muestreo Estratificado
Aleatorio (M.E.A.)
Muestreo estratificado
• Proceso de división de la población en grupos
homogeneos llamados estratos, para luego
seleccionar muestras independientes en cada
estrato
• Variables de estratificación pueden ser
geográficas o no-geográficas
• Estratificación se limita a los elementos de
información disponibles en el marco muestral
RAZONES PARA LA ESTRATIFICACION
1. Protegernos contra la posibilidad de
obtener una mala muestra.
2. La estratificación se utiliza para disminuir las
varianzas de los estimadores ( disminuir la
varianza para obtener estimaciones más precisas)
3. Se pueden formar estratos para aplicar diferentes
métodos y procedimientos de muestreo dentro de
cada estrato. (Selección de la muestra y
procedimientos de recojo de información).
4. Los estratos pueden establecerse para dar
resultados a nivel de “DOMINIOS DE ESTUDIO”
(Nivel de inferencia)
MUESTREO ALEATORIO ESTRATIFICADO ( MAE )

POBLACION ESTRATOS
ESTRATO 1
(Empresas
grandes)
N1 n1
ESTRATO 2
(Empresas
medianas)
N2 n2
ESTRATO 3
(Empresas
pequeñas) N3 n3
L
Tal que, N  N1  N 2  N 3  N   Nh
h 1
L
n  n1  n2  n3  n   nh
h 1
Muestreo estratificado
Ejemplo 1 de M.E.A.
Estratificacion de
usuarios de la empresa
EDELNOR (parte de Lima)
ESTRATIFICACION DE LA POBLACION
DE 267,694 CLIENTES (EDELNOR)
Nº ESTRATOS Nº de clientes % de clientes
de (Sub-estaciones (Tamaño del (Poderación del
estrato estrato)
transformación) estrato)
h =1 Canto Grande N1 = 57,241 W1 = 21.4
h =2 Jicamarca N2 = 37,932 W2 = 14.2
h=3 Mirones N3 = 41,157 W3 = 15.4
h=4 Santa Rosa N4 = 66,440 W4 = 24.8
h=5 Tacna N5 = 64,924 W5 = 24. 2
TOTAL N = 267,694 100.0
MUESTRA DE 500 CLIENTES DE LA POBLACION DE
267,694 CLIENTES (EDELNOR)
Nº ESTRATOS % de clientes Nº de clientes
de (Sub-estaciones (Poderación del (Tamaño del
estrato estrato)
transformación) estrato)
h =1 Canto Grande W1 = 21.4 n1 = 107
h =2 Jicamarca W2 = 14.2 n2 = 71
h=3 Mirones W3 = 15.4 n3 = 77
h=4 Santa Rosa W4 = 24.8 n4 = 123
h=5 Tacna W5 = 24.2 n5 = 122
TOTAL 100.0 n = 500
RESULTADOS MUESTRALES DE 500 CLIENTES:
promedio muestral mensual y desviación estándar de consumo por
estratos
N° ESTRATOS Clientes Media Desviación
estándar
nh xh sh

1 Canto Grande 107 1,200 10,000


2 Jicamarca 71 800 6000
3 Mirones 77 3,000 30,000
4 Santa Rosa 123 2,350 25000
5 Tacna 122 2,100 20,000
TOTAL 500 2,000 22,000
AFIJACION DE LA MUESTRA
Se da el nombre de afijación al reparto,
asignación o distribución de la muestra (n)
entre los diferentes
n  nestratos.
 n  .....Tal
 nque:
n
1 2 3 L

1. AFIJACION PROPORCIONAL

 Nh 
nh  n    nWh
 N 
nh N h nh n
  o  o fh  f
n N Nh N
2. AFIJACION DE NEYMAN ( O DE MINIMA VARIANZA)
La afijación de Neyman o afijación de mínima
varianza, consiste en determinar los valores de nh
de forma que para un tamaño de muestra (n) fijo,
la varianza V ( X st ) sea mínima.

 
 N S 
nh  n  L h h 
 
  N h Sh 
 h 1 
2
donde : S : cuasivarianza poblacional del estrato h
h
3. AFIJACION DE OPTIMA

La afijación de óptima, consiste en minimizar la varianza


para un coste fijo.L Es decir, minimizarV ( X st ) con la
condición de que:  Ch nh  C
h 1

  donde :

 N h Sh C  C : costo total

nh  n  L h
 Ch : costo por unidad en el

 N h Sh  estrato h (costo unitario )

 Ch  S h2 : cuasivarianza poblacional
 h 1  del estrato h

NOTA: Cuando Ch = constante  h, la Afijación Optima


coincide con la Afijación de Neyman
Muestreo por conglomerados
Muestreo por
conglomerados
• Es un proceso de muestreo en dos
pasos
– Agrupar la población en
conglomerados que se pueden
identificar en mapas y en el terreno
– Seleccionar una muestra de
conglomerados y entrevistar todos los
elementos de aquellos
Muestreo por
conglomerados
• Conglomerados pueden ser
agrupaciones naturales o
artificiales
• Posiblemente disponibles de
fuentes como el Censo (manzanas,
etc.)
• Los que diseñan la encuesta tal vez
tengan que conformarlos
Muestreo por
conglomerados
• Se entiende la población como
jerarquía de unidades
–personas viven en viviendas
–viviendas constituyen manzanas
–muchas manzanas hacen una
ciudad

Encuesta
Encuesta de
de estudiantes
estudiantes

 = Escuelas  = Estudiantes

Muestra
Muestra por
por conglomerados
conglomerados

 =  = Estudiantes  = Seleccionados
Escuelas
Muestreo por
conglomerados
• Ventajas
– Se pueden utilizar aun cuando no haya lista de
unidades de la población
– Para entrevistas personales, el tiempo y costo
de viajes se reduce muchísimo, sobre todo para
poblaciones rurales
– Se necesita sólo una lista de conglomerados
– O la posibilidad de construirla
Muestreo por
conglomerados
• Desventajas
– Tendencia de unidades vecinas de ser semejantes
reduce la precisión
– Dado n fijo, sería menos eficiente
– Pero si se consideran los costos en el terreno, la
posibilidad de aumentar n implica menor pérdida
de precisión en la práctica
MUESTREO POR
CONGLOMERADOS
• En el muestreo por conglomerados, los elementos
individuales de la población sólo pueden participar en
muestra si pertenecen a un conglomerado (UPM)
incluido en la muestra.

• La UPM no es igual a la unidad de observación (USM),


y hay que tomar en cuenta los dos tamaños de
unidades experimentales al calcular los errores
muestrales de las muestras por conglomerados.
¿ PORQUE USAR MUESTREO
POR CONGLOMERADOS ?
• La construcción de una lista de unidades de
observación para el marco de muestreo puede ser
difícil, cara e imposible.
• La población podría estar muy dispersa
geográficamente o aparecer en cúmulos naturales,
como las escuelas, hospitales, manzanas, familias.
• El muestreo por conglomerados se utiliza en la
práctica debido a que es más barato y conveniente
obtener muestras por conglomerados que al azar
entre la población.
MUESTREO POR
CONGLOMERADOS

• La población está particionada en N conjuntos que


llamaremos “Conglomerados”
• No se cuenta con una lista de unidades de la población, pero
se tiene una lista de los conglomerados.
• La forma de obtener una muestra consiste en escoger n
conglomerados, y en cada uno de ellos se observan todas las
unidades de población que estaban en cada conglomerado
selecionado.
• Este procedimiento de obtener la muestra se denomina
muestreo por conglomerados.
MUESTREO POR
CONGLOMERADOS : Ejemplo
Número de niños por manzana
Las 3510 manzanas de una ciudad se localizan
en 90 poblados (urbanizaciones, AAHH y
conjuntos habitacionales).
El número de manzanas en las diferentes
urbanizaciones, AA.HH., C.H. no es el
mismo .
Se selecciona una muestra aleatoria simple de
15 poblados y se determina el # de niños por
manzana.
MUESTREO POR
CONGLOMERADOS : Ejemplo3
• Promedio de Niños por manzana = 12.24
• La estimación de la varianza del promedio de
niños es de = 0.5854
• El Error Muestral absoluto de la estimación de
la varianza del promedio de niños por manzana es la
Raíz cuadrada de = 0.5854. Es decir :
Error muestral = 0.7651 niños por manzana
Error muestral relativo = .7651/12.24 =
6.25 %

Potrebbero piacerti anche