Sei sulla pagina 1di 5

(Semana 3) Selección de muestra

Para seleccionar la muestra de la GEIH, se usó un tipo de muestreo


estratificado probabilístico para la variable género (información homogénea a
lo interno y heterogénea entre sí).
Es necesario decir que previamente se realizó un análisis exploratorio
con la base de datos, esto con la finalidad de descartar a los encuestados
que dejaron vacía las características objeto de estudio. En consecuencia,
inicialmente la GEIH era de 60356 observaciones y quedó finalmente de
57550 observaciones.
La ecuación para obtener el tamaño de la muestra fue:
l

 N PQ i i i
n i 1
l

 N PQ i i i
NE  i 1
N
d2
E
(Z  )2
1
2

Ni
ni  N ( )  n(W)
N
N= tamaño de la población (57550)
Z= Nivel de confianza (95%)
P= proporción de mujeres en la población (0,50)
Q= proporción de hombres en la población (0,50)
E= error máximo de estimación (5%)
Los cálculos se ubican en el archivo Excel, en la pestaña “MUESTRA“. Así, la
tabla 1 muestra el resumen y tamaño de la muestra.

Tabla 1. Muestreo estratificado


Estrato Ni Pi PiQi NiPiQi Wi ni
Mujer 30596 0,5 0,5 7649 0,53 203
Hombre 26954 0,5 0,5 6738,5 0,47 179
Total 57550 14387,5 382

(Semana 4) Intervalo de confianza para dos variables numéricas

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados,
¿Existen diferencias?

Al observar visualmente ambos histogramas, se evidencia un leve


variabilidad respecto al promedio de años de escolaridad entre hombres y
mujeres (dividir la desviación entre el promedio). Además, se ve que los
hombres poseen mayor escolaridad que las mujeres. Lo expuesto hace
pensar que existen diferencias entre los años de escolaridad de los hombres
y las mujeres.
Histograma para las mujeres
70
59
60
50
40 37
26 26 27
Frecuencia

30
20 15
9
10 1 0 1 1 0 0 0 1
0

...
,9
,9

,6
,5
,4

,1
y m ,1
10

,8
,7
,6

,4
,3
,2

or
10
11

15
16
17

21
22
12
13
14

18
19
20

ay
Años

Histograma para Hombres


40 37
29 30 29
30 23
20 13
Frecuencia

10 5 8
2 1 0 0 0 1
0
...
12

13

14

15

16

y m 22
10

11

17

18

19

20

21

or
ay

Años

1. Asumiendo que los datos son normales, calcule un intervalo de


confianza del 95% para estimar, la escolaridad promedio de los
hombres y de las mujeres de forma individual, en los niveles de
estudio de Bachiller, Tecnólogo y Universitario.
Los intervalos de confianza, son valores que buscan acotar al
verdadero valor del parámetro, que en este caso es el promedio de años de
escolaridad entre hombres y mujeres. La ecuación usada para este fin fue:

s
X  Z / 2
n
Los cálculos para hallar los valores inferiores y superiores correspondientes
a un intervalo de confianza del 95% para el promedio de años de escolaridad
en hombres y mujeres, están en el archivo Excel, la pestaña “S4(Intervalos)”.
Así, los intervalos encontrados fueron:
Mujeres (12,84 - 13,40): esto indica que con un 95% de confianza el valor
del promedio poblacional para los años de escolaridad de las mujeres está
entre 12,84 y 13,40 años.
Hombres (13,07 - 13,68): esto indica que con un 95% de confianza el valor
del promedio poblacional para los años de escolaridad de los hombres está
entre 13,07 y 13,68 años.

2. Asumiendo que los datos son normales, calcule un Intervalo de


confianza al 95% para estimar la diferencia promedio de escolaridad
para los hombres y mujeres, en los niveles de estudio de Bachiller,
Tecnólogo y Universitario.

La ecuación para construir un intervalo de confianza para la diferencia


de promedios es:

1 1
X H  X M  Z / 2 * s 2 (  )
nH nM
Los cálculos se encuentran en el archivo Excel, la pestaña “S4(Intervalos)”.
Así los limites encontrados para la diferencia promedio de escolaridad entre
hombres y mujeres fueron:
0, 26  0, 42
(0,16  0, 26)
La estimación puntual para la diferencia de dos promedios poblacionales de
la escolaridad entre hombres y mujeres es de 0,26 años. El margen de error
es 0,42 años y la estimación por intervalo de 95% de confianza para dicha
diferencia va desde -0,16 años hasta 0,26 años. Se puede notar que en este
intervalo se incluye al cero (0), lo cual indica que las diferencias observadas
entre los promedios de años escolaridad son significativos y no se deben al
azar.

REFERENCIAS

Anderson, D; Sweeney, D y Williams, T. (2008). Estadística para


administración y economía. Décima edición Editorial: CENGAGE
Learning. México.

Mendenhall, W; Beaver, R y Beaver, B. (2010). Introducción a la probabilidad


y estadística. Décima tercera edición. Editorial: CENGAGE Learning.
México.

Martínez, C. (2012). Estadística y muestreo. Décima tercera edición. Ecoe


Ediciones Bogotá - Colombia.

Potrebbero piacerti anche