Sei sulla pagina 1di 13

TRABAJO COLABORATIVO ESTADISTICA

Presentado por:

Estupiñan Sotelo Brilly Yuressy


Leidy Lorena Andrade perez

Presentado a:
ANDY DOMINGUEZ

POLITECNICO GRANCOLOMBIANO

Administración de empresas
Estadística II
2019
OBJETIVOS

Objetivo general

El trabajo colaborativo está basado en analizar el módulo de estadística en el cual


nos da la Gran Encuesta Integrada de Hogares (GEIH) un aprendizaje del muestreo
de una población y estimación de parámetros y calcular el intervalo de confianza

Objetivos específicos

- Aprender e implantar las distintas metodologías

- Realizar temas de tamaño de muestral, variable

- Entender los conceptos de proporcionalidad y de prueba de hipótesis.


DESARROLLO DE LA ACTIVIDAD

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares


(GEIH), realizada por el DANE. Esta encuesta se hace en las 13 ciudades
principales de Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11
ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita
información sobre las condiciones de empleo de las personas (si trabajan, en qué
trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando
empleo), además de las características generales de la población como sexo, edad,
estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH
proporciona al país información a nivel nacional, cabecera - resto, regional,
departamental, y para cada una de las capitales de los departamentos.

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos


los elementos de una población), se selecciona una muestra, entendiendo por tal
una parte representativa de la población. En ese sentido, escoja un tipo de muestreo
y argumente la viabilidad de esta técnica para la base de datos dada. Para
seleccionar una muestra debe tenerse en cuenta el cómo seleccionar los elementos
que formarán parte de la muestra (tipo de muestreo) y cuántos elementos debemos
seleccionar (Tamaño de muestra).

Consideramos como alternativa correcta para la base de datos dada que es


viable usar el muestreo probabilístico específicamente con muestreo
aleatorio estratificado porque permite evaluar objetivamente las estimaciones
de las características de la población que resultan de la muestra. Teniendo
en consideración que la base de datos asignada es específica, completa, con
elementos de la población clara y sin ambigüedades.

1. Utilizando la variable género P (6020) determine el tamaño de la muestra


seleccionando adecuadamente justificando:
a. Fórmula a desarrollar
n = muestra
p = Porcentaje en que el fenómeno se produce, para efectos de los cálculos es de
50.
q = Porcentaje complementario (100 – p), para efectos de los cálculos es de 100 –
50
E = Error máximo permitido para efectos de los cálculos es de 5%.
Z = Error de muestreo, teniendo en cuenta el coeficiente de confianza para efectos
de los cálculos es de 1.96, debido a que el nivel de confianza establecido es de 95%

n = (1.96)2 * 50 * 50
52

n = 3.84 * 50 * 50
25

n = 9604
25

n = 384

La muestra representativa para el anteproyecto es de 384.

b. Estimación de la proporción de mujeres

Al analizar la proporción por sexo de la muestra, se obtiene que:

Sexo Número Porcentaje


Hombre 184 47.92%
Mujer 200 52.08%
TOTAL 384 100.00%
Se evidencia que, la mayor proporción de la muestra es de mujeres, quienes con un
52.8% tienen mayor representatividad, frente al género masculino. Estos resultados
siguen la tendencia poblacional de Colombia, pues históricamente las estadísticas
han demostrado que la mayor proporción de habitantes colombianos es femenina.

c. Nivel de confiabilidad

Datos hombres
Intervalos de confianza
7.17865449 7.96268542

Dentro de la muestra seleccionada, existen 184 hombres y al realizar los cálculos


se evidencia que los intervalos de confianza, se evidencia que se encuentra entre
7.17 y 7.96.

Datos mujeres
Intervalos de confianza
7.51184376 8.87357291

Por su parte, las mujeres tienen un intervalo de confianza mayor, oscilando entre
7.51 y 8.87.

d. Error de estimación

Para determinar el grado fiabilidad de los cálculos estadísticos, es importante tener


claridad sobre el error de estimación, se puede calcular mediante la siguiente
formula:

E = ((z)2 * p* q / n)1/2

E= Determinado de acuerdo a Castellanos (2012, p 96)


n = Número de unidades que integran la muestra, para efectos de los cálculos es
de 384
p = Porcentaje en que el fenómeno se produce, para efectos de los cálculos es de
50.
q = Porcentaje complementario (100 – p), para efectos de los cálculos es de 100 –
50
Z = Error de muestreo, teniendo en cuenta el coeficiente de confianza para efectos
de los cálculos es de 1.96, debido a que el nivel de confianza establecido es de 95%

E = ((1.96)2 * 50* 50 / 384)1/2


E = (3.84 * 50* 50 / 384)1/2
E = (9604 / 384)1/2
E = (25.0101)1/2
E = 5.00
El error aceptado es de 5.

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de
los hombres y las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Según los resultados, ¿Existen
diferencias?
Histograma hombres

5624
3155
2915
1433

1375
1355
1340

1278

1261
1244
1210

1106

955
833
797

752

589

393

271
268
97

41
37

20
16

13
6
4
0 1 2 3 4 5 6 7 8 9 1 01 11 21 31 41 51 61 71 81 92 02 12 22 32 42 52 6

Al analizar la escolaridad por años, se evidencia como en la población


masculina la mayor proporción de hombre tiene once años de educación, lo
cual considerando que son once años de bachillerato y que, de acuerdo a
datos establecidos por el Ministerio de Educación, la capacitación técnica en
promedio tiene 1 año de duración (MinEducación, 2014), se puede afirmar
que el nivel de capacitación más común.

De igual manera, se evidencia que la proporción de los hombres con más de


18 años de nivel educativo es baja, pues al sumar conjuntamente los
hombres con más de este número de años, se obtiene un personaje conjunto
de 3.26%

Con respecto a la escolaridad de las mujeres, se evidencia que el 41.5% de


la muestra cuenta con más de 11 años de escolaridad. Sin embargo, dentro
del grupo seleccionado para los cálculos, no existen mujeres con más de 20
años de educación.
Histograma mujeres

6530
3678
3016

1719
1461
1459

1441

1389
1380
1373

1331
1304

1140

1068
853
806

736

475

329
303
68
39
34
14
11

5
4
3
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

Se evidencia que, tanto hombres como mujeres tienen una mayor proporción
de 12 años de escolaridad, de igual manera en los dos grupos, en el género
femenino como masculino solo cuentan con nivel de bachillerato.

2. Asumiendo que los datos son normales, calcule un intervalo de


confianza del 95% para estimar, la escolaridad promedio de los
hombres y de las mujeres de forma individual, en los niveles de estudio
de Bachiller, Tecnólogo y Universitario.

De acuerdo al Ministerio de Educación Nacional de Colombia, el promedio de


número de años a nivel de bachillerato es de 11 años, el tecnológico son dos años
y el universitario o profesional como mínimo son 4 años más (MINEDUCACION,
2014)

Teniendo en cuenta lo anterior, obtienen los siguientes cálculos mediante la


utilización de la variable ESC:

Para la población masculina, al analizar los niveles de estudio de bachiller,


tecnólogo y universitario se encuentra una media de 6.16, de igual manera calcular
los intervalos de confianza se evidencio que se encuentra entre 4.71 y 6.20, para
los 184 hombres encuestados en la muestra.
Datos hombres
Media 6.167
Desviación Estandar 10.1
Confianza 95%
Tamaño de muestra hombres 184
Alfa 5%
Z 1.96

Intervalos de confianza
4.71281383 6.20375543

Al analizar el mismo grupo, las mujeres con un número de 200 encuestadas y una
proporción de 52.08%, los intervalos de confianza son de 5.23 y 8.60 para las
mujeres con niveles de estudio bachiller, tecnólogo y universitario.

Datos mujeres
Media 6.917
Desviación Estandar 12.1
Confianza 95%
Tamaño de muestra
mujeres 200
Alfa 5%
Z 1.96

Intervalos de confianza
5.23327621 8.60005712

3. Asumiendo que los datos son normales, calcule un Intervalo de


confianza al 95% para estimar la diferencia promedio de escolaridad
para los hombres y mujeres, en los niveles de estudio de Bachiller,
Tecnólogo y Universitario.

La media de los niveles educativos de bachiller, tecnólogo y universitario es de


6.167 y para las mujeres la media de estos mismos niveles de educación es de
6.917, por lo tanto, la diferencia promedio entre hombre y mujeres es de:0.750
Diferencia promedio entre hombres y
mujeres
0.750

Un investigador, cree determinar que los hombres asisten más a un colegio


oficial que las mujeres en Colombia. Para determinar lo anterior, use la
“muestra” encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial


(P6175) y sexo (P6020), realice un diagrama de barras comparativo para
los hombres y mujeres en un solo gráfico. Según los resultados,
¿Existen diferencias?

Al analizar la variable P6175, denominada EL ESTABLECIMIENTO AL QUE


ASISTE ... ¿ES OFICIAL?, a la cual se respondía sí o no, se evidencio que dentro
de la base de datos se presentaban datos faltantes, lo cual se vio reflejado
igualmente en la muestra seleccionada. Al realizar los cálculos, se evidencio que:

Actualmente asiste a un
establecimiento oficial

11
MUJER
101

7
HOMBRE
94

0 20 40 60 80 100 120

NO SI

Cuando se analiza la proporción de personas que asisten a un establecimiento


oficial, lo que traduce a instituciones públicas, tal y como se muestra en la gráfica,
la mayor proporción tanto en hombres como mujeres de la muestra coinciden en
que si pertenecen a una institución de carácter oficial. De igual manera, se resalta
que conjuntamente, solo 18 personas de la muestra no asisten o asistieron a un
establecimiento oficial.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de


hombres y de mujeres que asisten a un establecimiento oficial.

Actualmente asiste a un establecimiento oficial


SI NO
MUJER 47.42% 5.16%
HOMBRE 44.13% 3.29%

Al analizar la proporcionalidad, se evidencia que el mayor número de asistencia a


un establecimiento comercial se genera en el grupo de mujeres, pues representa el
47.42%, sin embargo, la diferencia en puntos porcentuales con los hombres es de
3.29. Se observa que conjuntamente la proporción de personas que no han asistido
a un establecimiento oficial de educación es de 8.45%.

3. Realice una prueba de hipótesis para determinar la afirmación del


investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede
decir de lo anterior?

El investigador afirma que los hombres asisten más a un colegio oficial que las
mujeres en Colombia, por lo cual de ser así más del 50% debe asistir a este tipo de
instituciones educativas, se realizan los siguientes cálculos:

H 0 = Los hombres asisten más a un colegio oficial que las mujeres en


Colombia

H0=H> 50.01%
H1=H< 50.01%
media 44.13%
N 384
n 195.00 Personas que dieron respuesta a la
pregunta, según la muestra
Desviacion estandar 4.949
Significancia 0.05 Nivel de confianza 95%
Alfa 5% alfa/2 0.025
Z critico derecho -1.96
Z critico izquierdo 1.96 Z prueba -0.005953

Teniendo en cuenta que, para aceptar una hipótesis el valor Z prueba debe estar
dentro de los rangos críticos, no se acepta la hipótesis expresada por el
investigador, por lo cual se rechaza la afirmación de que los hombres asisten más
a un colegio oficial que las mujeres en Colombia, dado que el valor de Z prueba es
de -0.0059.

CONCLUSIONES

El trabajo colaborativo nos permitió entender de manera más clara acerca de la


estadística ll y lo esencial que esta es para analizar una población, muestra y
variable de un teme especial con datos, la estadística ll ayuda a la comprensión y
entendimiento para organizar, analizar y tomar decisiones que estén de acuerdo
con los análisis efectuados por encuestas como medidas de tendencia central,
análisis de datos y resultados presentes en un gráfico, histograma y polígonos de
frecuencia, permitiendo hallar respuestas a numerosas investigaciones, con el fin
de obtener datos y analizar la información presentada para su fácil acceso o
manipulación por ultimo dando un resultado de correcta interpretación de estos

Potrebbero piacerti anche