Sei sulla pagina 1di 12

Trabajo Final

SUBGRUPO 19

Profesor: Domínguez Andy

Alumnos
Yeymi Carina Rocha Bejarano
Marco Antonio Cortes Rojas
Gabriel Darío Garcia Arias

Institución Universitaria
Politécnico Grancolombiano
Estadística II
2018
TABLA DE CONTENIDO

OBJETIVOS ................................................................................................................... 3
CONTEXTO ................................................................................................................... 4
Parte 1 Selección de muestra ........................................................................................ 4
Parte 2 Intervalo de Confianza para dos variables numéricas ........................................ 6
Parte 3 Prueba de hipótesis para dos variables nominales ............................................ 8
CONCLUSIONES ........................................................................................................ 11
REFRENCIAS .............................................................................................................. 12
OBJETIVOS

1. Conocer los criterios técnicos que hay que tener en cuenta antes de
seleccionar un tamaño de muestra.

2. Identificar el tipo de muestreo de acuerdo a los objetivos del estudio.

3. Calcular el tamaño de la muestra cuando el estudio es descriptivo.

4. Diferenciar y analizar las ventajas y desventajas de la estimación por


intervalos de confianza y las pruebas de hipótesis.

5. Determinar la prueba o técnica apropiada a aplicar en las diferentes


pruebas de hipótesis paramétricas.
CONTEXTO

A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares


(GEIH), realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades
principales del Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y
11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se
solicita información sobre las condiciones de empleo de las personas (si trabajan,
en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están
buscando empleo), además de las características generales de la población como
sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de
ingresos. La GEIH proporciona al país información a nivel nacional, cabecera -
resto, regional, departamental, y para cada una de las capitales de los
departamentos.

Parte 1 Selección de muestra

En ocasiones en que no es posible o conveniente realizar un censo (analizar a


todos los elementos de una población), se selecciona una muestra, entendiendo
por tal una parte representativa de la población. En ese sentido, escoja un tipo de
muestreo y argumente la viabilidad de esta técnica para la base de datos dada.
Para seleccionar una muestra debe tenerse en cuenta el cómo seleccionar los
elementos que formarán parte de la muestra (tipo de muestreo) y cuántos
elementos debemos seleccionar (Tamaño de muestra).

El tipo de muestreo a utilizar es un muestreo aleatorio simple, debido a que es la


técnica de muestreo en la que todos los elementos que forman parte de la
población que se está estudiando o identificando tienen idéntica probabilidad de
ser seleccionados para la muestra. Sería algo así como hacer un sorteo justo
entre los individuos del universo: asignamos a cada persona un boleto con un
número correlativo, introducimos los números en una urna y empezamos a extraer
al azar boletos. Todos los individuos que tengan un número extraído de la urna
formarían la muestra. Obviamente, en la práctica estos métodos pueden
automatizarse mediante el uso de ordenadores.
En este caso y al tener una base de Datos en Excel puede realizarse una muestra
aleatoria a través de las opciones de muestreo que nos facilita esta herramienta.
Para realizar un muestreo aleatorio simple al lado de la Columna G (Columna
P6020) se debe agregar otra columna que donde se debe crear un número
aleatorio mediante la función de Excel ALEATORIO. Con la formula
=ALEATORIO () para crear un número aleatorio entre 0 y 1 de muchos decimales.
Luego se debe seleccionar las 2 columna, asegurándose que selecciona primero
la columna nueva con los numero aleatorios y después la G y ordene las celdas
de menor a mayor. Una vez seleccionadas ambas columnas, active el orden de
menor a mayor que se encuentra a la derecha de la pantalla de Excel.
Los valores elegidos para la muestra son los que van de la celda G1 hasta el
tamaño de su muestra. En este caso seleccionaremos una muestra de 1000
datos.
La proporción de las Mujeres es de 55% en la muestra elegida.
Nivel de Confianza 95 %
Error de Estimación 0.05
Parte 2 Intervalo de Confianza para dos variables numéricas

Un investigador, cree determinar que existen diferencias entre los niveles de


estudio de los hombres y las mujeres en Colombia. Para determinar lo
anterior, use la “muestra” encontrada en la semana 3:

Histograma
160

140

120

100

80

60

40
Total
20

0
Ninguno

Ninguno
Bachiller

Técnico o tecnológico

Bachiller

Técnico o tecnológico
Universitario

Universitario
Postgrado

Postgrado

Hombre Mujer

Conclusiones:

● En la muestra seleccionada se evidencia más Mujeres con Bachillerato,


Técnico o Tecnólogo, Universitario y sin ningún estudio, la cantidad de
hombres y mujeres que pueden llegar a ser algo similares son los que
realizaron Postgrados.
Desviación estándar e intervalos de confianza para las mujeres

Genero Mujer

Cuenta de
P6220 P6220 Promedio Intervalo
Bachiller 122 55% 7,92732539
Ninguno 18 8% 20,6381302
Postgrado 11 5% 26,4003848
Técnico o
tecnológico 34 15% 15,0164454
Universitario 38 17% 14,2041353
Total general 223
Desviación
Estándar 44,67437744
Tamaño de la
Muestra 240
Intervalo de
Confianza 95%
Alfa 5%

Desviación estándar e intervalos de confianza para los Hombres

Genero Hombre

Cuenta de
P6220 P6220 Promedio Intervalo
Bachiller 127 66% 8,64937306
Ninguno 14 7% 26,0508844
Postgrado 9 5% 32,4911614
Técnico o
tecnológico 19 10% 22,3619509
Universitario 24 12% 19,8966916
Total general 193
Desviación
Estandar 49,73228328
Tamaño de la
muestra 185
Intervalo de
Confianza 95%
En general se puede evidenciar en la muestra seleccionada que existe en
promedio dentro del hombre un nivel académico de 66% con Bachillerato mientras
que en las mujeres es del 55%. Las mujeres superan a los hombres en nivel de
educación para los cursos de Postgrados Técnicos o Tecnólogos y Universitario

Parte 3 Prueba de hipótesis para dos variables nominales

Un investigador, cree determinar que los hombres asisten más a un colegio oficial
que las mujeres en Colombia.

1. Utilizando la variable si actualmente asiste a un establecimiento oficial


(P6175) y sexo (P6020), realice un diagrama de barras comparativo para los
hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen
diferencias?

140
Establecimiento Oficial

120

100

80

60 Total

40

20

0
No Sí No Sí
Hombre Mujer
En el diagrama de barras se puede evidenciar que según la muestra seleccionada
existen más mujeres que estudian en un establecimiento oficial.

2. Con un nivel de confianza del 95%, estime e interprete la proporción de


hombres y de mujeres que asisten a un establecimiento oficial.

Cuenta de
Genero P6175 P6175
Hombre No 44
Hombre Sí 106
Total Hombre 150
Mujer No 36
Mujer Sí 117
Total Mujer 153
Total general 303
Desviación Estándar 47,96092159
Tamaño de la Muestra 303
Nivel de confianza 95%
Alfa 5%
Media Hombres 75
Intervalos Hombres 67,325 82,675
Media Mujeres 76,5
Intervalos Mujeres 68,825 84,175

Según los intervalos de confianza existen mayor proporción de Mujeres que


hombres que estudian en un establecimiento oficial, se puede evidenciar en los
límites superiores de cada intervalo.
3. Realice una prueba de hipótesis para determinar la afirmación del
investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de
lo anterior?

Datos del Prueba de Hipótesis para proporción:


problema muestra grande

p gorro 48% Proporción Hipotética 51%

n 303

Alpha 5%

Tipo p-value
H0: p > 51% 0,1480 no rechazo

Según la prueba de Hipótesis No se rechaza esto quiere decir que efectivamente


existen mas mujeres que hombres estudiando en un establecimiento Oficial.
CONCLUSIONES

Con base a esta información se llega a la conclusión que el método que mayor
beneficio aporta es el de muestreo probabilístico puesto que sus resultados suelen
ser más representativos y los del muestreo no probabilístico se esfuerza en obtener
datos que efectivamente sea representativos.

En el muestreo no probabilístico deben de presentar sus características originales,


sus resultados son útiles si se hace un buen uso de ellos. En los métodos
de muestreo probabilísticos sus planteamientos teóricos resultan ser muy
exigentes.

Estos métodos de muestreo resultan de gran importancia para realizar una


investigación en una población determinada puesto que si se quiere realizar dicha
investigación con mayor éxito en cuestión de resultados, entonces se tiene que
optar por una de estas dos técnicas, de igual manera estas técnicas requieren de
un menor tiempo y recursos.

El muestreo es por lo tanto una herramienta de la investigación cuya función


es determinar que parte de una población debe examinarse, con la finalidad
de hacer conclusiones sobre dicha población.

La muestra debe obtener una representación adecuada de la población, en


la que se represente de la mejor manera los rasgos esenciales de dicha
población que son importantes para la investigación. Para que una muestra sea
representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias
encontradas en la población, es decir ejemplificar las características de ésta.

Durante el transcurso de este trabajo se pudo analizar las características de una


población bastante grande que bajo una muestra de 1000 personas se logró
identificar las características de esta población bajo métodos estadísticos como
Intervalos de confianza y pruebas de hipótesis.
REFRENCIAS

- Cartillas de Estudio Politécnico Grancolombiano “Autor: Rogelio


Alvarado Martinez” Muestreo y Distribuciones Muéstrales, Estimación de
Parámetros, Intervalos de Confianza, Pasos para probar una hipótesis”
- Inferencias Estadística “ Miguel Ángel Gomez Villegas” Diaz de Santos
Universidad Complutense de Madrid
http://www.editdiazdesantos.com/wwwdat/pdf/9788479786878.pdf

Potrebbero piacerti anche