Sei sulla pagina 1di 3

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLÍN

ESCUELA DE ESTADÍSTICA

SEGUNDO TRABAJO Pruebas de Hipótesis y Bondad de Ajuste (10%) SEM. 02 – 2019

# cédula usado Grupo:

Nombre Completo D. I.

Nombre Completo D. I.

La base de datos con la que le corresponde trabajar se obtiene como una muestra
aleatoria de una gran base de datos. La base original corresponde a los resultados
obtenidos por los jóvenes de todo el país en las pruebas Saber 11, del año 2019. Dicha
base contiene las variables: DEPARTAMENTO, MUNICIPIO, CALENDARIO,
NATURALEZA, JORNADA, EVALUADO, PROMLECT (Promedio obtenido en Lectura
Crítica), PROMMATE (Promedio obtenido en Matemáticas), PROMSOCIAL (Promedio
obtenido en Ciencias Sociales y Ciudadanas), PROMCIENCIA (Promedio obtenido en
Ciencias Naturales) y PROMINGLES (Promedio obtenido en Inglés). Solo se trabajará con
los departamentos de Antioquia y Valle.

Cada pareja debe generar una base de datos, que corresponderá a una muestra de
tamaño 120 de la base original. Los datos originales están en el archivo: “saber.txt”, el
cual está disponible en Moodle. Para hacerlo debe seguir los siguientes pasos:

# Procedimiento para generar archivo de datos para el trabajo


# Primero leer el archivo de datos.

saber <- read.table(file.choose(), header=T, sep=”,”)

# Copiar el siguiente código en R sin modificar nada

gener <- function(cedula){


set.seed(cedula)
data <- saber[sample(1:2668,120),]
data
}

# Para crear la base de datos con la cual trabajara, debe ejecutar la siguiente línea:

datos <- genera(cedula)


“cedula” representa el número de cedula de uno de los dos integrantes. En el trabajo
debe indicar cuál número de cédula usó. Este debe escribirse en la parte superior
izquierda.
En la parte superior derecha, el grupo al cual pertenecen los estudiantes. Se aclara que
ambos estudiantes deben pertenecer al mismo grupo en el cual están matriculados.

En todos los casos, para realizar las pruebas de hipótesis sobre medias o varianzas, debe
primero establecer si la respectiva muestra proviene de una distribución normal. En este
punto debe plantear las Hipótesis correspondientes, el estadístico de prueba usado y la
conclusión usando únicamente el Valor P.
Usando la base de datos generada, responda a las siguientes preguntas:

1. ¿Puede afirmarse que el resultado medio obtenido en lectura


Crítica es superior a 50? Justifique su respuesta.

2. ¿Se puede afirmar que el resultado medio obtenido en


Matemáticas es mayor en Antioquia que en el Valle? Justifique
su respuesta.

3. ¿Se puede afirmar que más del 24% de los estudiantes que
presentan la prueba, pertenecen a colegios No-Oficiales?
Justifique su respuesta.

4. El año 2018 la distribución de colegios en Antioquia y Valle


según la jornada era:

JORNADA COMPLETA FIN DE SEMANA MAÑANA NOCTURNA TARDE ÚNICA


% 0,24 0,09 0,4 0,1 0,09 0,08

¿Hay razones para suponer que la distribución de colegios


según la jornada ha cambiado para el 2019? Justifique su
respuesta.
El trabajo debe entregarse impreso antes de las 4:00 pm del lunes
16 de Marzo de 2020 a su respectivo profesor, o en la Secretaría
de la Escuela de Estadística, Bloque 43. Primer piso.

Potrebbero piacerti anche