Sei sulla pagina 1di 28

Escuela Superior

Politécnica del Litoral


Métodos Estadísticos III

Tema:
Descripción del rendimiento general de los
alumnos de la ESPOL correspondientes al I
Término Año 2010-2011.

Números de matrículas de los estudiantes:


200803179
200816239
200822914
200800761

Paralelo: 351

Catedrático: Muman Andrés Rojas

Guayaquil, Septiembre 3 del 2010


INDICE GENERAL

INTRODUCCIÓN......................................................................................2

DESARROLLO……………………………………………………………………………………………..…………3

MATRIZ DE VARIANZAS Y COVARIANZAS…………………………………………………………..7

TABLAS DE CONTINGENCIA………………………………………………………………………………18

CONCLUSIONES Y RECOMENDACIONES…………………………………………………………..22

ANEXOS………………………………………………………………………………………………………………23

BIBLIOGRAFÍA……………………………………………………………………………………………………28
INTRODUCCIÓN

La mayor preocupación de cualquier estudiante universitario, es su rendimiento


académico, sobre todo si de éste depende el día de registro de materias para
el siguiente semestre como ocurre en la ESPOL.

Para realizar nuestro estudio hemos reunido información de 80 alumnos


Politécnicos. Los datos acumulados, los cuales serán nuestras variables de
estudio son: Sexo, Promedio General del estudiante y el número de Materias
Reprobadas por alumno, donde sexo es una variable cualitativa y las otras
variables son cuantitativas

Los datos obtenidos serán ordenados, para luego tabularlos y finalmente


mostrar su correspondiente tabla de frecuencias, que nos permitirá visualizar
como están agrupados los datos.

Verificaremos si las muestras de las variables aleatorias cuantitativas tienen


alguna distribución conocida, para lo cual realizamos ciertas pruebas, luego
haremos hipótesis de los parámetros a partir de los datos observados en la
muestra, y las verificaremos por medio de importantes distribuciones, también
quisimos limitar un rango en el que se podría encontrar estos parámetros.

Más adelante, comprobaremos si las variables mencionadas anteriormente son


independientes.

Por último se presentaran las conclusiones a las que se llegaron luego de los
análisis descriptivos e inferenciales de cada una de las variables utilizadas en
este proyecto.
DESARROLLO

Hemos tomado una muestra de tamaño n=80, en la que las preguntas fueron:
Sexo, Promedio General y Número de materias reprobadas. Presentaremos a
continuación en una tabla los datos obtenidos en las encuestas, el cual ha sido
ordenado de menor a mayor en base al promedio general.

I
TABLA DE FRECUENCIAS
PROMEDIO GENERAL DE LOS ALUMNOS DE LA ESPOL
CORRESPONDIENTE AL I TÉRMINO 2010-2011

Ordinal Clase Marca Frecuencia Frecuencia Frecuencia Frecuencia


de Relativa Acumulada Relativa
Clase Acumulada

1 [5.875- 6 2 0.025 2 0.025


6.125)

2 [6.125- 6.25 5 0.0625 7 0.0875


6.375)

3 [6.375- 6.5 12 0.15 19 0.2375


6.625)

4 [6.625- 6.75 11 0.1375 30 0.375


6.875)

5 [6.875- 7 7 0.0875 37 0.4625


7.125)

6 [7.125- 7.25 12 0.15 49 0.6125


7.375)

7 [7.375- 7.5 13 0.1625 62 0.775


7.625)

8 [7.625- 7.75 8 0.1 70 0.875


7.875)

9 [7.875- 8 3 0.0375 73 0.9125


8.125)

10 [8.125- 8.25 4 0.05 77 0.9625


8.375)

11 [8.375- 8.5 3 0.0375 80 1


8.625]
En la tabla observamos una mayor frecuencia de alumnos con promedio
general en las clases 3, 4, 6 y 7, lo indicado se podrá observar mejor en el
histograma de frecuencia presentado a continuación.

En el histograma de frecuencias podemos ver con más claridad donde hay


mayor frecuencia de alumnos, en la marca de clase 6.5 y 7.25 encontramos en
ambas 12 alumnos, mientras que en la marca de clase 7.5 se encuentran 13
alumnos.

II
ESTADÍSTICAS DESCRIPTIVAS: PROMEDIO GENERAL

Variable N N* Media Desv. Varianza CoefVar Mín. Q1


Est.

Promedio 80 0 7,181 0,6201 0,3845 8,64 6,0300 6,655


General 4 0

Variable Mediana Q3 Máx. Rang IQR Modo N para Sesg


o moda o

Promedio 7,1700 7,610 8,600 2,570 0,955 6,51 7 0,24


General 0 0 0

Con estos datos podemos comprobar que la información obtenida en el


análisis anterior fue bastante aproximada, la mediana para esta variable
fue 7.17 esto quiere decir que el 50% de los alumnos de esta muestra
tiene ese promedio o menos. También podemos observar que el 25% de
los alumnos tienen de promedio 6.655 o menos y que el 75% tienen
7.61 o menos esto quiere decir que mucho menos del 25% de los
alumnos tienen 8 o más de promedio.

Continuemos con la siguiente variable:


III
TABLA DE FRECUENCIAS
NÚMERO DE MATERIAS REPROBADAS POR LOS ALUMNOS DE LA ESPOL
CORRESPONDIENTE AL III TÉRMINO 2009-2010

Ordinal Clase Media Frecuencia Frecuencia Frecuencia Frecuencia


de Relativa Acumulada Relativa
Clase Acumulada

1 [0-1) 0.5 30 0.375 30 0.375

2 [1-2) 1.5 23 0.2875 53 0.6625

3 [2-3) 2.5 19 0.2375 72 0.9

4 [3-4] 3.5 8 0.1 80 1

Los valores de esta variable son discretos, no puede tomar valores intermedios
entre 0 y 1 o 1 y 2 o 2 y 3 o 3 y 4, por lo que el ancho del rango va a ser 1.
Notamos que en esta variable los datos tienen frecuencia mayormente en la
primera clase, seguida por la segunda, luego la tercera y finalmente la cuarta.
Observaremos mejor en el histograma de frecuencias.

Aquí en el gráfico podemos observar con mayor claridad la concentración en el


número 0, que corresponde a que no han tenido materias reprobadas,
podemos observar también que la gráfica posee un sesgo bastante
pronunciado hacia la derecha.

IV
ESTADÍSTICAS DESCRIPTIVAS: MATERIAS REPROBADAS

Variable N N Medi Desv. Varianz CoefVa Mín. Q1


* a Est. a r

Materias 8 0 1100 1098 1205 99,80 0,00 0,00


Reprobadas 0 0 0

Variable Median Q3 Máx. Rang IQR Modo N para Sesg


a o moda o
Materias 1,000 2,00 4,00 4,000 2,00 0 30 0,80
Reprobadas 0 0 0

Con estos datos podemos decir con seguridad que el 25% de los
estudiantes de la muestra no han reprobado ninguna materia, el 50%
ha reprobado 1 materia o ni una y el 75% ha reprobado 2 o menos
materias.

Por último nuestra variable cualitativa GENERO, a esta variable no se le


pueden sacar estadísticas descriptivas, más que solo realizar un simple
conteo para conocer el número de mujeres y de hombres que conforman
la muestra.

En este gráfico, podemos observar claramente un mayor número de hombres.


Este gráfico no es un histograma, porque solo se lo utiliza para variables
cuantitativas.

MATRIZ DE VARIANZAS Y COVARIANZAS

La matriz de varianzas y covarianzas para este proyecto es la siguiente:

Cov(Xi,Xj2×2=0.38-0.18-0.181.21

Comprenderemos mejor la relación que existe entre estas dos variables


cuantitativas si obtenemos el coeficiente de correlación, el cual se calcula de la
siguiente manera:

rx,y=cov(promedio general,# de materias reprobadas)SpromedioSmaterias


reprobadas

Usando la calculadora, se obtiene el siguiente resultado:

rx,y=-0.26
La relación entre ambas variables es cercana a cero, es decir su relación
es poco lineal. Lo comprobaremos en el siguiente gráfico:

Gráfica de dispersión de Promedio General vs. Materias Reprobadas

8.5

8.0
Promedio General

7.5

7.0

6.5

6.0
0 1 2 3 4
Materias Reprobadas

Esta mala relación lineal se puede deber a que no necesariamente el no haber


reprobado ninguna materia es condición suficiente para tener un buen
promedio, eso es lo que se pudo observar en esta gráfica. Vemos casos de
personas que tiene promedio menor a 6 y que no han reprobado ninguna
materia y casos que son lo contario, podemos observar que existe una caso
claramente visible de un promedio cercano a 8 pero a reprobado 4 materias.
Los espacios que vemos entre los números del eje x se deben a que la variable
número de materias reprobadas solo toma valores discretos.

V
Variable Aleatoria: Promedio General

Estadísticas descriptivas: Promedio

Variable Media Desv.Est. Varianza Mínimo Q1 Mediana Q3 Máximo


Promedio 7.1814 0.6201 0.3845 6.0300 6.6550 7.1700 7.6100 8.6000

N para
Variable Modo moda
Promedio 6.51 7
Para nuestro análisis, queremos conocer, si la muestra de la variable aleatoria
promedio general, tiene distribución normal, para ello realizamos un contraste
de hipótesis:

H0: El promedio de las notas tiene distribución normal con µ = 7.18 y σ2=0.38
Vs.
H1: H0 No es verdad

A través del gráfico que nos da la probabilidad de promedio se determinó lo


siguiente:

Gráfica de probabilidad de Promedio


Normal
99.9
Media 7.181
Desv.Est. 0.6201
99 N 80
KS 0.077
95 Valor P >0.150
90
80
Porcentaje

70
60
50
40
30
20
10
5

0.1
5 6 7 8 9
Promedio

El tamaño de prueba o comúnmente conocido como el valor p es mayor a 0.15,


lo que es mayor a 0.1 y conocemos que eso nos da a entender que H0 no se
rechaza, El promedio de las notas tiene distribución normal con µ = 7.18 y
σ2=0.38.

6
Histograma de Promedio
14

12

10

Frecuencia 8

0
6.0 6.5 7.0 7.5 8.0 8.5
Promedio

Observando el gráfico que nos muestra el histograma de la variable aleatoria


promedio y la tabla 1, supusimos que la media de todos los promedios
generales de la EPOL, podría ser 7, y la varianza es mayor a 0.2, ya que la
muestra nos da cierta idea de la distribución de una población.

Por lo tanto, establecemos el siguiente contraste de hipótesis para la media:

H0: μ=7
Vs.
H1: μ<7

VI

T de una muestra: Promedio

Prueba de μ = 7 vs. < 7

Media del Límite


Error superior
Variable N Media Desv.Est. Estándar 95% T P
Promedio 80 7.1814 0.6201 0.0693 7.2968 2.62 0.995

En la tabla el valor p es mayor a 0.1, con lo cual no rechazamos H0, podemos


afirmar que la media no puede ser menor a 7. Es decir los promedios
generales deben ser iguales a 7, o un valor entre 7 y 10, con 2 cifras decimales

Procedemos ahora a establecer intervalos de confianza para la media


poblacional de la variable promedio general, esto nos ayuda a darnos una idea
de un rango con cierto nivel de confianza para la media de los promedios
generales de los estudiantes de la población.

La desviación estándar del promedio general de la ESPOL es desconocida, y es


tomada de una población normal, lo que nos permite ayudarnos de una
variable aleatoria t de student con (n-1) grados de libertad, mostrando lo
siguiente:

VII

T de una muestra: Promedio

Media del
Error
Variable N Media Desv.Est. Estándar IC de 95%
Promedio 80 7.1814 0.6201 0.0693 (7.0434; 7.3194)

Gráfica de intervalos de Promedio


95% IC para la media
7.35

7.30

7.25
Promedio

7.20

7.15

7.10

7.05

Con esto podemos afirmar con 95% de confianza en la tabla que la media de
promedios generales de todos los estudiantes de la ESPOL está en un rango de
(7.0434; 7.3194).
Con lo cual, verificamos que nuestra Hipótesis planteada fue correcta, ya que
el intervalo de confianza para el promedio general no es menor a 7.

Un procedimiento parecido se podría aplicar para la varianza, para lo que


establecemos el siguiente contraste de hipótesis para la varianza:

H0: σ2=0.2
Vs.
H1: σ2<0.2

VIII

Prueba e IC para una varianza: Promedio

Método

H0: σ 2=0.2
H1: σ 2<0.2

El método estándar se utiliza sólo para la distribución normal.


El método ajustado se utiliza para cualquier distribución continua.

Estadísticas

Variable N Desv.Est. Varianza


Promedio 80 0.620 0.385

95% Intervalos de confianza unilaterales

Límite Límite
Superior Superior
Para para
Variable Método Desv.Est. Varianza
Promedio Estándar 0.714 0.510
Ajustado 0.697 0.486

Pruebas

Variable Método X2 GL Valor P


Promedio Estándar 151.90 79.00 1.000
Ajustado 215.78 112.22 1.000

El valor p que nos muestra la tabla es mayor a 0.1, con lo cual no rechazamos
H0, podemos afirmar que la media no puede ser menor a 0.2

Podríamos conocer los intervalos de confianza para la varianza, usando una


distribución Ji-Cuadrado con (n-1) grados de libertad y conociendo S2, la
varianza de la muestra:

IX

Prueba e IC para una varianza: Promedio


Método

El método estándar se utiliza sólo para la distribución normal.


El método ajustado se utiliza para cualquier distribución continua.

Estadísticas

Variable N Desv.Est. Varianza


Promedio 80 0.620 0.385

Intervalos de confianza de 95%

IC para IC para
Variable Método Desv.Est. Varianza
Promedio Estándar (0.537; 0.735) (0.288; 0.540)
Ajustado (0.549; 0.713) (0.301; 0.509)

Podemos afirmar con 95% de confianza que la varianza de promedios de


todos los estudiantes de la ESPOL está en un rango de (0.288; 0.540), es decir
la variabilidad es relativamente pequeña.

Comprobamos que la media no es menor a 0.2 haciendo uso de los intervalos


de confianza.

Nos pareció buena idea conocer quienes tienen mejores promedios generales
entre los estudiantes de la ESPOL, si los hombres o las mujeres, para hacer
esta comparación, necesitamos observar la parte descriptiva de cada grupo:

Estadísticas descriptivas: Promedio Hombres

Variable Media Desv.Est. Varianza Mínimo Q1 Mediana Q3


Prom. Hombres 7.1737 0.6114 0.3738 6.0300 6.6650 7.2200
7.5575

Variable Máximo
Prom. Hombres 8.5600

Estadísticas descriptivas: Promedio Mujeres

Variable Media Desv.Est. Varianza Mínimo Q1 Mediana Q3


Prom. Mujeres 7.196 0.647 0.419 6.030 6.595 7.090 7.628

Variable Máximo
Prom. Mujeres 8.600

Antes de realizar dicho análisis, nos fijamos que las varianzas de las muestras
son 0.3738 y 0.419, con lo que podríamos afirmar que las varianzas de las 2
poblaciones son iguales aunque no podríamos estar seguros, para verificarlo
realizamos el siguiente contraste de Hipótesis:

H0: σ12=σ22
Vs.
H1: σ12≠σ22

La varianza mayor es SM2=0.419 y la menor es Sm2=0.3738 con nM=28 y


nm=52, los tamaños de muestra respectivamente, por medio de una
distribución F de Fisher con F (27,51), obtenemos el estadístico T, y con él
obtenemos el valor p.

XI

Prueba de varianzas iguales

Intervalos de confianza de Bonferroni de 95% para desviaciones estándares

Muestra N Inferior Desv.Est. Superior


1 28 0.495534 0.647302 0.923728
2 52 0.499976 0.611392 0.783135

Prueba F (distribución normal)

Estadística de prueba = 1.12; valor p = 0.709

El valor p mostrado en la tabla es mayor a 0.1 con lo cual no rechazamos H0,


no hay evidencia para afirmar que las varianzas sean distintas.

Observamos que la media del promedio general de la muestra de mujeres es


mayor a la media del promedio general de la muestra de hombres, por lo que
podríamos suponer que la media del promedio general de toda la población de
mujeres μ1 es mayor a la media del promedio general de toda la población de
hombres μ2.

Por lo tanto:
μ1>μ2

Que es equivalente suponer que:


μ1-μ2=0

Para verificar esa afirmación establecemos el siguiente contraste de hipótesis:

H0: μ1-μ2=0
Vs.
H1: μ1-μ2≠0

Conociendo las medias de los promedios generales, sus respectivas varianzas


muestrales y el número de estudiantes de cada muestra de hombres y mujeres
respectivamente, podemos obtener lo siguiente:

XII

Prueba de varianzas iguales

Prueba T e IC de dos muestras: Prom. Mujeres; Prom. Hombres

T de dos muestras para Prom. Mujeres vs. Prom. Hombres

Media del
Error
N Media Desv.Est. Estándar
Prom. Mujeres 28 7.196 0.647 0.12
Prom. Hombres 52 7.174 0.611 0.085

Diferencia = µ (Prom. Mujeres) - µ (Prom. Hombres)


Estimado de la diferencia: 0.022
IC de 95% para la diferencia: (-0.269; 0.313)
Prueba T de diferencia = 0 (vs. no =): Valor T = 0.15 Valor P = 0.881 GL
= 78
Ambos utilizan Desv.Est. Agrupada = 0.6240

Nuestro estadístico T está definido en relación a las de las diferencia de medias


muestrales, menos la diferencia de las medias poblacionales, sobre la
desviación, sabiendo que las varianzas son desconocidas pero iguales.

Dando nuestro valor p mayor a 0.1, con lo cual no rechazamos nuestra


Hipótesis nula, es decir no hay pruebas suficientes para decir que no son
iguales

Al estimar un rango en el que podría estar la diferencia de medias μ1-μ2, con


95% de confianza decimos que está en un intervalo entre (-0.269; 0.313),
con lo que verificamos nuestra Hipótesis, de igual forma vemos que el intervalo
no nos revela con seguridad, si la media del promedio general de mujeres es
mayor al promedio general de los hombres, ya que puede su diferencia está en
intervalo que comprende números positivos y negativos.

XIII
Variable Aleatoria: Número de Materias Reprobadas

Estadísticas descriptivas: Materias reprobadas

Variable Media Desv.Est. Varianza Mínimo Q1 Mediana


Q3
Materias reprobadas 1.100 1.098 1.205 0.000 0.000 1.000
2.000

Variable Máximo
Materias reprobadas 4.000

Histograma de Materias reprobadas

30

25

20
Frecuencia

15

10

0
0 1 2 3 4
Materias reprobadas

Como podemos observar en el grafico, la variable aleatoria número de


materias reprobadas es discreta ya que puede tomar valores solo entre 0, 1,
2, 3, y 4, además la varianza σ2 es desconocida, pero n es mayor a 30, no se
puede realizar un test de normalidad, ya que su distribución no es continua.
Podríamos hacer uso de la Aplicación de Muestras Grandes, que es una
situación en la que se supone que la variable aleatoria (x-μ)sn) Converge en
Distribución a una Normal Estándar, sin importar de que Población se toma la
muestra.

Se puede Establecer el siguiente contraste de hipótesis para la media:


H0: μ=1
Vs.
H1: μ>1
XIV

Z de una muestra: Materias reprobadas

Prueba de µ = 1 vs. µ > 1


La desviación estándar supuesta = 1.098

Media del
Error 95% Límite
Variable N Media Desv.Est. Estándar inferior Z P
Materias reprobadas 80 1.100 1.098 0.123 0.898 0.81 0.208

El valor p mostrado en la tabla es mayor a 0.1, con lo cual no rechazamos H0,


podemos afirmar que la media no puede ser mayor a 1. Es decir que los
estudiantes de la ESPOL tienen en promedio una materia reprobada en su vida
académica.

Procedemos ahora a establecer intervalos de confianza para la media


poblacional de la variable número de materias reprobadas, esto nos ayuda a
darnos una idea de un rango con cierto nivel de confianza para conocer en
donde podría estar el promedio de materias reprobadas

XV

Z de una muestra: Materias reprobadas

La desviación estándar supuesta = 1.098

Media del
Error
Variable N Media Desv.Est. Estándar IC de 95%
Materias reprobadas 80 1.100 1.098 0.123 (0.859; 1.341)

Con 95% de confianza podemos decir que el promedio del número de


materias reprobadas por los estudiantes de la ESPOL está entre 0.859 y 1.341.

La desviación estándar del número de materias reprobadas de la ESPOL es


desconocida, y es tomada de una población aplicada a muestras grandes, pero
podríamos reemplazar σ2 por S2 y esto tendrá distribución normal estándar

XVI
Prueba e IC para una varianza: Materias reprobadas

Método

Hipótesis nula 2 = 1.5


Hipótesis alterna σ 2 < 1.5

El método estándar se utiliza sólo para la distribución normal.


El método ajustado se utiliza para cualquier distribución continua.

Estadísticas

Variable N Desv.Est. Varianza


Materias reprobadas 80 1.10 1.21

95% Intervalos de confianza unilaterales

Límite Límite
superior superior
para para
Variable Método Desv.Est. varianza
Materias reprobadas Estándar 1.26 1.60
Ajustado 1.27 1.60

Pruebas

Variable Método X2 GL Valor P


Materias reprobadas Estándar 63.47 79.00 0.101
Ajustado 62.81 78.18 0.103

Nos ayudamos de una distribución de Ji-Cuadrada, porque conocemos que


para establecer hipótesis para la varianza, es apropiada usarla.
Nuestro valor p es mayor a 0.1, con lo que decidimos no rechazar la hipótesis
nula, quedaremos con que nuestra varianza poblacional de la variable aleatoria
número de materias reprobadas es 1.5

TABLAS DE CONTINGENCIA

Nos pareció necesario conocer, además del tipo de distribución que podía tener
nuestra variable aleatoria, y el establecimiento de hipótesis junto con la
estimación de parámetros, una verificación de independencia entre 2 variables
aleatorias, por medio de tablas de contingencia o también conocida como
pruebas de Independencia.
Nuestra primera tabla de contingencia verificaremos si existe independencia
entre las variables: número de materias reprobadas y el género, para lo cual
establecemos el siguiente contras de hipótesis:

H0: El número de materias reprobadas y el género son independientes


Vs.
H1: H0 No es verdad

XVII

Estadísticas tabuladas: C2; C3

Filas: C2 Columnas: C3

0 1 2 3 4 Todo

Hombre 21 12 13 3 3 52
19.50 14.95 12.35 3.25 1.95 52.00
0.1154 0.5821 0.0342 0.0192 0.5654 *

Mujer 9 11 6 2 0 28
10.50 8.05 6.65 1.75 1.05 28.00
0.2143 1.0811 0.0635 0.0357 1.0500 *

Todo 30 23 19 5 3 80
30.00 23.00 19.00 5.00 3.00 80.00
* * * * * *

Contenido de la celda: Conteo


Conteo esperado
Contribución a chi-cuadrada

Chi-cuadrada de Pearson = 3.761; GL = 4; Valor P = 0.439


Chi-cuadrada de la tasa de verosimilitud = 4.669; GL = 4; Valor P = 0.323

* NOTA * 4 celdas con conteos esperados menores que 5

Como el valor p es mayor a 0.1, no rechazamos nuestra hipótesis nula, es


decir el número de materias reprobadas y el género son independientes

XVIII
Prueba de Hipótesis para la Independencia de dos variables

X: Promedio General
Y: Género
Inferior al Promedio Superior al Total
Promedio Promedio

Hombre 25 5 22 52

Mujer 16 1 11 28

Total 41 6 33 80

Tabla 18.Desempeño de los hombres y mujeres con respecto al Promedio


General

H0:El promedio General y el Género son independientes


Vs.
H1: H0

Eij=xi.*x.jn

E11=52*4180=26.65

Eij=52*680=3.9

Eij=52*3380=21.45

Eij=28*4180=14.35

Eij=28*680=2.1

Eij=28*3380=11.55

Estadístico de Prueba

x2→i=1ri=1c(oij-Eij)2EIJ

x2=1.232

x2∼Χ2(r-1c-1)

Valor p<0.1

Conclusión
Dado el valor podemos concluir que no existe evidencia que nos diga que hay
independencia entre las variables Promedio General y Genero en estos casos
se procede a tomar una nueva muestra que se recomendaría mayor a 80 para
saber si hay independencia entre las dos variables.

XIX

X: Promedio General
Z: Materias Reprobadas

Inferior al Promedio Superior al Total


Promedio Promedio

6<x<7 9 12 17 38

7<x<8 13 11 13 37

x>8 5 0 0 5

Total 27 23 30 80

H0:El promedio General y numero de materias reprobadas son independientes


Vs.
H1: H0

Eij=xi.*x.jn

E11=38*2780=12.82

Eij=38*2380=10.92

Eij=38*3080=14.25

Eij=37*2780=12.48

Eij=37*2380=10.63

Eij=37*3080=13.87

Eij=5*2780=1.68

Eij=5*2380=1.439

Eij=5*3080=1.87
Estadístico de Prueba

x2→i=1ri=1c(oij-Eij)2EIJ

x2=11.74

x2∼Χ2(r-1c-1)

Valor p<0.01

CONCLUSIONES

Al final de este proyecto pudimos sacar las siguientes conclusiones:

En la muestra escogida para este proyecto se pudo observar que


aproximadamente el 75% de los alumnos tienen un promedio de 7.61 o
menos. Casi un 10% de los alumnos de nuestra muestra de 80 personas tiene
un promedio mayor a 8.

Por medio de las gráficas observamos también que alrededor de un 50% de los
alumnos de esta muestra han reprobado 0, 1 o 2 materias y un 25% no han
reprobado ninguna materia.

También en al final de la parte descriptiva de este proyecto nos dimos cuenta


en la grafica de dispersión que la relación que se esperaba entre las dos
variables promedio general y número de materias reprobadas no fue buena. El
tener un promedio alto no asegura que no haya reprobado alguna vez alguna
materia. Se observó una gran variedad de promedios de personas que no han
reprobado ninguna materia, por lo que la relación “mejor promedio, menos
materias reprobadas” no se halló completamente en esta muestra.

Las muestras tomadas a partir de la encuesta, sirvieron para conocer las


características de la población, y estimar sus parámetros conocidos tales como
la media y su varianza, esto nos permitió conocer información acerca de todos
los estudiantes de la ESPOL.
Por medio de las tablas de contingencia, pudimos observar si las variables eran
independientes.

RECOMENDACIONES

Una recomendación para un siguiente proyecto con este mismo tema sería
tomar una muestra mucho más grande, ya que con un número mayor a 80, la
aproximación al límite central sería mejor y tendríamos mejores cálculos para
el intervalos de la media para la variable número de materias reprobadas la
cual no tenia distribución normal ni otra conocida

También se recomendaría verificar si las muestras tomadas poseen distribución


normal, o convergen a ella, ya que si no se cumple esta condición, existe
posibilidad de no poder hacer uso de las hipótesis, ni intervalos de confianza.

ANEXOS

La encuesta fue realizada a una muestra de tamaño n=80, en la que las


preguntas fueron: Sexo, Promedio General y Número de materias reprobadas.
A continuación se presentará en una tabla los datos obtenidos en las
encuestas, el cual ha sido ordenado de menor a mayor el promedio general.

XX

Promedio General Género Materias


Reprobadas

7.9 Hombre 0

7.9 Hombre 1

8.1 Mujer 0

8.14 Mujer 0
8.15 Mujer 0

8.21 Hombre 0

6.3 Mujer 3

6.3 Hombre 3

6.37 Hombre 0

6.45 Mujer 1

6.51 Hombre 0

6.51 Mujer 2

6.51 Hombre 1

6.51 Hombre 2

6.51 Hombre 0

6.51 Hombre 0

6.51 Hombre 1

6.53 Mujer 2

6.54 Mujer 1

6.57 Hombre 1

6.57 Mujer 0

6.65 Hombre 2

6.03 Hombre 4

6.03 Mujer 0

6.15 Hombre 1

6.2 Hombre 2

6.67 Mujer 1

6.71 Hombre 2

6.81 Hombre 0

6.81 Hombre 4

6.9 Mujer 3
6.95 Mujer 1

6.96 Mujer 1

7 Hombre 2

7.05 Mujer 0

7.08 Mujer 1

7.1 Mujer 1

7.15 Hombre 0

7.15 Hombre 2

7.16 Hombre 0

7.18 Mujer 2

7.21 Hombre 0

7.23 Hombre 2

7.23 Mujer 1

6.81 Mujer 1

6.81 Hombre 0

6.83 Hombre 1

6.83 Hombre 1

6.85 Hombre 2

6.87 Hombre 0

7.51 Hombre 2

7.51 Hombre 0

7.51 Hombre 2

7.53 Hombre 1

7.53 Hombre 0

7.55 Hombre 2

7.56 Hombre 1

7.57 Mujer 2
Promedio. Hombres Promedio. Mujeres

7.57 6.03 Mujer 6.03 1

7.61 6.15 Mujer 6.3 1

7.61 6.2 Hombre 6.45 3

7.62 6.3 Mujer 6.51 0

7.63 6.37 Mujer 6.53 0

7.67 6.51 Hombre 6.54 0

7.71 6.51 Hombre 6.57 0

7.81 6.51 Mujer 6.67 2

7.81 6.51 Hombre 6.81 4

7.81 6.51 Hombre 6.9 1

7.82 6.51 Mujer 6.95 2

7.87 6.57 Hombre 6.96 1

8.25 6.65 Hombre 7.05 0

8.5 6.71 Hombre 7.08 0

8.56 6.81 Hombre 7.1 0

8.6 6.81 Mujer 7.18 0

7.23 6.81 Hombre 7.23 2

7.23 6.83 Hombre 7.57 0

7.25 6.83 Hombre 7.57 3

7.31 6.85 Hombre 7.61 1

7.35 6.87 Hombre 7.62 2

7.41 7 Hombre 7.63 0

7.15 7.81

7.15 7.82

7.16 8.1

7.21 8.14

7.23 8.15
Estos datos, nos muestran el promedio general de todos los hombres y el
promedio general de todas las mujeres de la muestra tomada, la cual se usó
para saber cuál de los dos promedios poblacionales es mayor

BIBLIOGRAFÍA

• ZURITA, G. Probabilidad y Estadística, Fundamentos y Aplicaciones.


Guayaquil: Ediciones del Instituto de Ciencias Matemáticas ESPOL,
2008.
• Bioestadísticas. Métodos y Aplicaciones
http://www.bioestadistica.uma.es/libro/node41.htm

• DE OTEYZA, Elena. Temas Selectos de Matemáticas, Primera Edición,


Pearson Educación.

• Estadísticas descriptivas. Tablas de frecuencias y gráficos


representativos

Usando MINITAB:
www.ust.cl/html/cree/asignaturas/material.../guiaminitab.pdf

Potrebbero piacerti anche