Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Pereira
Facultad de Ingeniera Elctrica y Computacin
Anlisis Estadstico de Algunas Caractersticas de los Estudiantes de Estadstica para Ingenieras de la Espol
Contenido
1. INTRODUCCIN ................................................................................................................... 3
2.ANLISIS ESTADSTICO UNIVARIADO ..................................................................................... 8
Tabla de frecuencia de la variable genero ................................................................................ 8
Primera parte: Anlisis estadstico para la variable fecha de nacimiento por mes. ................... 11
Segunda parte: Anlisis estadstico para la variable fecha de nacimiento por ao. ................... 12
Anlisis estadstico para la variable edad................................................................................ 16
Tabla de Frecuencia de la Variable Nmero de Materias Aprobadas........................................ 22
Tabla de Frecuencia de la Variable Nmero de Materias Aprobadas ....................................... 24
Anlisis estadstico para la variable dgito al azar.................................................................... 27
3. MATRIZ DE CORRELACIN. ................................................................................................. 49
4. ANLISIS ESTADSTICO BIVARIADO. .................................................................................... 54
Ao Ingreso Espol vs Gnero .............................................................................................. 54
5. ESTADSTICA INFERENCIAL. ................................................................................................ 60
5.1 Bondad de Ajuste ............................................................................................................. 60
5.2 Intervalos de confianza .................................................................................................... 66
5.3 Prueba de Hiptesis ......................................................................................................... 71
5.4 Anlisis de Contingencia ................................................................................................... 76
6. CONCLUSIONES.................................................................................................................. 81
7. RECOMENDACIONES .......................................................................................................... 83
8. REFERENCIAS BIBLIOGRAFICAS ........................................................................................... 85
9. ANEXOS ............................................................................................................................. 87
Pgina 1 de 91
Pgina 2 de 91
1. INTRODUCCIN
1.1. De qu se trata el proyecto
Este proyecto consiste en el anlisis de datos proporcionados por los estudiantes de la
ESPOL que estn cursando la materia de Estadstica para Ingenieras en el segundo trmino
2010, los cuales fueron obtenidos mediante encuesta a 260 alumnos durante el primer parcial
del trmino mencionado.
Este trabajo est basado en una muestra de 101 estudiantes, a los cuales realizamos un
anlisis individual por variables, as como un anlisis en grupo a fin de comprobar las
relaciones que pueden existir entre estos datos (anlisis bivariado), adems nos apoyamos en
la estadstica inferencial a fin de conocer, mediante los datos de la muestra, el
comportamiento general de las variables teniendo en cuenta que existe un cierto nivel de
significancia en las proyecciones que realizamos.
Es importante recalcar que los clculos obtenidos se obtuvieron de MINITAB 15 que es
un software diseado para estudios estadsticos (grficos, histogramas, tablas). Pero a travs
del texto usted podr encontrar un anlisis metdico y sistemtico sobre las variables de
estudio.
1.2. Objetivo
Utilizar los conocimientos adquiridos en clase para realizar los diferentes literales que se
piden en el proyecto.
Pgina 3 de 91
Pgina 4 de 91
Funcin de probabilidad
Una distribucin la podemos concebir con una distribucin terica de frecuencia, es
decir, es una distribucin que describe como se espera que varen los resultados. Dado que
esta clase de distribuciones se ocupan de las expectativas son modelos de gran utilidad para
hacer inferencias y tomar decisiones en condiciones de incertidumbre.
Media
En estadstica, la media es una medida de centralizacin. Se llama media de una
distribucin de estadstica a la media aritmtica de los valores de los distintos individuos que la
componen.
Varianza
Esta medida se basa en la cuantificacin de las distintas de los datos con respecto al
valor de la media.
Moda
Es el valor que ocurre con mayor frecuencia en una muestra puede ser que no exista la
moda y tambin es posible que exista ms de una moda.
Mediana
Una mediana es el valor de la variable que deja el mismo nmero de datos antes y
despus que l una vez ordenados estos.
Matriz de correlacin
Es una representacin ordenada de los coeficientes de correlacin de cada variable con
la otra variable y consigo misma.
Histograma
Es la manera ms comn de representar grficamente la distribucin de frecuencias de
los datos. Se lo construye dibujando rectngulos cuya base corresponda a cada intervalo de
clase y su altura, segn el valor de la frecuencia.
Diagrama de Cajas
Es un diagrama grafico que se usa para expresar en forma resumida, algunas medidas
estadsticas de posicin. El diagrama de caja describe grficamente el rango de los datos, el
rango intercuartlico, los valores extremos y la ubicacin de los cuartiles. Es una representacin
til para comparar grupos de datos.
Pgina 5 de 91
Intervalos de Confianza
Un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual
se encuentra el verdadero valor del parmetro, con una probabilidad determinada. La
probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo construido
se denomina nivel de confianza.
Nivel de significancia
La probabilidad de equivocarnos se llama nivel de significancia.
Variables cualitativas
Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada
modalidad que se presenta se denomina atributo o categora y la medicin consiste en una
clasificacin de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales.
Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores
posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms
valores. Dentro de ellas podemos distinguir:
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un
criterio de orden como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numricas. Las variables
cuantitativas adems pueden ser:
Pgina 6 de 91
Pgina 7 de 91
Femenino
Tabla #1
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
GENERO
CLASE
f/n
F/n
Femenino
11
0,11
11
0,11
Masculino
90
0,89
101
Para la Variable Aleatoria Discreta Gnero, el soporte que puede tomar es: Femenino
y Masculino. De los cuales, el 11% son personas del gnero Femenino y el 89% son del gnero
Masculino.
Pgina 8 de 91
Grafico #1
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Frecuencia
70
60
50
40
30
20
10
0
Maculino
Femenino
El grfico #1 muestra una proporcin muy marcada del gnero masculino (color rojizo)
de los estudiantes de la materia Estadstica. Puesto que del tamao de nuestra muestra de 101
encuestados, 90 son hombres y 11 apenas mujeres.
Grafico #2
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Media
Desv.Est.
N
1,0
0,1089
0,3131
101
0,8
0,6
0,4
0,2
0,0
-0,50
-0,25
0,00
0,25
x
0,50
0,75
1,00
Pgina 9 de 91
Esta Ojiva Emprica del Gnero nos indica en que medida estn distribuidos los datos. En
el eje X se encuentra la Variable Gnero identificado con el nmero -0.25 para el femenino y
Masculino para el 1. Y en el eje Y la frecuencia relativa acumulada. El programa Minitab (con
el que se realiz esta grfica) por su naturaleza matemtica ha dividido en decimales el eje X,
pero los valores importantes que identifican la variable Gnero son los valores antes indicado.
Grafico #3
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
f(x)=0
f(x)=0.11
f(x)=0.89
1.5
0.5
x
-1.8
-1.6
-1.4
-1.2
-1
-0.8
-0.6
-0.4
-0.2
0.2
0.4
0.6
0.8
1.2
1.4
1.6
1.8
-0.5
-1
-1.5
-2
Graph Limited School Edition
Esta distribucin emprica nos indica que solo el 11% son del gnero femenino (lnea
horizontal ms baja) y el 89% son del gnero masculino (lnea horizontal superior)
Pgina 10 de 91
Primera parte: Anlisis estadstico para la variable fecha de nacimiento por mes.
Hemos credo conveniente realizar el anlisis estadstico de la fecha de nacimiento por
mes, para que los resultados de nuestro anlisis sea ms especifico y obtener resultados ms
claro sobre la fecha de nacimiento de los estudiantes que actualmente estn tomando la
materia de estadstica para ingenieros , los cuales fueron encuestados y hemos tomado una
muestra de tamao n=101
Tabla #2
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
ORDINAL
CLASE
FRECUENCIA
FRECUENCIA FRECUENCIA
RELATIVA
ACUMULADA
FRECUENCIA
RELATIVA
ACUMULADA
[Enero - Febrero)
11
0.11
11
0.11
[Febrero - Marzo)
0.06
17
0.17
[Marzo - Abril)
0.07
24
0.24
[Abril - Mayo)
10
0.10
34
0.34
[Mayo - Junio)
14
0.14
48
0.48
[Junio - Julio)
10
0.10
58
0.57
[Julio Agosto)
0.07
65
0.64
[Agosto - Septiembre)
0.09
74
0.73
[Septiembre - Octubre)
0.06
80
0.79
10
[Octubre - Noviembre)
0.08
88
0.87
11
[Noviembre - Diciembre)
11
0.11
99
0.98
12
[Diciembre]
0.02
101
Pgina 11 de 91
Grafico #4
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Histograma
Mes de nacimiento
18
Frecuencia
16
14
12
10
8
6
4
2
0
o
ro
er
re
b
En
Fe
zo
ar
M
ril
Ab
o
ay
M
o
ni
Ju
lio
Ju
e
e
e
to
re
br
br
br
os
ub
g
m
t
m
m
e
e
A
ie
Oc
vi
ci
pt
Di
No
Se
Mes
Segunda parte: Anlisis estadstico para la variable fecha de nacimiento por ao.
El anlisis estadstico para la variable fecha de nacimiento por ao de los estudiantes
que estn tomando la materia de estadstica para ingenieros, los cuales fueron encuestados y
hemos tomado una muestra de tamao n=101se detalla a continuacin:
Pgina 12 de 91
Tabla #3
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
FRECUENCIA
ACUMULADA
FRECUENCIA
RELATIVA
ACUMULADA
ORDINAL
CLASE
FRECUENCIA
FRECUENCIA
RELATIVA
[1978-1979)
9.9x10-3
9.9x10-3
[1979-1980)
9.9x10-3
[1980-1981)
9.9x10-3
[1981-1982)
9.9x10-3
[1982-1983)
0.02
0.03
[1983-1984)
0.03
[1984-1985)
0.02
0.05
[1985-1986)
0.03
0.08
[1986-1987)
0.03
11
0.11
10
[1987-1988)
0.09
20
0.20
11
[1988-1989)
17
0.17
37
0.37
12
[1989-1990)
18
0.18
55
0.54
13
[1990-1991)
28
0.28
83
0.82
14
[1991-1992)
17
0.17
100
0.99
101
15
[1992-1993)
9.9x10
-3
Pgina 13 de 91
Tabla #4
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Tabla de medidas de tendencia central, dispersin y sesgo de la variable fecha de nacimiento por ao
(1988-1989)
Varianza
4.821
Desviacin Estndar
2.196
Mediana
1989
Q1 Cuartil 1
1988
Q3 Cuartil 3
1990
Rango
14
Rango Intercuartil - RI
Moda
1990
Sesgo
-1.96
La tabla #4 nos da una representacin ms clara de los resultados sobre los datos de la
variable cuantitativa discreta ao de nacimiento, se puede observar que la media de el ao de
nacimiento esta en un intervalo entre 1989 y 1990 , con una varianza de 4.821.
La mediana de esta muestra de n=101 es el ao 1989 y el primer cuartil est en 1988 y as
mismo el tercer cuartil est en 1990 , el cuartil 2 es igual que la mediana quedando un rango
intercuartil igual a 2 aos.
La moda es decir el ao donde hay la mayor cantidad de encuestados es el ao de 1990,
La distribucin de los datos es sesgada a la izquierda (distribucin asimtrica negativa), lo cual
quiere decir que los datos se encuentran concentrados a la derecha
Pgina 14 de 91
Grfico #5
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Frecuencia
24
22
20
18
16
14
12
10
8
6
4
2
0
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992
Ao
Ao de Nacimiento
1,0
Probabilidad
0,8
0,6
0,4
0,2
0,0
78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96
19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19 19
ao
Pgina 15 de 91
El grfico # 6 nos muestra claramente la ojiva de esta variable y se puede ver que el 25%
(Cuartil 1) naci antes de 1987. Que el 50% de los encuestados (Cuartil 2) naci antes de 1989.
Y que el 75% de los estudiantes naci antes de la llegada de 1991.
Grafico #7
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992
ao
La grfica # 7 representa el diagrama de cajas de la variable, el cual nos indica que los
datos mayoritariamente se localizan entre 1988 y 1990.
Pgina 16 de 91
Tabla #5
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Edad (hasta 8 de
febrero de 2011,
en aos)
32
Frecuencia
1
31
30
29
28
27
26
25
24
23
22
17
21
18
20
28
19
17
18
1
Grfico #8
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Frecuencia
20
15
10
5
0
18
20
22
24
26
28
30
32
Edades
Pgina 17 de 91
Observando esta grfica #8, podemos observar que la frecuencia ms alta de las edades
de los estudiantes que estn tomando la materia Estadstica, se encuentra localizada a los 20
aos. Mientras no existen alumnos con 27, 29, 30 y 31 aos en el dictado de esta materia.
Grafico #8
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
1,0
21,26
2,226
101
Probabilidad
0,8
0,6
0,4
0,2
0,0
15,0
17,5
20,0
22,5
25,0
Edades
27,5
30,0
32,5
Esta Ojiva de edad, nos indica que el 25% de los datos de la muestra (Cuartil 1) es
significativamente menor a 20 aos, que el 50% de los datos es menor que la mediana 22.5
(Cuartil2) y que el 75% de los datos es relativamente mayor a 22.5 (Cuartil 3).
Grafico #9
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Edades
28
26
24
22
20
18
Pgina 18 de 91
Este grfico #9 es el Diagrama de caja de Edad, el cual nos indica que la Distribucin de
los encuestados de la muestra est mayoritariamente entre 20 y 23 aos.
AO DE
INGRESO
f/n
F/n
1997
0,01
0,01
2001
0,01
0,02
2002
0,01
0,03
2003
0,02
0,05
2004
0,03
0,08
2005
0,03
11
0,11
2006
14
0,14
25
0,25
2007
30
0,30
55
0,54
2008
28
0,28
83
0,82
2009
18
0,18
101
Pgina 19 de 91
Tabla #7
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
La tabla #7 nos muestra la estadstica descriptiva de esta variable, es decir las medidas
de tendencia central, dispersin y el sesgo de esta variable, y obtuvimos como resultados que
la media o el promedio de ingreso de los estudiantes a la ESPOL corresponde al ao 2007, con
una varianza de 3.46 aos, la mediana de esta variable es el ao del 2008, y el primer cuartil
quedo establecido en el ao 2007 y el tercer cuartil en el ao del 2008, el rango es de 12 aos,
el valor que ms se repite y como ya lo establecimos en el tabla #6 es el valor que ms se
repite y corresponde al ao 2008. La distribucin de los datos es sesgada a la izquierda
(distribucin asimtrica negativa), lo cual quiere decir que los datos se encuentran
concentrados a la derecha.
Grafico #10
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Frecuencia
25
20
15
10
5
0
1997
Pgina 20 de 91
1,0
2007
1,865
101
Probabilidad
0,8
0,6
0,4
0,2
0,0
1995,0
1997,5
2010,0
2012,5
Aos
2006
2004
2002
2000
1998
1996
Pgina 21 de 91
MATERIAS
APROBADAS
f/n
F/n
0.01
0.01
(10-12)
0.04
0.05
(13-14)
0.07
12
0.11
(15-16)
11
0.11
23
0.22
(17-18)
11
0.11
34
0.33
(19-20)
18
0.18
52
0.51
(21-22)
0.08
60
0.59
(23-24)
0.03
63
0.62
(25-26)
11
0.11
74
0.73
(27-28)
0.04
78
0.77
(29-30)
0.04
82
0.81
(31-33)
0.04
86
0.85
(35-36)
0.02
88
0.87
(39-40)
0.02
90
0.89
(41-48)
0.03
93
0.92
(50-52)
0.02
95
0.94
(53-55)
0.02
97
0.96
(57- 58)
0.02
99
0.98
vacas
0.02
101
Pgina 22 de 91
La tabla #9 representa la tabla de frecuencia, en esta tabla se detallan los valores que
toma cada uno de los intervalos, para este caso hemos tomados intervalos de 4 en 4, y el valor
mnimo es de 10 hasta un valor mximo 58, donde el intervalo que tiene la ms alta frecuencia
es el intervalo de [18 22 ) materias aprobadas, y 41 de los estudiantes encuestados
respondieron que el nmero de materias aprobadas esta en este intervalo.
Cabe recalcar que en la muestra que nosotros tomamos tres estudiantes no contestaron
a esta pregunta.
Tabla #9
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Tabla de medidas de tendencia central, dispersin y sesgo de la variable Nmero de Materias Aprobadas.
24,76
Varianza
118.81
Desviacin Estndar
10,9
Mediana
20
Q1 Cuartil 1
17
Q3 Cuartil 3
27
Rango
49
Rango Intercuartil - RI
10
Moda
20
Pgina 23 de 91
Materias
Aprobadas
f/n
F/n
0.01
0.01
(10-12)
0.04
0.05
(13-14)
0.07
12
0.11
(15-16)
11
0.11
23
0.22
(17-18)
11
0.11
34
0.33
(19-20)
18
0.18
52
0.51
(21-22)
0.08
60
0.59
(23-24)
0.03
63
0.62
(25-26)
11
0.11
74
0.73
(27-28)
0.04
78
0.77
(29-30)
0.04
82
0.81
(31-33)
0.04
86
0.85
(35-36)
0.02
88
0.87
(39-40)
0.02
90
0.89
(41-48)
0.03
93
0.92
(50-52)
0.02
95
0.94
(53-55)
0.02
97
0.96
(57- 58)
0.02
99
0.98
vacas
0.02
101
La tabla #9 representa la tabla de frecuencia, en esta tabla se detallan los valores que
toma cada uno de los intervalos, para este caso hemos tomados intervalos de 4 en 4, y el valor
mnimo es de 10 hasta un valor mximo 58, donde el intervalo que tiene la ms alta frecuencia
es el intervalo de [18 22) materias aprobadas, y 41 de los estudiantes encuestados
respondieron que el nmero de materias aprobadas esta en este intervalo. Cabe recalcar que
en la muestra que nosotros tomamos tres estudiantes no contestaron a esta pregunta.
Proyecto de Estadstica para Ingeniera, Paralelo 3
Pgina 24 de 91
Tabla #11
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Tabla de medidas de tendencia central, dispersin y sesgo de la variable Nmero de Materias Aprobadas.
24,76
Varianza
118.81
Desviacin Estndar
10,9
Mediana
20
Q1 Cuartil 1
17
Q3 Cuartil 3
27
Rango
49
Rango Intercuartil - RI
10
Moda
20
Frecuencia
20
15
10
5
0
10
20
30
40
Numero de materias aprobadas
50
60
Pgina 25 de 91
1,0
23,99
10,90
100
Probabilidad
0,8
0,6
0,4
0,2
0,0
0
10
20
30
40
Numero de Materias Aprobadas
50
60
Pgina 26 de 91
Grafico #15
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
60
50
40
30
20
10
El grfico #15 es el diagrama de cajas de esta variable, en este grfico se representa que
la mayora de los alumnos de la materia Estadstica han aprobado un compendio de entre 18 a
27 materias en su malla curricular.
Pgina 27 de 91
Tabla # 12
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
NMERO DEL 0 AL 9
f/n
F/n
0,00
0,01
0,06
0,06
0,07
13
0,13
0,09
22
0,22
0,08
30
0,30
12
0,12
42
0,42
0,09
51
0,50
32
0,32
83
0,82
14
0,14
97
0,96
0,04
101
5,594
Varianza
4,94
Desviacin Estndar
2,223
Mediana
Q1 Cuartil 1
Q3 Cuartil 3
Rango
Rango Intercuartil - RI
Moda
Pgina 28 de 91
La tabla #13 muestra la estadstica descriptiva de esta variable, dndonos a conocer las
medidas de dispersin, de tendencia central, y el sesgo, donde la media de esta variable es
5,632 con una varianza de 4,825 con una mediana de 6, el primer cuartil es el numero 4 y el
tercer cuartil es el digito 7, el rango de esta variable es 9 y adems el rango intercuartil 3, el
dgito que ms se repite es 7
La distribucin de los datos es sesgada a la izquierda (distribucin asimtrica negativa),
lo cual quiere decir que los datos se encuentran concentrados a la derecha.
Grafico #15
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Frecuencia
25
20
15
10
5
0
5
Digitos
Pgina 29 de 91
Grafico #16
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
1,0
5,594
2,223
101
Probabilidad
0,8
0,6
0,4
0,2
0,0
0
6
Digito
10
12
Digitos
6
5
4
3
2
1
0
Pgina 30 de 91
INTERNET EN CASA
CLASE
f/n
F/n
No
25
0,25
25
0,11
76
0,75
101
La tabla #14 nos muestra la frecuencia de el nmero de estudiantes que como respuesta
dieron que si tenan internet en casa y de los que no tienen internet en casa, obteniendo que
los que respondieron que si tenan internet en casa fueron 76 de los 106 estudiantes de la
muestra lo que representa el 71.7% y que 30 de los estudiantes no poseen este servicio en su
hogar lo que representa el 18.3 %.
Tabla #15
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Pgina 31 de 91
Frecuencia
60
50
40
30
20
10
0
No
Si
Internet en casa
Pgina 32 de 91
Grafico #19
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
1,0
0,7525
0,4337
101
Probabilidad
0,8
0,6
0,4
0,2
0,0
0,0
0,5
1,0
Internet en Casa
1,5
2,0
Pgina 33 de 91
Tabla # 16
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
CUENTASTIEMPO
CLASE
0
f/n
F/n
84
0,83
84
0,01
0,02
86
0,85
Messenger
0,02
88
0,87
Hotmail
0,02
91
0,90
No tiene tiempo
0,02
93
0,92
No tiene cuenta
0,09
101
1,00
La tabla #16 es la tabla de frecuencia de esta variable, y aqu detallamos cuantos de los
estudiantes encuestados respondieron a que si tenan un cuenta en la red social facebook o
que no poseen una cuenta en esta red social.
Los datos obtenidos fueron los siguientes, los estudiantes que respondieron que si
tenan una cuenta en la red social facebook fue un total de 99 de los 101 estudiantes de la
muestra lo que representa el 93.4% y los estudiantes que respondieron que no tenan una
cuenta en la red social facebook fueron 7 lo que representa el 6.6 % de la muestra
Grafico #20
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Frecuencia
60
50
40
30
20
10
0
2
3
Redes Sociales
Pgina 34 de 91
El Grafico #20 nos muestra los resultados grficos de nuestra variable en la que
podemos comprobar que un 84% de la muestra usa preferiblemente facebook
y que el
9% de la muestra por diferentes razones usualmente no usa ninguna red social, estas razones
podran ser porque no tienen computadora o porque simplemente no tienen tiempo
Grafico #21
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
1,0
0,6436
1,559
101
Probabilidad
0,8
0,6
0,4
0,2
0,0
-3
-2
-1
0
1
2
3
Tiempo en Cuentas
En el grafico anterior nos podemos dar cuenta que la mayor parte de la poblacin es
menor que 1 que es representada por Twitter esto se debe porque en nuestra muestra
facebook es representado por el numero 0 de ah que nuestra media es de 0.6434 que a su
vez representa el cuartil 2
Pgina 35 de 91
Tabla # 17
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
EQUIPO FAVORITO
Seleccin
de
Ecuador
CLASE
f/n
F/n
0,01
0,01
19
0,19
20
0,20
53
0,52
73
0,72
0,08
81
0,80
0,01
82
0,81
0,01
83
0,82
0,03
86
0,85
0,02
88
0,87
13
0,13
101
1,00
0
1
Emelec
Barcelona
Liga de Quito
El Nacional
Barcelona
Espaa
de
5
6
Real Madrid
Manchester United
Ninguna
Frecuencia
50
40
30
20
10
0
or
ad
u
Ec
Em
ec
el
e
rc
Ba
na
lo
ga
Li
l
es
na
io
na
c
o
l
e
Na
rc
Ba
r id
ad
M
M
r
te
es
h
c
an
o
un
ng
i
N
Equipos de futbol
Pgina 36 de 91
En el grafico #22 nos podemos comprobar que Barcelona capta la mayor hinchada en
nuestra poblacin y que Emelec es el segundo equipo con mayor hinchada eso es
probablemente porque nuestra poblacin es de Guayaquil lugar donde residen los dos equipos
previamente analizados
Tambin podemos notar la influencia de grandes equipos del exterior como lo son:
Barcelona de Espaa y Real Madrid y Manchester United
Grafico #23
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
1,0
2,921
2,288
101
Probabilidad
0,8
0,6
0,4
0,2
0,0
-2
2
4
Equipos de futbol
El grafico #23 nos representa como estn distribuidos los datos en nuestra muestra en
donde Barcelona est representado por el numero 2 para realizar nuestros anlisis en minitab
15.0 (programa utilizado para realizar nuestro proyecto)
Pgina 37 de 91
Tabla # 18
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
FRECUENCIA FRECUENCIA
RELATIVA
ACUMULADA
FRECUENCIA
RELATIVA
ACUMULADA
ORDINAL
CLASE
FRECUENCIA
[0-1)
0.029
0.029
[1-2)
0.079
11
0.109
[2-3)
31
0.297
41
0.406
[3-4)
26
0.267
68
0.673
[4-5)
13
0.109
79
0.782
[5-6)
12
0,139
93
0.920
[6-7)
0.029
96
0.950
[7-8)
96
0.950
[8-9)
0.019
98
0.970
10
[9-10)
9.90x10-3
99
0.980
11
[10-11)
99
0.980
12
[11-12)
99
0.980
13
[12-13)
0.019
101
Pgina 38 de 91
Tabla #19
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
3.255
Varianza
3.982
Desviacin Estndar
1.996
Mediana
Q1 Cuartil 1
Q3 Cuartil 3
Rango
11.5
Rango Intercuartil - RI
Moda
Sesgo
2.02
La tabla #19 muestra la estadstica descriptiva de esta variable, dndonos a conocer las
medidas de dispersin, de tendencia central, y el sesgo, donde la media de esta variable es
3.255 con una varianza de 3.982 con una mediana de 3 horas, el primer cuartil es 2 y el tercer
cuartil es 4, el rango de esta variable es 11.5 horas y adems el rango intercuartil 2 horas.
El nmero de horas que la mayora de los estudiantes pasa en un computador es 2 horas
lo cual corresponde a la moda de esta variable, La distribucin de los datos es sesgada a la
derecha (distribucin asimtrica positiva), lo cual quiere decir que los datos se encuentran
concentrados a la izquierda.
Pgina 39 de 91
Grafico #24
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Horas en el computador
35
30
Frecuencia
25
20
15
10
5
0
5
6
7
8
horas en el computador
10
11
12
El grfico #24 podemos ver grficamente la frecuencia de cada uno de los intervalos y
vemos que para el intervalo correspondiente para [2 - 3) tiene la barra ms alta es decir este
intervalo tiene la mayor frecuencia lo que significa que la mayor cantidad de estudiantes pasa
2 horas frente a un computador.
Tambin observamos que la grafica tiene una acumulacin de datos en el lado izquierdo
de la grafica, lo que nos da a entender que es sesgada a la derecha y lo que ya habamos
determinado en la tabla #18 al haber quedado un valor del sesgo positivo.
Grafico #25
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Normal
Horas en el computador
1,0
Probabilidad
0,8
0,6
0,4
0,2
0,0
0
4
5
6
7
horas en computador
10
11
12
Pgina 40 de 91
4
5
6
7
8
horas en el computador
10
11
12
El grfico #26 es el diagrama de cajas de esta variable, en este grfico se representa los
datos aberrantes de la variable y vemos que esta variable tiene datos aberrantes,
correspondiente a los alumnos que pasan 8, 9 y 12 horas en un computador, esto quiere decir
que muy pocos estudiantes pasa esta cantidad de horas en el computador.
Pgina 41 de 91
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
FRECUENCIA
FRECUENCIA
RELATIVA
FRECUENCIA
ACUMULADA
FRECUENCIA
RELATIVA
ACUMULADA
ORDINAL
CLASE
[0-1)
0.059
0.059
[1-2)
11
0.109
17
0.168
[2-3)
35
0.346
52
0.514
[3-4)
21
0.208
73
0.723
[4-5)
10
0.099
83
0.821
[5-6)
10
0.099
93
0.920
[6-7)
0.019
95
0.941
[7-8)
95
0.941
[8-9)
0.019
97
0.960
10
[9-10)
9.90x10-3
98
0.970
-3
99
0.980
99
0.980
100
0.990
101
11
[10-11)
9.90x10
12
[11-12)
13
[12-13)
9.90x10-3
14
[13-14)
9.90x10
-3
Tabla #21
Proyecto de Estadstica para Ingeniera, Paralelo 3
Pgina 42 de 91
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Varianza
4.879
Desviacin Estndar
2.209
Mediana
Q1 Cuartil 1
Q3 Cuartil 3
Rango
12.6
Rango Intercuartil - RI
Moda
Sesgo
2.2
La tabla #21 muestra la estadstica descriptiva de esta variable, dndonos a conocer las
medidas de dispersin, de tendencia central, y el sesgo, donde la media de esta variable es 3
con una varianza de 4.879 con una mediana de 2 horas, el primer cuartil es 2 y el tercer cuartil
es 4, el rango de esta variable es 12.6 horas y adems el rango intercuartil 2 horas
El nmero de horas que la mayora de los estudiantes pasa en un internet es 2 horas lo
cual corresponde a la moda de esta variable.
La distribucin de los datos es sesgada a la derecha (distribucin asimtrica positiva), lo
cual quiere decir que los datos se encuentran concentrados a la izquierda.
Grafico #28
Proyecto de Estadstica para Ingeniera, Paralelo 3
Pgina 43 de 91
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Horas en Internet
40
Frecuencia
30
20
10
5
6
7
8
horas en internet
10
11
12
13
El grfico #28 podemos ver grficamente la frecuencia de cada uno de los intervalos y
vemos que para el intervalo correspondiente para [2 - 3) tiene la barra ms alta es decir este
intervalo tiene la mayor frecuencia lo que significa que la mayor cantidad de estudiantes pasa
2 horas diarias en internet, tambin observamos que la grafica tiene una acumulacin de datos
en el lado izquierdo de la grafica, lo que nos da a entender que es sesgada a la derecha y lo
que ya habamos determinado en la tabla #23 al haber quedado un valor del sesgo positivo .
Grafico #29
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Horas en Internet
1,0
Probabilidad
0,8
0,6
0,4
0,2
0,0
0
4 5
6 7 8
horas en internet
10 11 12 13
Pgina 44 de 91
5
6
7
8
horas en internet
10
11
12
13
El grfico #30 es el diagrama de cajas de esta variable, en este grfico se representa los
datos aberrantes de la variable y vemos que esta variable tiene datos aberrantes,
correspondiente a los alumnos que pasan 8, 9, 10, 12 y 13 horas diarias en internet, esto
quiere decir que muy pocos estudiantes pasa esta cantidad de horas en internet. Es decir el
intervalo de confianza de esta variable esta entre 2 y 4 horas.
Pgina 45 de 91
Tabla # 24
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
FRECUENCIA FRECUENCIA
RELATIVA
ACUMULADA
ORDINAL
CLASE
FRECUENCIA
Dficit Fiscal
Desigualdad social
Drogas
Falta de Empleo
Prdida de valores
morales
Problemas
Internacionales
Seguridad ciudadana
Otro
1
6
6
23
9.90x10-3
22
2
3
4
5
6
7
8
9.90x10-3
0.059
0.059
0.227
1
7
13
36
0.217
58
0.574
59
99
101
0.584
0.980
1
9.60x10-3
1
40
2
FRECUENCIA
RELATIVA
ACUMULADA
0.396
0.020
0.069
0.129
0.356
Frecuencia
40
30
20
10
0
a
isc
t-F
i
fic
a
gu
si
De
l
ia
oc
-s
d
a
ld
as
og
Dr
Fa
m
-e
lta
eo
pl
s
a
es
le
an
or
na
al
ad
o
v
i
d
iu
aac
id
-c
rn
rd
te
ad
n
d
I
i
Pe
r
as
gu
m
Se
le
b
o
Pr
ro
Ot
problemas
Pgina 46 de 91
Pgina 47 de 91
Pgina 48 de 91
MATRIZ DE CORRELACIN.
En numerosos estudios estadsticos, el inters que existe en la relacin entre 2 o ms
variables, se concentra en determinar si estn o no relacionadas y en caso afirmativo en
averiguar qu tan fuerte es la relacin lineal entre ellas. El investigador puede o no estar
interesado en la prediccin y en la estimacin. La tcnica analtica apropiada es la denominada
Anlisis de Correlacin. Lo que consiste en relacionar 2 variables cuantitativas diferentes.
Para esta seccin fue necesaria la asignacin de letras a cada variable para representar
la matriz; una vez hecho esto denotamos que la relacin entre:
Materias Aprobadas x
Materias Semestre.. y
Dgito al Azar....z
Horas Diarias Computadora..w
Horas Semanal Internet..v
Por ende, la matriz de correlacin poseer la siguiente forma:
Pgina 49 de 91
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Ao de
Mes de
Nacimiento nacimiento
Ao de
Ingreso
a la
ESPOL
Nmero
de
materias
aprobadas
Dgito
al Azar
Nmero de
horas en el
computador
Nmero
de horas
en
internet
Ao de
Nacimiento
0.855
0.983
-0.062
-0.053
0.115
0.202
Mes de
Nacimiento
0.855
0.828
-0.145
-0.104
0.094
0.172
Ao de
Ingreso a la
ESPOL
0.983
0.828
-0.046
-0.044
0.119
0.198
Nmero de
materias
aprobadas
-0.062
-0.145
-0.046
-0.003
0.132
0.183
Dgito al
Azar
-0.053
-0.104
-0.044
-0.003
0.046
0.042
Nmero de
horas en el
computador
0.115
0.094
0.119
0.132
0.046
0.911
Nmeros de
horas en
internet
0.202
0.172
0.198
0.183
0.042
0.911
-0.145
-0.104
-0.062
-0.053
-0.046
-0.044
-0.003
Pgina 50 de 91
Son negativas, lo que indica que si una aumenta la otra disminuye en un factor dado con
la correlacin entre s mostrada en la matriz. Podremos decir que mientras ms joven es un
estudiante de la muestra, menor ser el nmero de materias aprobadas.
Tambin se podra interpretar que el estudiante tiene una mayor edad va a tener una
mayor cantidad de materias aprobadas. Los estudiantes de la muestra con mayor edad tienen
la tendencia a escoger un digito al azar alto.
Los estudiantes de la muestra que permanecen ms horas en el computador tienen la
tendencia a escoger un digito al azar bajo. As tambin podemos entender que cuando el
coeficiente de correlacin tiende a cero se podra entender que no existe una relacin lineal,
este caso se presenta en las variables Digito al azar y Materias Aprobadas que tiene un
coeficiente de correlacin. Las relaciones positivas, es decir, las que aumentan
proporcionalmente son las siguientes:
0.983
0.911
0.828
0.855
0.202
0.198
0.183
0.172
0.132
0.119
0.115
0.094
0.046
0.042
Pgina 51 de 91
Pgina 52 de 91
Pgina 53 de 91
Gnero
Masculino Femenino
Ao de ingreso
1997
2001
2002
2003
2004
2005
2006
12
14
2007
27
30
2008
26
28
2009
15
18
90
11
101
Pgina 54 de 91
Grfico #32
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Genero
0,6
0,4
0,2
0,0
-0,2
1996
1998
2000
2002
2004
2006
Ao de Ingreso a la ESPOL
2008
2010
Grfico #33
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
1,5
Genero
1,0
0,5
0,0
-0,5
1996
1998
2000
2002 2004
2006
Ao de Ingreso a la ESPOL
2008
Pgina 55 de 91
Mediante el grafico anterior se puede estimar que el 10.89% son de gnero femenino y
que le 89.1% son de gnero masculino, por lo cual se concluye que el ingreso de estudiantes
de gnero masculino a la ESPOL es mayor que el gnero femenino lo cual no indica que por
cada mujer aproximadamente hay ocho hombres.
Tabla #26
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Internet en
casa
AO NACIMIENTO
Si
No
[1978-1979)
[1979-1980)
[1980-1981)
[1981-1982)
[1982-1983)
[1983-1984)
[1984-1985)
[1985-1986)
[1986-1987)
[1987-1988)
[1988-1989)
11
17
[1989-1990)
17
18
[1990-1991)
21
28
[1991-1992)
14
17
[1992-1993)
76
25
101
Pgina 56 de 91
Grfico # 33
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Grafica de Dispersin Bivariada de Internet y Ao de Nacimiento
Internet
0,8
0,6
0,4
0,2
0,0
1980
1983
1986
Ao de Nacimiento
1989
1992
Pgina 57 de 91
Grfico # 34
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Grafica de Marginal Bivariada de Internet y Ao de Nacimiento
1,5
Internet
1,0
0,5
0,0
-0,5
1980
1983
1986
1989
Ao de Nacimiento
1992
Pgina 58 de 91
Pgina 59 de 91
ESTADSTICA INFERENCIAL.
Criterio para anlisis del valor p
El mnimo valor de para rechazar Ho
Valor P < 0.05 (5%)
SE RECHAZA Ho
INCERTIDUMBRE
SE ACEPTA Ho
3.243 y
H1: Ho
Grfico # 35
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Grafica de la probabilidad de horas de internet
99.9
Media
Desv .Est.
N
KS
Valor P
99
95
Porcentaje
90
3.243
2.289
100
0.192
<0,010
80
70
60
50
40
30
20
10
5
1
0.1
-5.0
-2.5
0.0
2.5
5.0
7.5
Horas de Internet
10.0
12.5
Pgina 60 de 91
Grfico # 36
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Grafica de la probabilidad de materias aprobadas
99,9
Media
Desv .Est.
N
KS
Valor P
99
95
Porcentaje
90
24,10
10,90
99
0,198
<0,010
80
70
60
50
40
30
20
10
5
1
0,1
-10
10
20
30
40
Materias Aprobadas
50
60
Pgina 61 de 91
con
Ho: la edad de los estudiantes de estadstica para ingeniera tiene distribucin uniforme
y =9
Vs
H1: Ho
f(x)=
1
=0.11
Tabla # 27
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
k
1
2
3
4
5
6
7
8
9
10
Clase
1
31.5
2
3
4
5
6
8
9
10
Oi
10
3
22
21
18
12
7
3
3
2
Probabilidad
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
Ei
10.1
10.1
10.1
10.1
10.1
10.1
10.1
10.1
10.1
10.1
Valor p =
Valor p < 0,010
En la tabla #37 observamos detalladamente los valores que toma el test Ji- cuadrado, la
columna Oi representa la frecuencia con la que se presenta la clase en nuestra muestra de
tamao n=101
Pgina 62 de 91
Valor de contribucin
12
10
8
6
4
2
0
1,0
1,5
2,0
3,0
4,0
5,0
6,0
Horas en el Computador
8,0
9,0
12,0
En grfico #37 nos muestra la contribucin del test Ji-cuadrado, este grafico esta
ordenada desde la mayor contribucin hasta la menor contribucin.
Grfico # 38
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Esperado
Observ ado
20
Valor
15
10
0
Categora
1,0
1,5
2,0
3,0
4,0
5,0
6,0
8,0
9,0
12,0
En grfico #38 se muestran los valores que se esperara que tome cada clase de la
variable y a su vez muestra los valores de la frecuencia de la clase segn nuestra muestra de
tamao n=101
Proyecto de Estadstica para Ingeniera, Paralelo 3
Pgina 63 de 91
con
Ho: la edad de los estudiantes de estadstica para ingeniera tiene distribucin uniforme
y =9
Vs
H1: Ho
f(x)=
1
=0.11
Tabla # 28
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
K
1
2
3
4
5
6
7
8
9
Clase
1
2
3
4
5
6
7
8
9
Oi
6
7
9
8
12
9
32
14
3
Probabilidad
0.11111
0.11111
0.11111
0.11111
0.11111
0.11111
0.11111
0.11111
0.11111
Ei
11,111
11,111
11,111
11,111
11,111
11,111
11,111
11,111
11,111
Valor p =
Valor p < 0,010
En la tabla #28 observamos detalladamente los valores que toma el test Ji- cuadrado, la
columna Oi representa la frecuencia con la que se presenta la clase en nuestra muestra de
tamao n=101, como partimos de la hiptesis de que la variable digito al azar de los
estudiantes de estadstica para ingenieras tiene distribucin uniforme entonces nuestra
probabilidad para cada clase es la misma, Ei es el valor esperado de la clase que resulta de
multiplicar la probabilidad por el tamao de la muestra.
Pgina 64 de 91
Grfico # 39
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Valor de contribucin
40
30
20
10
5
Digito
En grfico #39 nos muestra la contribucin del test Ji-cuadrado, este grafico esta
ordenada desde la mayor contribucin hasta la menor contribucin.
Grfico # 40
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
Esperado
Observ ado
30
Valor
25
20
15
10
5
0
Categora
En grfico #40 se muestran los valores que se esperara que tome cada clase de la
variable y a su vez muestra los valores de la frecuencia de la clase segn nuestra muestra de
tamao n=101.
Proyecto de Estadstica para Ingeniera, Paralelo 3
Pgina 65 de 91
Grfico # 41
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
_
X
20
22
24
26
Edad
28
30
32
34
Pgina 66 de 91
Pgina 67 de 91
Grfico # 42
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
_
X
6
8
Horas en el Computador
10
12
Pgina 68 de 91
Grfico # 43
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
_
X
6
Horas de Internet
10
12
Pgina 69 de 91
Pgina 70 de 91
Grfico # 44
Anlisis Estadstico de Algunas Caractersticas de los estudiantes de Estadstica para Ingenieras de la ESPOL
_
X
10
20
30
40
Materias Aprobadas
50
60
Pgina 71 de 91
30
30
Z=
Z=
Z = -0.78
200
200
Z=
Z=
Z = -0.18
Pgina 72 de 91
50
50
grados de libertad
No existe evidencia estadstica para rechazar Ho (Hiptesis Nula), ya que el valor p est
entre valores mayores 0.1 (10%).
. Por lo que el
Pgina 73 de 91
500
500
*Regin de Rechazo:
*Con la Ayuda de la Distribucin Ji cuadrado, el Estadstico de Prueba sera:
Con S2= 5530 y n=101
grados de libertad
50
0.50
*Regin de Rechazo:
*Con la Ayuda de la Distribucin Normal, el Estadstico de Prueba sera:
Con = 35/101= 0.3, 2 aproximada con S2= 139.75 y n=101
Pgina 74 de 91
Z=
Z=
Z = -0.12
0.3
*Regin de Rechazo:
*Con la Ayuda de la Distribucin Normal, el Estadstico de Prueba sera:
Con = /101= 0. , 2 aproximada con S2= 5530
Z=
Z=
Z = 0.013
Pgina 75 de 91
n: Cantidad de observaciones.
r: Cantidad de Filas.
c: Cantidad de Columnas
ri: Total de resultados en la fila i.
cj: Total de resultados en la columna j.
ni,j: Total de resultados observados en la fila i, columna j. (Datos Mustrales ).
ei,j: Total de resultados observados en la fila i, columna j. (Frecuencia Esperada)
X<=20
Adulto
X>20
Materias Aprobadas
Mximo: 57
Mnimo: 12
Intervalos
Pocas
X<=15
Muchas
15< X <=20
Bastantes
X>=20
Pgina 76 de 91
Tabla de contingencia:
Pocas
4
13
17
Joven
Adulto
Totales
Edad
Frecuencia esperada
Materias Aprobadas
Muchas
Bastantes
7
6
19
52
26
58
Totales
17
84
101
1
2
1
2,86
14,14
2
4,38
21,62
3
9,76
69,8
Prueba de hiptesis.
Ho: Las Materias Aprobadas es independiente de la Edad.
Ha: No son independientes (Negando Ho).
Estadstico de Prueba:
Regin de Rechazo:
Apoyados en MINITAB:
Pgina 77 de 91
X<=2007
2Generacin
X>=2008
Materias Aprobadas
Mximo: 57
Mnimo: 12
Intervalos
Pocas
X<=20
Mediana
20< X 25
Bastantes
X>25
Tabla de contingencia:
Ingreso Espol
Materias
Aprobadas
Pocas
Mediana
bastante
Totales
1Generacin
19
19
18
54
2Generacin
32
8
5
47
Totales
51
27
23
101
Pgina 78 de 91
Frecuencia esperada
1
27,26
14,43
12,29
1
2
3
2
23,73
12,69
10,70
Prueba de hiptesis.
Ho: El Ingreso a la Espol es independiente de las Materias Aprobadas.
Ha: No son independientes (Negando Ho).
Estadstico de Prueba:
Regin de Rechazo:
Apoyados en MINITAB:
Pgina 79 de 91
Pgina 80 de 91
6. CONCLUSIONES
1. Al finalizar este proyecto podemos recordar todo lo ocurrido durante la realizacin de este
por lo que hemos llegado a algunas conclusiones:
2. Las variables de gnero, internet en casa, mayor dedicacin a una red social, equipo de
futbol y problemas actuales de Ecuador son variables cualitativas mientras las variables de
fecha de nacimiento, ao de ingreso a la Espol, materias aprobadas, digito a la azar, horas
en el computador y horas en internet son variables cuantitativas.
3. Gracias a la utilizacin del programa Minitab, nos ahorramos muchos clculos puesto que
esta herramienta informtica nos lanzaba resultados conocidos como varianza, medias,
graficas de dispersin, histogramas, ojivas, valores p para las pruebas de hiptesis, entre
otras.
4. Con la ayuda de nuestra, podemos estar seguros que la mayoritariamente los alumnos que
estn cursando la materia Estadistica para ingeneria han ingresado en 2009.
5. Existe una estrecha relacin entre las materias tomadas por los estudiantes con el
nmero de horas en la computadora y el nmero de horas semanales que utilizan el
internet. Ya que si un estudiante toma ms materias tendr que hacer una gran cantidad
de tareas, investigaciones o actividades relacionadas con las mismas; por lo que la
computadora y el internet son herramientas bsicas para
cumplir con sus
responsabilidades acadmicas. Vase fig. 20, 21, 22.
6. Para saber que si dos variables son independientes entre s utilizamos el mtodo de Ji
cuadrado, para lo cual nos dio lo siguiente: Que la variable horas frente al computador y
digito al azar son independientes entre s.
7. Se demostr gracias a los mtodos de MINITAB 15 que ninguna de las variables
cuantitativas presenta una distribucin conocida.
8. Como la muestra que se tom fue lo suficientemente grande se puedo suponer que la
distribucin de la Poblacin era Normal, suposicin til para la realizacin de las hiptesis.
9. En las pruebas de hiptesis resultaron positivas para la Hipotesis Nula H0. Esto se debe a
que dicha hiptesis se hizo con un valor de prueba muy cercano a a la realidad.
10. Las Tablas de Contingencia indican que las variables materias aprobadas y las edades son
independientes entre s, lo cual es lgico ya que no depende la edad para aprobar
materia. Tambin se realizo el estudio de las variables de ao de ingreso y materias
aprobadas lo que nos dio a conocer que son dependientes, era algo de esperarse debido
a que los estudiantes segn el ao de ingreso a la Espol llevan sus materias aprobadas.
Proyecto de Estadstica para Ingeniera, Paralelo 3
Pgina 81 de 91
Pgina 82 de 91
7. RECOMENDACIONES
1. Es necesario realizar un estudio metdico, con tiempo acerca de las muestras para poder
presentar datos fiables.
2. Es necesario estimas o suponer ciertos parmetros que ayuden a un anlisis de stas para
que posean cierta correspondencia.
3. Se necesita mayor responsabilidad en cuanto a los estudiantes que llenaron los
formularios ya que al dejar preguntas en blanco el proceso estadstico se ve afectado.
4. Hacemos hincapi respecto a que no calculamos las varianzas poblacionales debido que la
finalidad de la seccin 5 es de INFERIR en las caractersticas poblacionales.
5. Se debera realizar una encuesta con similitud en cuanto al gnero para poder hacer un
mejor anlisis respecto a las mujeres.
6. Las variables estudiadas deben ser representativas y con una finalidad. Realmente el
autor no encontr eso en la variable de Dgito al Azar y su anlisis no fue profundo para
ella.
Pgina 83 de 91
Pgina 84 de 91
8. REFERENCIAS BIBLIOGRAFICAS
MINITAB INC. (2007), CONOCE MINITAB 15.1.20.0, Para Windows, (1 era edicin),
Minitab Inc., Estados Unidos de Amrica
Pgina 85 de 91
Pgina 86 de 91
9. ANEXOS
Pgina 87 de 91
Pgina 88 de 91
Pgina 89 de 91
Pgina 90 de 91
Pgina 91 de 91