Sei sulla pagina 1di 34

TRABAJO DE CAMPO ESTADISTICA BÁSICA

Yeraldin Saldarriaga Mazo


Iván Andrés Anaya Estrada
Daniela Amaya Gutiérrez
Yohana Acosta Vidal
Saray Hurtado Aguirre.

Mayo 2019.

Instituto Tecnológico Metropolitano.


Facultad de ciencias exactas y aplicadas
Estadística Básica
ii
Tabla de Contenidos

Capítulo 1 Resumen ........................................................................................................................ 1


Introducción ................................................................................................................................ 1
Contextualización ....................................................................................................................... 2
Capítulo 2 Marco Teórico .............................................................................................................. 3
Tabla 1 Frecuencias ........................................................................................................................ 4
Objetivos ................................................................................................................................... 10
Capítulo 3 Resultados .................................................................................................................. 12
Variable 1: GÉNERO ............................................................................................................... 12
Variable 2: DEPORTE .............................................................................................................. 13
Variable 3: LICOR .................................................................................................................... 14
Variable 4: EDAD..................................................................................................................... 16
Variable 5: PESO ...................................................................................................................... 18
Variable 6: ESTATURA ........................................................................................................... 21
Variable 7: ESTATURA Y PESO ............................................................................................ 23
Variable 8: ESTATURA Y EDAD ........................................................................................... 25
Variable 9: EDAD Y PESO ...................................................................................................... 26
Conclusión ................................................................................................................................ 29
Referencias .................................................................................................................................... 30
Lista de tablas iii

Tabla 1. Frecuencias. .........................................................Error! Bookmark not defined.


Tabla 2. Regresión Lineal. .................................................Error! Bookmark not defined.
Tabla 3. Variable 1. ............................................................Error! Bookmark not defined.
Tabla 4. Variable 2. ............................................................Error! Bookmark not defined.
Tabla 5. Variable 3. ............................................................Error! Bookmark not defined.
Tabla 6. Datos para elaborar intervalos. ............................Error! Bookmark not defined.
Tabla 7. Variable 4. ............................................................Error! Bookmark not defined.
Tabla 8. Resultados. ...........................................................Error! Bookmark not defined.
Tabla 9. Datos para construir intervalos. ...........................Error! Bookmark not defined.
Tabla 10. Datos agrapuados. ..............................................Error! Bookmark not defined.
Tabla 11. Resultados. .........................................................Error! Bookmark not defined.
Tabla 12. Datos para construir intervalos. .........................Error! Bookmark not defined.
Tabla 13. Datos agrapuados. ..............................................Error! Bookmark not defined.
Tabla 14. Resultados. .........................................................Error! Bookmark not defined.
Lista de figuras y gráficos iv

Figura 1.Media. ..................................................................Error! Bookmark not defined.


Figura 2.Mediana. ..............................................................Error! Bookmark not defined.
Figura 3.Moda. ...................................................................Error! Bookmark not defined.
Figura 4. Varianza y desviación estándar. .........................Error! Bookmark not defined.
Figura 5. Formas y descripción de las formas. ..................Error! Bookmark not defined.
Gráfico 1. Diagrama de barras. ..........................................Error! Bookmark not defined.
Gráfico 2. Diagrama de barras vertical y horizontal. .........Error! Bookmark not defined.
Gráfico 3. Diagrama circular. ............................................Error! Bookmark not defined.
Gráfico 4. Diagrama de barras V1. ....................................Error! Bookmark not defined.
Gráfico 5. Diagrama circular V1. ......................................Error! Bookmark not defined.
Gráfico 6. Digrama circular V2 ........................................................................................... . Error!
Bookmark not defined.
Gráfico 7. Diagrama de barras V2. ....................................Error! Bookmark not defined.
Gráfico 8. Diagrama de barras V3. ....................................Error! Bookmark not defined.
Gráfico 9. Diagrama cicular V3. ........................................Error! Bookmark not defined.
Gráfico 10. Histograma e datos agrupados . ......................Error! Bookmark not defined.
Gráfico 11. Histograma variabe 4. .....................................Error! Bookmark not defined.
Gráfico 12. Histograma de datos agrupados. .....................Error! Bookmark not defined.
Capítulo 1 1

Resumen

El presente informe cuenta con la información referente al estudio realizado a lo

estudiantes del ITM, en él se plasma información acerca de sus estilos de vida, y de las cosas que

cotidianamente hacen para conservar ese estilo de vida. La revisión teórica permite identificar

conceptos importantes, que nos posibilitan cuantificar la realidad y disponer de los elementos

que permitan su análisis.

Se indago a través de encuestas a 30 estudiantes de diferentes facultades con el objetivo

de mostrar resultados que nos permitan evidenciar y tener claro que un buen estilo de vida

influye directamente en la calidad de aprendizaje que reciben los estudiantes a diario. La técnica

a través de la cual se consiguió la información fue por medio de una encuesta elaborada con

preguntas, que nos permitió estudiar y analizar 3 variables cualitativas y 3 variables

cuantitativas, finalmente la recolección y el análisis de todos los datos obtenidos, y por

consiguiente de las 6 variables estudiadas, nos mostraron unos resultados que fueron plasmados

y resumidos en diferentes gráficos, para así lograr una interpretación y una conclusión más clara.

Introducción

El ITM es una institución universitaria de alta calidad que cuenta con una cobertura de

23.972 estudiantes, donde se forman diversos tipos de profesionales, por tal motivo se decidió

realizar una actividad para acercarnos un poco más a los estudiantes y conocer un poco sobre sus

estilos de vida, considerando que un buen estilo de vida tiene influencia directa en los

estudiantes, su relación con la actividad académica y el aprendizaje universitario.

Gracias a la encuesta realizada a los 30 estudiantes de diferentes facultades, tomando en

consideración las variables como edad. Estatura, peso, tipo de licor que consumen y el deporte
que practican, se encontraron diversos resultados tales como, que muy pocos estudiantes están 2

considerando tener hábitos saludables, pues solo un pequeño grupo de ellos practican deporte y

en su gran mayoría consumen alcohol.

Contextualización

El ITM es una institución universitaria de alta calidad que cuenta con una cobertura de

23.972 estudiantes, donde se forman diversos tipos de profesionales, por tal motivo se decidió

realizar una actividad para acercarnos un poco más a los estudiantes y conocer un poco sobre sus

estilos de vida, considerando que un buen estilo de vida tiene influencia directa en los

estudiantes, su relación con la actividad académica y el aprendizaje universitario.

Gracias a la encuesta realizada a los 30 estudiantes de diferentes facultades, tomando en

consideración las variables como edad. Estatura, peso, tipo de licor que consumen y el deporte

que practican, se encontraron diversos resultados tales como, que muy pocos estudiantes están

considerando tener hábitos saludables, pues solo un pequeño grupo de


Capítulo 2 3

Marco Teórico

POBLACION: Se concibe como un conjunto total de elementos Ej datos.

La población puede ser:

1) Población finita: cuando es posible enumerar físicamente todos los elementos que

pertenecen a la población.

2) Población infinita: cuando no es posible enumerar físicamente los elementos que

perteneces a la población.

MUESTRA: Es el subconjunto de la población.

PARAMETRO: Valor numérico que resume todos los datos de la población.

ESTADISTICO: Valor numérico que resume todos los datos de la muestra.

DATOS: Valores recolectados para la variable.

DATO: Valor de la variable asociado a un elemento de la población o muestra.

VARIABLE: Es una característica, atributo o medida que se está analizando en un estudio

estadístico.

La variable puede ser:

1) VARIABLE CUALITATIVA: Clasifica o describe un atributo o cualidad de los

elementos de la población o muestra.

2) VARIABLE CUANTITATIVA: Los datos recolectados cuantifican un elemento de la

población o muestra.

La variable cuantitativa puede ser:

a) VARIABLE CUANTITATIVA DISCRETA: Cuando los valores que toma la

variable son enteros que no se pueden partir.


b) VARIABLE CUANTITATIVA CONTINUA: Cuando los valores que toma la 4

variable se pueden partir.

FRECUENCIA: Es la repetición de un evento el valor o atributo en el conjunto de datos.

(Adriana Guerrero Peña, María Victoria Buitrago Cardona, María Curieses Paulete, 2007,

pág. 24)

TABLA DE FRECUENCIAS: Está formada por los valores de una variable cuantitativa y

sus frecuencias correspondientes.

(Adriana Guerrero Peña, María Victoria Buitrago Cardona, María Curieses Paulete, 2007,

pág. 31)

Tabla 1 Frecuencias

TIPOS DE FRECUENCIA SÍMBOLO CÁLCULO


Absoluta: número de medición de fi (suma)
una categoría
Relativa: (o de porción) de hi f/total
mediciones de una categoría
Porcentual: De mediciones de h* h*100%
una categoría.
Absoluta Acumulada: Sumatorias F fi+fi-1
de las fi
Porcentual Acumulada: H* hi+hi-1
Sumatoria de las hi*

CATEGORIA: Subdivisión de una variable según el dato almacenado en esta.

(Adriana Guerrero Peña, María Victoria Buitrago Cardona, María Curieses Paulete, 2007,

pág. 33)

MEDIDAS DE TENDENCIA CENTRAL: Son aquellas que se encuentran localizadas

hacia el centro de la información. Estas medidas se buscan tanto para datos simples como para

datos agrupados.
MEDIA: Representa el promedio del conjunto de datos de la muestra. Su cálculo se 5

realiza con la suma de todos los valores de los datos, dividida entre el número de datos que

componen la muestra.

Figura 1 Media

MEDIANA: Es una medida de posición.

 El valor que ocupa el lugar central, de tal forma que aquel valor deja el 50% de las

observaciones por debajo de él y el otro 50% por encima de él.

 Para la ubicación de la posición de la mediana se deben ordenar los datos en forma

ascendente.

 La mediana es representada por ME

Figura 2 Mediana
MODA: El valor que más se presenta. 6

La moda se representa por MO y puede ser aplicada a las variables cuantitativas y

cualitativas, discretas o continuas.

Figura 3 Moda

(Adriana Guerrero Peña, María Victoria Buitrago Cardona, María Curieses Paulete, 2007, págs.

50-52)

MEDIDAS DE DISPERSION Y FORMA:

VARIANZA: Se conoce también como el error cuadrático y mide la variación en

unidades cuadráticas de los datos con respecto a la media.

DESVIACION ESTANDAR: Indica el grado de dispersión o alejamiento de los datos

con respecto a su promedio. Se calcula como la raíz cuadrada de la varianza.

Figura 4 Varianza y desviación estándar


(Adriana Guerrero Peña, María Victoria Buitrago Cardona, María Curieses Paulete, 2007, págs. 7

54-55)

Tabla 2 Regresión Lineal

Regresión Lineal

Ecuación de regresión lineal simple

Modelo de regresión lineal simple

Ecuación de regresión lineal simple


estimada.

Pendiente e intersección con el eje y


de la ecuación de regresión estimada

Suma de cuadrados debida al error

Suma total de cuadrados

Suma de cuadrados debida a la


regresión
8
Coeficiente de determinación

Coeficiente de correlación

DIAGRAMA DE BARRAS: El diagrama de barras (gráfico de barras) es un gráfico que

se utiliza para representar datos de variables cualitativas o discretas. Está formado por barras

rectangulares cuya altura es proporcional a la frecuencia de cada uno de los valores de la

variable.

Las principales características del diagrama de barras son:

 En el eje de abscisas se colocan las cualidades de la variable, si la variable es cualitativa,

o los valores de dicha variable, si es discreta.

 En el eje de ordenadas se colocan las barras proporcionales a la frecuencia relativa o

absoluta del dato.

 Las barras pueden ser horizontales o verticales, según si los valores de la variable se

reflejan en el eje horizontal o vertical.

 Todas las barras deben tener el mismo ancho y no deben superponerse las unas con las

otra
Gráfico 1 Diagrama de barras 9

Gráfico 2 Diagrama de barras vertical y horizontal

(Universo Formulas, s.f.)

DIAGRAMA CIRCULAR: El diagrama circular (grafica circular, grafica de pastel o

diagrama de sectores) sire para representar variables cualitativas o discretas. Se utiliza para

representar la proporción de elementos de cada una de los valores de la variable.

Consiste en partir el circulo en porciones proporcionales a la frecuencia relativa, Entiéndase

como porción la parte del circulo que representa a cada valor que tomo la variable.
Gráfico 3 Diagrama circular 10

(Universo Formulas, s.f.)

HISTOGRAMA: Un histograma es una representación gráfica de datos mediante

intervalos. Los datos provienes de unas variables cuantitativas continuas. También cabe emplear

variables cualitativas ordinarias siendo necesario que el número de datos sea alto.

Un histograma es un conjunto de barras rectangulares verticales que su altura es

proporcional a las frecuencias absolutas de cada uno de los intervalos (También se pueden

representar las frecuencias relativas o frecuencias relativas porcentuales)

Los intervalos abarcan todo el conjunto sin cortarse, de manera que un elemento está solo

en un intervalo. La base de cada barra vertical es proporcional a la amplitud del intervalo.

(Universo Formulas, s.f.)

Objetivos

GENERAL: Fortalecer la calidad de vida de los estudiantes implementando nuevos

programas de deporte dentro de la institución.

ESPECIFICOS:
 Identificar entre ambos sexos cual de estos consume más licor y si practica algún 11

deporte.

 Identificar cual es el licor que mas consumen y con qué frecuencia lo hacen.

 Determinar si el consumo de licor y la práctica de algún deporte influye de manera

directa en cuanto a la estatura de una persona.

 Saber en qué rango de edad se encuentran las personas que más licor consumen y de la

misma manera saber si practican algún deporte.

 Determinar si el peso depende de que licor consuman y su cantidad, y saber cuál es el

comportamiento de su peso según el deporte que practiquen.

 Saber cuáles son las preferencias en cuanto al deporte, para poner un foco en el proyecto

que en este caso sería la implementación de nuevos deportes.

 Identificar de qué manera se comporta el peso de acuerdo a la estatura de una persona.

 Identificar qué relación existe entre la estatura y edad.

 Conocer como están relacionados los factores que se están evaluando de una variable

respecto a la otra.
12

Capítulo 3

Resultados

Variable 1: GÉNERO

Tabla 3

GENERO f h hi* Fi Hi*


FEMENINO 19 0,6333 63,33% 19 63,33%
MASCULINO 11 0,3667 36,67% 30 100,00%
30 1 100%

Gráfico 4 Diagrama de barras V1

Género
19
20
15
11
10
5
0
FEMENINO MASCULINO

Gráfico 5 Diagrama circular V1

Porcentajes

37% FEMENINO

63% MASCULINO
13

Interpretación

En el grafico se puede observar que de los 30 estudiantes encuestados el 63.33% son

mujeres mientras que el otro 36.67% son hombres con el fin de determinar que preferencias

tienen hacia el consumo de alcohol y si practican algún deporte.

Variable 2: DEPORTE

Tabla 4 Variable 2

DEPORTE f hi hi* Fi Hi*


FUTBOL 6 0,2 20% 6 20%
BALONCESTO 3 0,1 10% 9 30%
VOLEIBOL 1 0,0333 3% 10 33%
KARATE 1 0,0333 3% 11 37%
NINGUNO 19 0,6333 63% 30 100%
30 1 100%

Gráfico 6 Diagrama circular V2

FUTBOL
20%
BALONCESTO
10% VOLEIBOL
63% KARATE
3%
3% NINGUNO
Gráfico 7 Diagrama de barras V2 14

Deporte
70% 63%
60%

50%

40%

30%
20%
20%
10%
10% 3% 3%
0%
FUTBOL BALONCESTO VOLEIBOL KARATE NINGUNO

Interpretación

Según las gráficas podemos determinar que solo el 37% de los estudiantes encuestados

practican algún deporte entre futbol, baloncesto, Voleibol y karate, siendo futbol el que mas

practican con un porcentaje del 20% seguido del baloncesto con un 10% y el 6% practican entre

voleibol y karate, pero el alza se visualiza en que el 63% de estos estudiantes no practican ningún

deporte.

Variable 3: LICOR

Tabla 5 Variable 3

LICOR f hi hi* Fi Hi*


CERVEZA 11 0,3667 37% 11 37%
AGUARDIENTE 6 0,2 20% 17 57%
RON 6 0,2 20% 23 77%
NINGUNO 7 0,2333 23% 30 100%
30 1 100%
Gráfico 8 Diagrama de barras V3 15

PREFERENCIA LICOR
37%
40%
30% 20% 20% 23%
20%
10%
0%

CERVEZA AGUARDIENTE RON NINGUNO

Gráfico 9 Diagrama circulas V3

Porcentajes

23%
37%

20%
20%

CERVEZA AGUARDIENTE
RON NINGUNO

Interpretación

Según las gráficas se determina que de los 30 estudiantes encuestados el 30% prefiere

tomar cerveza por su facilidad de adquisición, precio y disponibilidad, por igual de porcentajes

prefieren consumir aguardiente y ron y el 23% prefieren no consumir ningún licor.


Variable 4: EDAD 16

Descripción

A continuación, estudiaremos la dispersión de los datos obtenidos con la variable EDAD.

La pregunta: ¿Cuántos años tienes? Arrojo los siguientes datos.

23,22,32,30,26,22,31,23,23,22,21,21,22,22,20,21,20,26,22,20,18,19,23,24,18,29,25,20,21,30

Al ser 30 datos y muchos repetidos o valores cercanos se procede a realizar la agrupación

en intervalos.

Valor máximo: 32

Valor mínimo: 18

Tabla 6 Datos para elaborar intervalos.

k 7
r 14
A 2

Nota. Se proponen el número de intervalos (k) para trabajar más cómodos con números

enteros.

Obteniendo un rango de 14 entre el valor menor y el mayor, con 7 intervalos se tiene una

amplitud de 2 para cada intervalo.

Tabla 7 Variable 4

(xi - (xi - )^2 (x - (x -


LI LS fi x x*fi (xi - ) )^2 *fi )^3*fi )^4*fi
18 20 7 19 133 -4 16 112 -448 1792
20 22 10 21 210 -2 4 40 -80 160
22 24 4 23 92 0 0 0 0 0
24 26 3 25 75 2 4 12 24 48
26 28 0 27 0 4 16 0 0 0
28 30 3 29 87 6 36 108 648 3888
30 32 3 31 93 8 64 192 1536 12288

TOTAL 30 690 140 464 1680 18176
FUENTE: Encuesta 17

Calculamos todos los datos pertinentes y obtuvimos.

Tabla 8 Resultados

N 30
Min 18
Max 32
N 30
Min 18
Max 32
Media ( ) 23
Varianza Muestral (S^2) 16
Desviación Estándar (S) 4
Coeficiente de Asimetría Fisher (g1) 0,875
Coeficiente Curtosis (g2) -0,6333333
S^3 64
S^4 256
Coeficiente de Variación (CV) 0,17

Nota. Los datos se toman como una muestra de la población (estudiantes del ITM)

Interpretación

De 30 estudiantes encuetados 24 tienen menos de 27 años dándonos una idea de cómo se

distribuyen los datos. Se calcula la media (23) para posteriormente saber cuál es el valor de la

desviación estándar (4) de nuestro grupo de datos. Con todo esto finalmente tenemos un

coeficiente de variación de 0.17 o 17 % que nos daría una precisión regular o es una distribución

homogénea de los datos, veamos gráficamente.

El coeficiente de Fisher g1= (0.875) es mayor a 0. Esto quiere decir que los datos se

agruparan a la izquierda del grafico o la mayoría de los datos son menores que la media (23).

Mientras tanto el coeficiente de Curtosis g2= (-0.633) es menor a 0. Esto quiere decir que hay

baja concentración de datos (platocurtica).

Observemos el grafico resultante de los datos.


Gráfico 10 Histograma Variable 4 18

EDAD
SERGO Y CURTOSIS

15
Frequency

10

0
19 21 23 25 27 29 31
EDAD

Nota. Cada barra del histograma equivale a la amplitud (2 años)

Poniendo todo en contexto con el objetivo de nuestra investigación la variable por si sola

nos da poca información solo el promedio de edad de los estudiantes, pero al usarla en conjunto

con alguna otra variable encuestada es que se puede llegar a información importante, por

ejemplo, en que rango de edad los estudiantes practican algún deporte o consumen más alcohol.

De esta manera también crear grupos de entrenamiento deportivos por edades para así tener claro

un nivel de exigencia para cada grupo.

Variable 5: PESO

Al preguntar por el peso de los estudiantes obtuvimos los siguientes datos.

23,22,32,30,26,22,31,23,23,22,21,21,22,22,20,21,20,26,22,20,18,19,23,24,18,29,25,20,21,30

Agrupamos los datos en intervalos

Valor mínimo: 45

Valor máximo: 100


Tabla 9 Datos para construir intervalos 19

K 5
R 55
A 11

Nota. Se propone un numero de intervalos (k) entero para mayor comodidad.

Obteniendo un rango de 55 entre el valor menor y el mayor, con 5 intervalos se tiene una

amplitud de 11 para cada intervalo.

Tabla 10 Datos agrupados

(xi - )^2
LI LS fi x x*fi (xi - ) (xi - )^2 *fi (x - )^3*fi (x - )^4*fi
-
45 56 11 50,5 555,5 -12,833333 164,6944444 1811,638889 23249,36574 298366,86
-
56 67 9 61,5 553,5 -1,8333333 3,361111111 30,25 55,45833333 101,673611
67 78 6 72,5 435 9,16666667 84,02777778 504,1666667 4621,527778 42364,0046
78 89 2 83,5 167 20,1666667 406,6944444 813,3888889 16403,34259 330800,742
89 100 2 94,5 189 31,1666667 971,3611111 1942,722222 60548,17593 1887084,82
TOTAL 30 1900 1630,138889 5102,166667 58268,22222 2558718,1
FUENTE: Encuesta

Hallamos los siguientes datos:

Tabla 11 Resultados

media ( ) 63,3333333
varianza muestral (S^2) 175,936782
desviación estándar (S) 13,2641163
N 30
Min 45
Max 100
g1 0,83229167
g2 -0,2445794
S^3 2333,64594
S^4 30953,7511
coeficiente de variación (CV) 0,20943342
Interpretación 20

Viendo la tabla 5 observamos una gran parte de los estudiantes entre el peso menor 45

kilos y 80 kilos, que es los normal para estudiantes en los rangos de edad que estudiamos

anteriormente. Con una media en 63.3 kilos y una desviación estándar de 13.2 podemos decir

que aproximadamente el 68 % (Adriana Guerrero, estadística básica) de los estudiantes tienen un

peso entre 50.1 kg y 76.5 kg.

Con un coeficiente de variación de 0.2 o 20% también tenemos una precisión regular al

igual con la variable anterior.

Analicemos los coeficientes de Fisher y Curtosis para estimar en una gráfica como se distribuyen

los datos.

El coeficiente de Fisher g1=0.8 mayor a 0, los datos se agrupan a la izquierda del gráfico

y la mayoría de los datos quedarían ubicados a la derecha de la media 63.3.

En cambio, Curtosis nos da una idea de que tanto están concentrados los dado alrededor de la

media en este caso obtuvimos un Curtosis g2 de -0.2 que es menor a 0. (platocurtica).

Miremos el grafico real de los datos.

Gráfico 11 Histograma de datos agrupados

PESO
FISHER Y CURTOSIS

12
10
Frequency

8
6
4
2
0
50.5 61.5 72.5 83.5 94.5
PESO
Nota. Cada barra del histograma equivale a la amplitud (A) 21

Ahora contextualizando; es la variable más importante porque respecto al peso de los

estudiantes nos será más fácil saber si en verdad estarían dispuestos a aceptar nuestro programa

deportivo con el fin de llevar una vida más sana.

En caso de llegar a nuestro objetivo general nos sería muy útil al momento de hacer

clases personalizadas en caso de existir sobrepeso o incluso asesorías con nutricionistas.

Variable 6: ESTATURA

Por último, analizaremos la variable estatura

Consideremos los siguientes datos.

1,68-1,61-1,7-1,52-1,72-1,8-1,82-1,54-1,6-1,56-1,62-1,66-1,8-1,47-1,6-1,6-1,65-1,52-1,65-1,65-

1,65-1,69-1,65-1,74-1,51-1,71-1,62-1,59-1,71-1,57.

Realizamos agrupación en intervalos

Valor mínimo: 1.47 mts

Valor máximo: 1.82 mts

Tabla 12 Datos para construir intervalos

k 5
r 0,35
A 0,07

Obteniendo un rango de 0.35 entre el valor menor y el mayor, con 5 intervalos se tiene

una amplitud de 0.07 para cada intervalo.


Tabla 13 Datos agrupados 22

(xi - )^2
LI LS fi X x*fi (xi - ) (xi - )^2 *fi (x - )^3*fi (x - )^4*fi
- -
1,47 1,54 5 1,505 7,525 0,128333333 0,016469444 0,082347222 0,002113579 0,000271243
- -
1,54 1,61 7 1,575 11,025 0,058333333 0,003402778 0,023819444 0,000198495 1,15789E-05
1,61 1,68 9 1,645 14,805 0,011666667 0,000136111 0,001225 1,58796E-06 1,85262E-08
1,68 1,75 6 1,715 10,29 0,081666667 0,006669444 0,040016667 0,000544671 4,44815E-05
1,75 1,82 3 1,785 5,355 0,151666667 0,023002778 0,069008333 0,003488755 0,000529128
FUENTE: Encuesta

Cálculos respectivos

Tabla 14 Resultados

N 30
media ( ) 1,633333333
varianza muestral (S^2) 0,007462644
desviación estándar (S) 0,086386594
S^3 0,000644672
S^4 5,56911E-05
coeficiente de variación (CV) 0,052889752
coeficiente de asimetría Fisher (g1) 0,089086069
coeficiente curtosis (g2) 0,512619345

Interpretación

Dándole el primer vistazo a la tabla nos damos cuenta de que la mayoría de los

estudiantes tiene una estatura cercana al centro del rango aproximadamente entre 1.6 mts y 1.7

mts. Con una media de 1.63 mts y un coeficiente de variación de 0.51, tendríamos una

variabilidad de 1.2 mts.

Analizando los coeficientes para estimar una gráfica de distribución de los datos;

El coeficiente de Fisher en 0.089 algo muy cercano a 0 pero aun mayor nos aproximaría a una

gráfica simétrica con la media muy cerca de la mitad de los datos.


Mientras el coeficiente de Curtosis en 0.51 si es mucho mayor a 0 nos imaginaríamos una 23

gráfica con un pico pronunciado (leptocúrtica)

Veamos el grafico real de los datos.

Gráfico 12 Histograma de datos agrupados

ESTATURA
FISHER Y CURTOSIS

10
Frecuencia

0
1.505 1.575 1.645 1.715 1.785
estatura

Nota. Cada barra del histograma equivale a la amplitud (A)

Para nuestro fin esta es un variable complementaria que tiene sus usos acompañando a las

dos anteriores como por ejemplo la relación peso-estatura para identificar un posible sobrepeso.

En caso de llegar a nuestro objetivo general sería utilizada para hacer recomendaciones a los

estudiantes de que deporte practicar, por ejemplo; hay 9 estudiantes entre 1.6 y 1.82 mts los

cuales serían buenos elementos en un equipo de baloncesto o atletismo por su altura o zancada.

Variable 7: ESTATURA Y PESO

Identificar de qué manera se comporta el peso de acuerdo a la estatura de una persona.

Esto lo realizamos por medio de una regresión lineal simple tomando el PESO como la Variable

Independiente y la estatura como la Variable Dependiente


Tabla 15 Resultados 24

1,640333333
63,46666667
b1 107,4146502
Bo -112,7291645
Ecuación de regresión estimada ŷ=107,41x+-112,72
Coeficiente de Determinación 0,462257396
SCE 2997,090478
STC 5573,466667
SRC 2576,376189
Coeficiente de Correlación 0,679895136

Se realiza las respectivas fórmulas para llegar a los resultados que se encuentran en la tabla

anterior.

Con los datos de peso y estatura del grupo de 30 estudiantes realiza una tabla de dispersión para

así poder tener una predicción con estas dos variables.

Gráfico 13 Tabla de Diagrama de Dispersión.


25
Interpretación

Estas dos variables tienen un aumento de una correlación positiva con un coeficiente de

correlación de 0.6798% esto quiere decir que tiene una relación buena pero no muy fuerte.

Variable 8: ESTATURA Y EDAD

Identificar qué relación existe entre la estatura y edad.

Para responder a ello se realiza por medio de una Regresión Lineal y se obtiene la siguiente la
tabla:

Tabla 16 Resultados

1,640333333
23,2
b1 6,753347565
Bo 12,12225888
Ecuación de regresión estimada ŷ=6,75x+12,12
Coeficiente de Determinación 0,023973748
SCE 414,6159519
STC 424,8
SRC 10,18404813
Coeficiente de Correlación 0,154834583

Con los resultados obtenidos se procedió a realizar una Tabla de Dispersión para así apreciar los

puntos de dispersión y la línea de tendencia para observar de una mejor manera los resultados.
Gráfico 14 Tabla de Diagrama de Dispersión. 26

Interpretación

Tiene un aumento de la correlación positiva, los puntos de dispersión nos indican que hay

relación entre las variables ya que están cerca de la Línea de Tendencia. El coeficiente de

correlación es de 0,1548%.

Variable 9: EDAD Y PESO

Conocer como están relacionados los factores que se están evaluando de una variable respecto a
la otra.

Con ayuda de la Regresión Lineal nos apoyamos para obtener una respuesta para uno de los

objetivos específicos.
Tabla 16 Resultados 27

23,2
63,4667
b1 1,0221
Bo 39,7533
Ecuación de regresión estimada ŷ=1,02x+37,75
Coeficiente de Determinación 0,07963
SCE 5129,6587
STC 5573,4667
SRC 443,8080
Coeficiente de Correlación 0,28219

La tabla de dispersión se puede ver de una mejor manera los resultados sacados de la base de

datos.

Gráfico 15 Tabla de Diagrama de Dispersión.

EDAD VS PESO
120

100

80

60

40

20

0
0 5 10 15 20 25 30 35
Interpretación 28

Las dos variables tienen una relación positiva que los datos se agrupan de manera

positiva para lo que se busca. El coeficiente de correlación es de 0,2821%.


Conclusión 29

De acuerdo a lo que hemos visto anteriormente, a través de la encuesta que se realizó a 30

estudiantes del ITM, se identificó que el 63% de los estudiantes no practica ningún deporte.

tras saber esto también logramos identificar que un 77% del total de estudiantes consume algún

tipo de licor y la mayor parte de ellos son mujeres entre 18 y 23. teniendo en cuenta esto nos

enfocaríamos en deportes más femeninos.

la estatura promedio o media es de 1.63 más pero hay un grupo numeroso de hombres que miden

más de 1.70 mts que sería una buena opción para un taller de baloncesto, con la edad tendríamos

la mayoría de los estudiantes entre 19 y 25 años, su peso entre 50.1 y 76.5 kg y su estatura media

en 1.63; tendríamos un índice de masa corporal un poco más alto de lo normal ya que el peso

debería estar entre 49.2 - 66.2 kg para llevar un vida saludable.

Enfocándonos en aspectos específicos e implementando las ideas y patrones que obtuvimos en el

análisis de las variables (pag 16,17,18,19,20,21,22,23) tendríamos una alta probabilidad de que

nuestra idea de negocio sea sostenible y rentable.

Se aclara que no es un tipo de competencia con el área deportiva del Instituto Tecnológico

Metropolitano por eso nos enfocaremos en estudiantes que no practiquen ningún deporte por

falta de variedad y asesorías.


30

Referencias

Adriana Guerrero Peña, María Victoria Buitrago Cardona, María Curieses Paulete. (2007).
Estadistica Básica. Medellín: Instituto Tecnologico Metropolitano.
Universo Formulas. (s.f.). Obtenido de
https://www.universoformulas.com/estadistica/descriptiva/diagrama-barras/
Universo Formulas. (s.f.). Obtenido de
https://www.universoformulas.com/estadistica/descriptiva/diagrama-circular/
Universo Formulas. (s.f.). Obtenido de
https://www.universoformulas.com/estadistica/descriptiva/histograma/

Potrebbero piacerti anche