Sei sulla pagina 1di 8

1

Trabajo de aplicacin: Estadstica


Universidad de San Carlos, Facultad de Ingeniera, Departamento de Estadstica
201318662, Vladimir Antonio Lpez Alvarado
201318600, Maria Alejandra Garcia-Salas Galindo

Resumen
El siguiente proyecto trata sobre la aplicacin de la estadstica sobre datos reales obtenidos en 1996, con la ayuda da la
Facultad de Ciencias Qumicas y Farmacia de la USAC en el cual realizaron un diagnstico con los alumnos de primer ingreso,
acerca de sus conocimientos de matemtica y fsica. En el cual se les pas un examen en donde se les realizaron preguntas de
algunos temas de matemtica y fsica.
Adicionalmente se les preguntaron algunos datos adicionales: Edad, Trabaja o no, estado civil, ttulo de secundaria, qu tipo
de establecimiento, ubicacin del establecimiento, recibi curso preuniversitario y las notas de lgica, lgebra, geometra, fsica
y nota total. Con los datos obtenidos en dicho diagnostico, se procedi a graficar las variables: trabaja, estado civil y tipo de
establecimiento. Tambin se realizo el anlisis de estadstica descriptiva a edad, lgica y algebra, dicho anlisis se procedi con los
datos sin agrupar y tomando en cuenta que es una poblacin. De la misma forma de realizo el anlisis de estadstica descriptiva a
la variable nota total, pero en este caso los datos fueron agrupados. Y por ltimo, en base a los clculos realizados anteriormente
se llego a la interpretacin de los datos, llegando a la conclusin que la poblacin a la cual se realizo dicho diagnostico es una
poblacin joven con una nota total bastante bajo.

I. O BJETIVOS
I-A. General
Aplicar estadstica descriptiva a un caso real

I-B. Especficos
* Relacionar la informacin contenida en la tabla con el tipo de variable que se est tabulando
* Conocer distintas maneras de organizar y presentar informacin incluyendo el clculo de algunos indicadores estadsticos,
la elaboracin de tablas y grficos

II. M ARCO T ERICO

II-A. Estadstica
Es el conjunto de procedimientos y tcnicas empleadas para recolectar, organizar y analizar datos, los cuales sirven de base
para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o naturales.

II-B. Estadstica Descriptiva


Estadstica Descriptiva se refiere a la recoleccin, presentacin, descripcin, anlisis e interpretacin de una coleccin de
datos, esencialmente consiste en resumir stos con uno o dos elementos de informacin (medidas descriptivas) que caracterizan
la totalidad de los mismos. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre s
mismos y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto
ya sea que se trate de una poblacin o de una muestra, esto ltimo en la etapa preliminar de la Inferencia Estadstica se
conocen los elementos de una muestra.

II-C. Anlisis estadstico


El anlisis estadstico es todo el proceso de organizacin, procesamiento, reduccin e interpretacin de datos para realizar
inferencias.

II-D. Datos y variables


Cuando se consideran los mtodos de organizacin, reduccin y anlisis de datos estadsticos, se hace necesario aclarar los
siguientes conceptos:
2

II-D1. Variable: Es toda caracterstica que vara de un elemento a otro de la poblacin.


II-D2. Dato: Son medidas o valores de las caractersticas susceptibles de observar y contar, se originan por la observacin
de una o ms variables de un grupo de elementos o unidades.

II-E. Representacin de datos


Los datos son colecciones de un nmero cualquiera de observaciones relacionadas entre s, para que sean tiles se deben
organizar de manera que faciliten su anlisis, se puedan seleccionar tendencias, describir relaciones, determinar causas y efectos
y permitan llegar a conclusiones lgicas y tomar decisiones bien fundamentadas; por esa razn es necesario conocer lo mtodos
de Organizacin y Representacin, la finalidad de stos mtodos es permitir ver rpidamente todas las caractersticas posibles
de los datos que se han recolectado.

II-E1. Representacin Tabular: Presenta las variables y las frecuencias con que los valores de stas se encuentran presentes
en el estudio. Resumen la informacin que deben poner en evidencia los aspectos que interesa mostrar y resalten las
comparaciones que se desean hacer notar.

II-E2. Representacin Grfica: Se llaman grficas a las diferentes formas de expresar los datos utilizando los medios de
representacin que proporciona la geometra. Entrega informacin utilizando dibujos que permiten no solo presentar los datos
sino expresar ideas que se desean destacar.

II-F. Medidas descriptivas


Con estas medidas se persigue reducir en pocas cifras significativas el conjunto de observaciones de una variable y describir
con ellas ciertas caractersticas de los conjuntos, logrando una comparacin ms precisa de los datos que la que se puede
conseguir con tablas y grficas.

II-G. Medidas de tendencia central (Promedios)


Los promedios son medidas de posicin que dan una descripcin compacta de cmo estn centrados los datos y una
visualizacin ms clara del nivel que alcanza la variable, pueden servir de base para medir o evaluar valores extremos o raros
y brinda mayor facilidad para efectuar comparaciones.
Entre estas medidas tenemos: La frecuencia, la media aritmtica, la moda, la mediana y la media ponderada.

II-H. Medidas de dispersin


Su objetivo es tratar de medir cuanto se diferencia los elementos estudiados, entre ellos se encuentran: Rango o recorrido,
Desviacin media, la varianza, la desviacin estndar y el coeficiente de variacin.

II-I. Medidas de posicin


Entre sus objetivo esta el tratar de medir el porcentaje de diferencia ente los elementos estudiados en una determinada
posicin, entre ellos se encuentran: los cuartiles y los percentiles.
3

III. R ESULTADOS

III-A. Inciso 2. Graficar las variables: Trabaja, estado civil, ttulo y tipo de establecimiento

Figura 1: Alumnos que Trabajan

Figura 2: Estado Civil


4

Figura 3: Titulo del alumno

Figura 4: Tipo de establecimiento


5

III-B. Inciso 3. Calcular estadstica descriptiva a edad, lgica y lgebra sin agrupar datos.

EDAD LOGICA ALGEBRA

Mnimo 16 Mnimo 0 Mnimo 0


Mximo 29 Mximo 100 Mximo 82
Rango 13 Rango 100 Rango 82
Moda 18 Moda 50 Moda 18
Mediana 18 Mediana 25 Mediana 36
Suma 2755 Suma 5200 Suma 4993
Conteo 146 Conteo 146 Conteo 146
Media 18.86986301369863 Media 35.61643835616438 Media 34.198630136986303
Var. poblacin 3.6885438168511917 Var. poblacin 597.90767498592606 Var. poblacin 494.88520360292739
Desv. Estndar 1.920558204494514 Desv. Estndar 24.452150723114851 Desv. Estndar 22.246015454524152
CV 10.177912807847516 CV 68.654115491822481 CV 65.049434335279912
Kurtosis 6.2493299479836679 Kurtosis -0.17595309707525608 Kurtosis -0.76022266424781337
Asimetra 1.9749276109262688 Asimetra 0.30237486943837555 Asimetra 0.34487795148767109
Q1 18 Q1 25 Q1 18
Q3 20 Q3 50 Q3 45
P1O 17 P1O 0 P1O 9
P90 21 P90 75 P90 76.599999999999994

III-C. Inciso 4. Agrupar la variable nota total y realizar estadstica descriptiva

TOTAL error TOTAL nuevo

Mnimo 8 Mnimo 9
Mximo 92 Mximo 89
Rango 84 Rango 80.25
Clases 8 Clases 8
Intervalo 10 Intervalo 10
Moda 40 Moda 17
Mediana 38 Mediana 37
Suma 5801 Suma 5770
Conteo 146 Conteo 146
Media 39.732876712328768 Media 39.517123287671232
Varianza 312.74884270193667 Varianza 319.88504959848842
Desvo Estndar 17.68470646355027 Desvo Estndar 17.885330570008719
CV 44.509000925329076 CV 45.259697776605826
Kurtosis -0.12979233722945027 Kurtosis -0.118814530039272
Asimetra / Sesgo 0.61662540778322994 Asimetra / Sesgo 0.55649557869119004
Q1 26.25 Q1 25.3125
Q3 51 Q3 50.375
P1O 20 P1O 16.75
P90 68 P90 65
6

L.A. L.R. xi fi Fi fri % xi*fi (xi x)2 fi*(xi x)2


9 18 8.5 18.5 13.5 18 18 12.328767123287671 243 680.99549634077675 12257.918934133981
19 28 18.5 28.5 23.5 24 42 16.43835616438356 564 259.07768812159873 6217.8645149183694
29 38 28.5 38.5 33.5 34 76 23.287671232876711 1139 37.159879902420684 1263.4359166823033
39 48 38.5 48.5 43.5 31 107 21.232876712328768 1348.5 15.242071683242656 472.50422218052233
49 58 48.5 58.5 53.5 14 121 9.5890410958904102 749 193.32426346406461 2706.5396884969045
59 68 58.5 68.5 63.5 17 138 11.643835616438356 1079.5 571.40645524488662 9713.909739163073
69 78 68.5 78.5 73.5 3 141 2.054794520547945 220.5 1149.4886470257086 3448.4659410771255
79 88 78.5 88.5 83.5 3 144 2.054794520547945 250.5 1927.5708388065304 5782.7125164195913
89 98 88.5 98.5 93.5 2 146 1.3698630136986301 187 2905.6530305873525 5811.3060611747051
5781 47674.657534246573
7

III-D. Inciso 5. Interpretando los resultados estadsticamente

III-D1. Interpretando inciso 3:

III-D1a. Edad:
La edad mas frecuente es 18 aos, es una poblacin joven
La mitad de las notas es menor a 38 puntos y la otra mitad mayor que 38 puntos
Si todos tuvieran la misma edad seria 18.869 aos
La distancia promedio entre los datos y la media es 1.92
Si se acepta 20 % como limite, entonces los datos son homogneos
Como K>0.263 la distribucin es Leptocurtica
La distribucin es asimtrica positiva
El 25 % de los datos esta por debajo de 18 aos y el 75 % arriba de 18 aos
El 75 % de los datos esta por debajo de 20 aos y el 25 % arriba de 20 aos
El 10 % de los datos esta por debajo de 17 aos y el 90 % arriba de 18 aos
El 90 % de los datos esta por debajo de 21 aos y el 10 % arriba de 21 aos

III-D1b. Lgica:
La puntuacin mas frecuente es 50
La mitad de las puntuaciones es menor que 25 y la otra mitad mayor que 25
Si todos tuvieran la misma puntuacin seria 35.616
La distancia promedio entre los datos y la media es 24.452
Si se acepta 20 % como limite, entonces los datos son heterogneos
Como K<0.263 la distribucin es Platicurtica
La distribucin es asimtrica positiva
El 25 % de los datos esta por debajo de 25 y el 75 % arriba de 25
El 75 % de los datos esta por debajo de 50 y el 25 % arriba de 50
El 10 % de los datos esta por debajo de 0 y el 90 % arriba de 0
El 90 % de los datos esta por debajo de 75 y el 10 % arriba de 75

III-D1c. lgebra:
La puntuacin mas frecuente es 36
La mitad de las puntuaciones es menor que 36 y la otra mitad mayor que 36
Si todos tuvieran la misma puntuacin seria 34.198
La distancia promedio entre los datos y la media es 22.246
Si se acepta 20 % como limite, entonces los datos son heterogneos
Como K<0.263 la distribucin es Platicurtica
La distribucin es asimtrica positiva
El 25 % de los datos esta por debajo de 18 y el 75 % arriba de 18
El 75 % de los datos esta por debajo de 45 y el 25 % arriba de 45
El 10 % de los datos esta por debajo de 9 y el 90 % arriba de 9
El 90 % de los datos esta por debajo de 76.6 y el 10 % arriba de 76.6

III-D2. Interpretando inciso 4: Se define la variable calculada como error a los datos de la columna total tomados
directamente de la tabla proporcionada. Se define la variable calculada nuevo a los datos tomados de la columna total calculados
como promedio de las cuatro notas proporcionadas en la tabla.

III-D2a. Total error:


La puntuacin mas frecuente es 40
La mitad de las puntuaciones es menor que 38 y la otra mitad mayor que 38
Si todos tuvieran la misma puntuacin seria 39.733
La distancia promedio entre los datos y la media es 17.685
Si se acepta 20 % como limite, entonces los datos son heterogneos
Como K<0.263 la distribucin es Platicurtica
La distribucin es asimtrica positiva
8

El 25 % de los datos esta por debajo de 26.25 y el 75 % arriba de 26.25


El 75 % de los datos esta por debajo de 51 y el 25 % arriba de 51
El 10 % de los datos esta por debajo de 20 y el 90 % arriba de 20
El 90 % de los datos esta por debajo de 68 y el 10 % arriba de 68

III-D2b. Total nuevo:


La puntuacin mas frecuente es 17
La mitad de las puntuaciones es menor que 37 y la otra mitad mayor que 37
Si todos tuvieran la misma puntuacin seria 39.517
La distancia promedio entre los datos y la media es 17.885
Si se acepta 20 % como limite, entonces los datos son heterogneos
Como K<0.263 la distribucin es Platicurtica
La distribucin es asimtrica positiva
El 25 % de los datos esta por debajo de 25.313 y el 75 % arriba de 25.313
El 75 % de los datos esta por debajo de 50.375 y el 25 % arriba de 50.375
El 10 % de los datos esta por debajo de 16.75 y el 90 % arriba de 16.75
El 90 % de los datos esta por debajo de 65 y el 10 % arriba de 65

IV. C ONCLUSIONES
* Los datos muestran numricamente lo que el analista puede detectar

* La utilizacin de grficas resulto ser muy til para conocer del perfil de los estudiantes de nuevo ingreso.
* El calculo de los datos estadsticos por diferentes mtodos fue importante para poder conocer los datos tanto analtica
como grficamente

V. F UENTES DE CONSULTA
[1] JAY L., DEVORE. Probabilidad y Estadstica para Ingeniera y Ciencias.
[2] CENGAGE Learning. 7ma. Edicin. 2008, California Polytechnic State University, San Luis Obispo.