Sei sulla pagina 1di 11

UNIVERSIDAD CENTRAL DEL ECUADOR

INGENIERIA QUIMICA
ESTADISTICA II

NOMBRE: Paul Gavilanes


PARALELO: 2
FECHA: 26 de junio del 2020
TEMA: Organización de datos
DOCENTE: Ing. Ghem Carvajal

Organización y Descripción de Datos


Para el ejercicio en clase:
 Definir la población y la variable aleatoria.
 Dibujar el diagrama de Puntos
 Dibujar el diagrama de tallo y hojas.
 Dibujar los seis histogramas más utilizados (frecuencias, frecuencias relativas,
frecuencias acumuladas “menor que”, frecuencias relativas acumuladas “menor que”,
frecuencias acumuladas “mayor que”, frecuencias relativas acumuladas “mayor
que”).
 Calcular media, mediana y moda. Interpretar estos valores.
 Calcular la desviación media, desviación estándar, el coeficiente de variación y el
error estándar. Interpretar estos valores.
 Calcular los percentiles del conjunto de datos. ¿Entre qué valores se encuentra el 25%
central de los datos?
 Dibujar el diagrama de caja y bigotes. ¿Existen puntos atípicos en sus datos? ¿Por
qué?
 Calcular dos estadísticos de asimetría y dos de apuntamiento, a su elección. Calcular
los coeficientes de sesgo estandarizado y curtosis estandarizada. Interpretar estos
valores.
Desarrollo:
En un proceso industrial se requiere el llenado de un envase estándar de 20 galones. Se está
evaluando el tiempo en el que la máquina de llenado 1 completa dicho volumen. Para ello se
levantó la siguiente información.
1. Definir la población y la variable aleatoria.
La población del ejercicio propuesto son todas las mediciones posibles de tiempo de llenado
de un recipiente de 20 galones.
La variable aleatoria es el tiempo de llenado de un recipiente de 20 galones.

2. Dibujar el diagrama de puntos.


Figura 2.1
Diagrama de Puntos

Gráfica de puntos de tiempo de llenado

48.6 50.4 52.2 54.0 55.8 57.6 59.4 61.2


tiempo de llenado

Fuente: Minitab, 2016


3. Dibujar el diagrama de Tallos y Hojas
Figura 3.1

Diagrama de Tallo y Hojas


Fuente: Minitab, 2016
Nota: no se incluyen los datos atípicos en el diagrama de tallo y hojas, se identificaron 4
valores de estos que se denotan como AA al final del diagrama.

4. Histogramas más Utilizados.


Existen 70 valores con un rango desde 48.64 a 62.45, utilizando la regla de Sturges se obtiene
8 clases las cuales se representan en la siguiente tabla:

Tabla 4.1
Tabla de Frecuencias

Frecuencia Frecuencia Frecuencia Frecuencia


Límite Límite Punto Frecuencia
Clase Frecuencia Acumulada Rel. Acum. Acumulada Rel. Acum.
Inferior superior Medio Realativa
Menor que Menor que Mayor que Mayor que

Li Ls mc Fi W Fa(<) Wa(<) Fa(>) Wa(>)


1 48.635 49.499 50.363 22 0.314 22 0.314 70 1
2 50.363 51.226 52.090 21 0.300 43 0.614 48 0.686
3 52.090 52.954 53.818 20 0.286 63 0.900 27 0.386
4 53.818 54.681 55.545 3 0.043 66 0.943 7 0.100
5 55.545 56.409 57.273 0 0.000 66 0.943 4 0.057
6 57.273 58.136 59.000 1 0.014 67 0.957 4 0.057
7 59.000 59.864 60.728 2 0.029 69 0.986 3 0.043
8 60.728 61.591 62.455 1 0.014 70 1.000 1 0.014

Fuente: Microsoft Excel, 2016


Figura 4.1
Histograma de Frecuencia Absoluta

25

20
Frecuencia absoluta

15

10

0
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase

Fuente: Microsoft Excel, 2016

Figura 4.2

Histograma de Frecuencias Relativas

0.350

0.300
Frecuencia Relativa

0.250

0.200

0.150

0.100

0.050

0.000
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase

Fuente: Microsoft Excel, 2016


Figura 4.3

Histograma Frecuencia Acumulada “Menor que”

80

70

60
Frec. Acumulada

50

40

30

20

10

0
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase

Fuente: Microsoft Excel, 2016

Figura 4.4
Histograma Frecuencia Relativa Acumulada “Menor que”

1.200

1.000
Frecuencia Relativa Acum.

0.800

0.600

0.400

0.200

0.000
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de CLase

Fuente: Microsoft Excel, 2016


Figura 4.5

Histograma Frecuencia Acumulada “Mayor que”

80
Frecuencia Acumulada 70

60

50

40

30

20

10

0
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase

Fuente: Microsoft Excel, 2016

Figura 4.6
Histograma Frecuencia Relativa Acumulada “Menor que”

1.2

1
Frecuencia Relativa Acum.

0.8

0.6

0.4

0.2

0
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase

Fuente: Microsoft Excel, 2016


5. Calcular media, mediana y moda.
Tabla 5.1
Resumen Estadístico de datos

Resumen estadístico
Media 51.789
Mediana 51.31
49.45
49.74
49.76
Moda 50.19
51.28
51.93
52.24
Fuente: Microsoft Excel, 2016
Interpretación: En este caso los datos presentan varias modas por lo que se conoce esto
como multimodal, y se puede observar como la media es mayor que la mediana pudiendo
decir que los datos van a tener sesgo positivo o sea hacia la derecha.

6. Calcular desviación media, desviación estándar, el coeficiente de variación y el


error estándar.
Tabla 6.1

Resumen Estadístico de Datos

Resumen Estadístico
Desviación Media 1.70
Varianza 6.41
Desviación Estándar 2.53
Coeficiente de
Variación 4.89%
Error Estándar 0.30
Fuente: Microsoft Excel, 2016

Interpretación: analizando la desviación media y el coeficiente de variación se puede


observar que los datos pueden tener una tendencia no normal lo que podría provocar gran
variabilidad, ya que se observa que tiene una desviación de 0.0489 segundos por unidad de
media. Un valor considerable para este proceso lo que conlleva a pensar que existe dispersión
en los datos.
7. Calcular los percentiles del conjunto de datos. ¿Entre qué valores se encuentra
el 25% central de los datos?
Tabla 7.1
Percentiles para Tiempo de Llenado
1.00% 48.64 26.00% 50.19 51.00% 51.34 76.00% 52.58
2.00% 49.09 27.00% 50.19 52.00% 51.52 77.00% 52.58
3.00% 49.16 28.00% 50.19 53.00% 51.62 78.00% 52.72
4.00% 49.16 29.00% 50.28 54.00% 51.62 79.00% 52.78
5.00% 49.29 30.00% 50.3 55.00% 51.82 80.00% 52.8
6.00% 49.32 31.00% 50.32 56.00% 51.93 81.00% 52.82
7.00% 49.32 32.00% 50.46 57.00% 51.93 82.00% 52.85
8.00% 49.45 33.00% 50.49 58.00% 51.93 83.00% 52.9
9.00% 49.45 34.00% 50.49 59.00% 52 84.00% 52.9
10.00% 49.575 35.00% 50.56 60.00% 52.045 85.00% 52.91
11.00% 49.7 36.00% 50.62 61.00% 52.09 86.00% 53.4
12.00% 49.73 37.00% 50.62 62.00% 52.14 87.00% 53.4
13.00% 49.74 38.00% 50.63 63.00% 52.18 88.00% 53.5
14.00% 49.74 39.00% 50.87 64.00% 52.18 89.00% 53.55
15.00% 49.74 40.00% 50.885 65.00% 52.22 90.00% 53.805
16.00% 49.75 41.00% 50.9 66.00% 52.24 91.00% 54.06
17.00% 49.75 42.00% 50.95 67.00% 52.24 92.00% 54.12
18.00% 49.76 43.00% 50.96 68.00% 52.24 93.00% 54.33
19.00% 49.76 44.00% 50.96 69.00% 52.4 94.00% 54.33
20.00% 49.775 45.00% 51.07 70.00% 52.415 95.00% 58.79
21.00% 49.79 46.00% 51.11 71.00% 52.43 96.00% 59.26
22.00% 49.83 47.00% 51.11 72.00% 52.52 97.00% 59.26
23.00% 49.84 48.00% 51.28 73.00% 52.53 98.00% 60.39
24.00% 49.84 49.00% 51.28 74.00% 52.53 99.00% 62.45
25.00% 49.93 50.00% 51.31 75.00% 52.57 99.99% 62.45

Fuente: Statgraphics Centurion, 2016


El 25% central de los datos se encuentra entre los percentiles 63 y 37 que corresponden a los
valores de 52,18 y 50,62 respectivamente.
8. Diagrama de Caja y Bigotes
Figura 8.1
Gráfico de Cajade
Diagrama y Bigotes
Caja y Bigotes

48 51 54 57 60 63
tiempo de llenado

Fuente: Statgraphics Centurion, 2016.


¿Existen datos atípicos?

Como se puede observar en el gráfico, existen datos que están fuera de los limites lo que
verifica que si existen datos atípicos ya que posiblemente la distribución no provenga de una
normal.

9. Estadísticos de asimetría y apuntamiento. Calcular los coeficientes de sesgo


estandarizado y curtosis estandarizada

Estadísticos de Asimetría
Una medida del estadístico de asimetría es el Coeficiente de Karl Pearson el cual va a ser
calculado de la siguiente manera:
3(𝑥 − 𝑀𝑑 )
𝐴𝑠 =
𝑠
Donde:
X= media aritmética

Md= mediana
S= desviación típica o estándar
3(51.789 − 51.31)
𝐴𝑠 =
2.53
𝐴𝑠 = 0.57
Interpretación: El coeficiente de Pearson varía entre -3 y 3, el resultado obtenido muestra
que As >0 lo que significa que la distribución es asimétrica positivamente.
La otra forma de medir el estadístico de asimetría es la Medida de Fisher la cual se busca de
la siguiente manera:

𝛴𝑓 (𝑥𝑖 − 𝑥 )3
𝐴𝑠 =
𝑛𝑠 3

2429.59
𝐴𝑠 =
70 ∗ 2.533

𝐴𝑠 = 2,15

Interpretación: El valor obtenido es > 2 lo que indica que existe sesgo a la derecha y que
los datos no podrían ser de una distribución normal.

El coeficiente de sesgo estandarizado tiene la siguiente fórmula para su cálculo:


𝑆𝑒
𝑆𝐸 =
√6
𝑛
𝑆𝐸 = 7.62
Este resultado indica que al estar fuera del rango – 2+ 2 los datos no tienen forma de
distribución normal y al ser mayor a 2 tiene sesgo positivo o a la derecha.

Estadísticos de Apuntamiento
Una forma de determinar los indicadores de apuntamiento es la Medida de Fisher la cual se
realiza de la siguiente manera:

Σ𝑓 (𝑥𝑖 − 𝑥 )4
∝=
𝑛𝑠 4

24589.43
∝=
70 ∗ 2.534
∝= 8.57

Interpretación: El valor obtenido es >3 por lo que se dice que la distribución es leptocurtica,
lo que significa que posee una cantidad mayor de datos concentrados en torno a la media de
una distribución.
Otro método para calcular el apuntamiento es el coeficiente de curtosis estandarizada que
tiene la siguiente formula:
𝑔
𝑧=
√24
𝑛
𝑧 = 10.77

Este resultado indica que esta sobre fuera del rango de -2 +2 lo que indica que los datos no
provienen de una distribución normal y al tener un valor mayor a 2 indica que tiene una forma
leptocurtica.

Potrebbero piacerti anche