Organizacion de Datos

UNIVERSIDAD CENTRAL DEL ECUADOR
INGENIERIA QUIMICA
ESTADISTICA II
NOMBRE: Paul Gavilanes

PARALELO: 2
FECHA: 26 de junio del 2020
TEMA: Organización de datos
DOCENTE: Ing. Ghem Carvajal
Organización y Descripción de Datos

Para el ejercicio en clase:
 Definir la población y la variable aleatoria.
 Dibujar el diagrama de Puntos
 Dibujar el diagrama de tallo y hojas.
 Dibujar los seis histogramas más utilizados (frecuencias, frecuencias relativas,
frecuencias acumuladas “menor que”, frecuencias relativas acumuladas “menor que”,
frecuencias acumuladas “mayor que”, frecuencias relativas acumuladas “mayor
que”).
 Calcular media, mediana y moda. Interpretar estos valores.
 Calcular la desviación media, desviación estándar, el coeficiente de variación y el
error estándar. Interpretar estos valores.
 Calcular los percentiles del conjunto de datos. ¿Entre qué valores se encuentra el 25%
central de los datos?
 Dibujar el diagrama de caja y bigotes. ¿Existen puntos atípicos en sus datos? ¿Por
qué?
 Calcular dos estadísticos de asimetría y dos de apuntamiento, a su elección. Calcular
los coeficientes de sesgo estandarizado y curtosis estandarizada. Interpretar estos
valores.
Desarrollo:
En un proceso industrial se requiere el llenado de un envase estándar de 20 galones. Se está
evaluando el tiempo en el que la máquina de llenado 1 completa dicho volumen. Para ello se
levantó la siguiente información.
1. Definir la población y la variable aleatoria.
La población del ejercicio propuesto son todas las mediciones posibles de tiempo de llenado
de un recipiente de 20 galones.
La variable aleatoria es el tiempo de llenado de un recipiente de 20 galones.
2. Dibujar el diagrama de puntos.

Figura 2.1
Diagrama de Puntos
Gráfica de puntos de tiempo de llenado
48.6 50.4 52.2 54.0 55.8 57.6 59.4 61.2

tiempo de llenado
Fuente: Minitab, 2016

3. Dibujar el diagrama de Tallos y Hojas
Figura 3.1
Diagrama de Tallo y Hojas

Fuente: Minitab, 2016
Nota: no se incluyen los datos atípicos en el diagrama de tallo y hojas, se identificaron 4
valores de estos que se denotan como AA al final del diagrama.
4. Histogramas más Utilizados.

Existen 70 valores con un rango desde 48.64 a 62.45, utilizando la regla de Sturges se obtiene
8 clases las cuales se representan en la siguiente tabla:
Tabla 4.1
Tabla de Frecuencias
Frecuencia Frecuencia Frecuencia Frecuencia

Límite Límite Punto Frecuencia
Clase Frecuencia Acumulada Rel. Acum. Acumulada Rel. Acum.
Inferior superior Medio Realativa
Menor que Menor que Mayor que Mayor que
Li Ls mc Fi W Fa(<) Wa(<) Fa(>) Wa(>)

1 48.635 49.499 50.363 22 0.314 22 0.314 70 1
2 50.363 51.226 52.090 21 0.300 43 0.614 48 0.686
3 52.090 52.954 53.818 20 0.286 63 0.900 27 0.386
4 53.818 54.681 55.545 3 0.043 66 0.943 7 0.100
5 55.545 56.409 57.273 0 0.000 66 0.943 4 0.057
6 57.273 58.136 59.000 1 0.014 67 0.957 4 0.057
7 59.000 59.864 60.728 2 0.029 69 0.986 3 0.043
8 60.728 61.591 62.455 1 0.014 70 1.000 1 0.014
Fuente: Microsoft Excel, 2016

Figura 4.1
Histograma de Frecuencia Absoluta
25
20
Frecuencia absoluta
15
10
0
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase
Figura 4.2
Histograma de Frecuencias Relativas
0.350
0.300
Frecuencia Relativa
0.250
0.200
0.150
0.100
0.050
0.000
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase

Figura 4.3
Histograma Frecuencia Acumulada “Menor que”
80
70
60
Frec. Acumulada
50
40
30
20
10
0
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase
Figura 4.4
Histograma Frecuencia Relativa Acumulada “Menor que”
1.200
1.000
Frecuencia Relativa Acum.
0.800
0.600
0.400
0.200
0.000
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de CLase

Figura 4.5
Histograma Frecuencia Acumulada “Mayor que”
80
Frecuencia Acumulada 70
60
50
40
30
20
10
0
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase
Figura 4.6
Histograma Frecuencia Relativa Acumulada “Menor que”
1.2
1
Frecuencia Relativa Acum.
0.8
0.6
0.4
0.2
0
50.363 52.090 53.818 55.545 57.273 59.000 60.728 62.455
Marca de Clase

5. Calcular media, mediana y moda.
Tabla 5.1
Resumen Estadístico de datos
Resumen estadístico
Media 51.789
Mediana 51.31
49.45
49.74
49.76
Moda 50.19
51.28
51.93
52.24
Interpretación: En este caso los datos presentan varias modas por lo que se conoce esto
como multimodal, y se puede observar como la media es mayor que la mediana pudiendo
decir que los datos van a tener sesgo positivo o sea hacia la derecha.
6. Calcular desviación media, desviación estándar, el coeficiente de variación y el

error estándar.
Tabla 6.1
Resumen Estadístico de Datos
Resumen Estadístico
Desviación Media 1.70
Varianza 6.41
Desviación Estándar 2.53
Coeficiente de
Variación 4.89%
Error Estándar 0.30
Interpretación: analizando la desviación media y el coeficiente de variación se puede

observar que los datos pueden tener una tendencia no normal lo que podría provocar gran
variabilidad, ya que se observa que tiene una desviación de 0.0489 segundos por unidad de
media. Un valor considerable para este proceso lo que conlleva a pensar que existe dispersión
en los datos.
7. Calcular los percentiles del conjunto de datos. ¿Entre qué valores se encuentra
el 25% central de los datos?
Tabla 7.1
Percentiles para Tiempo de Llenado
1.00% 48.64 26.00% 50.19 51.00% 51.34 76.00% 52.58
2.00% 49.09 27.00% 50.19 52.00% 51.52 77.00% 52.58
3.00% 49.16 28.00% 50.19 53.00% 51.62 78.00% 52.72
4.00% 49.16 29.00% 50.28 54.00% 51.62 79.00% 52.78
5.00% 49.29 30.00% 50.3 55.00% 51.82 80.00% 52.8
6.00% 49.32 31.00% 50.32 56.00% 51.93 81.00% 52.82
7.00% 49.32 32.00% 50.46 57.00% 51.93 82.00% 52.85
8.00% 49.45 33.00% 50.49 58.00% 51.93 83.00% 52.9
9.00% 49.45 34.00% 50.49 59.00% 52 84.00% 52.9
10.00% 49.575 35.00% 50.56 60.00% 52.045 85.00% 52.91
11.00% 49.7 36.00% 50.62 61.00% 52.09 86.00% 53.4
12.00% 49.73 37.00% 50.62 62.00% 52.14 87.00% 53.4
13.00% 49.74 38.00% 50.63 63.00% 52.18 88.00% 53.5
14.00% 49.74 39.00% 50.87 64.00% 52.18 89.00% 53.55
15.00% 49.74 40.00% 50.885 65.00% 52.22 90.00% 53.805
16.00% 49.75 41.00% 50.9 66.00% 52.24 91.00% 54.06
17.00% 49.75 42.00% 50.95 67.00% 52.24 92.00% 54.12
18.00% 49.76 43.00% 50.96 68.00% 52.24 93.00% 54.33
19.00% 49.76 44.00% 50.96 69.00% 52.4 94.00% 54.33
20.00% 49.775 45.00% 51.07 70.00% 52.415 95.00% 58.79
21.00% 49.79 46.00% 51.11 71.00% 52.43 96.00% 59.26
22.00% 49.83 47.00% 51.11 72.00% 52.52 97.00% 59.26
23.00% 49.84 48.00% 51.28 73.00% 52.53 98.00% 60.39
24.00% 49.84 49.00% 51.28 74.00% 52.53 99.00% 62.45
25.00% 49.93 50.00% 51.31 75.00% 52.57 99.99% 62.45
Fuente: Statgraphics Centurion, 2016

El 25% central de los datos se encuentra entre los percentiles 63 y 37 que corresponden a los
valores de 52,18 y 50,62 respectivamente.
8. Diagrama de Caja y Bigotes
Figura 8.1
Gráfico de Cajade
Diagrama y Bigotes
Caja y Bigotes
48 51 54 57 60 63
tiempo de llenado
Fuente: Statgraphics Centurion, 2016.

¿Existen datos atípicos?
Como se puede observar en el gráfico, existen datos que están fuera de los limites lo que
verifica que si existen datos atípicos ya que posiblemente la distribución no provenga de una
normal.
9. Estadísticos de asimetría y apuntamiento. Calcular los coeficientes de sesgo

estandarizado y curtosis estandarizada
Estadísticos de Asimetría
Una medida del estadístico de asimetría es el Coeficiente de Karl Pearson el cual va a ser
calculado de la siguiente manera:
3(𝑥 − 𝑀𝑑 )
𝐴𝑠 =
𝑠
Donde:
X= media aritmética
Md= mediana
S= desviación típica o estándar
3(51.789 − 51.31)
𝐴𝑠 =
2.53
𝐴𝑠 = 0.57
Interpretación: El coeficiente de Pearson varía entre -3 y 3, el resultado obtenido muestra
que As >0 lo que significa que la distribución es asimétrica positivamente.
La otra forma de medir el estadístico de asimetría es la Medida de Fisher la cual se busca de
la siguiente manera:
𝛴𝑓 (𝑥𝑖 − 𝑥 )3
𝐴𝑠 =
𝑛𝑠 3
2429.59
𝐴𝑠 =
70 ∗ 2.533
𝐴𝑠 = 2,15
Interpretación: El valor obtenido es > 2 lo que indica que existe sesgo a la derecha y que
los datos no podrían ser de una distribución normal.
El coeficiente de sesgo estandarizado tiene la siguiente fórmula para su cálculo:

𝑆𝑒
𝑆𝐸 =
√6
𝑛
𝑆𝐸 = 7.62
Este resultado indica que al estar fuera del rango – 2+ 2 los datos no tienen forma de
distribución normal y al ser mayor a 2 tiene sesgo positivo o a la derecha.
Estadísticos de Apuntamiento
Una forma de determinar los indicadores de apuntamiento es la Medida de Fisher la cual se
realiza de la siguiente manera:
Σ𝑓 (𝑥𝑖 − 𝑥 )4
∝=
𝑛𝑠 4
24589.43
∝=
70 ∗ 2.534
∝= 8.57
Interpretación: El valor obtenido es >3 por lo que se dice que la distribución es leptocurtica,
lo que significa que posee una cantidad mayor de datos concentrados en torno a la media de
una distribución.
Otro método para calcular el apuntamiento es el coeficiente de curtosis estandarizada que
tiene la siguiente formula:
𝑔
𝑧=
√24
𝑛
𝑧 = 10.77
Este resultado indica que esta sobre fuera del rango de -2 +2 lo que indica que los datos no
provienen de una distribución normal y al tener un valor mayor a 2 indica que tiene una forma
leptocurtica.

Organizacion de Datos

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Organizacion de Datos

Caricato da

Copyright:

Formati disponibili

UNIVERSIDAD CENTRAL DEL ECUADOR

NOMBRE: Paul Gavilanes

Organización y Descripción de Datos

2. Dibujar el diagrama de puntos.

Gráfica de puntos de tiempo de llenado

48.6 50.4 52.2 54.0 55.8 57.6 59.4 61.2

Fuente: Minitab, 2016

Diagrama de Tallo y Hojas

4. Histogramas más Utilizados.

Frecuencia Frecuencia Frecuencia Frecuencia

Li Ls mc Fi W Fa(<) Wa(<) Fa(>) Wa(>)

Fuente: Microsoft Excel, 2016

Fuente: Microsoft Excel, 2016

Histograma de Frecuencias Relativas

Fuente: Microsoft Excel, 2016

Histograma Frecuencia Acumulada “Menor que”

Fuente: Microsoft Excel, 2016

Fuente: Microsoft Excel, 2016

Histograma Frecuencia Acumulada “Mayor que”

Fuente: Microsoft Excel, 2016

Fuente: Microsoft Excel, 2016

6. Calcular desviación media, desviación estándar, el coeficiente de variación y el

Resumen Estadístico de Datos

Interpretación: analizando la desviación media y el coeficiente de variación se puede

Fuente: Statgraphics Centurion, 2016

Fuente: Statgraphics Centurion, 2016.

9. Estadísticos de asimetría y apuntamiento. Calcular los coeficientes de sesgo

El coeficiente de sesgo estandarizado tiene la siguiente fórmula para su cálculo:

Potrebbero piacerti anche