Sei sulla pagina 1di 13

Organización y

clasificación de
datos
Agrupados y no agrupados

Jorge Edgar
INSTITUTO TECNOLÓGICO DE HERMOSILLO
Probabilidad y Estadística Descriptiva. Guía Unidad 1

En una evaluación de conocimientos departamental en la asignatura de Probabilidad y Estadística


Descriptiva se examinó un grupo compuesto por 50 alumnos. Los resultados fueron los siguientes

Datos no agrupados
37 38 48 49 57 57 61 61 63 64
65 66 66 67 68 68 69 70 71 72
73 73 74 74 74 76 76 77 77 77
78 78 78 80 80 80 81 83 83 85
85 85 87 88 89 89 90 93 96 97

Paso 1. Se tienen los datos

Paso 2. Se clasifican los datos de menor a mayor

Paso 3. Se determina el número de clases con alguna de las dos fórmulas siguientes

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = √𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 = 1 + 3.3 log(𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠)


Nota 1: Se usará la primera formula

Nota 2: Al resultado obtenido, si da entero con decimales, se redondea al entero más cercano, es
decir, si es menor que 0.5 se redondea al número entero, si es mayor que 0.5 se redondea al
siguiente entero y si dio con 0.5 se redondea al siguiente entero

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = √50 = 7.0710


Por lo que este problema tendrá 7 clases

Paso 4. Se calcula el tamaño del ancho de clase o intervalo


𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟
𝐴𝑛𝑐ℎ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 = 𝑐 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠
Nota 3: El valor mayor corresponde, por obvias razones, al último valor de los datos ordenados de
menor a mayor (en esta actividad el 97) y el valor mayor corresponde al primer valor de los datos
ordenados de menor a mayor (en esta actividad el 37)
97 − 37 60
𝑐= = = 8.5714
7 7
Solo se toma la parte entera, que es 8

Paso 5. Se establece el tamaño exacto del intervalo

En este paso se obtiene la unidad de variación. La unidad de variación es una unidad que se da en
el establecimiento de los límites superiores del intervalo, con la finalidad de establecer un valor
anterior al siguiente límite inferior de la clase siguiente. Este valor puede variar, dependiendo si los
datos del problema contienen decimales, por lo que la unidad de variación puede quedar en
decimales si los datos no tienen mucha diferencia entera entre ellos (es decir, por ejemplo, las
estaturas).

Como los datos son enteros y no se ve mucha discrepancia entre ellos, su unidad de variación será
de uno, por lo tanto, para esta actividad, el tamaño exacto del intervalo será de 9.

Paso 6. Se identifican los límites de clase

𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 =


𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 + 𝑇𝑎𝑚𝑎ñ𝑜 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 =
𝐿𝑖 = 𝐿𝑖−1 + 𝑐𝑒
Nota 4: el primer límite inferior (el de la primera clase, clase A) es el primer valor de los datos
ordenados de menor a mayor (en esta actividad el 37), por lo que se obtienen los siguientes seis
valores para las clases restantes

Clase Sustitución de datos para límite inferior Resultado


A 37 37
B 37 + 9 46
C 46 + 9 55
D 55 + 9 64
E 64 + 9 73
F 73 + 9 82
G 82 + 9 91

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 =


𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 + 𝑇𝑎𝑚𝑎ñ𝑜 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 − 𝑈𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛
𝐿𝑠 = 𝐿𝑖 + 𝐶𝑒 − 𝑈𝑣
Nota 5: En esta actividad se usará uno como unidad de variación.

Clase Sustitución de datos para límite superior Resultado


A 37 + 9 − 1 45
B 46 + 9 − 1 54
C 55 + 9 − 1 63
D 64 + 9 − 1 72
E 73 + 9 − 1 81
F 82 + 9 − 1 90
G 91 + 9 − 1 99

Paso 7. Se crea la tabla en base a los datos de la actividad. Se anexa una columna llamada
frecuencia absoluta (𝑓𝑖 ) (o frecuencia únicamente) la cual contiene los valores comprendidos entre
el límite inferior y el límite superior de la clase
Datos no agrupados
37 38 48 49 57 57 61 61 63 64
65 66 66 67 68 68 69 70 71 72
73 73 74 74 74 76 76 77 77 77
78 78 78 80 80 80 81 83 83 85
85 85 87 88 89 89 90 93 96 97

Paso 8. Obtención de la marca de clase y los límites exactos


𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 + 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 =
2
𝐿𝑖 + 𝐿𝑠
𝑀𝑖 =
2
Nota 6: Para la marca de clase solo se usan los límites inferior y superior, sumados, de la clase,
divididos entre 2. Por lo tanto

Clase Sustitución de datos para marca de clase Resultado


A 37 + 45 41
2
B 46 + 54 50
2
C 55 + 63 59
2
D 64 + 72 68
2
E 73 + 81 77
2
F 82 + 90 86
2
G 91 + 99 95
2
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 =
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 − 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 −
2
𝐿𝑖+1 − 𝐿𝑠
𝐿𝑖𝑒 = 𝐿𝑖 −
2
Nota 7: Se van sustituyendo los datos en cada clase para obtener el límite inferior exacto.

Nota 8: El límite inferior de la penúltima clase es el límite superior de la última clase, más la
diferencia entre el límite inferior de la última clase y el límite superior de la penúltima clase. Esta
nota es referente a la última clase (clase G), debido a que en esta se ocupa el límite inferior de la
clase siguiente y como no hay, se obtiene con este paso indicado y de la siguiente manera

𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑒 =


𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑒 + (𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑒 − 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑝𝑒𝑛ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑒)

𝐿𝑖𝑢 = 𝐿𝑠 + (𝐿𝑖 − 𝐿𝑠−1 )


𝐿𝑖𝑢 = 99 + (91 − 90) = 100

Clase Sustitución de datos para límite inferior Resultado


A 46 − 45 36.5
37 −
2
B 55 − 54 45.5
46 −
2
C 64 − 63 54.5
55 −
2
D 73 − 62 63.5
64 −
2
E 82 − 81 72.5
73 −
2
F 91 − 90 81.5
82 −
2
G 100 − 99 90.5
91 −
2

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 =


𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 − 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒
𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 +
2
𝐿𝑖+1 − 𝐿𝑠
𝐿𝑠𝑒 = 𝐿𝑠 +
2
Clase Sustitución de datos para límite superior Resultado
A 46 − 45 45.5
45 +
2
B 55 − 54 54.5
54 +
2
C 64 − 63 63.5
63 +
2
D 73 − 62 72.5
72 +
2
E 82 − 81 81.5
81 +
2
F 91 − 90 90.5
90 +
2
G 100 − 99 99.5
99 +
2

Paso 9. Obtener la frecuencia acumulada

Nota 9: La frecuencia acumulada es aquella que se va sumando con el dato contenido en la clase
más el anterior obtenido de la suma de las frecuencias.

Por lo tanto, la tabla se expande de la siguiente manera

Paso 10. Obtención de las medidas de tendencia central para datos no agrupados y datos
agrupados

Para datos no agrupados

Las medidas de tendencia central a obtener son la media (o promedio), mediana y moda
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
𝑀𝑒𝑑𝑖𝑎 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 + 1 𝑛 + 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = =
2 2
Nota 10: Al determinar la posición de la mediana se determina el valor de la misma por el dato
contenido en dicha posición. Si la cantidad de datos es par, se debe obtener un promedio del valor
de los dos elementos centrales.

𝑀𝑜𝑑𝑎 = 𝐷𝑎𝑡𝑜 𝑞𝑢𝑒 𝑚𝑎𝑠 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒


Nota 11: A veces se presentan dos o más valores que se repiten con mayor frecuencia. En este
caso, a los datos se les conoce como bimodales o multimodales, respectivamente.
37 + 38 + 48 + 49 + 57 + 57 + 61 + 61 + 63 + 64
+65 + 66 + 66 + 67 + 68 + 68 + 69 + 70 + 71 + 72
+73 + 73 + 74 + 74 + 74 + 76 + 76 + 77 + 77 + 77
+78 + 78 + 78 + 80 + 80 + 80 + 81 + 83 + 83 + 85
3673
𝑥̅ = +85 + 85 + 87 + 88 + 89 + 89 + 90 + 93 + 96 + 97 = = 73.46
50 50

50 + 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = = 25.5
2
Nota 12: Como la cantidad de datos es par y el dato contenido en la posición 25 es 74 y en la
posición 26 es 76, se saca un promedio de ambos valores centrales
74 + 76
𝑀𝑒 = = 75
2
Nota 13: Como los datos que más se repiten son 74, 77, 78, 80 y 85, entonces es multimodal.

Para datos agrupados


𝑆𝑢𝑚𝑎(𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 ∗ 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑐𝑙𝑎𝑠𝑒)
𝑀𝑒𝑑𝑖𝑎 =
𝑆𝑢𝑚𝑎(𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎𝑐 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑐𝑙𝑎𝑠𝑒)
𝑆𝑢𝑚𝑎(𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 ∗ 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑐𝑙𝑎𝑠𝑒)
𝑀𝑒𝑑𝑖𝑎 =
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒 𝑙𝑎 ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑒
∑𝑛𝑖=1(𝑀𝑖 ∗ 𝑓𝑖 ) ∑𝑛𝑖=1(𝑀𝑖 ∗ 𝑓𝑖 )
𝑥̅ = =
∑𝑛𝑖=1 𝑓𝑖 𝑁

Nota 14: La media para datos agrupados se obtiene multiplicando la marca de clase por la
frecuencia relativa de la misma clase. Al final se suman los resultados de las multiplicaciones y se
divide entre el total de la suma de la frecuencia relativa de cada clase.
Nota 15: Al obtener las medidas de tendencia central, así como los cuantiles y las medidas de
dispersión para datos agrupados, los resultados obtenidos pueden diferir un poco con respecto a
los no agrupados.
41 ∗ 2 + 50 ∗ 2 + 59 ∗ 5 + 68 ∗ 11 + 77 ∗ 17 + 86 ∗ 10 + 95 ∗ 3 3679
𝑥̅ = = = 73.58
50 50

𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒 𝑙𝑎 ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑒 + 1


𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 =
2
∑𝑛𝑖=1 𝑓𝑖 + 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 =
2
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =

𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑚𝑜𝑑𝑎


𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑐𝑙𝑎𝑠𝑒
( − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎)
2
+ (𝐴𝑛𝑐ℎ𝑜 𝑒𝑥𝑎𝑐𝑡𝑜)
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

(∑𝑛𝑖=1 𝑓𝑖 ⁄2 − 𝑓𝑎−1(𝐶𝑀𝑒) )
𝑀𝑒 = 𝐿𝑖𝑒(𝐶𝑀𝑒) + (𝐶𝑒 )
𝑓𝑖(𝐶𝑀𝑒)

Nota 16: Para obtener la mediana primero se debe obtener su posición, es decir, entre que límites
se encuentra localizada. Para esto se hace uso de la tabla de frecuencias, en la sección de
frecuencia acumulada. Recordar que la frecuencia acumulada es el acumulo de las frecuencias,
donde inicia una y termina la otra.
50 + 1 51
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = = = 25.5
2 2
Checamos la tabla de distribución de frecuencias, en la frecuencia acumulada vemos que la clase E
iniciaría en el dato 21 y termina en el 37 (de ahí el número 37), por lo tanto, la mediana se
encuentra en la clase E, de ahí obtendremos los datos a ocupar para la formula.

Nota 17: Puede haber ocasiones en que la mediana, dependiendo de la cantidad de clases en la
tabla de distribución de frecuencias, quede en los extremos, es decir, en la primera clase o última
clase, por lo que, si alguno de los datos a ocupar no existen, su valor es cero, por ejemplo, la
frecuencia acumulada anterior.
(50⁄2 − 20) (25.5 − 20) 5.5 ∗ 9
𝑀𝑒 = 72.5 + (81.5 − 72.5) = 72.5 + (9) = 72.5 + = 75.4117
17 17 17

𝑀𝑜𝑑𝑎 =
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑚𝑜𝑑𝑎
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑜𝑑𝑎 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑜𝑑𝑎
+ (𝐴𝑛𝑐ℎ𝑜 𝑒𝑥𝑎𝑐𝑡𝑜)
2 ∗ 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑜𝑑𝑎 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑜𝑑𝑎 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑜𝑑𝑎
𝑓𝑖(𝑀𝑜) − 𝑓𝑖−1(𝑀𝑜)
𝑀𝑜 = 𝐿𝑖𝑒(𝑀𝑜) + (𝐶 )
2 ∗ 𝑓𝑖(𝑀𝑜) − 𝑓𝑖−1(𝑀𝑜) − 𝑓𝑖+1(𝑀𝑜) 𝑒

Nota 18: Puede haber ocasiones en que haya más de dos modas, esto es debido a que la moda
para datos agrupados está basada en localizar la clase con la mayor cantidad de datos y si hay dos
o más clases con la misma cantidad entonces hay dos o más modas.

Nota 19: Puede haber ocasiones en que la moda, dependiendo de la cantidad de clases en la tabla
de distribución de frecuencias, quede en los extremos, es decir, en la primera clase o última clase,
por lo que, si alguno de los datos a ocupar no existen, su valor es cero, por ejemplo, la frecuencia
acumulada anterior.

Si checamos la tabla de distribución de frecuencias, en la sección de frecuencia, observamos que la


que contiene mayor cantidad es la clase E por tener 17, por lo tanto, la moda se encuentra en la
clase E. De ahí sacamos los datos para obtener la moda
17 − 11 6 6∗9
𝑀𝑜 = 72.5 + (81.5 − 72.5) = 72.5 + (9) = 72.5 + = 76.6538
2 ∗ 17 − 11 − 10 34 − 21 13

Paso 11. Obtención de los cuantiles

Para datos no agrupados


𝑖(𝑛 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 𝑖 = 1 +
4
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑖

𝑖(𝑛 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝐷𝑒𝑐𝑖𝑙 𝑖 = 1 +
10
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝐷𝑒𝑐𝑖𝑙 𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑖

𝑖(𝑛 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑖 = 1 +
100
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑖 = 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑖
Nota 20: El valor de n es de la cantidad total de datos. Los cuartiles solo pueden ser del 1 al 3. Los
deciles del 1 al 9 y los porcentiles del 1 al 99. Cuando la posición del cuantil da en decimales, el
valor del cuantil queda determinado por la siguiente formula

𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑐𝑢𝑎𝑛𝑡𝑖𝑙 =


𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑖 + 𝑝𝑎𝑟𝑡𝑒 𝑑𝑒𝑐𝑖𝑚𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛(𝑣𝑎𝑙𝑜𝑟 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 − 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛)

Supongamos que deseamos obtener el 3er. Cuartil, 4to. Decil y 80 porcentil


3(50 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 3 = 1 + = 37.75
4
Nota 21: Consultando la tabla, se tiene que en la posición 37 está el valor 81

Datos no agrupados
37 38 48 49 57 57 61 61 63 64
65 66 66 67 68 68 69 70 71 72
73 73 74 74 74 76 76 77 77 77
78 78 78 80 80 80 81 83 83 85
85 85 87 88 89 89 90 93 96 97

Por lo que el cuartil 3 sería

𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 3 = 81 + 0.75(83 − 81) = 81 + 0.75 ∗ 2 = 82.5

4(50 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝐷𝑒𝑐𝑖𝑙 4 = 1 + = 20.6
10
Nota 22: La posición del decil 4 es en este caso la posición 20 y, de la tabla, el valor en dicha
posición es 72, por lo que

𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝐷𝑒𝑐𝑖𝑙 4 = 72 + 0.6(73 − 72) = 72 + 0.6 ∗ 1 = 72.6

80(50 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙 80 = 1 + = 40.2
100
Nota 23: El valor en la posición 40 es 85, obteniendo el valor sería

𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙 80 = 85 + 0.2(85 − 85) = 85 + 0.2 ∗ 0 = 85

Para datos agrupados

𝑖(𝑛 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 𝑖 = 1 +
4
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 𝑖 =
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙
𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑑𝑒𝑠𝑒𝑎𝑑𝑜(𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑡𝑜𝑡𝑎𝑙⁄4 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟)
+( ) (𝐴𝑛𝑐ℎ𝑜 𝑒𝑥𝑎𝑐𝑡𝑜)
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙

𝑖 ∗ (∑𝑛𝑖=1 𝑓𝑖 ⁄4) − 𝑓𝑎−1


𝑄𝑖 = 𝐿𝑖𝑒(𝑄𝑖) + ( ) (𝐶𝑒 )
𝑓𝑖(𝑄𝑖)
𝑖(𝑛 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝐷𝑒𝑐𝑖𝑙 𝑖 = 1 +
10
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝐷𝑒𝑐𝑖𝑙 𝑖 =
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑑𝑒𝑐𝑖𝑙
𝑑𝑒𝑐𝑖𝑙 𝑑𝑒𝑠𝑒𝑎𝑑𝑜(𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑡𝑜𝑡𝑎𝑙⁄10 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟)
+( ) (𝐴𝑛𝑐ℎ𝑜 𝑒𝑥𝑎𝑐𝑡𝑜)
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑑𝑒𝑐𝑖𝑙

𝑖 ∗ (∑𝑛𝑖=1 𝑓𝑖 ⁄10) − 𝑓𝑎−1


𝐷𝑖 = 𝐿𝑖𝑒(𝐷𝑖) + ( ) (𝐶𝑒 )
𝑓𝑖(𝐷𝑖)

𝑖(𝑛 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑖 = 1 +
100
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑖 =
𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙
𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑑𝑒𝑠𝑒𝑎𝑑𝑜(𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑡𝑜𝑡𝑎𝑙⁄100 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟)
+( ) (𝐴𝑛𝑐ℎ𝑜 𝑒𝑥𝑎𝑐𝑡𝑜)
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙

𝑖 ∗ (∑𝑛𝑖=1 𝑓𝑖 ⁄100) − 𝑓𝑎−1


𝑃𝑖 = 𝐿𝑖𝑒(𝑃𝑖) + ( ) (𝐶𝑒 )
𝑓𝑖(𝑃𝑖)

Nota 24: La diferencia de los cuantiles agrupados es que la posición obtenida determina en cual
clase se encuentra el cuantil deseado. Para ello hacemos uso de la frecuencia acumulada.

Obteniendo los mismos cuantiles, ahora para datos agrupados.

3(50 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝐶𝑢𝑎𝑟𝑡𝑖𝑙 3 = 1 + = 37.75
4
De la tabla de distribución de frecuencias
Tenemos que el cuartil 3 está en la clase F, por lo que

3 ∗ (50⁄4) − 37 37.5 − 37
𝑄3 = 81.5 + ( ) (90.5 − 81.5) = 81.5 + ( ) (9) = 81.95
10 10

4(50 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝐷𝑒𝑐𝑖𝑙 4 = 1 + = 20.6
10
Tenemos que el decil 4 está en la clase E, por lo que

4 ∗ (50⁄10) − 20 20 − 20
𝐷4 = 72.5 + ( ) (81.5 − 72.5) = 72.5 + ( ) (9) = 72.5
17 17
80(50 − 1)
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑖𝑙 80 = 1 + = 40.2
100
Tenemos que el porcentil 80 está en la clase F por lo que

80 ∗ (50⁄100) − 37 40 − 37
𝑄80 = 81.5 + ( ) (90.5 − 81.5) = 81.5 + ( ) (9) = 84.2
10 10

Paso 12. Obtención del rango

Datos no agrupados

𝑅𝑎𝑛𝑔𝑜 = 𝑉𝑎𝑙𝑜𝑟 𝑀𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑀𝑒𝑛𝑜𝑟


𝑅𝑎𝑛𝑔𝑜 = 97 − 37 = 60

Datos agrupados

𝑅𝑎𝑛𝑔𝑜 = Ú𝑙𝑡𝑖𝑚𝑜 𝑙í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜 − 𝑃𝑟𝑖𝑚𝑒𝑟 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑒𝑥𝑎𝑐𝑡𝑜


𝑅𝑎𝑛𝑔𝑜 = 99.5 − 36.5 = 63
Paso 13. Desviación Media

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎 =
𝑆𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑠 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
∑𝑛𝑖=1|𝑥𝑖 − 𝑥̅ |
𝐷. 𝑀. =
𝑛
Nota 25: Tomando el valor del promedio del ejercicio, que es 73.58 y obteniendo la diferencia de
los valores respecto al promedio se tiene que
|37 − 73.46| + |38 − 73.46| + |48 − 73.46| + |49 − 73.46| + ⋯ |97 − 73.46| 506.24
𝐷. 𝑀. = = = 10.1248
50 50

Nota 26: No hay desviación media para datos agrupados


Paso 14. Varianza y desviación estándar

Datos no agrupados
𝑆𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒𝑙 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑠 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠

2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎 =
𝑛
(37 − 73.46)2 + (38 − 73.46)2 + (48 − 73.46)2 + ⋯ (97 − 73.46)2 8684.42
𝜎2 = = = 173.6884
50 50

Datos agrupados

𝑆𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎[(𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 − 𝑀𝑒𝑑𝑖𝑎)2 (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑐𝑙𝑎𝑠𝑒)]


𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 =
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠

2
∑𝑛𝑖=1(𝑀𝑖 − 𝑥̅ )2 (𝑓𝑖 )
𝜎 =
∑𝑛𝑖=1 𝑓𝑖
(41 − 73.58)2 ∗ 2 + (50 − 73.58)2 ∗ 2 + (59 − 73.58)2 ∗ 5 … (95 − 73.58)2 ∗ 3 7787.988
𝜎2 = = = 155.75976
50 50

Nota 27: El promedio es el promedio para datos agrupados

La desviación estándar es solo la raíz cuadrada de la varianza, para ambos casos, datos agrupados
y no agrupados, por lo que para cada uno sería

Datos no agrupados

𝜎 = √𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √173.6884 = 13.1790895


Datos agrupados

𝜎 = √𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √155.75976 = 12.48037499

Potrebbero piacerti anche