Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Taller unidad #4
Tutor
Susana Bonilla
NRC16676
Pág. 1 de 22
Introducción
La mayoría de los datos estadísticos no están adecuadamente centrados en un punto, por ello es necesario conocer como se comporta todo el
conjunto de datos, y para ello se utilizan las medidas de dispersión y simetría, estas medidas son muy importantes en la industria cuando se
realizan mediciones para analizar la forma en que cambia cierta producción o para explicar como varia un conjunto de personas a las que se
les aplica un tratamiento entre otras.
Pág. 2 de 22
Objetivo
Reconocer la importancia de analizar las medidas de dispersión y simetría de la productividad de una empresa o negocio y a la vez
interpretar dichas medidas a partir de un ejercicio de investigación y practica, mediante las formulación de rango, La desviación estándar y
la varianza.
Pág. 3 de 22
Medidas de Dispersión
Una medida de dispersión nos da una referencia de la variabilidad de los datos, es decir, que tan uniforme son entre ellos, se usan en los
análisis estadísticos generales. Y existen dos tipos que son:
1) Absoluta 2) Atípica
[ Desviación típica
[ Rango o Recorrido
Es la medida de dispersión mas sencilla de calcula, ya que solo hace referencia al recorrido que hace la variable desde su valor mas pequeño
hasta el valor mas grande de la variable y que se puede realizar solo para aquellas variables que puedan ser ordenadas, esto quiere decir que
podemos medir el rango para las variables medidas en escala: ordinal, de intervalo o de razón
Datos no Agrupados
¿Cual es el nivel de agrado con las medidas implementadas por el director de la Institución? Codificación de las posibles respuestas
1: Nada
2: Algo
3: Bastante
4: Mucho
Rango = Max - Min Rango = 20 - 1 Rango = 19 Puntos Aquí podemos observar que el rango
es de 19 puntos
A pesar que el Rango e suma medida de Dispersión muy sencilla de calcular, presenta una desventaja, ya que utiliza el valor máximo y el
valor mínimo de todos los datos, por lo tanto siempre se va a ver afectada por los valores atípicos, toda vez que existan en el conjunto de
datos a estudiar
Ejemplo para una variable medida en Escala de Razón con valores atípicos.
para poder evidenciar la sensibilidad de los valores atípicos, a continuación se presenta una tabla de frecuencias donde tenemos un conjunto
de calificaciones, que van desde 1 punto hasta 18 puntos, podemos observar que la nota de 1 punto es una calificación atípica; ya que la
mayoría de los datos se encuentra entre 14 y 18 puntos.
Pág. 5 de 22
1 1 1 0.10 0.10
14 2 3 0.20 0.30
15 4 7 0.40 0.70
17 2 9 0.20 0.90
18 1 10 0.10 1.00
10 1.00 100%
Presentamos el calculo de Rango tanto para los datos con el valor atípico, como el Rango sin el valor atípico, utilizando la misma formula
general.
Rango Con Vr Atípico = Max - Min Rango = 18 - 1 Rango = 17 Puntos El rango Aumenta
Rango Sin Vr Atípico = Max - Min Rango = 18 - 14 Rango = 4 Puntos El Rango Disminuye
Podemos evidenciar que el Rango cuando no incluimos el valor atípico (1) nos da 4 puntos y cuando incluimos el valor atípico de un punto
vemos que el rango aumenta su valor y llegas hasta 17 puntos , entonces podemos confirmar que el Rango es una medida de dispersión muy
sensible a valores atípicos, por lo cual no se recomienda su uso halla presente valores atípicos en el conjunto de datos.
[ Varianza σ2 = Sigma
De las medidas de dispersión, la varianza y la desviación estándar, revisemos el cálculo de la varianza como medida de dispersión absoluta
y el cálculo de la desviación estándar como medida de dispersión absoluta
hasta ahora hemos visto el rango y el rango intercuartilico que corresponden al recorrido que hace la variable desde el valor mínimo hasta el
valor máximo, pero si queremos estimar una medida de dispersión de los valores con respecto a la media probablemente muchos de nosotros
estemos pensando en un valor promedio de las desviaciones de cada valor con respecto a su media, algo así, como la expresión matemática
que pudiéramos restar cada valor con respecto a la media sumar todos esos valores y dividirlo entre el total de datos; es decir tener el
promedio de las desviaciones.
Esto no posible lograrlo debido a la propiedad de la media, que nos dice que la sumatoria de todas esas desviaciones siempre es Cero, si eso
es así entonces esa medida ideal que quisiéramos tener pues siempre daría cero.
Este problema se ha resuelto con el cálculo de la varianza que lo que nos dices que estás desviaciones las elevamos al cuadrado, de esta
manera se garantiza que la sumatoria de las desviaciones en este caso cuadráticas pues no sea cero, sino que acumule los valores tanto
positivos como negativos de estas desviaciones y las dividimos entre total de datos entonces la varianza no es más que la sumatoria de las
desviaciones cuadráticas con respecto a la media entre el total de los datos; es decir es un valor de promedio.
La varianza es posible determinarla para cualquier variable que sea numera que este medida en escala de intervalo o de razón.
La varianza tiene 2 formulas diferentes, porque la formula va a depender si estamos trabajando con datos que forman una población o con
datos que forman una muestra.
La notación que tenemos para la varianza es igual a la varianza muestral como s2 al cuadrado y la varianza poblacional σ2 como Sigma al
cuadrado, esta notación no es solamente para este curso la van a encontrar en la mayoría de las bibliografías respecto al cálculo de la
varianza.
∑24_(𝑖=1)^𝑁▒ 〖 ∑24_(𝑖=1)^𝑁▒ 〖
(𝑋_𝑖 − 𝛍)^2 〗 (𝑋_𝑖 − X̅ )^2 〗
Pág. 6 de 22
∑24_(𝑖=1)^𝑁▒ 〖 ∑24_(𝑖=1)^𝑁▒ 〖
(𝑋_𝑖 − 𝛍)^2 〗 (𝑋_𝑖 − X̅ )^2 〗
σ2 = S2 =
N n-1
El cálculo de la varianza muestral, estaría dado por la expresión matemática que tenemos, y sería s2 y va a ser igual a la sumatoria de las
desviaciones cuadráticas entre n -1, este es un factor de corrección que se realiza para tratar de obtener un estimador insesgado de la
varianza.
La varianza poblacional será igual a la sumatoria de las desviaciones cuadráticas dividido entre N mayúscula qué es el tamaño de la
población.
1 2 -4 〖 (𝑋 16
〗 _𝑖 4
2 4 -2 − 𝛍 )^2
4 2
3 6 0 0 0
4 8 2 4 2
5 10 4 16 4
∑ 30 0 40 12
a) Rango
Rango = Max - Min Rango = 10 - 2 Rango = 8
b) Varianza
Para poder hallar la varianza necesitamos los siguiente
∑24_(𝑖=1)^𝑁
▒𝑋𝘪
𝛍= 30 𝛍 = Media Poblacional.
𝛍= 6
N 5
∑24_(𝑖=1)^𝑁▒ 〖
(𝑋_𝑖 − 𝛍)^2 〗 40 σ2 = 8
σ 2=
N 5
Pág. 7 de 22
hasta ahora hemos visto el rango y el rango intercuartilico que corresponden al recorrido que hace la variable desde el valor mínimo hasta el
valor máximo, pero si queremos estimar una medida de dispersión de los valores con respecto a la media probablemente muchos de nosotros
estemos pensando en un valor promedio de las desviaciones de cada valor con respecto a su media, algo así, como la expresión matemática
que pudiéramos restar cada valor con respecto a la media sumar todos esos valores y dividirlo entre el total de datos; es decir tener el
promedio de las desviaciones.
La desviación estándar es una medida de dispersión muy importante y no es más que la raíz cuadrada de la varianza, entonces ya que muchas
de las inferencias estadísticas está determinada por la desviación estándar obviamente la inferencia estadística para variables medidas en
escalas cuantitativas.
la varianza es una medida de dispersión que representa el promedio de las desviaciones cuadráticas de cada valor con respecto a la media y
qué es la varianza bien expresada en unidades de la medida al cuadrado por su parte la desviación estándar es la raíz cuadrada de la varianza
y esta medida de dispersión viene expresada en unidades de la medida lineales
Desviación estándar muestral está expresada por la notación por la letra s y es igual a la raíz cuadrada de la expresión matemática, para la
varianza muestral, en el caso de la desviación estándar poblacional está bien se denota con Sigma σ y no es más que la raíz cuadrada de la
expresión matemática para la varianza de la población,
𝜎 = √(𝜎2 ) 𝜎= σ= 2.8284
√( 〖 8 〗 ^ )
[ Coeficiente de Variación Cv
Como medida de dispersión relativa, el coeficiente de variación indica el tamaño relativo de la desviación estándar respecto a la media es
una medida adimensional, es decir no viene expresada en kilogramos ni en puntos, ni centímetros, es una medida que no tiene ninguna
dimensión la notación para el coeficiente de variación que vamos a utilizar en este curso será CV y su cálculo esta representado por la
expresión matemática de la división entre la desviación estándar y la media, multiplicado * 100, porque que es una medida porcentual.
Debemos acotar que el cálculo del coeficiente de variación es solamente para variables cuyos valores son positivos por lo que se asocia a
variables medidas en escala de razón.
La importancia de las medidas de dispersión relativa es decir la importancia en este caso el coeficiente de variación es porque a través de él,
podemos comparar la variabilidad de los datos que provienen de dos poblaciones o qué provienen de la misma población pero son variables
distintas y nos da una idea de dónde tenemos mayor variabilidad.
Entonces el cálculo está asociado esencialmente a este tema de la comparación de la variabilidad entre dos conjuntos de datos.
Ejemplos donde tenemos calculada la varianza la desviación estándar referido a las notas y las estaturas tenemos para el caso de las notas
Notas Estatura
(𝑿 ) ̅ 10,95 Puntos (𝑿 ) ̅ 1,54 cm =𝛍
= =
S2 = 35,13 Puntos 2
S2 = 66 cm 2
CV =
Desviación estándar
CV =
σ CV =
5.94 CV = 0.54 CV = 54.25%
Media 𝛍 10.95
CV =
Desviación estándar
CV =
σ CV =
8.12 CV = 0.05 CV = 5.27%
Media 𝛍 154
Particularmente lo que queremos hacer aquí, es donde?, existe mayor variabilidad de los datos, es decir donde pudiéramos decir que los
datos tienen mayor dispersión no podemos compararlo con la desviación estándar porque están expresadas en unidades distintas, no se puede
comparar puntos con centímetros, este es el caso oportuno para calcular el coeficiente de variación: para las notas sería igual a 54,25% y en
el caso del coeficiente de variación para la estatura es de 5,27%.
Pág. 8 de 22
Vemos que el coeficiente de variación es mucho mayor en el caso de las notas a pesar de que la desviación estándar en las notas era inferior a
la desviación estándar en las estaturas, aquí podemos decir claramente que, en las notas hay mayor variabilidad de los datos que en la
estatura, esto es esencialmente el uso que le damos al coeficiente de variación como medida de dispersión relativa.
En resumen de variación es una medida de dispersión relativa adimensional que permite comparar la variabilidad de los datos asociados a
variables distintas o provenientes de poblaciones distintas.
CV =
Desviación estándar
CV =
σ CV =
2.8284 CV = 0.4714
Media 𝛍 6
CV = 47.14%
[ Desviación Media
Es la diferencia en valor absoluto entre cada valor de la variable y la media aritmética
∑24_(𝑖=1)^𝑁▒ 〖
│𝑋 _𝑖 − 𝛍│^ 〗 12 DM = 2.4
DM = DM =
N 5
Datos Agrupados
Intervalo de Clase Frecuencia Frecuencia Marca de Clase Frecuencia Relativa Frecuencia Relativa
Absoluta absoluta acumulada
Intervalo
Lim Inf Lim Supe 𝑛_
Acumulada 𝑴_𝑪 = 〖𝑳 _𝑺 𝑓_𝑖 =
de clase 𝐹_𝑖
a b 𝑖 𝑁_𝑖 " + "(𝑳_𝑰 " 𝑿 𝑛_𝑖/𝑁
" 〗� _ /𝟐 _𝒊
i1 [ 321 , 371 ) 5 5 � 346 0.08 0.08
i2 [ 371 , 421 ) 8 13 396 0.13 0.22
i3 [ 421 , 471 ) 14 27 ) 446 0.23 0.45
i4 [ 471 , 521 ) 9 36 ̅ 496 0.15 0.60
i5 [ 521 , 571 ) 11 47 546 0.18 0.78
i6 [ 571 , 621 ) 8 55 596 0.13 0.92
i7 [ 621 , 671 ) 5 60 646 0.08 1.00
60 1
n = 60 K = Intervalos = 7
350
𝑅𝑎𝑛𝑔𝑜/(#
Encontrar la amplitud A= 𝐼𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠) A= / A= 50.0
( 7)
Pág. 9 de 22
Para datos no agrupados
1 Las siguientes corresponden a las edades de un grupo de personas que ingresaron a la biblioteca:
55 67 62 88 37 55 67 38 41
calculara el Rango
Calcular la Varianza
b. La varianza.
Para poder hallar la varianza necesitamos los siguiente
Varianza Poblacional
∑24_(𝑖=1)^𝑁▒ 〖
(𝑋_𝑖 − 𝛍)^2 〗
2210
σ2 = 245.6
σ 2=
N 9
𝜎 = √(𝜎2 ) 𝜎= σ= 15.7
√( 〖 245,6 〗 ^ )
d. El coeficiente de variación.
Pág. 11 de 22
CV =
Desviación estándar
CV =
σ CV =
15.67 CV = 0.28 CV = 27.66%
Media 𝛍 56.7
e. Desviación Media
∑24_(𝑖=1)^𝑁▒ 〖
│𝑋 _𝑖 − 𝛍│^ 〗 115 DM = 12.7
DM = DM =
N 9
1 2 3 4 5 6 7 8 9 10
Pág. 12 de 22
15 15 16 16 16 16 16 16 16 16
11 12 13 14 15 16 17 18 19 20
16 16 17 17 17 17 17 17 17 17
21 22 23 24 25 26 27 28 29 30
17 17 17 17 18 18 18 18 18 18
31 32 33 34 35 36 37 38 39 40
18 18 18 18 18 18 18 18 18 18
41 42 43 44 45 46 47 48 49 50
18 18 18 18 19 19 19 19 19 19
51 52 53 54 55 56 57 58 59 60
19 19 19 19 19 19 19 19 19 20
61 62 63 64 65 66 67 68 69 70
20 20 20 20 20 20 20 20 20 20
71
20
Posición Posición
1 * (71 + 1) 72
4 4
Q1 = 18
18
17
Q1 = 17
𝑸_𝟏= (𝒌
∗(𝒏+𝟏))/𝟒
Posición Posición
2 * (71 + 1) 144
𝑸_𝟐= (𝒌 Q2 = 36
36
Q2 = 18
∗(𝒏+𝟏))/𝟒 4 4 18
Posición Posición
3 * (71 + 1) 216
𝑸_𝟑= (𝒌 Q3 = 54
54
Q3 = 19
∗(𝒏+𝟏))/𝟒 4 4 19
Q1 Q3
14 15 16 17 18 19 20
Q2 = M e
Pág. 13 de 22
b. Determine los valores del rango, la varianza, la desviación típica o estándar y el coeficiente de variación
1 15 2 13.5 〖 (𝑋182.8
〗 _𝑖 13.5
2 16 10 14.5 − 𝛍 )^2
210.9 13.5
3 17 12 15.5 240.9 15.5
4 18 20 16.5 272.9 16.5
5 19 15 17.5 307.0 17.5
6 20 12 18.5 343.0 18.5
∑ 105 96.1 1558 95
* La varianza.
Para poder hallar la varianza necesitamos los siguiente
Varianza Poblacional
∑_(𝑖=1)^𝑁▒ 〖 (𝑋
_𝑖 − 𝛍)^2 〗
95
σ2 = 1.34
σ 2=
N 71
* El coeficiente de variación.
CV =
Desviación estándar
CV =
σ CV =
1.18 CV = 0.80 CV = 80%
Media 𝛍 1.5
* Desviación Media
∑_(𝑖=1)^𝑁▒ 〖 │
𝑋 _𝑖 − 𝛍│^ 〗 95 DM = 1.3
DM = DM =
N 71
Pág. 14 de 22
3 Los siguientes datos corresponden a los días de vacaciones que tomaron los empleados durante el
último año
Determine los valores del rango, la varianza, la desviación típica o estándar y el coeficiente de variación. (Ejercicio
A. para subir a la plataforma)
* La varianza.
Para poder hallar la varianza necesitamos los siguiente
Varianza Poblacional
∑_(𝑖=1)^𝑁▒ 〖 (𝑋
_𝑖 − 𝛍)^2 〗
356.6
σ2 = 7.9
σ 2=
N 45
* El coeficiente de variación.
CV =
Desviación estándar
CV =
σ CV =
7.92 CV = 7.28 CV = 728%
Media 𝛍 1.1
* Desviación Media
∑_(𝑖=1)^𝑁▒ 〖 │
𝑋 _𝑖 − 𝛍│^ 〗 42 DM = 0.9
DM = DM =
N 45
4 En una competición de tiro al blanco con rifle de aire, se tienen los dos últimos participantes, quienes
tiraron a un tablero y obtuvieron el siguiente registro después de 15 disparos cada uno
Halle el promedio del conjunto de datos, la mediana, la moda, la desviación estándar y el coeficiente de desviación de los datos y compare los
dos conjuntos.
Realice el diagrama de caja y de bigotes para el puntaje de cada uno de los jugadores. (Nota: hacer la tabla de frecuencias para el puntaje de
cada jugador)
Pág. 16 de 22
Moda = Mo = 1 El jugador 1 en el 1Pts realizo mas tiros que en las demás.
∑▒(𝑋_𝑖∗
Media Aritmética
(𝑿 𝑛_𝑖)/𝑁
) ̅ =
(1 x 6) + (2 x 3) + (3 x 0) + (4 x 3) + (5 x 3)
(𝑿 ) ̅ ∑
= 15
1 2 3 4 5
1 1 1 1 1
6 7 8 9 10 n = 15 k =1, 2, 3
1 2 2 2 4
11 12 13 14 15
4 4 5 5 5
1
Q1 = 1
𝑸_𝟏= (𝒌
∗(𝒏+𝟏))/𝟒
Valor
según
Posición
posición
2 * (15 + 1) 32
𝑸_𝟐= (𝒌 Q2 = 8
8
Q2 = 2
∗(𝒏+𝟏))/𝟒 4 4 2
Valor
según
Posición posición
3 * (15 + 1) 48
𝑸_𝟑= (𝒌 Q3 = 12
12
Q3 = 4
∗(𝒏+𝟏))/𝟒 4 4 4
Pág. 17 de 22
Q1 Q2 = M e Q3
1 2 3 4
* La varianza.
Para poder hallar la varianza necesitamos los siguiente
Varianza Poblacional
∑_(𝑖=1)^𝑁▒ 〖 (𝑋
_𝑖 − 𝛍)^2 〗
54.0
σ2 = 3.6
σ 2=
N 15
* El coeficiente de variación.
CV =
Desviación estándar
CV =
σ CV =
3.6 CV = 3.60 CV = 360%
Media 𝛍 1.0
Pág. 18 de 22
Moda 2 3 7 14 0.47 0.93 3 9 3
4 1 15 0.07 1.00 4 16 4
5 0 15 0.00 1.00 5 25 5
N= 15 1.00 14 54 14
100%
Moda =Mo = 2 y3 El jugador 1 en el 1Pts realizo mas tiros que en las demás.
multimodal
∑▒(𝑋_𝑖∗
(𝑿 𝑛_𝑖)/𝑁
) ̅ =
(1 x 0) + (2 x 7) + (3 x 7) + (4 x 7) + (5 x 0)
(𝑿 ) ̅ ∑
= 0
b. Determine Q1, Q2 y Q3 .
1 2 3 4 5
2 2 2 2 2
6 7 8 9 10 n = 15 k = 1, 2, 3
2 2 3 3 3
11 12 13 14 15
3 3 3 3 4
2
Q1 = 2
𝑸_𝟏= (𝒌
∗(𝒏+𝟏))/𝟒
Valor
según
posición
Posición
2 * (15 + 1) 32
𝑸_𝟐= (𝒌 Q2 = 8
8
Q2 = 3
∗(𝒏+𝟏))/𝟒 4 4 3
Valor
según
posición Pág. 19 de 22
Valor
según
posición
Posición
𝑸_𝟑= (𝒌 3 * (15 + 1) 48
4 4
Q3 = 12
12
3
Q3 = 3
∗(𝒏+𝟏))/𝟒
r = Q3 - Q1 r = 3- 2 r = 1
Q1 Q2 = M e Q3
1 2 3 4
* La varianza.
Para poder hallar la varianza necesitamos los siguiente
Varianza Poblacional
∑_(𝑖=1)^𝑁▒ 〖 (𝑋
_𝑖 − 𝛍)^2 〗
54.0
σ2 = 3.6
σ2=
N 15
𝜎 = √(𝜎2 ) 𝜎= √(3,6 )
σ= 1.9
* El coeficiente de variación.
CV =
Desviación estándar
CV =
σ CV =
3.6 CV = 3.60 CV = 360%
Media 𝛍 1.0
Pág. 20 de 22
Análisis de los resultados
Los dos jugadores tiene un total de aciertos que equivalen a 15 cada uno, el jugador 1 acertó en 4 puntos de los 5 y el
jugador 2 acertó solo en 3 puntos, y de acuerdo a los resultado obtenidos de los diagramas de cajas y bigotes de los dos
jugadores podemos observar que; el jugador 1 acertó más veces entre los puntos 2 y 4 puntos. Mientras el jugador 2 realizo
mayor número de aciertos en los puntos 2 y 3
En los Cuartiles Q1, Q2 Y Q3 El jugador 1 tuvo más relevancia que el jugador 2. Mientras que en el Q2 y Q3 el jugador 2 tuvo
más relevancia que el jugador 1.
Vemos que el coeficiente de variación es mucho es igual en ambos casos pese a que los pintos fueron realizados en
diferentes intervalos unos mas que otros, y la desviación estándar la diferencia es muy mínima entre el jugador 1 y el
jugador 2,
Referencias
Uniminuto Virtual y a Distancia. (2019). Estadística Descriptiva - Unidad 4. [archivo de video]. Recuperado de
https://youtu.be/EQz8cl404oY
ULASx Equis.(2016). Medidas de Dispersión Rango. [archivo de video]. YouTube. Recuperado de https://youtu.be/g16Pac7AvC8
Pérez. L. (2014). Medidas de Dispersión para datos no agrupados. [archivo de video]. YouTube. Recuperado de
https://youtu.be/ZmRmKshFk7A
Matemáticas Profe Alex. (2017). Tabla de frecuencias agrupada en intervalos Ejemplo 1. [archivo de video]. YouTube. Recuperado de
https://youtu.be/CuKr7GzohbI
Matemovil. (2019). Rango, varianza, desviación estándar, coeficiente de variación, desviación media: datos no agrupados. [archivo de video].
YouTube. Recuperado de https://youtu.be/KsVQygSlf4k
ULAx Equis. (2016). Medidas de dispersión Varianza y Desviación Estándar. [archivo de video]. YouTube. Recuperado de
https://youtu.be/_Z8WpYMPK4w
ULAx Equis. (2016). Medidas de dispersión coeficiente de variación. [archivo de video]. YouTube. Recuperado de
https://youtu.be/InXJIzJ44bc
Pág. 21 de 22
𝑛_
𝑖
Pág. 22 de 22