Sei sulla pagina 1di 36

MEDIDAS DE

DISPERSIÓN
MEDIDAS DE DISPERSIÓN
RANGO, VARIANZA, DESVIACIÓN ESTÁNDAR,
COEFICIENTE DE VARIACIÓN
SECCIÓN DE REFERENCIA

MEDIDAS DE DISPERSIÓN

• Rango
• Varianza
• Desviación estándar
• Coeficiente de variación
LOGRO DE LA SESIÓN:

Al finalizar el estudiante calcula las medidas de


dispersión usando las fórmulas e interpreta sus
resultados.
¿Donde me conviene trabajar?
Supongamos que los sueldos mensuales de los enfermeros en dos
clínicas son las siguientes:

¿En cuál de las dos clínicas existe mayor diferencia de los sueldos
con respecto al promedio?
Medidas de dispersión
Una medida de variabilidad es un número
que nos indica el grado de dispersión en
un conjunto de datos. Si el valor es
pequeño (respecto de la unidad de
medida) entonces hay una gran
uniformidad entre los datos (homogénea).
Por el contrario, un gran valor nos indica
poca uniformidad (heterogénea). Cuando
es cero quiere decir que todos los datos
son iguales.
LAS MEDIDAS DE DISPERSIÓN INDICAN LA MAYOR O MENOR CONCENTRACIÓN DE
DATOS CON RESPECTO A LAS MEDIDAS DE CENTRALIZACIÓN.
Rango
Distancia que existe entre el valor máximo y el valor mínimo

Rango = Vmax - Vmin

Ejemplo:
Los siguientes datos corresponden a las notas del curso de Estadística de la
UCSUR del grupo 1A

10 12 15 07 15 18 17 16 11 12 07 18 17 16 15 10 11 13 14 15

R= 18 – 07 = 11
Varianza
Mide la mayor o menor dispersión de
la variable respecto a su media
aritmética.
Cuanto mayor sea la varianza mayor
dispersión existirá, por lo tanto,
menor representatividad tendrá la
media aritmética.

Varianza poblacional Varianza muestral

2
σ(𝑥𝑖 − µ)2 σ (𝑥𝑖 − 𝑥)
ҧ 2
σ = 𝑠2 =
𝑁 𝑛−1
Cálculo de la varianza muestral (𝒔𝟐 )
Para datos no agrupados Para datos agrupados

σ (𝑥 − 𝑥)
ҧ 2 σ (𝑥 − 𝑥)
ҧ 2. 𝑓
𝑖 𝑖 𝑖
𝑠2 = 𝑠2 =
𝑛−1 𝑛−1

Donde: Donde:
n: tamaño de la muestra. n: tamaño de la muestra.
𝑥:ҧ media. 𝑥:ҧ media.
Otra forma: Otra forma:
σ 2 2
σ 𝑥 2 − 𝑛 𝑥ҧ 2 𝑥𝑖 𝑖𝑓 − 𝑛 𝑥ҧ
𝑠2 =
𝑖 𝑠2 =
𝑛−1 𝑛−1
EJEMPLO:

En una muestra aleatoria de las edades de 10 pacientes con


infección renal, se obtuvo los siguientes datos
42,28,28,61,31,23,50,34,32,37
Calcule la varianza de las edades de los pacientes.
Calculamos la media:
(42+28+28+61+31+23+50+34+32+37)
xത =
10
xത= 36.6
Aplicamos la fórmula:
(42−36.6) 2+(28−36.6)2+(28−36.6)2+ ⋯ . +(37−36.6)2
σ(𝑥𝑖 −𝑥)ҧ 2 𝒔𝟐 =
𝑠2 = 9
𝑛−1
1196.4
𝒔𝟐 =
9

S2 = 132.9

La varianza de la edades de los pacientes es 132.9 𝑎ñ𝑜𝑠 2 .


Características:

1. Es la suma de los cuadrados de las diferencias de cada valor respecto a su


media entre el número de observaciones.

2. Mide la distancia existente entre los valores de la serie y la media.

3. La varianza siempre será mayor a cero. Mientras más se aproxima a cero, más
concentrados están los valores de las serie alrededor de la media. Por el
contrario, mientras la varianza sea mayor más dispersos están los datos.

4. Este estadístico es poco significativo ya que mide el cuadrado de la unidad de


la variables. Ejemplo: Si la variable es en cm. La varianza será en cm2.
EJEMPLO:
Un pediatra registra en una tabla el número meses que los niños tardan
en dar sus primeros pasos luego de haber nacido.

Calcule la varianza.
Calculamos la media:
σ 𝑥𝑖 𝑓𝑖 9𝑥1+10𝑥4+11𝑥9+⋯.+15𝑥1 610
xത =
𝑛
=
50
= 50
xത= 12.2

Aplicamos la fórmula:
σ (𝑥 − 𝑥)
ҧ 2. 𝑓
2 𝑖 𝑖
𝑠 =
𝑛−1
(9 − 12.2) 2 . 1 + (10 − 12.2)2 . 4 + (11 − 12.2)2 . 9 + ⋯ . +(15 − 12.2)2 . 1
𝑠2 =
49
84
2
𝑠 = 𝑠 2 = 1.7
49
La varianza de los meses que tardan los niños en dar sus primeros
pasos es 1.7 𝑚𝑒𝑠𝑒𝑠 2 .
EJEMPLO:
Las calorías que se pierde en una hora de gimnasio de 80 personas se
muestran a continuación en la siguiente tabla. Calcule la varianza de las
calorías de las calorías perdidas.

Calorías Marca de clase (xi) fi


90-130 110 15
130-170 150 22
170-210 190 24
210-250 230 15
250-290 270 4
Total 80
Calculamos la media:
σ 𝑥𝑖 𝑓𝑖 110𝑥15+150𝑥22+190𝑥24+⋯.+270𝑥4 14040
xത =
𝑛
=
80
= 80
xത= 175.5

Aplicamos la fórmula:
σ (𝑥 − 𝑥)
ҧ 2. 𝑓
2 𝑖 𝑖
𝑠 =
𝑛−1
2 . 15 + (150 − 175.5)2 . 22 + (190 − 175.5)2 . 24 + ⋯ . +(270 − 175.5)2 . 4
(110 − 175.5)
𝑠2 =
79

𝑠 2 =2075.7

La varianza de las calorías perdidas es 2075.7 𝑐𝑎𝑙 2 .


Desviación estándar
Es la raíz cuadrada de la varianza.
Es la más usada de las medidas de dispersión.

Cálculo de la desviación estándar

𝑠= 𝑠2
Es útil como medida de variación en un determinado conjunto de datos
Desviación estándar

Regla empírica para una distribución de frecuencias simétrica de campana:


• Cerca de 68.2% de las observaciones estará dentro de ± 1σ de la media(μ);
• Cerca de 95.4% de las observaciones estará dentro de ± 2σ de la media(μ);
• Casi todas (alrededor de 99.6%) las observaciones estarán dentro de ± 3σ
de la media(μ).
Coeficiente de variación
Describe la desviación estándar relativa a la media, sirve para comparar
la variación en diferentes poblaciones.

S
CV =

X

El coeficiente de variación es la razón entre las desviación típica y la media.


También se le conoce como variabilidad relativa.

Permite comparar dos o más conjuntos de datos


Características
1. Es frecuente que se presente en porcentajes. Ejemplo: si la media es 80 y la desviación
es 20, entonces: CV= 20/80 = 0,25 = 25% (variabilidad relativa).

2. Permite comparar la variabilidad de diferentes variables. Ejemplo: si el peso tiene CV= 40


y la altura tiene CV= 20, los individuos presentan más dispersión en peso que en altura.

3. No debe usarse cuando la variable presenta valores negativos o cuando el 0 sea


arbitrario. Ejemplo: la temperatura 00C ≠ 00F

4. Se interpreta como porcentaje, por lo que nos permitirá decidir entre dos muestras, cuál
es la que representa mayor dispersión .
El coeficiente de variación es independiente a cualquier escala de medición.

Se debe considerar que no es un verdadero porcentaje porque puede ser superior a 100. A
mayor CV, menos representatividad tiene la media aritmética.
Ejemplo:

Los siguientes resultados corresponden a dos muestras formadas por


varones:
MUESTRA 1 MUESTRA 2

Edad 25 años 11 años


Peso medio 145 libras 80 libras
Desviación 10 libras 10 libras
estándar
¿Cuál de los datos tiene mayor variabilidad?
Si realizamos la comparación entre las desviaciones estándar de los
individuos de ambas edades, podemos concluir que ambos tienen igual
variabilidad (información errónea).

Si calculamos los coeficientes de variación tenemos:


Individuos de 25 años:

CV = (10/145 ) x 100 = 6.9

Individuos de 11 años:

CV = (10/80) x 100 = 12.5

Obteniendo los resultados correctos y completamente diferentes a los


anteriores.
Medidas de asimetría
Hay ocasiones en que es deseable calcular una medida que muestre la
dirección de la dispersión con respecto al centro de la distribución.
Las medidas de asimetría indican la deformación horizontal de las
curvas de frecuencias. Cuando la curva de frecuencias está inclinada
hacia la derecha se llama asimetría derecha o positiva, y la curva esta
inclinada hacia el lado izquierdo se denomina asimetría a la izquierda o
negativa.
Sesgo de una distribución
Asimetría
Coeficiente de Asimetría de Pearson
𝟑(ത𝐱 − 𝐌𝐞) (ത𝐱 − 𝐌𝐨)
𝐀𝐬 = 𝐀𝐬 =
𝐬 𝛔

As<0 Asimetría negativa


As = 0 Simétrica
As>0 Asimetría positiva
Medida de Yule Bowley o Medida Cuartílica

La Medida de Bowley varía entre -1 y 1

𝐐𝟏 + 𝐐𝟑 − 𝟐𝐐𝟐 • Si As < 0 ? la distribución será asimétrica negativa.


𝐀𝐬 = • Si As = 0 ? la distribución será simétrica.
𝐐𝟑 − 𝐐𝟏
• Si As > 0 ? la distribución será asimétrica positiva.
Curtosis
La Curtosis mide el grado de agudeza o achatamiento de una distribución
con relación a la distribución normal, es decir, mide cuán puntiaguda es una
distribución(mide la deformación vertical de los datos).

Mide la mayor o menor concentración de datos alrededor de la media.

TIPOS DE CURTOSIS
Leptocúrtica: Alta concentración.
Mesocúrtica: Normal concentración.
Platicúrtica: Baja concentración
SECCIÓN DE REFERENCIA

Medida de Apuntamiento

Una medida para medir la curtosis en función de los percentiles, es el


coeficiente de curtosis percentilico k:
PRACTIQUEMOS!!

En un informe (que se supone es correcto) sobre sueldos en todo el país una


empresa de estudios de mercados publica la siguiente tabla

Clase A Clase B Clase C Clase E

% de población 10% 25% 35% 30%


Sueldos 2500 1500 500 200
y concluye diciendo que "la media de los sueldos en todo el país es S/1175.
a) ¿Qué comentario le merece el informe?. Si no está de cuerdo, ¿cuál sería la
corrección?
b) ¿Es la media en este caso el promedio representativo?, si no está de
acuerdo, ¿cuánto es el promedio adecuado?.
PRACTIQUEMOS!!

Una prueba de conocimientos, A, se calificó sobre 20


puntos dando una media de 12 y una desviación
estándar de 2 puntos. Mientras que una prueba de
aptitud, B, se calificó sobre 100 puntos, dando una
media de 70 y una desviación estándar de 5.
a) ¿En cuál de las dos pruebas los puntajes son más
homogéneos?
b) Si Juan tiene 14 en A y Luis 73 en B, ¿quién tiene
mejor rendimiento?
¿Qué hemos aprendido hoy?
¡¡TRABAJO EN EQUIPO!!
BIBLIOGRAFÍA

 Guía Práctica de Estadística General. 5° Edición 2016. UCSUR


 Triola, Mario. (2013). Estadística (11a. ed.). Pearson Educación. Disponible
en biblioteca virtual: https://elibro.net/es/ereader/ucsur/37906
 Levine, D., Krehbiel, T. y Berenson, M.(2014). Estadística para
administración (6a. ed.). Pearson Educación. Disponible en biblioteca virtual:
https://elibro.net/es/ereader/ucsur/37938
 Quevedo, Héctor., y Pérez, Blanca. (2015). Estadística para ingeniería y
ciencias. México: Grupo Editorial Patria. Disponible en biblioteca virtual:
https://elibro.net/es/ereader/ucsur/39467
GRACIAS

Potrebbero piacerti anche