Sei sulla pagina 1di 5

MEDIDAS DE DISPERSIN

Estudia la distribucin de los valores de la serie, analizando si estos se


encuentran ms o menos concentrados, o ms o menos dispersos.
Existen diversas medidas de dispersin, entre las ms utilizadas podemos
destacar las siguientes:
1.- Rango: mide la amplitud de los valores (calificaciones) de la muestra y se
calcula por diferencia entre el valor ms elevado y el valor ms bajo. El rango
es la medida de variabilidad ms fcil de calcular y, como el modo, es tambin
la menos estable, ya que los cambios en unas cuantas calificaciones pueden
afectar considerablemente su valor.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la
media. Se calcula como sumatoria de las diferencias al cuadrado entre cada
valor y la media, multiplicadas por el nmero de veces que se ha repetido cada
valor. La sumatoria obtenida se divide por el tamao de la muestra.
En el caso discreto se define segn la frmula:

Y en el caso continuo mediante la frmula:

m
xx

2



2=


S

La varianza es una medida del esparcimiento o dispersin de los valores que


puede tomar la variable X correspondiente.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero,
ms concentrados estn los valores de la serie alrededor de la media. Por el
contrario, mientras mayor sea la varianza, ms dispersos estn.
Cuando se hace necesario, se utiliza S para representar la varianza de una
muestra y (sigma) para la varianza de una poblacin.
3.- Desviacin tpica: Se calcula como raz cuadrada de la varianza. Tambin
se le llama desviacin media, desviacin promedio o desviacin
estndar. Probablemente la desviacin estndar es la medida de variabilidad
ms ampliamente usada y la ms estable, ya que depende de todas las
calificaciones de la distribucin y no solo de unas cuantas.
La desviacin estndar se define como la raz cuadrada de la suma de las
desviaciones alrededor de la media, elevadas al cuadrado, divididas entre el
nmero de casos menos uno.

=
x2
N 1

O bien:

Donde S es la desviacin estndar, x = X-M, x2 =(X-M)2 y N = nmero de casos, X=


es cada una de las variables (datos), M = es la media

Mientras mayor es el valor de la desviacin estndar, mayor es el grado de variabilidad

Frecuencia

media
El valor de la desviacin estndar se puede definir como la distancia entre la
media y el punto de flexin en la curva normal.

4.- Rango Semiintercuartilar: As como el modo y el rango son medidas de


precisin comparable, tambin lo son la mediana y el rango semiintercuartilar.
El rango semiintercuartilar se define como la mitad de la distancia sobre la
escala entre Q1 (cuartil 1, que es el punto, bajo el cual queda el 25% de los
casos) y Q3 (cuartil 3, bajo el cual queda el 75% de los casos). La frmula
siguiente ilustra esta definicin:
Q3 Q1
RSIC=
2

Un aspecto de la definicin del rango semiintercuartilar (y por lo mismo de la


mediana) que frecuentemente es confuso, es que aunque los puntos Q se
localizan por la referencia al orden de las calificaciones, estos puntos Q se
expresan en trminos de una escala de intervalos a lo largo de la lnea base.
Por ejemplo, suponiendo que tenemos unos datos en los que Q 1 vale 3.5 y Q3 es
igual a 8.5, entonces el RSIC resulta ser (8.5-3.5)/2= 5/2= 2.5 puntos sobre la
escala de la lnea base.
(en clase veremos algn ejemplo de esto)

5.-Coeficiente de varianza de Pearson: se calcula como cociente entre la


desviacin tpica y la media.

Cv = S / M

El inters del coeficiente de variacin es que al ser un porcentaje permite


comparar el nivel de dispersin de dos muestras. Esto no ocurre con la
desviacin tpica, ya que viene expresada en las mismas unidas que los datos
de la serie.
Por ejemplo, para comparar el nivel de dispersin de una serie de datos de la
altura de los alumnos de una clase y otra serie con el peso de dichos alumnos,
no se puede utilizar las desviaciones tpicas (una viene expresada en cm y la
otra en kg). En cambio, sus coeficientes de variacin son ambos porcentajes,
por lo que s se pueden comparar.

Veamos un ejemplo:
Vamos a utilizar la serie de datos de la estatura de los alumnos de una clase
(leccin 2) y vamos a calcular sus medidas de dispersin.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
x x x x x

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%


1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor
valor (1,20). Luego el rango de esta muestra es 10 cm.
2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego,
aplicamos la frmula:

Sustituyendo valores:

Por lo tanto, la varianza es 0,0010

3.- Desviacin tpica:


Del ejemplo, tenemos que:

4.- Rango Semiiintercuartilar: Para encontrar el valor del rango


semiintercuartilar debemos encontrar Q1 y Q3. Multiplicando el nmero de casos
(30) por la proporcin de casos debajo de Q1 (0.25) y por 0.75 as encontramos
que Q1 y Q3 son los puntos debajo de los cuales caen 7.5 y 22.5 casos
respectivamente. Contando de menor a mayor de la distribucin, encontramos
que 7.5 casos caen dentro del intervalo 1.22 por lo tanto Q 1 = 1.22. De nuevo,
contando de menor a mayor encontramos que 22.5 casos caen dentro del
intervalo 1.28 por lo tanto Q3 = 1.28. Sustituyendo en la ecuacin tenemos que
RSIC= (1.28 -1.22)/2 = 0.03

Nota. En este ejemplo los cuartiles caen exactamente a la mitad de la


frecuencia de los intervalos sealados, es necesario ver otro ejemplo para
cuando esto no sucede.

As como la frmula pudo ser dada para calcular la mediana, podemos


establecer otra para el clculo de Q1 y Q3 o cualquier otro percentil. Esta
frmula es meramente una expresin ms general que la dada para la
mediana:
perc=x L +
[ PN cfb x L
f ]i

Donde: % perc = percentil que deber encontrarse

PN = nmero de casos que caen abajo del punto que se busca y


se calcula multiplicando la proporcin deseada por N para el ej:(0.75 *30=
22.5)

N = es el total de casos (en el caso del ejemplo sera =30)

f = frecuencia o nmero de casos dentro del intervalo que

contiene la mediana

i = tamao del intervalo

cfbxL = frecuencia acumulativa o nmero de casos debajo del


intervalo en la cual queda la mediana.

xL = lmite inferior del intervalo que contiene la mediana (en


el caso del ejemplo el lmite inferior del intervalo es 1.275 =
(1.28 +1.27)/2 porque el intervalo es de 0.01

Aplicando la frmula para el ejemplo, tenemos:

Q3=1.275+ [ 22.520
4 ]0.01

Q3 = 1.28125

5.- Coeficiente de variacin de Pearson: se calcula como cociente entre la


desviacin tpica y la media de la muestra.

Cv = 0,0320 / 1,253
Luego,

Cv = 0,0255

Potrebbero piacerti anche