Sei sulla pagina 1di 15

UNIDAD 4

Medidas de variabilidad o dispersin

Universidad Autnoma de Santo Domingo, UASD


Agosto, 2011

Contenidista: Francisco Roa Familia

Nombre del Curso

Estadstica General

Clave del Curso

Est-111

Nmero de la Unidad

IV

Autor de la Unidad

Francisco Roa Familia


ndice

I.
II.
III.
IV.

Introduccin/Explicacin de la unidad
Objetivo General
Objetivos especficos
Desarrollo del contenido
Rango o recorrido.
La varianza y la desviacin estndar.
El coeficiente de variacin.

V.

Bibliografa

I. INTRODUCCION/EXPLICACION DE LA UNIDAD
En esta unidad estudiaremos las medidas estadsticas de variabilidad
o dispersin. Son medidas que operan como complementarias a las
de tendencia central y a las de posicin no central, en el proceso
de describir, comparar y analizar conjuntos de datos en relacin a
variables de inters.

II. OBJETIVO GENERAL


Al finalizar esta unidad el estudiante conocer y podr aplicar, de
acuerdo a las circunstancias, la (s) ms importante(s) medidas de
variabilidad o dispersin.
2

Contenidista: Francisco Roa Familia

III.

OBJETIVOS ESPECFICOS

Al finalizar esta unidad el estudiante estar en capacidad de calcular y


aplicar, adecuadamente:
a)
b)
c)
d)

El rango o recorrido, rango intercuartlico.


La varianza y la desviacin estndar
El coeficiente de variacin.
Las principales caractersticas de estas medidas.

1. DESARROLLO DEL CONTENIDO:


Medidas de variabilidad o dispersin
Son medidas estadsticas cuyo objetivo es determinar el grado en
que los valores de un conjunto se alejan o concentran, entre s, o
alrededor de un valor central, que en la mayora de los casos es el de
la media aritmtica y cuando no, el de la mediana.
Las medidas de variabilidad se dividen en: Medidas de variabilidad
absolutas y Medidas de variabilidad relativas.
Las medidas de variabilidad absolutas se utilizan, por lo regular, en
la descripcin, anlisis y comparacin de conjuntos de valores con
promedios parecidos; y entre estas se encuentran el rango o
recorrido, la desviacin media, la varianza y la desviacin estndar.
Las medidas de variabilidad relativa se utilizan en la descripcin,
anlisis y/o comparacin de conjuntos con promedios muy
dismiles, y de esas nos interesa el Coeficiente de Variacin (CV).

a. Rango o recorrido (R)


3

Contenidista: Francisco Roa Familia

Es el intervalo o tramo en que existen o se distribuyen los valores de un


conjunto. Es una medida de cuan concentrados o parecidos son entre s las
magnitudes de los valores de un conjunto. Se obtiene con la simple diferencia
entre el valor mayor y el menor del conjunto considerado.
R = valor mayor valor menor
Ejemplo
El valor (RD$) del gasto (y) en refrigerio en una muestra aleatoria de 5
estudiantes fue como sigue:
(yi): 50, 75, 105, 60, 80
n=5
Valor mayor = 105; valor menor = 50
R = 105 50 = 55.
El R = 55
Este valor nos da la distancia o diferencia mxima entre los valores de
ll variable, en este caso el conjunto en refrigerio. En un conjunto de
valores, mientras mayor el valor del R mayor variabilidad entre sus
valores. Pero esta medida tiene la debilidad de que ignora toda la
informacin en el conjunto, entre el valor ms grande y el ms
pequeo, y eso la hace una medida de poca capacidad descriptiva, por
lo que en muy pocas circunstancias resulte de inters.

La varianza
La varianza es una medida cuadrtica (es decir expresada en valores elevados al
cuadrado) de la variabilidad o dispersin de los valores de un conjunto respecto a
su media aritmtica.
4

Contenidista: Francisco Roa Familia

Ya vimos que a la diferencia entre cada valor cualquiera (yi) y la media aritmtica
( , segn sea de una muestra o de una poblacin) se conoce como
desviacin, variacin o discrepancia respecto a la media, y sabemos que esta se
representada por (yi_), si corresponde a una muestra (n); y si se trata de una
poblacin o universo (N), se representa por (yi_).
La varianza es la media aritmtica de los cuadrados de las diferencias,
discrepancias o desviaciones de los valores de un conjunto respecto a su media
aritmtica. En ocasiones se utiliza a la mediana en lugar de la media.

La varianza para datos individuales


Si y1, y2, y3,. . ., yn es el conjunto de valores de la variable y en una muestra
aleatoria (n) e () su media aritmtica, entonces, la varianza para datos
originales o individuales viene dada por:

S2 = in(yi- )2/(n-1) = [(y1- )2+ (y2- )2+(y3- )2+. . . +(yn- )2]/(n-1), donde n es el
nmero de datos o valores que compone la muestra. Observe las similitudes y
diferencias entre la formula de la varianza con la de la desviacin media.
Al trmino (n-1) es conocido entre los estadsticos con el nombre de grados de
libertad (G.L), y tiene que ver con la cantidad de elecciones libres, es decir
elecciones aleatorias, de los valores de una muestra.
Esta verificado que para n 30 valores, el valor de la varianza es el mismo cuando
se calcula usando como denominador (n-1) o n.

Contenidista: Francisco Roa Familia

Se ha verificado que para n<30 valores y con (n-1) y no n como denominador, la


varianza muestral (S2) resulta ser un estimador insesgado (no sesgado) de la
varianza poblacional ( 2). ( 2 es la letra griega mayscula sigma, al cuadrado).
Ya hemos indicado que, en general, las aplicaciones estadsticas se realizan en
base a datos provenientes de muestras. Es decir que, en general, se calculan
estimadores (medidas estadsticas calculadas en muestras), no parmetros
(medidas calculadas en poblaciones o universos), pero que cuando se calculan los
estimadores es porque se tiene inters en conocer sus correspondientes
parmetros.
El procedimiento para la determinacin del valor de un estimador y el de su
parmetro difieren solo en la cantidad de valores involucrados en sus respectivos
clculos.
Una expresin apropiada para el clculo de la varianza poblacional ( 2), para
datos individuales u originales es:
2 = in (yi- )2/N = [(yi- )2+ (yi- )2+(yi- )2+. . . +(yN- )2]/ N, donde N es el
nmero total de valores en la poblacin.
La diferencia con la frmula para calcular la varianza muestral, su estimador, es
solo la cantidad de valores, es decir que solo cambia N por n.

Ejemplo
Calculemos la varianza de la edad de una muestra (n) de los estudiantes de
Ingeniera, registrada en nuestra Base_de_Datos_0, para lo que
necesitamos calcular primero la media aritmtica:
= inyi/n = (y1+ y2 + y3+. . . +yn)/n =
6

Contenidista: Francisco Roa Familia

n = 49 estudiantes.
= (y1+ y2 + y3+. . . + y49)/49
= 23.2245 (ver Pgina 8 anterior).

Para aplicar la formula de la varianza con datos individuales u originales, vamos


a nuestro archivo Base_de_Datos_0, e igual que hicimos para calcular la
desviacin media, creamos una columna para colocar los cuadrados de
las diferencias o variaciones entre cada valor de la variable y su media
aritmtica [(yi- )^2], y procedemos exactamente como lo hicimos para la
determinacin de la desviacin media. Eso se observa en la imagen que sigue:

Verifique que el primer resultado, y dems, en la columna bajo el encabezado


[(yi- )^2], se obtiene de aplicar esta expresin, por ejemplo donde y1 = 23 y la
= 23.2245, [(23-23.2245)^2] = 0.0504.
Observe que la expresin del numerador de la ecuacin de la varianza: in (yi- )2
= [(y1- )2+ (y2- )2+ (y3- )2+ . . . + (y49- )2 = 0.0504 + 0.0504 + 10.3973 + . . . +
4.9484 = 10.3973, se corresponde con la secuencia y sumatoria de los valores de
la columna cuyo encabezado es (yi- )^2; es decir que (yi- )^2 dividida por 49,
como sigue:
7

Contenidista: Francisco Roa Familia

S2 = in (yi- )2/(n-1) = [(y1- )2+ (y2- )2+ (y3- )2+. . . + (y49- )2 ]/49 = 10.3973/49 =

S2 = in (yi- )2/n = 17.2


S2 = 17.2
Y la desviacin estndar es la raz cuadrada de la varianza, es decir que:
S = 17.2 = 4.14

La varianza para datos agrupados


Si y1, y2, y3,. . ., yk, son los k puntos medios y f1, f2, f3,. . ., fk, las k frecuencias
correspondientes a las k clases de una distribucin de frecuencias, entonces, la
varianza resulta de la aplicacin de la expresin:
S2 = in(yi- )2 fi/(n-1) = [(y1- )2 f1+ (y2- )2 f2 + (y3- )2 f3+ . . . +(yk- )2 fk]/ (n-1)

Ejemplo
Primero calculamos el valor de la media aritmtica (), en este caso para datos
agrupados, porque tenemos que usarlo en la formula de la S2. Para eso volvamos
al ejemplo de la distribucin de los estudiantes de Ingeniera segn la edad,
calculada anteriormente, y que se la presentamos a continuacin:

Contenidista: Francisco Roa Familia

Revsese el procedimiento que sobre esa distribucin hemos hecho para


calcular la media aritmtica.

Usamos el valor de la media aritmtica ( = 23.) en el procedimiento de

clculo de la varianza. Apliquemos el modelo o expresin para el


clculo de la varianza, para datos agrupados:
S2 = in(yi- )2 fi/(n-1) = [(y1- )2 f1+ (y2- )2 f2+(y3- )2 f3+ . . . +(yk- )2 fk]/ n =
Aqu utilizamos n y no (n-1), debido a que n > 30.
Aprovechemos parte de los clculos hechos anteriormente para calcular a la
desviacin media, como se presenta a continuacin:

Contenidista: Francisco Roa Familia

Ahora agreguemos una columna para el clculo de la los cuadrados de las


diferencias o variaciones [(yi_)^2], multiplicados por las frecuencias (fi), es decir
[(yi_)^2(fi)], como se observa en la imagen, a continuacin:

10

Contenidista: Francisco Roa Familia

Obsrvese que la expresin del numerador de la frmula para el clculo de la


varianza: (yi_)^2fi = in(yi- )2 fi = (y1- )2 f1+ (y2- )2 f2+(y3- )2 f3+ . . . +(yk- )2 fk =
232,0032033 + 28,48860475 + . . . + 241,833601 + 189,7644003 = 808,53061, se
corresponde con la secuencia de los valores y la suma de estos en la columna de
la derecha, en el cuadro anterior.
Finalmente dividimos por n = 49:
S2 = in(yi- )2 fi/n = 808,53061 / 49 = 16.50
S2 = 16.50;

S = 4.1

As llegamos al final del proceso de calcular los valores a la varianza y a la


desviacin estndar para datos agrupados en una distribucin de frecuencias.
S Varianza

La varianza resulta expresada en unidades de medidas de la variable al cuadrado,


lo que dificulta la comprensin e interpretacin de su valor. Su utilidad se limita
a la comparacin entre la variabilidad de dos o ms variables y para facilitar la
determinacin de la desviacin estndar (S). A un elevado valor de la varianza o
desviacin estndar corresponde un alto grado de variabilidad, heterogeneidad,
diferencias o discrepancias colectivas de los valores considerados.
Recuerde que hemos sealado y reiterado que en el caso de la distribucin de
frecuencias, cada punto medio representa a los valores incluidos en el intervalo o
clase considerado.

b. Desviacin estndar o tpica


La desviacin estndar es la raz cuadrada positiva de la varianza.
En el caso de la desviacin estndar muestral es S=
desviacin estndar poblacional

11

S 2 ; cuando se trata de la

Contenidista: Francisco Roa Familia

El valor de la varianza viene expresado en unidades de medidas al cuadrado, lo


que dificulta su comprensin e interpretacin, sin embargo con la desviacin
estndar se elimina esa dificultad al resultar expresada en unidades de medidas
lineales, al igual que la media aritmtica, que es como vienen expresadas las
unidades de medidas de los valores originales.
En el ejemplo anterior, referido a la edad de los estudiantes de Ingeniera de la
universidad, el valor de la varianza S2 = 16.50; y el valor de la desviacin
estndar (S) = 4.1
Y para mas sobre las principales medidas de tendencia central y de variabilidad
les presento una serie de videos, a los que pueden acceder a travs de
http://www.youtube.com/watch?v=dIgo6In-siI&NR=1.

Caractersticas de la varianza y desviacin estndar.


1. La varianza y la desviacin estndar son medidas que toman en cuenta la
magnitud de cada valor involucrado en sus clculos.
2. Al igual que la media aritmtica, la varianza calculada usando la frmula para
datos individuales y la frmula para datos agrupados (sobre los mismos datos),
por lo regular, presenta diferencias. Pero diferencias despreciables. Diferencias
que se explican con que, en el caso de datos agrupados en una distribucin de
frecuencias, los valores pierden su individualidad, y los puntos medios de los
intervalos o clases, ponderados por las frecuencias correspondientes, hacen de
representantes de los valores individuales, con la consiguiente y obvia
imprecisin. . .

Uso de la varianza y la desviacin estndar:

12

Contenidista: Francisco Roa Familia

En el mbito de aplicacin de esta asignatura, la varianza (S2) se calcula con el


exclusivo propsito de facilitar la determinacin del valor de la desviacin
estndar o tpica (S).
Empricamente, la desviacin estndar o tpica es una medida de la distancia o
diferencia promedio entre los valores de un conjunto y su media aritmtica. Y se
puede afirmar que el comportamiento natural de los valores de las variables,
esencialmente cuando su polgono de frecuencias tiende a tener forma de
campana, es tal que aparecen distribuidos segn se describe a continuacin:
Intervalo
Sy

%
68.26

[ _ Sy a + Sy]
2Sy

95.45

[ _ 2Sy a + 2Sy]
3Sy

99.73

[ _ 3 Sy a + 3Sy]

Donde es la media aritmtica de la variable y, y Sy su desviacin


estndar o tpica.
Esto significa que de los valores de una variable el 68.26 % aparecer en el
intervalo definido por su media aritmtica () ms o menos () una vez su
desviacin estndar (Sy), es decir (

1Sy);

que el 95.45% estar comprendido

entre su media aritmtica y ms o menos dos veces su desviacin estndar

2Sy) y

el 99.73% estar comprendido en el intervalo definido por su media

aritmtica ms o menos tres veces su desviacin estndar

( 3Sy).

Es un

esquema a partir del cual podemos, en general, describir y analizar,


comparativamente a conjuntos de elementos o individuos en relacin a variables
de inters.
13

Contenidista: Francisco Roa Familia

Si aplicamos estos criterios al comportamiento de la edad de los estudiantes de


Ingeniera, tendramos que:
[ _ Sy a + Sy] = [23.2245-4.1 a 23.2245 + 4.1];

[19.13 a 27.32] =>68.26%

[ _ (2) Sy; + (2)Sy]; [23.2245 8.2 a 23.2245 + 8.2];

[15.02 a 31.32] =>95.45%

Hemos calculado unos intervalos en los cuales se espera que, en el primero, si se


realiza una investigacin sobre la poblacin o universo de estudiantes de
Ingeniera de esta universidad, alrededor del 68 % tiene edad entre 19 y 27 aos
y que alrededor del 95% tiene edad en el intervalo de 15 a 31 ao.
g. Medidas de variabilidad relativas, el coeficiente variacin (C V)
De las medidas de variabilidad relativas la ms importante y de uso comn es
el coeficiente de variacin (CV), el cual se obtiene por cociente de la
desviacin estndar entre la media aritmtica, expresado en porcentaje, en
base al que esta (la desviacin estndar) haya sido calculada. Es una medida
abstracta, no tiene ninguna unidad de medida asociada, y nos indica el grado
en que se alejan o concentran los valores de una variable alrededor de su
media aritmtica. El hecho de no tener asociada ninguna unidad de medida
facilita la comparacin de conjuntos asociados a caractersticas distintas y/o a
variables a distintas escalas pero que estn relacionadas estadsticamente
y sustantivamente y con un factor en comn. Es decir, ambas variables
tienen una relacin causal con ese factor. Para mas sobre esto, vea
http://es.wikipedia.org/wiki/Coeficiente_de_variaci%C3%B3n.
En nuestro ejemplo anterior, referido a la edad de los estudiantes de Ingeniera,
el valor (4.1) de la desviacin estndar (S) y el valor (23) de la media aritmtica
(), nos genera un coeficiente de variacin de CV = (4.1/23)*100 = 17.80 %
CV 17.80 %

BIBLIOGRAFIA CONSULTADA:
14

Contenidista: Francisco Roa Familia

1. http://estadistica-uasd.blogspot.com/, sitio Web del que somos copropietarios.


2. Enciclopedia virtual Wikipedia, 30 de nov. 2010
http://es.wikipedia.org/wiki/Estad%C3%ADstica.
3. BIBLIOTECA VIRTUAL de Derecho, Economa y Ciencias Sociales
http://www.eumed.net/libros/2006a/rmss/00.htm (30 de nov. 2010)
4. David R. Anderson. Denny J. Sweeney. Thomas A. Williams, en
Estadstica para Administracin y Economa. D.R. 2008 por Editorial
CENGAGE Learning Editores S.A., Mxico, DF, 10. Edicin.
5. Richard I. Levin y Bubin, David S, en Estadstica para Administracin
y Economa; 7ma. Edicin; Editorial Pearson Educacin, Mxico,
2004.
6. Allen L. Webster, en Estadstica Aplicada a los negocios y a la
Economa. Editora IrWin-McGraw-Hill. Tercera edicin; abril del ao
2004.
7. Carlos Custodio Guerrero, en Estadstica Bsica, Editorial Surco,
4ta.edicin, ao 2008.
8. Alfonso Garca Barbancho, en Estadstica Elemental Moderna. 9na.
Edicin, noviembre 1993.Editorial Ariel, S.A, Crcega, 270,
Barcelona-8. ISBN:84 344 01401. Impreso en Espaa.

15

Potrebbero piacerti anche