Para estudiar de manera detallada el comportamiento de un conjunto de observaciones,
no es suficiente el conocimiento de las medidas de posicin o tendencia central, sino que tambin resulta necesario abordar la desviacin o dispersin de dichas observaciones respecto a stas. As, a modo de ejemplo, en una determinada localidad el salario medio de los trabajadores que en ella habitan puede ser de 1.500 euros/mes. Ahora bien, dicha informacin, por s sola, nada nos dice acerca de la representatividad de dicho promedio. Es que la totalidad de los trabajadores perciben 1.500 euros/mes? Es que la mitad percibe 500 euros/mes y la otra mitad percibe 2.500? Evidentemente, ambas situaciones son muy distintas, si bien en las dos el salario medio de los trabajadores de la localidad en cuestin es el mismo. De igual manera que la medida de posicin central que ms se utiliza es la media aritmtica de la distribucin, la desviacin tpica es la medida de dispersin absoluta por excelencia. La principal diferencia entre la varianza y la desviacin tpica, es que mientras que la varianza viene medida en las unidades de la variable al cuadrado, la desviacin tpica viene medida en las mismas unidades que la variable, lo que hace ms sencilla su interpretacin. Continuando con el ejemplo anterior, la varianza de los salarios de los trabajadores de la localidad en cuestin vendra dada en euros al cuadrado, mientras que la desviacin tpica viene expresada en euros. Resulta evidente, y no merece mayor comentario, que nadie ha visto nunca un euro al cuadrado. Otro ejemplo evidente podra resultar de una distribucin de alturas. Si stas se miden en metros (longitud), la varianza vendra dada en metros al cuadrado (un rea). Lgicamente, nadie entendera que la variabilidad de las alturas de una distribucin de observaciones fuese un rea; todos esperaramos que fuese una longitud, tal y como dicta la desviacin tpica. II. INTERPRETACIN Como se ha comentado anteriormente, la desviacin estndar es una medida del grado de dispersin de las observaciones alrededor de su valor medio. Al definirse como la raz cuadrada con signo positivo de la varianza, la desviacin estndar es simplemente la raz cuadrada de la media cuadrtica de las desviaciones de las observaciones respecto de su media, por lo cual, podra interpretarse como una desviacin "promedio" de dichas zobservaciones respecto la media aritmtica. Obviamente, cuanto mayor sea la desviacin tpica, mayor ser la dispersin de los valores de la distribucin respecto a la media aritmtica y, por tanto, la media aritmtica ser menos representativa de las observaciones de dicha distribucin. Y viceversa. Mostrar/Ocultar En el grfico anterior pueden verse representadas mediante un histograma dos diferentes distribuciones de frecuencias, A y B. Ambas tienen el mismo valor medio,Mostrar/Ocultar sin embargo la distribucin de los valores en torno a dicha media es muy diferente. Mientras que la distribucin A tiene valores muy alejados de su media, la distribucin B presenta la mayora de los valores alrededor de la misma. Por tanto, como puede apreciarse, la media de la distribucin A, Mostrar/Ocultar es muy
poco representativa de la distribucin mientras que la media que la distribucin B,
Mostrar/Ocultar s es representativa, pues la mayora de los valores de la distribucin estn muy prximos a ella. Debe quedar claro que ambas distribuciones tienen la misma media, pues en caso contrario la medida apropiada para decidir cul de los dos promedios es ms representativo es el coeficiente de variacin de Pearson, que relaciona la desviacin tpica con la media a travs de un cociente, es decir, que indica las veces que la desviacin tpica contiene la media (por ejemplo, la desviacin tpica es dos veces la media, o tres veces la media). III. PROPIEDADES Vanse a continuacin algunas propiedades interesantes de la desviacin tpica:
- La desviacin tpica siempre es mayor o igual que cero. Lgicamente, la
variabilidad de una distribucin de frecuencias puede ser muy elevada, elevada, poca, muy poca o ninguna. Pero nunca puede ser negativa. No se entiende el concepto de variabilidad relacionado con medidas negativas.
- La desviacin tpica puede expresarse como
Mostrar/Ocultar
- A la desviacin tpica no le afectan los cambios de origen: si yi = xi b,
entonces Sy = Sx Es decir, si a los valores de una variable se le suma o resta una constante, su variabilidad, medida por la desviacin tpica, no se modifica, pues dicha constante se le ha agregado o sustrado a la totalidad de ellos.
- A la desviacin tpica le afectan los cambios de escala: si yi = axi, entonces
Mostrar/Ocultar
- Como consecuencia de las propiedades 3) y 4), si a una variable se le aplica un
cambio de origen b y un cambio de escala a, la desviacin tpica pasa a ser Mostrar/Ocultar
- La desviacin tpica, igual que la varianza, es una medida de dispersin
ptima, en el sentido de que proporciona el valor mnimo de la variabilidad (menor que cualquier otra desviacin relativa a otro punto de la escala).
- En general, la desviacin estndar est menos influida por las fluctuaciones de
los datos que las dems medidas de dispersin.
- A partir de la desigualdad de Tchebycheff se establece que el nmero de
observaciones contenidas en el intervalo Mostrar/Ocultar es al menos el 75% de las que contiene la distribucin. Igualmente, al menos el 89% de las observaciones de la distribucin pertenecen al intervalo Mostrar/Ocultar . En general, como mnimo el Mostrar/Ocultar de las observaciones de la distribucin se encuentran ubicadas en el intervalo Mostrar/Ocultar .
A partir de estas consideraciones, es relativamente sencillo hacerse una idea de las
observaciones de la distribucin a partir de dos sencillas medidas sintticas como son la media y la desviacin tpica. IV. Tipificacin Se denomina tipificacin de los valores de una variable al proceso por medio del cual se expresan dichos valores en trminos del nmero de desviaciones tpicas que estn por encima o por debajo de la media. Analticamente, el valor tipificado de xi, x*i viene dado por: Mostrar/Ocultar La distribucin de frecuencias correspondiente a la variable tipificada X* tiene media nula y desviacin tpica unitaria. Cul es la principal utilidad de la operacin de tipificacin? Vemoslo con un ejemplo que ya se puede considerar como clsico. Imagnese que un trabajador est empleado en una empresa en la que el salario medio mensual es de 1.500 euros, siendo la desviacin tpica de 150 euros. Su salario, en concreto, es de 1.750 euros. Supngase ahora que recibe una oferta de otra empresa por valor de 2.000 euros al mes. En dicha empresa el salario medio es de 1.600 euros y la desviacin tpica es de 300 euros. La pregunta es en cul de las dos empresas su salario es ms elevado en relacin con sus compaeros de trabajo? Pues bien, en la empresa actual su salario est 1,67 desviaciones tpicas por encima del salario medio de la misma; sin embargo, en la empresa que realiza la oferta su salario estara tan solo 1,33 desviaciones tpicas por encima de la media salarial. En conclusin, independientemente de si el trabajador acepta o no la oferta en cuestin, el salario en la nueva empresa sera ms elevado, pero la posicin del trabajador en el ranking de trabajadores segn salario sera ms baja que en la empresa en la que actualmente trabaja. V. DESVIACIN TPICA DE UNA VARIABLE ALEATORIA En aras de la sencillez, las secciones anteriores hace referencia al clculo de la desviacin tpica a partir de distribuciones de frecuencias. Pero de manera anloga se puede definir la desviacin tpica en el mbito de la incertidumbre, es decir, cuando se trabaja con variables aleatorias. En este caso, dada la variable aleatoria X, su desviacin tpica viene dada por:
- Caso discreto:
Mostrar/Ocultar
- Caso continuo:
Mostrar/Ocultar
donde denota la media o valor esperado de la variable aleatoria X, y, en el caso
continuo, f (x) representa su funcin de densidad de probabilidad. Mostrar/Ocultar La Figura 2 representa una funcin de densidad con la misma media (o esperanza), 25, pero con distinta desviacin tpica (en la primera es 3 y en la segunda 10). Como puede apreciarse, la media de la primera distribucin (que viene acompaada de una menor desviacin tpica o estndar) resulta ms representativa, como medida de posicin central, de la distribucin de probabilidad que la de la segunda. La interpretacin, propiedades, etc. de la desviacin tpica en el contexto aleatorio son las mismas que en el contexto determinista. Gema Fernndez-Avils Caldern Jose Juan Amaya 224
Resumen de Diseño Estadístico Para Investigadores en Ciencias Sociales y del Comportamiento. Capítulo 2: Variables Estadísticas: RESÚMENES UNIVERSITARIOS