La varianza es una medida de dispersión que representa la variabilidad de
una serie de datos respecto a su media. Formalmente se calcula como la
suma de los residuos al cuadrado divididos entre el total de observaciones.
También se puede calcular como la desviación típica al cuadrado. Dicho sea de
paso, entendemos como residuo a la diferencia entre el valor de una variable en un momento y el valor medio de toda la variable.
Ver todas las medidas de dispersión
Antes de ver la fórmula de la varianza, debemos decir que la varianza en estadística es muy importante. Ya que aunque se trata de una medida sencilla, puede aportar mucha información sobre una variable en concreto.
Fórmula para calcular la varianza
La unidad de medida de la varianza será siempre la unidad de medida correspondiente a los datos pero elevada al cuadrado. La varianza siempre es mayor o igual que cero. Al elevarse los residuos al cuadrado es matemáticamente imposible que la varianza salga negativa. Y de esa forma no puede ser menor que cero.
Donde
X: variable sobre la que se pretenden calcular la varianza
xi: observación número i de la variable X. i puede tomará valores entre 1 y n. n: número de observaciones. x̄: Es la media de la variable X.
O lo que es lo mismo:
¿Por qué se elevan al cuadrado los residuos?
La razón por la que los residuos se elevan al cuadrado es sencilla. Si no se elevasen al cuadrado, la suma de residuos sería cero. Es una propiedad de los residuos. Así pues para evitarlo, tal como ocurre con la desviación típica se elevan al cuadrado. El resultado es la unidad de medida en la que se miden los datos pero elevada al cuadrado. Por ejemplo, si tuviésemos datos sobre los salarios de un conjunto de personas en euros, el dato que arroja la varianza sería en euros cuadrados. Para que tenga sentido la interpretación calcularíamos la desviación típica y pasaríamos el dato a euros.