Sei sulla pagina 1di 10

ESTADISTICA DESCRIPTIVA BIVARIADA

MEDIDAS DE RELACIN ENTRE


VARIABLES CUANTITATIVAS

Covarianza (Sxy)
Mide la relacin lineal entre dos variables y se expresa mediante la
siguiente frmula:

Propiedades:
Sxy es un valor que vara entre - y +
Si Sxy es positivo, entonces la correlacin es directa (a mayor valor de X, mayor
valor de Y) y, por tanto, la recta de regresin es ascendente.
Si Sxy es negativo, entonces la correlacin es inversa (a mayor valor de X, menor
valor de Y) y, por tanto, la recta de regresin es descendente.
Si Sxy es cero, entonces no hay correlacin entre X e Y.

Coeficiente de correlacin de Pearson (rxy)


La covarianza depende de los valores de las variables y por tanto de sus
unidades. Para tener una medida adimensional se utiliza el coeficiente de
correlacin de Pearson (r xy) que nos indica qu tipo de relacin existe
entre dos variables, as como la magnitud de dicha correlacin, siendo
invariante frente a transformaciones lineales (cambio de origen y escala)
de las variables.
El coeficiente de correlacin de Pearson fue construido bajo el supuesto
de que los datos siguen una distribucin normal bivariada y la escala de
medicin es al menos de intervalo.

El Coeficiente de Correlacin de Pearson mide la relacin lineal entre dos variables


y se define como el cociente entre la covarianza y el producto de las desviaciones
tpicas de ambas variables. Toma la siguiente expresin para el clculo:

Propiedades:
Es un coeficiente adimensional. Es decir, que es independiente de las unidades
en que estn expresadas las variables. Por ello sirve de valor de comparacin
aunque la variables vengan expresadas en unidades diferentes.
-1 rxy 1
Si rxy =1 rxy = -1, la relacin es funcional. Una variable depende
matemticamente de la otra (puede expresarse mediante una frmula en la que
intervenga la otra, por ejemplo la longitud de una circunferencia depende del radio
mediante la frmula (L=2r).

Interpretacin:
Si rxy est prximo a 1 -1 la correlacin es fuerte (por encima de 0.8).
Si rxy est prximo a 0, la correlacin es dbil.
Si rxy >0 la correlacin es directa. Hay relacin lineal positiva.
Si rxy <0 la correlacin es inversa. Hay relacin lineal negativa.
Si Sxy = 0 y por tanto rxy = 0 la correlacin es nula. La relacin lineal es nula.
Interpretacin grfica:
Si rxy = 1 los puntos (x,y) forman una lnea ascendente.
Si rxy = -1 los puntos (x,y) forman una lnea descendente.
Si rxy > 0 los puntos (x,y) forman una nube ascendente ms cercana a una recta
cuanto ms cercano sea este valor a 1.
Si rxy < 0 los puntos (x,y) forman una nube descendente ms cercana a una recta
cuanto ms cercano sea este valor a -1.
Si rxy = 0 la nube de puntos sigue una distribucin totalmente aleatoria (circular).

MEDIDAS DE RELACIN ENTRE VARIABLES ORDINALES


Coeficiente de correlacin de Spearman
Cuando los datos no se distribuyen segn una normal bivariada o bien estn medidos
con una escala ordinal, una de las posibles medidas de asociacin lineal es el
coeficiente de correlacin de Spearman (1904). Este coeficiente se define de igual
manera que el de Pearson, slo que en lugar de utilizar los valores de las variables,
utiliza los rangos asociados a estos valores.
En el caso de que una variable sea ordinal y la otra cuantitativa, se analizarn los
datos como si las dos fuesen ordinales.

donde di es la diferencia entre el rango del caso i en la variable X, y en la variable Y.


Propiedades:
- 1 rs +1
Si rs = +1, hay correlacin directa mxima.
Si rs = -1, hay correlacin inversa mxima.
Si rs = +1, la correlacin es nula.

MEDIDAS DE RELACIN ENTRE VARIABLES NOMINALES


En muchos casos la relacin entre determinadas variables no puede medirse con
una escala cuantitativa. Por ejemplo: la relacin entre el gnero y la ideologa
poltica.
Al no cuantificarse numricamente las variables no se puede hablar de una
correlacin directa o inversa.
Por ejemplo: decir que a mayor gnero, mayor ideologa poltica no tiene sentido.
Por lo tanto, cuando decimos que dos variables nominales X e Y estn
relacionadas, queremos decir que las proporciones de X (gnero: hombre, mujer)
son diferentes en cada categora de Y (ideologa poltica: izquierda, derecha). Si X
e Y no estn relacionadas, entonces las proporciones de X sern iguales en las
distintas categoras de Y.
A las frecuencias que esperaramos obtener si X e Y estuvieran relacionadas se
les denomina frecuencias observadas.
A las frecuencias que esperaramos obtener si X e Y no estuvieran relacionadas
se les denomina frecuencias esperadas.

REGRESIN LINEAL SIMPLE


En un grfico de nube de puntos, podemos observar de manera intuitiva cierto
grado de asociacin o correlacin lineal entre las dos variables. Incluso se podra
trazar una recta, llamada recta de regresin, que se ajustase a la nube de puntos.
No obstante, tambin la apreciacin visual de la existencia de correlacin no es
suficiente. Vamos a proceder ahora a estudiar el procedimiento de seleccin de
esta recta y los parmetros de medida que debemos usar.
Una vez encontrada la funcin que representa esta dependencia de las variables,
podremos predecir los valores de una variable (variable dependiente o explicada) a
partir de los valores de las otras (variables independientes o explicativas).
Adems, podremos calcular la fiabilidad de esta prediccin.

La regresin puede o no representarse por una recta. En el caso de que elijamos


un recta para ajustarla a la nube de puntos, estaremos hablando de regresin
lineal. En otro caso, diremos que la regresin es no lineal.
Asimismo, una regresin lineal es simple cuando solamente exista una variable
independiente. Cuando sean ms de una las variables independientes diremos
que la regresin lineal es mltiple.
A partir de la observacin de la nube de puntos se elige el tipo de funcin o curva
que mejor relaciona las dos variables. Se obtiene as la ecuacin de la recta o de
la curva que mejor se adapta al conjunto de puntos y que sirve para predecir el
valor de una de las variables.