Sei sulla pagina 1di 8

CORRELACION:

EL objetivo de un estudio de correlacin es determinar la consistencia de una relacin


entre observaciones por partes. EL trmino correlacin significa relacin mutua, ye que
indica el grado en el que los valores de una variable se relacionan con los valores de
otra. Se considera tres tcnicas de correlacin uno para datos de medicin, otro para
datos jerarquizados y el ltimo para clasificaciones nominales.
En tanto, en probabilidad y estadstica, la correlacin es aquello que indica la fuerza y la
direccin lineal que se establece entre dos variables aleatorias. Se considera que dos
variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan
sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos
variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de
B y viceversa. La correlacin entre dos variables no implica, por s misma, ninguna
relacin de causalidad
Cuando r = 1 existe una relacin funcional entre las dos variables de modo que el valor de
cada variable se puede obtener a partir de la otra. Los puntos de la nube estn todos
situados sobre una recta de pendiente positiva.
Esto ocurre, por ejemplo, cuando una barra metlica se somete a distintas temperaturas,
x1, x2,, xn, y se miden con precisin sus correspondientes longitudes, y1, y2,, yn. Las
longitudes se obtienen funcionalmente a partir de las temperaturas de modo que,
conociendo la temperatura a que se va a calentar, se podra obtener la longitud que
tendra la barra.
Cuando r es positivo y grande (prximo a 1) se dice que hay una correlacin fuerte y
positiva. Los valores de cada variable tienden a aumentar cuando aumentan los de la otra.
Los puntos de la nube se sitan prximos a una recta de pendiente positiva.
Es el caso de las estaturas, x1, x2,, xn, y los pesos, y1, y2,, yn, de diversos atletas de
una misma especialidad. A mayor estatura cabe esperar que tengan mayor peso, pero
puede haber excepciones.
Cuando r es prximo a cero (por ejemplo, r = -0,12 o r = 0,08) se dice que la correlacin
es muy dbil (prcticamente no hay correlacin). La nube de puntos es amorfa.
Es lo que ocurrira si lanzramos simultneamente dos dados y anotramos sus
resultados: puntuacin del dado rojo, xi; puntuacin del dado verde, yi. No existe ninguna
relacin entre las puntuaciones de los dados en las diversas tiradas.
Cuando r es prximo a -1 (por ejemplo, r = -0,93) se dice que hay una correlacin fuerte y
negativa. Los valores de cada variable tienden a disminuir cuando aumentan los de la
otra. Los puntos de la nube estn prximos a una recta de pendiente negativa. .
Cuando r = -1 todos los puntos de la recta estn sobre una recta de pendiente negativa.
Existe una relacin funcional entre las dos variables.

La relacin entre dos sper variables cuantitativas queda representada mediante la lnea
de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes
elementales de una lnea de ajuste y, por lo tanto, de una correlacin, son la fuerza, el
sentido y la forma:
En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin entre dos
variables aleatorias. As, por ejemplo, podemos preguntarnos si hay alguna relacin entre
las notas de la asignatura Estadstica I y las de Matemticas I. Una primera aproximacin
al problema consistira en dibujar en el plano R2 un punto por cada alumno: la primera
coordenada de cada punto sera su nota en estadstica, mientras que la segunda sera su
nota en matemticas. As, obtendramos una nube de puntos la cual podra indicarnos
visualmente la existencia o no de algn tipo de relacin (lineal, parablica, exponencial,
etc.) entre ambas notas.
En particular, nos interesa cuantificar la intensidad de la relacin lineal entre dos
variables. El parmetro que nos da tal cuantificacin es el coeficiente de correlacin
lineal de Pearson r, cuyo valor oscila entre 1 y +1

TIPOS DE CORRELACIN:
La correlacin puede clasificarse en dos tipos dependiendo de la cantidad de variables
analizadas y por el tipo de relacin lineal:
1. Correlacin simple: se estudia la dependencia nicamente entre dos variables.
2. Correlacin mltiple: se estudia la dependencia entre ms de 2 variables.
3. Correlacin parcial: cuando se incluye la influencia de variables exgenas no
consideradas en el clculo de los coeficientes.
Dependiendo del tipo de relacin lineal el coeficiente relaciona:

1. Correlacin directa:
La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.

2. Correlacin inversa:
La correlacin inversa se da cuando al aumentar una de las
variables la otra disminuye.
La recta correspondiente a la nube de puntos de la distribucin es
una recta decreciente.

3. Correlacin nula:
La correlacin nula se da cuando no hay dependencia de ningn
tipo entre las variables.
En este caso se dice que las variables son incorreladas y la nube
de puntos tiene una forma redondeada.

Los tipos de correlacin que pueden presentarse son:


Correlacin positiva o directamente proporcional r = (+).

Nos indica que al modificarse en promedio una variable en un sentido, la otra lo hace en
la misma direccin.
Correlacin negativa o inversamente proporcional r = (-).
Nos muestra que al cambiar una variable en una determinada direccin (en promedio), la
otra lo hace en sentido contrario u opuesto.
Incorrelacin r = 0
Cuando la obtencin de dicho indicador r sea exactamente igual a cero, se dice que no
existe alguna relacin, asociacin o dependencia entre las variables estudiadas, siendo
por tanto ellas, variables correlacionadas o faltes de alguna dependencia lineal.

GRADO DE CORRELACIN:
El grado de correlacin indica la proximidad que hay entre los puntos de la nube de
puntos. Se pueden dar tres tipos:
1. Correlacin fuerte:

La correlacin ser fuerte cuanto ms cerca est los puntos de la recta.

2. Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. correlacin nula
El coeficiente de correlacin lineal, el cociente entre la varianza el producto de las
desviaciones tpicas ambas variables.
El coeficiente de correlacin lineal se expresa mediante:

Coeficientes de correlacin:
Existen diversos coeficientes que miden el grado de correlacin, adaptados a la
naturaleza de los datos. El ms conocido es el coeficiente de correlacin de Pearson
(introducido en realidad por Francis Galton), que se obtiene dividiendo la covarianza de
dos variables por el producto de sus desviaciones estndar. Otros coeficientes son:
Coeficiente de correlacin de Spearman

Correlacin cannica.
Coeficiente de correlacin de Pearson
En estadstica, el coeficiente de correlacin de Pearson es un ndice que mide la relacin
lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlacin de Pearson es independiente de la escala de medida de las variables.
El coeficiente de correlacin entre dos variables aleatorias X e Y es el cociente donde
XY es la covarianza de (X,Y) y X y Y las desviaciones tpicas de las distribuciones
marginales.
Coeficiente de correlacin de Spearman
En estadstica, el coeficiente de correlacin de Spearman, (ro) es una medida de la
correlacin (la asociacin o interdependencia) entre dos variables aleatorias continuas.
Para calcular , los datos son ordenados y reemplazados por su respectivo orden.
El estadstico viene dado por la expresin:
Donde D es la diferencia entre los correspondientes valores de x - y. N es el nmero de
parejas.
Se tiene que considerar la existencia de datos idnticos a la hora de ordenarlos, aunque si
stos son pocos, se puede ignorar tal circunstancia
La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin
de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlacin pero no independencia. La tau de
Kendall es un coeficiente de correlacin por rangos, inversiones entre dos ordenaciones
de una distribucin normal bivariante. (Enciclopedia Libre Wikipedia (2010. Parra. 1))
De esta forma podemos observar cmo se orienta la aplicacin de cada uno de estos
viendo que el primero toma en cuenta dos variables aleatorias cuantitativas y el segundo
entre dos variables aleatorias continuas.
Clasificacin del grado de correlacin.
CORRELACIN
VALOR O RANGO
Perfecta: |R| = 1
Excelente: 0.9 <= |R| < 1
Buena: 0.8 <= |R| < 0.9
Regular: 0.5 <= |R| <0.8
Mala: |R|< 0.5

Ejemplo:
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:
Matemticas
2
3
4
4
5
6
6
7
7
8
10
10
Fsica

Hallar el coeficiente de correlacin de la distribucin e interpretarlo.


xi
yi
xi yi xi2
yi2
2

16

16

16

16

20

25

16

24

36

16

36

36

36

28

49

16

42

49

36

56

64

49

10

90

100

81

10

10

100

100

100

72

60

431

504

380

1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las desviaciones tpicas.

4 Aplicamos la frmula del coeficiente de correlacin lineal.

10

Al ser el coeficiente de correlacin positivo, la correlacin es directa.


Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy fuerte.

Correlacin parcial:
El procedimiento Correlaciones parciales permite estudiar la relacin lineal existente entre
dos variables controlando el posible efecto de una o ms variables extraas. Un
coeficiente de correlacin parcial es una tcnica de control estadstico que expresa el
grado de relacin lineal existente entre dos variables tras eliminar de ambas el efecto
atribuible a terceras variables.
El coeficiente de correlacin parcial de primer orden, anotado aqu, permite conocer el
valor de la correlacin entre dos variables A y B, si la variable C haba permanecido
constante para la serie de observaciones consideradas.
Dicho de otro modo, el coeficiente de correlacin parcial es el coeficiente de correlacin
total entre las variables A y B cuando se les retir su mejor explicacin lineal en trmino
de C
Por ejemplo, se sabe que la correlacin entre las variables inteligencia y rendimiento
escolar es alto y positivo. Sin embargo, cuando se controla el efecto de terceras variables
como el nmero de horas de estudio o el nivel educativo de los padres, la correlacin
entre inteligencia y rendimiento desciende, lo cual indica que la relacin entre inteligencia
y rendimiento est condicionada, depende o est modulada por las variables sometidas a
control.

Los coeficientes de mayor orden se obtienen siguiendo la misma lgica. Hablamos de


correlacin de primer orden para indicar que se est controlando el efecto de una variable;
de segundo orden, para indicar que se est controlando el efecto de dos variables; etc.
Lgicamente, cuando no se est controlando ninguna variable, es decir, cuando utilizamos
el coeficiente de correlacin de Pearson del apartado anterior, hablamos de correlacin de
orden cero.

Potrebbero piacerti anche