Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Escuela de Psicologa
Universidad de Santiago de Chile
CORRELACIONES
1. Qu es una correlacin?
Procedimiento estadstico que intenta probar el grado de asociacin entres dos o ms variables. Es un
nmero que nos dice hasta dnde los cambios o variaciones que presenta una variable se explican por las
variaciones que presenta la otra variable.
En una correlacin siempre hay cambios que no pueden ser explicados, por eso expresa variabilidad, pero
no causalidad. Slo es posible hablar de causalidad cuando la correlacin es perfecta (-1 o +1).
2. Caractersticas de una correlacin
Monto: indica la intensidad o fuerza de una relacin.
-
0
0 0,34
0,35 0,65
0,66 0,99
: No existe relacin.
: La relacin es baja.
: La relacin es moderada.
: La relacin es fuerte.
3. Hiptesis
-
Unidireccional: adems de poner a prueba la relacin entre las variables, les entrega
una direccin (positiva o negativa).
Lic. Evelyn Espinoza Guerrero
4. Coeficientes de Correlacin
a) Pearson (r):
La gran mayora de los coeficientes de correlacin derivan de Pearson. Este coeficiente se utiliza cuando
se quiere conocer el grado de asociacin entre dos variables cuantitativas cuyo nivel de medicin es, a lo
menos, intervalar y se distribuyen normalmente dentro de la poblacin.
Los valores de Pearson van de -1 a +1, pasando por el 0 que indica ausencia de relacin.
Frmula de Pearson:
Sig. (bilateral)
N
Correlacin de Pearson
Asistencia a las
clases
Sig. (bilateral)
N
,616**
,000
72
,616**
Monto y Direccin
Valor p
72
1
,000
72
72
Coeficiente de determinacin: indica el grado de variacin conjunta entre las variables, es decir,
en qu porcentaje los cambios que presenta una variable, estn siendo explicados por los cambios
de la otra variable, o viceversa.
o Frmula: K = 100 - d
b) Spearman (rs):
Coeficiente de correlacin derivado de Pearson, por lo que sus valores fluctan entre -1 y +1, donde 0
indica ausencia de relacin. Se utiliza para correlacionar dos variables cuantitativas cuyo nivel de
medicin es a lo menos ordinal. Tambin se usa para correlacionar dos variables cuantitativas siendo una
ordinal y la otra intervalar o de razn. Es una buena alternativa a Pearson cuando existen valores extremos
o cuando las variables no se distribuyen normalmente.
Clculo de Spearman en SPSS:
Hiptesis
-
Sig. (bilateral)
N
Monto y Direccin
1,000
,671**
,000
72
72
**
1,000
,000
72
72
Actitud hacia
la estadstica
,671
Valor p
c) Kendall ():
Coeficiente de correlacin que, al igual que Spearman, sirve para correlacionar dos variables cuantitativas
cuyo nivel medicin es, a lo menos, ordinal. Tambin se usa para correlacionar dos variables cuantitativas
siendo una ordinal y la otra intervalar o de razn, o en los casos que las variables no se distribuyan
normalmente en la poblacin.
Su valor es menor al que arroja Spearman, por lo que suele ser utilizado en muestras pequeas.
Lic. Evelyn Espinoza Guerrero
Actitud hacia
la Estadstica
1,000
,556**
,000
72
72
**
1,000
,000
72
72
Coeficiente de correlacin
Notas Metodologa Sig. (bilateral)
N
Tau_b de Kendall
Coeficiente de correlacin
Actitud hacia la
Estadstica
Sig. (bilateral)
N
,556
Monto y Direccin
Valor p
p
q
Xp
X
Sx
: proporcin de sujetos con una de las dos modalidades posibles de la variable nominal.
: proporcin de sujetos con la otra modalidad de la variable nominal.
: media en la variable intervalar, de los sujetos cuya proporcin es p.
: media en la variable intervalar, de todos los sujetos.
: desviacin tpica en la variable intervalar, de todos los sujetos.
Ho: rpb xy = 0
Ha: rpb xy 0
Notas Metodologa
Correlacin de Pearson
Sig. (bilateral)
N
-,011
,927
N
Correlacin de Pearson
Sexo
72
-,011
Valor p
72
1
,927
72
72
e) Biserial (rb):
Coeficiente de correlacin derivado de Pearson. Se utiliza cuando se desea calcular la correlacin entre
una variable cuantitativa cuyo nivel de medicin es, a lo menos intervalar, con otra variable que es
dicotmica aparente o artificial (se ha dicotomizado).
Una variable dicotmica aparente es aquella que puede presentar tres o ms modalidades, pero que ha sido
transformada de tal manera que se vuelve dicotmica. Un ejemplo, es la variable nmero de hijos, la
cual al ser dicotomizada puede quedar en por encima de tres o tres o menos.
Este coeficiente no se puede calcular a travs de SPSS.
Frmula Biserial:
p
: proporcin de sujetos con una de las dos modalidades posibles de la variable nominal.
Xp
: media en la variable intervalar, de los sujetos cuya proporcin es p.
X
: media en la variable intervalar, de todos los sujetos.
Sx
: desviacin tpica en la variable intervalar, de todos los sujetos.
y
: ordenada correspondiente a un valor z que deja a la derecha e izquierda, en una
distribucin normal, sendas proporcionales del rea p y q, respectivamente.
f) Phi (r):
Coeficiente de correlacin utilizado para calcular el grado de asociacin entre dos variables dicotmicas
reales, o entre una variable dicotmica real y una aparente.
Lic. Evelyn Espinoza Guerrero
Para ser calculado, hay que recurrir a la Tabla de Contingencia. En ella, se requiere que al menos un 80%
de las frecuencias esperadas sean mayor a 5 para interpretar Phi. En caso que no se cumpla esta condicin,
la correlacin se interpreta mediante el estadstico exacto de Fisher (Chi cuadrado).
En Phi los valores van de 0 a 1, y el signo de correlacin no se interpreta, pues las variables son
cualitativas.
Clculo de Phi en SPSS:
Hiptesis
-
Seleccionar Casillas
Contingencia: ver si el 80% de las frecuencias esperadas son mayores o iguales a 5. De ser as, se
interpreta ms abajo Phi. De lo contrario, se interpreta Chi cuadrado.
Tabla de contingencia Sexo * Rendimiento acadmico
Rendimiento Acadmico
Aprobado
Hombre
Sexo
Mujer
Total
Recuento
Reprobado
Total
15
10,0
5,0
15,0
11
15
Frecuencia esperada
Recuento
10,0
20
5,0
10
15,0
30
Frecuencia esperada
20,0
10,0
30,0
Frecuencia esperada
Recuento
Frecuencias
esperadas
Chi cuadrado o Phi: de acuerdo al valor de las frecuencias esperadas, interpretar la tabla de Chi
cuadrado o la tabla de Phi. En ambas, hay que visualizar:
o Significancia: identificar valor p (significancia). Si p 0,05 se rechaza Ho y se concluye
que existe relacin significativa entre las variables. Si p > 0,05 se acepta Ho y se concluye
que no existe relacin significativa entre las variables.
o Monto: si la relacin es significativa, identificar si la relacin es fuerte, dbil o moderada.
Pruebas de chi-cuadrado
Valor
Chi-cuadrado de Pearson
Correccin por continuidad
Razn de verosimilitudes
Sig. asinttica
Sig. exacta
Sig. exacta
(bilateral)
(bilateral)
(unilateral)
,439
,150
,699
,603
,437
,600
b
gl
Significancia
,700
,580
,350
Monto
,446
30
Medidas simtricas
Valor
Phi
Sig. aproximada
-,141
,439
,141
,439
Significancia
Monto
30
g) Contingencia ():
Coeficiente de correlacin derivado de Pearson, por lo que toma valores entre 0 y 1.
Se utiliza para calcular la relacin entre dos variables policotmicas (reales o aparentes) o entre una
variable dicotmica (real o aparente) y una policotmica (real o aparente).
Si el 20% de las frecuencias esperadas son menores a 5, no se puede calcular y no existe alternativa.
Clculo de Contingencia en SPSS:
Hiptesis:
- Ho: xy = 0 (no existe relacin)
- Ha: xy 0 (existe relacin)
Seleccionar Casillas
Observar frecuencias: para calcular el coeficiente, el 80% de las frecuencias esperadas debe ser
mayor a 5. De lo contrario, no se puede interpretar el estadstico.
Comuna
Sector
Oriente
USACH
Universidad
U. Chile
Total
Sector
Sur
Total
Sector
Poniente
Recuento
15
22
Frecuencia esperada
6,4
3,4
7,2
5,0
22,0
Recuento
Frecuencia esperada
Recuento
PUC
Sector
Norte
Frecuencia esperada
Recuento
Frecuencia esperada
19
6,6
3,1
7,3
2,0
19,0
20
22
2,5
1,7
2,1
22,0
24
13
20
24,0
13,0
20,0
6,0
2,9
Frecuencias
esperadas
63,0
Medidas simtricas
Valor
Nominal por nominal
N de casos vlidos
Coeficiente de contingencia
,622
31
Sig. aproximada
,190
Significancia
Monto
h) Tetracrico (rt):
Coeficiente de correlacin utilizado para calcular la asociacin entre dos variables dicotmicas aparentes.
Originalmente ambas variables eran cuantitativas, a lo menos, intervalares y se distribuan normalmente
en la poblacin. La dicotoma por lo general se realiza en la mediana.
Es un derivado de Pearson y una prueba que se puede realizar slo en trminos bidireccionales. No se
puede calcular a travs de SPSS.
Clculo manual de Tetracrico:
En una tabla, sealar la cantidad de personas que comparten categoras (a, b, c y d) y hacer
multiplicaciones cruzadas:
Motivacin
Rendimiento
acadmico
Aprobado
Reprobado
Alta
a
c
Baja
b
d
En Valores antiguos seleccionar Rangos En Valores nuevos escribir el nuevo valor para el
rango Aadir - Continuar - Aceptar.
P value:
SPSS no entrega valor de la significancia, por lo que la prueba de significancia se realiza mediante
puntuaciones z:
Z observado = * n 1
: monto del coeficiente de correlacin
n: tamao de la muestra
Para saber si este Z observado cae en la zona de rechazo o de aceptacin, es necesario plantearse el
siguiente esquema:
Z.R
Z.A
/2
Z.R
/2
0,025
0,025
Zc=-1,96
Zc=1,96
Este esquema fue confeccionado considerando un 5% de error. Al ser una prueba de hiptesis bilateral,
ese 5% se divide en 2 (de ah el valor 0,025 para cada cola de la curva).
El valor crtico (Zc) es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que se acepta la hiptesis nula (en este caso, 1.96). Se determina de acuerdo al grado de error
permitido y al tamao de la muestra.
Interpretacin de los resultados:
-
Eta
Variable categorizada 1
DEPENDIENTE
,089
Variable categorizada 2
DEPENDIENTE
,089
Monto
Primero se debe calcular la correlacin entre las variables (sin considerar la tercera variable)
Analizar Correlacin Bivariada
Luego se calcula la correlacin parcial entre estas mismas variables, pero manteniendo al margen las
influencias de la variable interviniente
Confianza
Camaradera
1,000
,001
Significacin (bilateral)
,993
gl
47
Correlacin
,001
1,000
Significacin (bilateral)
,993
47
Correlacin
Confianza
Desarrollo
Camaradera
gl
Monto y direccin
Significancia
monto de asociacin aumenta, se dice que la variable interviniente tiene una influencia
negativa. De lo contrario, si en la correlacin parcial el monto de asociacin es menor, se
dice que la variable interviniente tiene una influencia positiva.
Kendall
Punto Biserial
Biserial
Phi
Tetracrico
Contingencia
Eta
Parcial