Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CORRELACIN LINEAL DE
PEARSON
TEMA 1
DEFINICIN
rXY
ndice que mide la covariacin entre variables:
en qu medida la variacin en una variable
influye en la variacin en otra variable.
Variables cuantitavas (escala mnima de
intervalo).
Relacin EXCLUSIVAMENTE lineal.
Valores: -1 rXY +1.
Interprentacin:
+1: relacin perfecta positiva (directa).
-1: relacin perfecta negativa (inversa).
0: ausencia de relacin.
2
Ausencia de correlacin
7
Frmulas
XY
rXY
rXY
rXY
XY
N
S X SY
xy
x y
2
ZY
Puntuaciones directas
Puntuaciones
diferenciales
Puntuaciones
estandarizadas
Ejemplo
X: 2 4 6 8 10 12 14 16 18 20
Y:1 6 8 10 12 10 12 13 10 22
1.Clculo de rxy con puntuaciones directas.
2.Clculo de rxy con puntuaciones
diferenciales.
3.Clculo de rxy con puntuaciones
tipificadas.
9
Ejemplo: diagrama de
dispersin
10
Y
1
6
8
10
12
10
12
13
10
22
104
XY
2
24
48
80
120
120
168
208
180
440
1390
X2
4
16
36
64
100
144
196
256
324
400
1540
Y2
1
36
64
100
144
100
144
169
100
484
1342
11
X
N
110
11
10
Sx
Y 104
10,4
N
rXY
10
XY X Y
N
S X SY
Sy
2
X
2
Y
1540
X
112 5,745
10
2
1342
Y
10,4 2 5,103
10
2
1390
11 *10,4
10
0,839
5,745 * 5,103
12
Y
1
6
8
10
12
10
12
13
10
22
104
x
-9
-7
-5
-3
-1
1
3
5
7
9
0
y
-9,4
-4,4
-2,4
-0,4
1,6
-0,4
1,6
2,6
-0,4
11,6
0
xy
84,6
30,8
12
1,2
-1,6
-0,4
4,8
13
-2,8
104,4
246
x2
81
49
25
9
1
1
9
25
49
81
330
y2
88,36
19,36
5,76
0,16
2,56
0,16
2,56
6,76
0,16
134,56
260,4
13
xy
x y
2
246
0,839
330 * 260,4
14
Y
1
6
8
10
12
10
12
13
10
22
104
Zx
-1,567
-1,218
-0,870
-0,522
-0,174
0,174
0,522
0,870
1,218
1,567
0
Zy
-1,842
-0,862
-0,470
-0,078
0,314
-0,078
0,314
0,510
-0,078
2,273
0
ZxZy
2,886
1,051
0,409
0,041
-0,055
-0,014
0,164
0,443
-0,096
3,561
8,391
15
rXY
Y Y
ZY
SY
ZY
8,391
0,839
10
16
Significacin
El valor obtenido como coeficiente de correlacin
muestra que las variables X e Y estn relacionadas
en realidad, o presentan dicha relacin debido al
azar?
Hiptesis nula H0: rxy = 0. El coeficiente de
correlacin obtenido procede de una poblacin cuya
correlacin es cero (XY = 0).
Hiptesis alternativa H1:
. El coeficiente de
rXYde una
0 poblacin cuyo
correlacin obtenido procede
coeficiente de correlacin es distinto de cero (XY
).
0
17
Significacin
Frmula:
rXY
1 r
N 2
2
XY
Interpretacin:
Significacin: ejemplo
t
rXY
1 r
N 2
2
XY
0,839
1 0,839
10 2
4,37
t( , N 2) t( 0.05,8) 2,306
4,37 2,306
Conclusiones: rechazamos la hiptesis nula con un
riesgo (mximo) de equivocarnos de 0,05. La
correlacin no procede de una poblacin
caracterizada por una correlacin de cero. Ambas
variables estn relacionadas.
19
Otras cuestiones a
considerar
Correlacin no implica causalidad.
La significacin estadstica depende del tamao
de la muestra (a mayor N, ms probable es
encontrar significacin).
Otra posible interpretacin la da el coeficiente
de determinacin
, en trminos de
2
proporcin de rvariabilidad
de Y compartida o
XY
explicada por X.
La proporcin de variabilidad no explicada,
aquello de Y que queda sin explicar por X, se
2
denomina coeficiente de no determinacin:
1 r
XY
20
Coeficiente de
determinacin: ejemplo
2
rXY
0,839 2 0,704
. El 70,4% de la
1 r 1 0,839 0,296
2
XY
. El
29,6% de la variabilidad de Y queda
sin explicar.
21