Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Una variable dicotómica es aquella cuyos valores sólo son de dos tipos, que suelen
representarse por 1 y 0, o representan situaciones donde ocurre o deja de ocurrir un hecho.
X1 X 0
rbp pq
Sx
donde:
X 1 es la media de las puntuaciones de X que se corresponden con un 1 en Y,
X 0 es la media de las puntuaciones de X que se corresponden con un 0 en Y,
p es la proporción de sujetos con 1 en Y, y
q es la proporción de sujetos con 0 en Y.
rbp será positivo siempre que X 1 X 0 y será negativo en caso contrario. Cuando sea positivo
indicará una relación positiva entre X y la característica medida como 1. Cuando sea
negativo indicará una relación negativa entre X y dicha característica.
Cuando la variable X se presenta en intervalos, r bp se calculará a partir de los puntos medios de dichos
intervalos.
Cuando nos encontramos con dos variables medidas en una escala ordinal utilizaremos
el coeficiente de Spearman, rs, definido:
6 d i2
rs 1
n n2 1
donde d i
2
se define como la suma de la diferencia de rangos elevada al cuadrado.
1
RELACIÓN ENTRE LAS VARIABLES CUALITATIVAS: Ø
El coeficiente Ø se utiliza con dos variables dicotómicas. Se han dado casos donde variables
continuas se han dicotomizado, lo que conlleva pérdida de información.
Su fórmula es:
ad bc
O
a b c d a c b d
cuyos valores aparecen representados en la siguiente tabla de doble entrada, donde 1 y 0 representan las dos
categorías de cada una de las variables:
1 0
1 (a) (b) (a+b)
0 ( c) (d) (c+d)
(a+c) (b+d)
Si el resultado de Ø es positivo, existe una relación entre los 1 de las dos variables y entre los ceros. Si
fuera negativo indicaría una relación entre las características 1 de una variable y cero de la otra y
viceversa.
2
TEMA 11: REGRESIÓN MÚLTIPLE, CORRELACIÓN
MÚLTIPLE Y CORRELACIÓN PARCIAL
REGRESIÓN MÚLTIPLE
Al aumentar a dos las variables predictoras ya no estamos tratando de determinar la ecuación de una
recta si no de un plano, el plano de regresión, que requiere una representación tridimensional.
En puntuaciones directas:
Yi A B1 X i1 B2 X i 2
donde A Y B1 X 1 B2 X 2
En puntuaciones diferenciales:
y i b1 xi1 b2 xi 2
y en puntuaciones típicas:
z y b1* z x1 b2* z x2
A partir de la fórmula del coeficiente de correlación de Pearson entre dos variables y de la varianza,
utilizando puntuaciones diferenciales, podemos expresar las pendientes del plano de regresión en
función de los coeficientes de correlación:
S y r1 y r2 y r12
b1
S1 1 r122
S y r2 y r2 y r12
b2
S 2 1 r122
r2 y r1 y r12
b2*
1 r122
Por tanto,
Sy
b1 b1*
S1
3
Sy
b2 b2*
S2
Los planos de regresión, en puntuaciones directas, diferenciales y típicas, serían los siguientes:
Sy S S S
Yi b1 X i1 b2 y X i 2 Y b1 y X 1 b2 y X 2
S1 S2 S1 S2
Sy S
y i b1 xi1 b2 y xi 2
S1 S2
*
z y b1 z1 b2* z 2
CORRELACIÓN MÚLTIPLE
El coeficiente de correlación entre las puntuaciones reales, Y, y las puntuaciones estimadas se denomina
coeficiente de correlación múltiple, se representa por R y 12 y se puede calcular a partir de Y e Y’.
CORRELACIÓN PARCIAL
La correlación parcial puede usarse para detectar correlaciones espúreas entre dos variables. Una
correlación espúrea es aquella en que la relación entre dos variables está correlacionada con una
tercera variable que también puede utilizarse como predictor. Sean las variables X, Y y Z, entonces la
correlación entre X e Y eliminando el influjo de Z, que representaremos rxy z , será la correlación entre
aquella parte de X y aquella parte de Y que no dependen de Z, es decir:
rxy z r x x y y