Sei sulla pagina 1di 7

Coeficiente de correlacin semiparcial

_____________________________________________________________________________ 1.- Introduccin ............................................................................................................. 1 2.- Correlacin semiparcial ........................................................................................................ 2 3.- Contribucin especfica de las distintas variables al modelo de Regresin Mltiple........... 3 4.- Correlacin semiparcial de orden superior ........................................................................... 4 5.- Correlacin semiparcial mltiple.......................................................................................... 5 6.- Significacin estadstica de los coeficiente de correlacin semiparcial ............................... 6 _____________________________________________________________________________

1.- Introduccin

Una de las cuestiones fundamentales en el anlisis de la regresin consiste en determinar la importancia relativa que tienen sobre la variable dependiente cada una de las variables explicativas. Hasta ahora, el tema de la regresin mltiple se ha centrado fundamentalmente en el clculo de R2, su significacin y los coeficientes b asociados, pero nada se ha dicho de la contribucin particular de cada una de las variables trminos de proporcin de variacin explicada. En este sentido, en las prxima pginas se ofrecen una herramienta conceptual extraordinariamente til -correlacin semiparcial- que permite determinar el papel real representado por cada una de las variables al margen de su protagonismo aparente. Las correlaciones semiparciales tienen inters igualmente dentro de lo que se puede llamar control estadstico de variables, por cuanto permite conocer las distintas fuentes de variacin que determinan la variable dependiente investigada, y por tanto, permite, de acuerdo con el modelo concebido, asignar causalidad a ciertas variables explicativas. En este sentido, este tema puede considerarse como un preludio de los modelos causales que sern estudiados ms adelante.

2.- Correlacin semiparcial Como se ha indicado, en el cuadrado de la correlacin mltiple queda reflejada la proporcin de variacin explicada por el conjunto de regresores, pero nada se dice de la contribucin especfica de cada uno de ellos. Por otro lado, las correlaciones simples (al cuadrado) de cada una de las variables explicativas podran ser , en principio, un indicador de dichas contribuciones, pero , como se ver, frecuentemente las distintas variables explicativas, estn a su vez, correlacionadas entre s, compartiendo variabilidad, y por tanto, elementos comunes, no siendo siempre fcil atribuir la fuente original de tales elementos compartidos. Tengamos, en este sentido, las variables X1 , X2 e Y, cuyas correlaciones son las siguientes:

ry1 = 0.7

ry 2 = 0.6

R y.12 = 0.8

Una primera ojeada puede hacernos pensar que la variable X1 contribuye en la variabilidad de Y en una proporcin de 0.72=0.49 y que la variable X2 contribuye en una proporcin de 0.62=0.36. No obstante, se sabe por la correlacin mltiple que la proporcin de variacin explicada es de 0.82=0.64. El total de ambas contribuciones no es igual a la suma, luego est claro que ambas variables explicativas no son fuentes independientes de variabilidad, sino que comparten una cierta cantidad de la misma. Existe, pues, redundancia entre ambas variables. El siguiente diagrama de Venn ilustra lo que queremos decir:

Y
d

a b

X1

X2

El campo de variacin de las distintas variables queda reflejada en los diferentes crculos (de rea total, la unidad), de tal manera que la contribucin de X1 en Y es a+b, y la de X2, b+c . La contribucin total de X1 y X2 ser a+b+c. Queda una parte -d- que es la variabilidad que no logran explicar entre X1 y X2.

La proporcin de variacin explicada por la variable X1 ser precisamente la interseccin del crculo correspondiente a X1 y del crculo indicado por Y. As pues:
ry21 = a + b = 0.49

Y la proporcin de variacin explicada por X2:


ry22 = b + c = 0.36

Como entre ambas variables explican una proporcin de 0.64, es evidente que la contribucin adicional de X1 sobre la que explica X2 ser:
2 ry2(1.2) = R y .12 ry22 = 0.64 0.36 = 0.28 a

Esto es, lo que aade X1 a X2 es una proporcin de variacin explicada de 0.28. La raz cuadrada de este valor se expresa como Ry(1.2) y se define como coeficiente de correlacin semiparcial. As: ry (1.2) = 0.28 = 0.529 Por otro lado, lo que aade X2 a X1 ser:

2 ry2( 2.1) = R y .12 ry21 = 0.64 0.49 = 0.15 c

Es decir, la inclusin de X2 supone un incremento sobre la proporcin de variacin explicada por X1 de 0.15 puntos. Su coeficiente de correlacin semiparcial ser:

ry ( 2.1) = 0.15 = 0.387

3.- Contribucin especfica de las distintas variables al modelo de Regresin Mltiple

Las correlaciones semiparciales tienen especial inters para conocer el reparto de las contribuciones de las variables X sobre la variable Y. Frecuentemente las variables explicativas estn solapadas y hay que utilizar algn criterio que permita asignar las zonas compartidas a variables especficas. A este respecto, ha de establecerse una jerarqua entre tales variables de forma que las de mayor orden jerrquico tienen prioridad respecto a su variabilidad compartida, a las que se les adjudica. As, cuando el orden es 1 X1 y 2 X2 las contribuciones observadas por las distintas variables sern:
2 R y.12 = ry21 + ry2( 2.1) = 0.49 + 0.15 = 0.64

Por el contrario, cuando el orden de entrada es 1 X2 y 2 X1 entonces:


2 R y.12 = ry22 + ry2(1.2) = 0.36 + 0.28 = 0.64

Se observa la importancia del orden de entrada; de esta forma, cuando la variable X1 entra en primer lugar explica una proporcin de 0.49 y deja tan slo un resto de 0.15 para X2. Cuando X2 es la variable de mayor rango en el modelo, explica una proporcin de 0.36 y deja para X1 una proporcin explicada de 0.28. Es importante destacar que los mismos datos, segn el acento que se ponga en cada una de las variables llevar al investigador al conclusiones muy diferentes respecto a su participacin en el modelo.

La siguiente tabla ilustra lo que estamos comentando:

Var. Explicativa X1 X2 R2 y.12

Orden 1 2

Incremento 0.49 0.15 0.64

Orden 2 1

Incremento 0.28 0.36 0.64

As pues, la contribucin especfica de las distintas variables depende de su orden de entrada. Cuanto ms intercorrelacionadas estn y ms tarde se introduzcan menos explicarn. En cierto sentido, la importancia relativa concedida a cada una de las variables, cuando existe redundancia, es subjetiva y depende en gran parte del juicio del investigador y del dominio que tenga de la materia. No existen reglas que especifiquen claramente el orden de entrada. No obstante, se suele utilizar el criterio de maximizar progresivamente la variacin explicada de la variable dependiente, por lo que se introducen las variables en orden de mayor a menor proporcin de variacin explicada.

4.- Correlacin semiparcial de orden superior

Las correlaciones expuestas del tipo ry(1.2) o ry(2.1) se denominan correlaciones semiparciales de primer orden porque es una variable cuya influencia se elimina. No obstante, puede interesar eliminar la influencia de ms variables, por ejemplo, ry(1.23) expresa que la variable Y es relacionada con la variable X1 eliminando de sta la influencia de X2 y X3 . Se trata de una correlacin semiparcial de orden dos. Una correlacin de orden tres sera ry(1.234) donde se relaciona Y con X1 eliminado la influencia de X2 , X3 , y X4. En general una correlacin semiparcial del tipo ry(i.23..(i).......K) es una correlacin semiparcial de orden k-1 que indica la correlacin entre Y y Xi eliminado de sta la influencia de las restantes variables explicativas.

El procedimiento para calcular las correlaciones semiparciales de orden superior es equivalente al ya expuesto para correlaciones de primer orden. A este efecto, resulta de nuevo ilustrativo recurrir a los diagramas de Venn. Supongamos, ahora, que disponemos de cuatro variables: Y, X1, X2 , y X3, y deseamos calcular r2y(3.12):

X3

X1

X2

Est claro que la contribucin especfica de X3 ser:


2 2 ry2(3.12) = R y.123 R y.12

Si deseamos recomponer la aportacin de cada una de las variables suponiendo que el orden de entrada sea X1 , X2 , y X3:
2 R y.123 = ry21 + ry2( 2.1) + ry2(3.12)

Pero si el orden de entrada fuera X3 , X2 , y X1, entonces:


2 R y.123 = ry23 + ry2( 2.3) + ry2(1.23)

5.- Correlacin semiparcial mltiple

Todas las correlaciones estudiadas anteriormente han sido siempre entre dos variables, la variable dependiente Y y una variable explicativa Xi, eliminando la influencia, bien de una variable (correlacin semiparcial simple de primer orden) o de un conjunto de k variables (correlacin semiparcial simple de orden k). La correlacin semiparcial mltiple hace referencia a la correlacin entre una variable dependiente y un conjunto de variables explicativas eliminado la influencia de una o varias variables del conjunto de variables explicativas. Est claro que las correlaciones

semiparciales mltiples pueden ser a su vez, de primer orden o de orden superior. En trminos de proporcin de variacin, el cuadrado del coeficiente de correlacin semiparcial mltiple expresa la contribucin que de la variacin de la variable dependiente suponen una serie de variables explicativas eliminado la influencia de otras. De esta forma, Ry(12.3) indica la correlacin semiparcial de Y con las variables X1 y X2 eliminando la influencia de X3. En trminos de proporcin de variacin se calcular de la siguiente manera:
2 2 2 Ry (12.3) = Ry.123 Ry.3

Si por ejemplo, deseamos calcular R2y(12.34) :


2 2 2 R y (12.34 ) = R y.1234 R y.34

Obsrvese que en el clculo de las correlaciones semiparciales (al cuadrado), sea simple o mltiple, de primer orden o de orden superior, siempre se calcula de la misma manera. Se trata de una diferencia entre dos elementos, donde el primero de ellos hace referencia a la correlacin mltiple (al cuadrado) de la variable Y con todas las variables explicativas consideradas, y donde el segundo elemento indica la correlacin (al cuadrado) de la variable Y con las variables explicativas a eliminar.

6.- Significacin estadstica de los coeficiente de correlacin semiparcial

Las pruebas con estos coeficientes consiste bsicamente en comprobar si la variacin explicada por la variable o variables introducidas supera la varianza aleatoria o residual. En este sentido, la frmula a aplicar es equivalente a las ya conocidas con la nica diferencia que el numerador est constituido por el incremento en trminos de proporcin de variacin que supone la adicin de las variables estudiadas. Puesto que el numerador est formado por una diferencia de R2 sus grados de libertad corresponde a tal diferencia. Supongamos que deseamos conocer la significacin estadstica de R2y(12.34). Esta expresin se calcula como la diferencia entre dos sumandos:
2 2 2 R y (12.34 ) = R y.1234 R y.34

El primer sumando R2y.1234 tiene k=4 grados de libertad, tantos como variables independientes consideradas, mientras que el segundo sumando R2y.34, por la misma lgica, tiene k1=2 grados de libertad. As pues, la prueba F a realizar ser (supongamos que operamos con 20 sujetos):

2 R y (12.34)

2 R y (12.34)

F=

k k1 2 = 2 2 1 R y .1234 1 R y.1234 N k 1 15

Compararemos el cociente F obtenido con el de las tablas para 2 y 15 grados de libertad.

Problema 1.- Tengamos los siguientes datos:

2 R y .12 = 0.35

r21 = 0.4

r y 3 = 0 .5

r31 = 0

r32 = 0

Determinar R2y.123. SOL: Tenemos que:


2 R y .123 = ry2.1 + ry2( 2.1) + ry2(3.12)

Por otro lado, se sabe:


2 R y .12 = ry2.1 + ry2( 2.1)

Como X3 no correlaciona ni con X2 ni con X1: ry2(3.12) = ry23 Por tanto:


2 2 R y .123 = R y .12 + ry23 = 0.35 + 0.25 = 0.6

Lo que se ilustra mejor grficamente:

X3

X1

X2

Potrebbero piacerti anche