Sei sulla pagina 1di 8

DEPARTAMENTO DE ECONOMA GENERAL Y ESTADSTICA

Estadstica e Introduccin a la Econometra

PRCTICA 9

CORRELACIN

Profesorado: Prof. Dra. M Dolores Gonzlez Galn Prof. Ana Gonzlez Galn Prof. Germn Prez Morales

Estadstica e Introduccin a la Econometra

Prctica 9

1.

INTRODUCCIN Cuando se estudian dos variables (X,Y) o tres variables (X,Y,Z) es importante obtener

una medida de la dependencia o medida de la relacin entre esas variables. Para estudiar y medir esta relacin, el primer paso consistir en recoger los datos que muestren los correspondientes valores de las variables consideradas y en representarlas despus mediante un diagrama de dispersin (el alumno puede consultar este tipo de grficos en la prctica relativa al clculo de estadsticos descriptivos y grficos). Esta representacin grfica es la que ms se utiliza en el estudio de la dependencia de dos o tres variables y resulta muy til como anlisis previo a la ejecucin de procedimientos de correlacin y regresin. Ms tarde, estudiaremos la regresin entre dos variables que nos permitir obtener una frmula o ecuacin que represente la relacin aproximada entre esas dos variables. 2. CORRELACIN BIVARIADA El procedimiento Correlaciones Bivariadas de SPSS permite medir el grado de dependencia existente entre dos o ms variables mediante la cuantificacin por los denominados coeficientes de correlacin lineal de Pearson, de Spearman y la Tau-b de Kendall con sus respectivos niveles de significacin. Antes del clculo de un coeficiente de correlacin, inspeccionaremos los datos con el fin de detectar valores atpicos que puedan producir resultados equvocos. De entre estos coeficientes, vamos a centrarnos en el coeficiente de correlacin lineal de Pearson entre dos variables X e Y, el cual ha sido objeto de estudio en esta asignatura. Su expresin matemtica es la que presentamos a continuacin:

r=

(x
N i =1

x ) (y i y )

(N 1) S x S y

Este coeficiente de correlacin de Pearson es una medida de asociacin lineal. Es el ms conocido y utilizado de todos. Por lo que dos variables pueden estar perfectamente relacionadas, pero si la relacin no es lineal, el coeficiente de correlacin de Pearson no ser un estadstico adecuado para medir su grado de asociacin. 2

Estadstica e Introduccin a la Econometra

Prctica 9

Toma valores que se encuentran dentro del intervalo cerrado [-1,1], de modo que cuando los valores son cercanos a 1 en trminos absolutos la dependencia entre las dos variables es estrecha. De otra parte, el signo del mencionado coeficiente denota si nos encontramos ante un tipo de relacin directa, para el caso de valores positivos, e inversa, para el caso de valores negativos. Un valor 0 indica que no existe una relacin lineal entre ambas variables. Para la obtencin de correlaciones bivariadas abriremos el archivo ccaa.sav procederemos como expresamos a continuacin: Elija en los mens: Analizar Correlaciones Bivariadas... Una vez seleccionadas estas opciones, aparecer el cuadro de dilogo que presentamos a continuacin: y

Introducimos en el recuadro de variables aqullas sobre las que vamos a cuantificar los coeficientes de correlacin. Resulta obvio que al tratarse del clculo de correlaciones, se debern introducir al menos dos variables. Por ejemplo las variables pib.pc y paro 92. Una vez seleccionadas aquellas variables, cuyos coeficientes de correlacin vamos a cuantificar, deberemos seleccionar el tipo de coeficiente de correlacin que queremos calcular, para lo cual se nos presentan tres opciones diferentes:

Estadstica e Introduccin a la Econometra

Prctica 9

Pearson Medida de la asociacin lineal entre dos variables. Los valores del coeficiente de correlacin varan entre -1 a 1. El signo del coeficiente indica la direccin de la relacin y su valor absoluto indica la fuerza o grado. Los valores mayores indican que la relacin es ms estrecha y un valor de 0 indica que no existe una relacin lineal.

Tau-b de Kendall Medida no paramtrica de asociacin para variables ordinales o de rangos que tiene en consideracin los empates. El signo del coeficiente indica la direccin de la relacin y su valor absoluto indica la magnitud de la misma, de tal modo que los mayores valores absolutos indican relaciones ms fuertes. Los valores posibles varan de -1 a 1, pero un valor de -1 o +1 slo se puede obtener a partir de tablas cuadradas.

Spearman Versin no paramtrica del coeficiente de correlacin de Pearson, que se basa en los rangos de los datos en lugar de hacerlo en los valores reales. Resulta apropiada para datos ordinales (susceptibles de ser ordenador) y para datos agrupados en intervalos que no satisfagan el supuesto de normalidad. Los valores del coeficiente varan de -1 a +1. El signo del coeficiente indica la direccin de la relacin y el valor absoluto del coeficiente de correlacin indica la fuerza de la relacin entre las variables. Los valores absolutos mayores indican que la relacin es mayor. Resumiendo, para las variables cuantitativas normalmente distribuidas,

seleccionaremos el coeficiente de correlacin de Pearson, mientras que si los datos no estn normalmente distribuidos o tienen categoras ordenadas, seleccionaremos la Tau-b de Kendall o de Spearman, que miden la asociacin entre rdenes de rangos. Tras la especificacin del coeficiente o coeficientes de correlacin que estimamos oportuno calcular, procederemos a indicar si queremos que se realice un contraste de hiptesis estadstica bilateral o unilateral1 para casos en los que la direccin de la relacin puede ser especificada a priori. Este contraste, trata de probar la hiptesis de que el coeficiente de correlacin sea nulo (r=0), esto es, que no exista relacin alguna entre las variables cuyo coeficiente de correlacin estamos cuantificando.

Un contraste de hiptesis es un test que se utiliza para contrastar dos hiptesis.

Estadstica e Introduccin a la Econometra

Prctica 9

El contraste de hiptesis al que hacamos referencia en el prrafo anterior utiliza como estadstico de contrate:
t =r N 2 t N 2 1 r 2

el cual se distribuye segn una funcin de probabilidad t-Student2 con N-2 grados de libertad siempre y cuando las variables cuya correlacin se mide, se distribuyan normalmente. Finalmente, con el objeto de identificar aquellos coeficientes de correlacin que tienen una mayor significacin, se puede seleccionar: Marcar las correlaciones significativas, opcin que marca los coeficientes de correlacin significativos al nivel 0,05 por medio de un solo asterisco y los significativos al nivel 0,01 con dos. La salida que SPSS proporciona es la que presentamos a continuacin:

Una distribucin t de Student se puede definir en trminos de una distribucin normal y una

independientes. Sean, z~N(0,1) y V~r donde z y V son ambas independientemente. Entonces,

t=

z ~ tr V r

Estadstica e Introduccin a la Econometra

Prctica 9

Esta salida consiste en una matriz de tipo simtrica que toma valores unitarios en la diagonal. Se muestra para cada par de variables el coeficiente de correlacin seleccionado (r), la significacin del contraste realizado (p), de modo que cuanto menor sea su valor ms fiable ser el dato arrojado por el coeficiente de correlacin seleccionado; y el nmero de casos no perdidos considerados (N). Si se ha seleccionado la opcin de Marcar las correlaciones significativas se podr observar las marcas en las correlaciones que cumplan las condiciones anteriormente establecidas. Si pulsamos en el botn opciones del cuadro de dilogo, SPSS nos ofrece la posibilidad de calcular diversos estadsticos:

Medias y desviaciones tpicas Si elegimos esta opcin, SPSS calcula para cada una de las variables que se han introducido en el cuadro de variables la media y la desviacin tpica. Tambin se muestra el nmero de casos que no tienen valores perdidos.Si seleccionamos esta opcin y ejecutamos el procedimiento, la salida que nos muestra SPSS es la que presentamos a continuacin:

Estadstica e Introduccin a la Econometra

Prctica 9

Productos cruzados y covarianzas Si elegimos esta opcin, SPSS calcula para cada par de variables el producto cruzado de las desviaciones ,que es igual a la suma de los productos de las variables corregidas respecto a la media, esto es, el numerador del coeficiente de correlacin de Pearson; y la covarianza que es una medida no tipificada de la relacin entre dos variables, igual al producto cruzado diferencial dividido por N-1. Si seleccionamos esta opcin y ejecutamos el procedimiento, la salida que nos muestra SPSS es la que presentamos a continuacin:

De otra parte, en relacin con los valores perdidos se pueden seleccionar las siguientes opciones: Excluir casos segn pareja Se excluyen del anlisis los casos con valores perdidos para una o ambas variables de la pareja que forma un coeficiente de

correlacin. Debido a que cada coeficiente est basado en todos los casos que tienen cdigos vlidos para esa pareja concreta de variables, en cada clculo se utiliza la mayor cantidad de informacin disponible. Esto puede dar como resultado un grupo de coeficientes basados en un nmero de casos variables. Excluir casos segn lista Se excluyen de todas las correlaciones los casos con valores perdidos para cualquier variable.

Estadstica e Introduccin a la Econometra

Prctica 9

3.

Bibliografa

Camacho Rosales, J. (2000): Estadstica con SPSS para Windows. Ed. Rama, Madrid. Martn Pliego, F.J. (1994): Introduccin a la Estadstica Econmica y Empresarial (Teora y Prctica). Editorial AC, Madrid. SPSS Inc. (1999): SPSS 9.0. Manual de Usuario, SPSS, Chicago. Visauta Vinacua, B. (1998): Anlisis Estadstico con SPSS para Windows. Ed. McGraw-Hill, Madrid.

Potrebbero piacerti anche