Sei sulla pagina 1di 9

CUADRO RESUMEN TABLAS Y MATRICES DEL ANLISIS FACTORIAL MATRIZ CARACTERSTICAS Y PROPIEDADES Indican la media, la desviacin tpica y N (nmero

de sujetos del estudio) 1/Estadsticos descriptivos Aparecen en las columnas las variables. En la diagonal principal aparece la correlacin de cada variable consigo misma (1) la suma de esa diagonal es igual al n de variables del anlisis. Valores altos prximos a 1 es procedente la factorizacin. Vemos las correlaciones altas y bajas entre cada variable. En la parte baja de la tabla aparece el determinante de la matriz. valores prximos a 0 procede la factorizacin Se utiliza para comprobar si los elementos de la diagonal principal son igual a 1. el test de esferidicidad de Barlett se plantea H0:|R|=1 frente a H1: |R|#1 si la significacin es < 0.05 se rechaza H0 y se acepta

2/Matriz de correlaciones

3/ Prueba de esferidicidad de Barlett

H1, la matriz es apropiada para la factorizacin


Valores prximos a 1, pertinencia de las variables para el anlisis factorial. 0,9=valores excelentes, 0,8=buenos, 0,7=aceptables, 0,6=regulares, 0,5=malos; < 0,5=inaceptables Se utiliza para calcular las comunalidades iniciales y para calcular la matriz de correlaciones anti-imagen En la parte de covarianza anti-imagen se representa la unicidad de cada variable aportada al modelo en la parte de correlacin anti-imagen es el valor negativo del coeficiente de correlacin parcial. ser apropiado para el anlisis con valores cercanos a 0 y en la diagonal principal, valores prximos a 1 Se utiliza el mtodo de extraccin de componentes principales. En la columna de la izda. Aparecen los factores, se extraen los que tengan un valor superior a 1. A la izda. Est el autovalor que es la variabilidad total de la muestra explicada por dicho factor. s=a1 +a2 +(suma de filas) /n x100.Comunalidades (suma de columnas) es la proporcin de la variablilidad de una variable explicada por los m factores

4/ KMO medida de adecuacin muestras 5/ Inversa de la matriz de correlaciones 6/ Matriz anti-imagen

7/ Matriz de varianza total explicada por el modelo factorial

MATRIZ 8/ Grfico de sedimentacin 9/ Matriz de componentes

CARACTERSTICAS Y PROPIEDADES Ayuda en la toma de decisin sobre el n de componentes a extraer cuando la pendiente cae bruscamente marca el n de factores Aparecen en las filas todas las variables y en las columnas los factores con el valor que tiene cada variable en cada factor. sirve para saber cada variable a que factor pertenece Si nos dan las dos matrices mejor miramos sta. se muestra la variable que menos aporta al factor 1 y la que menos aporta al factor 2, tambin podemos ver cul es la variable que ms aporta a cada factor. aparecen ordenadas por orden decreciente Permite comprobar el grado de ajuste del modelo. En la parte de abajo aparece la matriz residual que resulta de la diferencia entre las correlaciones originales y las reproducidas. a medida que los residuos disminuyen, se consigue un mayor grado de ajuste al modelo Sirve para calcular las puntuaciones factoriales. Los valores de cada factor se calculan sumando el valor de todas las variables. f1= 0,206v1 + v2 + v3 con estos clculos se pueden construir las puntuaciones de un sujeto en las componentes sustituyendo cada variable por su valor y efectuando las operaciones indicadas Aparecen todas las variables con su valor inicial (1) y despus de la extraccin. nos dice qu variable es la que ms explicacin aporta y cual la que menos Nos permite calcular el ngulo de giro de los ejes factoriales Muestra en la diagonal principal la varianza de cada componente que ser 1. tambin aparece la covarianza entre las componentes que es 0, y al ser normal su distribucin indicar la independencia de las componentes

10/ Matriz de componentes rotados o matriz factorial rotada 11/ Matriz de correlaciones reproducidas. matriz residual 12/ Matriz de coeficientes para el clculo de las puntuaciones en las componentes 13/ Comunalidad de las variables Matriz de transformacin de los factores Matriz de varianzascovarianzas

ANALISIS FACTORIAL. INTERPRETACION DE RESULTADOS

1. JUSTIFICACIN DE SU PERTINENCIA. Lo que se nos est preguntando aqu es, si en base a los datos que tenemos en las tablas presentadas se puede o no realizar un anlisis factorial. Como sabemos ya, de lo que trata este tipo de anlisis es de agrupar variables para obtener un nmero reducido de factores que expliquen unos datos y para ello necesitamos que las variables correlacionen entre s por grupos PASOS A SEGUIR: 1/- la primera tabla: hace una descripcin de la media, la desviacin tpica y n de anlisis 2/ - Examinar la matriz de correlaciones, en la que se presentan todas las correlaciones de las variables dos a dos o bivariada (cada variable independiente con todas las dems). El anlisis factorial ser pertinente si se dan correlaciones altas entre algunas variables, superiores a cero. Un ejemplo lo tenemos en la matriz de la pgina 126, tabla 4.5., en la que vemos que las correlaciones de la variable v1 a v5 son altas (todas superiores a 0,7) y de v6 a v9 son bajas o negativas. Por lo tanto la relacin se dara pero entre determinadas variables y no con las otras. La diagonal principal expresa correlacin de una variable consigo misma, al ser normalizada, es igual a 1. As pues, la varianza total explicada es igual a la suma de los valores de la diagonal principal, o lo que es lo mismo, al nmero de variables incluidas en el anlisis El determinante de la matriz: es un indicador de las posibilidades de la factorizacin, cuanto ms se aproxime a cero mayor posibilidad de factorizacin 3/ La prueba de esfericidad de Barlett: pretende comprobar si existe relacin significativa entre variables. Plantea Ho = /R/= 1; y una H1= /R/ 1. La Ho dice que no existe relacin entre variables. Mediante el clculo de X se acepta o se rechaza la Ho, en cuyo caso es apropiada la factorizacin, existe correlacin. Es significativo es todo aquello que est por debajo de =0,05, que es el alfa que usa SPSS siempre. 4/ Medidas de adecuacin de la muestra KMO. Compara los coeficientes de correlacin observados (Pearson) y los coeficientes de correlacin parcial entre las variables (correlacin parcial: la que queda entre dos variables cuando los efectos de las otras se hacen fijos). Los valores prximos a 1 denotan pertinencia de las variables para el anlisis factorial, 0.7 son aceptables, 0.5 son malos y por debajo de 0.5 son inaceptables 5/ Inversa de la matriz de correlaciones: esta matriz se utiliza para calcular las comunalidades iniciales (es el porcentaje de varianza de la variable que puede ser explicada por el modelo factorial) y para calcular la matriz de correlaciones antiimagen. 6/ Matrices anti-imagen en primer lugar muestra la matriz de covarianzas cuya diagonal principal da idea de la unicidad de cada variable, si sus valores son elevados indican pertinencia. En segundo lugar aparece la correlacin anti-imagen cuya diagonal principal muestra el MAS de KMO. Otra pregunta que se podra hacer es la informacin que aportan la matriz de correlaciones, la tabla KMO y la prueba de Barlett. Como hemos visto la respuesta sera tan sencilla como decir que lo que aportan es la adecuacin de nuestros datos o no para realizar el anlisis factorial.

2. NMERO DE FACTORES ESCOGIDOS. CUANTOS FACTORES SE HAN DE EXTRAER?


El mtodo de los componentes principales (PC) es el ms usual de extraccin de factores. Pretende conseguir una combinacin lineal de la variables, de modo que el primer componente sea el que explique la mayor proporcin de varianza, el segundo el que le sigue y as sucesivamente con tantos componentes como variables tiene el anlisis con un valor propio mayor que 1. La extraccin de factores se observa mediante: 7/ La tabla de varianza total explicada. Por defecto se extraen tantos factores como valores propios mayores que 1 ( Del anlisis de la matriz de correlaciones del punto anterior ya se podra saber cuntos factores se escogeran, dependiente de en cuntos grupos se agrupen las variables pero lo ms correcto sera decir que si el criterio utilizado para escoger un nmero de factores es el de la raz latente (que es simplemente el nombre de un mtodo de extraccin de factores), entonces deberamos consultar la tabla de varianza total explicada en la que debemos consultar la columna de autovalores iniciales y ver cuntos de los componentes o variables tienen un valor en ella mayor de 1 y ese sera el nmero de factores escogidos. Por ejemplo en el examen de junio de 2007 primera semana de 10 componentes o variables extraemos 3 factores.) El autovalor es la proporcin de la variabilidad total de la muestra explicada por dicho factor. Es simplemente una medida de la importancia de cada componente para el anlisis 8/ el grfico de sedimentacin, En l se representa lo mismo que acabamos de decir pero grficamente y por ello vemos claramente cuntos factores tienen valores altos y a partir de cul se produce la cada. En el eje de abscisas aparecen los componentes y en el de ordenadas los autovalores 9/ La matriz de componentes: sirve para calcular la puntuacin factorial. Para cada variable, aparece en las columnas los factores (el programa los denomina componentes) mayores de 1 identificados. Los nmeros que aparecen en cada columna son los coeficientes factoriales y se identifican con la letra . Las diferentes variables se saturan en cada factor y SPSS hace rotacin de factores que suponen un giro del hiperplano hasta que las variables se saturan sobre un solo factor. Esto podemos observarlo en 10/ la matriz de componentes rotados, siempre que aparezca sta trabajaremos con ella, en vez de con la de componentes. 3. CUL ES LA PROPORCIN DE VARIANZA EXPLICADA POR LA SOLUCIN FACTORIAL? Se calcula elevando al cuadrado cada valor de de cada una de las variables 10/ (matriz de componentes rotados). Obtendr, por tanto, la proporcin de varianza explicada por el factor para cada variable ( ejem: 0.76 al cuadrado = 0.57 por lo que la variable educativa est explicada con un 57 % en el factor 1) si sumo las proporciones de varianza de una c variable en cada factor ( filas) obtendr la comunalidad final o H (cuadrado) que proporciona la varianza explicada por solucin factorial. Al porcentaje que no queda explicado por solucin factorial se le conoce por unicidad variable, es decir, 1- el porcentaje explicado por la solucin factorial (1- 57%= 43 % de unicidad de la variable). Si en vez de por filas, sumamos la varianza explicada por columnas elevndolas al cuadrado, obtendremos los autovalores 4. CUAL ES LA VARIABLE MEJOR REPRESENTADA? La que tenga mayor proporcin de varianza por la solucin factorial. A partir del 50% es una muy buena representacin. 4

5. CORRELACIONES REPRODUCIDADAS O RESIDUALES 11/ Permite comprobar el grado ajuste del modelo a los datos. Son las correlaciones entre las diferentes variables despus de aplicar la solucin factorial. Entre las primeras correlaciones que vimos y estas habr poca diferencia. Esa diferencia aparece en la matriz residual. A medida que los residuos disminuyen se consigue mayor grado de ajuste al modelo. La tabla presenta en la base el porcentaje de residuos no redundantes mayores en valores absolutos de 0.05, si esta cantidad es reducida (19%) habr buen ajuste. 6. CALCULAR LAS PUNTUACIONES FACTORIALES. Las calcula directamente el programa. Hay dos procedimientos fundamentales: 1. 10/ A partir de la matriz de componentes rotados, se multiplica la puntuacin del sujeto en cada variable con su coeficiente factorial, estamos en variables estandarizadas, luego ser Z. (en el examen suelen pedir la ecuacin pero tambin pueden pedir el resultado) 2. 12/ Matriz de coeficientes para el clculo de las puntuaciones de los componentes.

OTRAS CUESTIONES QUE PUEDEN PEDIR EN EL EXAMEN


Exmenes: junio 2007 primera semana, junio 2004 primera semana, septiembre 2007 primera semana.

3. Grado de unicidad de una variable.


13/ Se obtiene restando de 1 la comunalidad de esa variable, que aparece en la tabla de comunalidades. Como la comunalidad es el porcentaje de varianza de cada variable que puede ser explicado por nuestro modelo factorial entonces su unicidad ser el porcentaje que no puede explicarse por l sino por otras cosas. Es decir, sera un ndice de la singularidad de esa variable respecto de las dems, una medida de lo que la hace diferente. La definicin de Comunalidad: es el porcentaje de varianza de la variable que puede ser explicada por el modelo factorial. pg. 127.

4. Reparto de variables por factor. La podemos encontrar en la (10/matriz de componentes rotados.) Decir que la rotacin de factores es algo que se hace una vez que se extraen para simplificar lo obtenido y mejorar la interpretacin, es decir, que es una fase ms del anlisis que realiza SPSS. Por ejemplo en el examen de junio de 2007 primera semana en la tabla de componentes rotados vemos que aparecen los tres componentes que se extraen segn los datos anteriores y vemos que a la izquierda aparecen todas las variables independientes utilizadas. Pues bien, para cada una de esas variables aparece un nmero en solo uno de los componentes, que es en el que se clasifican. As las 6 primeras estn dentro del factor 1 las 3 siguientes en el 2 y la ltima en el 3. 5. Grado de explicacin de la varianza por cada factor. En la tabla de 7/ varianza total explicada (la misma que usbamos para buscar el nmero de factores) tenemos una columna llamada suma de las saturaciones al cuadrado de la extraccin y una subcolumna llamada porcentaje de varianza, que sera la respuesta a esa pregunta. As en el examen de jun io de 2007 primera semana el componente 1 explica el 50,804% de la varianza de la variable dependiente, el 2 el 10,874% y el 3 10,547%. El total sera la suma de esos porcentajes o directamente podramos, mirarla en los porcentajes acumulados a la derecha de estos.

6. Por los datos posteriores grado de aproximacin conseguido por nuestro modelo (se entiende que la aproximacin es la ideal, que sera explicar el 100% de la varianza de la variable dependiente). Los residuos son las diferencias entre lo que pronosticamos y la realidad, como veremos ms detalladamente al hablar de regresin y por lo tanto debemos examinar su porcentaje para responder a esa pregunta. El porcentaje de residuos no redundantes con valores absolutos mayores que 0,05 (que son los que se consideran influyentes) aparece siempre en letra muy pequea al pie de una de las tablas del final, por ejemplo la de varianza total explicada. Si queremos saber el ajuste tenemos simplemente que restar de 100 ese porcentaje, ya que esos residuos son lo que impide que el ajuste sea perfecto y lo deseable es que fueran muy pocos para que nuestro porcentaje se acercase al 100%. 7. Variable de mayor influencia en el modelo factorial y factor en el que se representa.
En la 10/ matriz de componentes rotados encontramos esa informacin. La variable de mayor influencia sera aquella que, de entre las de la izquierda, punte ms alto de todas o ms se acerque a 1. El factor en el que se representa es el factor en el que se encuentra. Lo mismo cabe decir del factor pero representado.

En ese mismo examen de 2007 la ltima variable es la de mayor influencia con un 0, 966 y se representa en el tercer componente. 8. Valor de un factor para un individuo con determinada puntuacin en las variables. En nuestros datos debe aparecer una 12/ matriz de coeficientes para el clculo de las puntuaciones en los componentes, con ese nombre. En ella vemos en columnas los componentes que tengamos y a la izquierda las variables incluidas en el anlisis. Teniendo las puntuaciones en las variables no tenemos ms que multiplicarlas por cada coeficiente en cada uno de los componentes y luego sumar cada columna por separado. As en el examen de septiembre de 2007 el apartado b pregunta esto mismo y multiplica las puntuaciones del sujeto primero por los valores de la primera columna y luego lo suma al final y luego hace lo mismo con la segunda columna. Los valores obtenidos seran los valores de ese sujeto en cada factor. Sera conveniente realizar ese ejercicio y luego comprobar la solucin, que en este caso para el factor 2 es 8,151. Ejercicios de este tipo suelen parecer bastante y exigen simplemente fijarse en el enunciado del problema en los dos tipos de datos de los que se habla, en este caso, en las puntuaciones de un sujeto dadas y en los factores y buscar la tabla adecuada de entre las que tenemos, realizando posteriormente el clculo. 9. Desde el punto de vista de los residuos factor peor representado. En la 11/ tabla de correlaciones reproducidas, que es una derivacin complicada de otras tablas, habra que buscar cul de los dos factores aglutina una mayor cantidad de residuos redundantes con valores absolutos mayores de 0,05, que como decamos son los que consideramos perjudiciales. Como esa tabla es una matriz compuesta por residuos buscamos primero la agrupacin de las variables por factores en base a lo explicado de las correlaciones por grupos y dentro de cada grupo miramos cuntos residuos son mayores de 0,05. Posteriormente dividimos ese nmero por el total de residuos existentes y multiplicamos por 100 el resultado.
6

ESQUEMA: PASOS ANALISIS FACTORIAL 1. COMPROBACION DE SUPUESTOS: Tamao muestral elevado: 5 por variable Cumple los supuestos de normalidad, elevada correlacin (por debajo de 0.30 no procede factorizacin) 2. PROCEDE O NO LA FACTORIZACIN? Si no procede en alguno de los indicadores, continuamos pero lo hacemos constar. 3. DETERMINAR EL N DE FACTORES Mediante: Autovalores Proporcin de varianza Grfico de sedimentacin. cuando en el paso de un factor (ej. factor 4) a otro (factor 5) hay menos pendiente, quiere decir que el factor 4 incrementa poco a la hora de explicar la varianza 4. MATRIZ DE COMPONENTES: Importancia de la rotacin, trata de saturar cada variable en un componente Sobre la matriz factorial rotada: entran los valores de y la proporcin de varianza explicada en cada variable y en cada factor y la proporcin no explicada por la solucin factorial. A partir de esa matriz se ven las variables que proporcionan mayor coeficiente factorial y las que menos (tambin se puede decir mayor o menor proporcin de varianza explicada

5. PUNTUACIONES FACTORIALES. Por dos procedimientos: Matriz rotada Matriz de coeficientes 6. AJUSTE DEL MODELO. Analizamos los residuos mayores de 0.05 el dato del porcentaje de residuos suele aparecer debajo de la matriz de correlaciones reproducidas. Si no nos dan el dato hay que calcularlo: contamos en la segunda parte de la matriz, denominada residual, todos los valores no redundantes > 0.05 (es decir, si hay dos cantidades iguales solo contamos una) en valor absoluto (sin tener en cuenta el signo positivo o negativo), esa cantidad se divide por el n total de valores y se multiplica x 100 para tener el porcentaje ej.: (n valores >0.05/ n total valores) X 100. Clculo de
ajuste del modelo: 100-% residuos ej.: 5

______ X100 = 20.83 24

ajuste modelo: 100 20.83 = 79.17%

MS APUNTES PARA REPASO. El anlisis factorial intenta explicar, mediante un modelo lineal, un conjunto amplio de variables o individuos, segn un nmero reducido de variables hipotticas llamadas FACTORES, que no son directamente observables: se pueden obtener factores de variables (Tcnica R) individuos (Tcnica Q)

2 objetivos del anlisis factorial: - exploratoria: hay que saber cuntos factores (m) existen en (n) variables confirmatoria: dada una estructura factorial se pretende saber si los datos se corresponden con esa estructura

PARA QU SE UTILIZA EL ANLISIS FACTORIAL: - para explicar las influencias entre las variables teniendo medidas de un conjunto de variables - para probar una hiptesis de trabajo sobre el nmero y la naturaleza de las construcciones factoriales que explican las relaciones entre variables - para reducir datos El principal objetivo es la agrupacin de variables: dado un conjunto de n variables sobre N individuos. Se quiere obtener un conjunto ms reducido de m factores latentes (no observables) que expliquen la covarianza existente entre las n variables APLICACIONES DEL ANLISIS FACTORIAL - anlisis y mejora de instrumentos de medida de criterios de agrupacin y caracterizacin de constructo s - en el anlisis factorial de individuos (Tcnica Q) la bsqueda de tipologas de personas que las agrupa en base a intercorrelaciones de los mismos. SUPUESTOS DEL ANLISIS FACTORIAL - elegir un mnimo de 5 variables por factor - las variables no deben ser complejas (son las que no aportan informacin para la identificacin de los factores), deben saturar solo en el factor que pretenden medir - no seleccionar variables altamente correlacionadas porque representan poca cantidad de varianza comn, es preferible suprimir una de las variables - variables medidas en escala continua o de muchas categoras (12 o ms categoras) - muestra de 100 o ms casos y mnimo 5 veces el nmero de variables CONDICIONES DEL MODELO: - los factores K son independientes e idnticamente distribuidos con media 0 y varianza 1 - los (factores nicos), estn independientemente distribuidos con media 0 y varianza j ( diagonal) para j= 1
8

- los dos factores (k y ) tienen distribuciones independientes para todas las


combinaciones de k factores y j variables - el coeficiente de correlacin entre la variable y el factor coincidir con la covarianza y ser igual a la saturacin o peso de la variable en el factores Comunalidad H (suma de columnas) es la contribucin de todos los factores a la variacin de la variable j. es la proporcin de la variablilidad de dicha variable explicada por los m factores. Para ver si una matriz R se puede factorizar se emplea: 1) prueba de esfericidad de Barlett 2) coeficiente de correlacin parcial. deben ser cercanos a 0 para que se puede factorizar Una matriz (anti-imagen) con coeficientes de correlacin negativos, debe mostrar una proporcin muy reducida de coeficientes de correlacin altos para que sea apropiada su factorizacin 3) la medida de adecuacin de la muestra (MSA) prueba de Kaiser-Meyer-Olkin (KMO) valores pequeos cercanos a 0 indican que no es recomendable usar anlisis factorial 4) R. Cuadrado del coeficiente de correlacin mltiple entre una variable y todas las dems. coincide con la Comunalidad. coeficiente pequeo para una variable, se elimina del estudio

Potrebbero piacerti anche