Sei sulla pagina 1di 5

INTRODUCCIN AL ANLISIS FACTORIAL

I.- INTRODUCCIN
El Anlisis Factorial es un mtodo de anlisis multivariante que intenta
explicar, segn un modelo lineal, un conjunto extenso de variables
observables mediante un nmero reducido de variables hipotticas
llamadas factores.
Teniendo como precedentes los conceptos de factor latente de Galton y eje
principal de K. Pearson, el Anlisis Factorial fue originalmente
desarrollado por los psiclogos. En 1904 Spearman desarroll toda una
teora de la inteligencia apoyada sobre un solo factor general: el llamado
factor g.
Pero, lo que se entiende actualmente por Anlisis Factorial tiene su punto
de partida en un trabajo publicado por Thurstone en 1931 y, sobre todo
despus de su obra, publicada en 1947, Multiple factor anlisis.
Hasta aproximadamente los aos 60 el Anlisis Factorial se entendi en
sentido exploratorio, como una herramienta que permitiera explorar la
dimensionalidad desconocida de las variables. La obra de Harman (con
diferentes ediciones: 1960, 1967, 1976) es una buena exposicin del
Anlisis Factorial Exploratorio.
Posteriormente, el Anlisis Factorial se ha entendido, tambin, en sentido
confirmatorio, que quiere decir establecer una estructura para los factores
y seguidamente, mediante estimacin y contraste de hiptesis, confirmarla
con las variables observadas. Han contribuido especialmente a este tema
Bock y Bargmann (1966) y Jreskog (1969, 1970). Las obras de Mulaik
(1972), Lawley y Maxwell (1971), Maxwell (1977) y en nuestro pas
Cuadras (1981) tienen un importante contenido de Anlisis Factorial
Confirmatorio.
Un aspecto esencial del Anlisis Factorial es el que los factores no sean
directamente observables, obedeciendo a conceptos de naturaleza ms
abstracta que las variables originales. Por ejemplo, un modo bastante
comn de dividir las enseanzas es el hacerlo en: asignaturas de ciencias y
asignaturas de letras.

El Anlisis Factorial opera sobre n variables aleatorias observables


X1, X2, X3, , Xn
definidas sobre una misma poblacin.
Se trata de encontrar (m + n) nuevas variables, llamadas factores
F1, F2, ., Fm, V1, V2, ., Vn
y determinar su contribucin en las variables originales.
Las variables se relacionan con los factores a travs del modelo factorial
lineal:
X1 = a11F1 + .. + a1m Fm + d1 V1
X2 = a21F1 + .. + a2m Fm + d2 V2
(1)

Xn = an1F1 + .. + anm Fm + dn Vn
Las variables F1, F2, ., Fm se denominan factores comunes porque, de
acuerdo con el modelo, influyen en comn en las n variables.
Las variables V1, V2, ., Vn se llaman factores nicos porque cada factor
Vi influye exclusivamente en la variables Xi (i =1, 2,, n).
Los factores comunes explican las correlaciones entre las variables.
Cada factor nico explica la varianza restante (incluyendo el error).
En el modelo factorial lineal se supone:
1) m < n , puesto que se desea explicar las variables por un nmero ms
reducido de variables-factores.
2) La totalidad de los (m+n) factores son variables no correlacionadas.
Se pretende que la parte de la variabilidad de una variable explicada
por un factor no tenga relacin (en sentido lineal) con los dems
factores.

La determinacin de la matriz del modelo factorial, o matriz factorial

a11
a
A = 21
...
a n1

a12
a 22
...
an2

... a1m
... a 2 m
... ...
... a nm

es uno de los problemas fundamentales del Anlisis Factorial.


Los coeficientes de A informan de la relacin existente entre las variables y
los factores comunes. Solamente tales factores tienen inters y son
susceptibles de interpretacin experimental.
Los factores nicos se incluyen en el modelo dado la imposibilidad de
expresar, en general, n variables en funcin de un nmero ms reducido de
m factores.
Como veremos ms adelante, la matriz A se obtiene a partir de los
coeficientes de correlacin entre las variables. Por lo tanto, los factores
comunes deben entenderse como la dimensionalidad influyente que
relaciona y explica las relaciones y asociaciones existentes entre las
variables.
Reuchlin (1964) comenta un sencillo ejemplo de Anlisis Factorial que nos
servir de excelente ilustracin. Se trata de la clsica divisin entre
asignaturas de ciencias y de letras que comentbamos antes. Esta divisin
se caracteriza por:
Asignaturas de Ciencias: factor muy general y emprico
Asignaturas de Letras: significado ms especulativo, siendo quizs la
memoria una de sus caractersticas ms importantes.

Sin embargo, esta divisin no es absoluta, el latn (por ejemplo),


considerado de letras, es una asignatura que induce al razonamiento
mientras que las ciencias naturales siendo de ciencias, abligan a recurrir a
la memoria.
De forma ms precisa admitiremos que las asignaturas dependen
principalmente de dos factores (ciencias y letras), aunque algunas de ellas
admitan una cierta relacin con ambos.
Ambos factores no son directamente medibles, pero su significado ha sido
tradicionalmente aceptado y es ms amplio que cada asignatura por
separado.

Vamos a suponer que ha sido efectuado un Anlisis Factorial sobre n = 4


asignaturas: Matemticas, Ciencias Naturales, Francs y Latn; a partir de
las notas de un grupo de ocho alumnos (calificados sobre 20 puntos).
Alumno
1
2
3
4
5
6
7
8

Matemticas
13
14,5
5,5
14
11
8
6
6

CC.Naturales
12,5
14,5
7
14
10
8
7
6

Francs
8,5
15,5
14
12
5,5
8
11
5

Latn
9,5
15
11,5
12,5
7
8
9,5
5,5

Si fuera posible medir para cada alumno su nota en el factor ciencias y en


el factor letras, como si ambos fueran asignaturas, tendramos un camino
para obtener las dems notas. Supongamos que esto es posible (no lo es en
la prctica) y que las notas de esos ocho alumnos hubiesen sido:
Alumno
1
2
3
4
5
6
7
8

Factor C
14
15
4
15
12
8
5
6

Factor L
7,5
16
15,5
12
4
8
12
4,5

Cada asignatura tendr, adems, un coeficiente aij en cada factor:


Matemticas
CC Naturales
Francs
Latn

Factor C
0,8
0,7
0,1
0,3

Factor L
0,1
0,2
0,8
0,6

(2)

Estos coeficientes constituyen la matriz factorial A.


Segn el modelo lineal expuesto, atendiendo a los factores comunes, la
nota del primer alumno, en matemticas, ser:

(0,8) 14 + (0,1) 7,5 = 11,95


En las notas reales obtenidas, el alumno puntuaba en matemticas con un
13. La diferencia entre ambas puntuaciones (13 11,95 = 1,05) es debida a
que no todas las matemticas pueden explicarse por ambos factores
comunes, es decir:
X1 = a11F1 + a12F2 + d1V1
13 = (0,8)14 + (0,1)7,5 + 1,05
La variable V1, con coeficiente d1, es el factor nico, que es intrnseco a las
Matemticas, y aporta 1,05 de los 13 puntos obtenidos.
Procediendo anlogamente para las dems calificaciones y asignaturas
observamos que:
- Las cuatro asignaturas se explican por dos factores en el grado en
que indica la matriz (2).
- Los factores son hipotticos y no se pueden medir directamente.
- Son variables incorrelacionadas. De este modo, Ciencias y Letras se
corresponden con conceptos independientes (en el sentido de
independencia lineal).
- Una pequea parte de la variabilidad de cada asignatura (el factor
nico) se explica por s misma, sin relacin con las dems, ni con los
dems factores comunes.

Las ideas que hemos descrito contienen los conceptos principales que rigen
el Anlisis Factorial, sin embargo, el problema de encontrar la matriz
factorial es bastante complejo y, afortunadamente, existen programas para
ello.
El Anlisis Factorial es muy similar al modelo del Anlisis de Regresin en
lo que se refiere a que una variable se expresa como una combinacin
lineal de otro conjunto de variables mas un trmino residual; sin embargo,
en el anlisis de regresin, el conjunto de variables independientes son
observables, mientras que en el anlisis factorial son entes hipotticos que
nicamente pueden estimarse a partir de los datos observados.

Potrebbero piacerti anche