Componentes de Varimax

El procedimiento varimax
Sea Z [ zij ] A( E )T la representacin de un conjunto de datos de dimensiones n p .
Ahora ocurre que tanto A como E estn truncados, luego de cierto valor m. es decir, que
slo en los primeros m autovectores y las correspondientes m componentes son retenidas,
luego de haber aplicado algn criterio de seleccin. Entonces suponemos, de aqu en mas,
que A [ a1 , , am ] de dimensiones n m y E [e1 em ] de dimensiones p m ;
donde 0 m p . Sea
una matriz de rotacin (de dimensiones p p ) que aplicaremos a
R
R
R
E de forma tal que ER E R . Entonces ER [e1 em ] . Teniendo en cuenta que
R ( R )T ( R ) T R I p
podemos escribir
Z A[ R ( R )T ]( E )T [ A R ][( E R )T ] AR ( E R )T
(6.118)
obteniendo una nueva representacin de Z , donde
AR A R
nueva matriz de componentes (n m)
ER E R nueva de autovectores ( p m)
(6.119)
Podemos utilizar la (6.118) para expresar la nueva matriz de componentes, utilizando la
propiedad de ortonormalidad de ER , como
(6.120)
AR Z ER
Sea
AR [ a1R amR ]
(6.121)
( n m)
donde
a Rj [ a1Rj anjR ]T
j 1,..., m
(6.122)
Adems
ER [e1R emR ]
(6.123)
( p m)
donde
e Rj [e1Rj e Rpj ]T
j 1,..., m
(6.124)
Cada elemento de la (6.120) puede ser escrito como

p
aiRj zik ekjR
j 1, , m
i 1, , n
k 1
R
j
(6.125)
a [a1Rj anjR ]T
Entonces a Rj es la proyeccin de
aj
sobre el nuevo eje e Rj . Si calculamos la varianza de
los n puntos de a j proyectados sobre cada nuevo eje e Rj , tenemos que

n
(a Rj ) 2 n 1 (akR j ) 2
j 1, , m
k 1
63
(6.126)
Entonces calculando la dispersin respecto a la varianza de las proyecciones sobre cada uno
de los nuevos ejes e Rj ; j 1, , m , estimamos la cantidad

m
[(a ) ( a ) ] ( ER )T [ Z ( Z )T n 1 S ] ER
j 1 k 1
R 2
kj
R 2 2
j
donde hemos tenido en cuenta que la varianza de los puntos proyectados esta dada por

n 1 ( Z ER )T Z ER n 1 ( ER )T [( Z )T Z ] ER n 1 ( ER )T S ER , siendo S la matriz de
dispersin dada por (6.46).
Nuestro objetivo es encontrar un nuevo sistema de ejes ER que maximice . Para este
propsito hacemos variar los e Rj ; j 1, , m , sobre todas las posibles orientaciones en

E p sujetos a las restricciones de ortonormalidad
(eiR )T e Rj i j
i, j 1,..., m
(6.127)
Resolver este problema implica utilizar multiplicadores de Lagrange en forma de una
ecuacin de autovalores no lineal, que debe ser resuelta en forma iterativa. No entraremos
en detalles sobre el procedimiento, slo mencionaremos que existen muchas rutinas que
aplican el mtodo varimax de rotacin.
Ejemplo de aplicacin de una rotacin
Muchas veces los resultados alcanzados al aplicar el PCA no son fciles de interpretar,
especialmente en la dependencia espacial. Este problema es muy frecuentemente en
meteorologa, donde en el estudio de la circulacin atmosfrica o de la precipitacin se
presentan modos espaciales cuyas formas no se ajustan a lo esperado.
Mostraremos la dependencia de las soluciones respecto a las formas de los campos
mediante un ejemplo: Sea el caso de tres campos de presin a nivel del mar de formas
singulares, como los mostrados en la Figura 6.14, sobre una grilla de 36 puntos (6 x 6). El
Caso I corresponde a una circulacin SW-NE, el Caso II a una circulacin zonal W-E; y por
ltimo el Caso III que es una circulacin ciclnica, con su centro de alta presin desplazado
hacia el NE. La correspondiente matriz de datos, digitalizados a partir de la Figura 6.14,
est dada por la Tabla XI. En el proceso de digitalizacin se ha producido cierto ruido.
64
Figura 6.14
Nodo
Caso I
Caso II
Caso III
1034
1012
1027
1032
1012
1028
1030
1012
1036
1028
1012
1036
1026
1012
1033
1024
1012
1032
1032
1013
1028
1030
1013
1030
1028
1013
1032
10
1026
1013
1034
11
1024
1013
1034
12
1022
1013
1033
13
1030
1014
1027
65
14
1028
1014
1030
15
1026
1014
1032
16
1024
1014
1034
17
1022
1014
1034
18
1020
1014
1033
19
1028
1015
1026
20
1026
1015
1028
21
1024
1015
1030
22
1022
1015
1032
23
1020
1015
1033
24
1018
1015
1032
25
1026
1018
1024
26
1024
1018
1026
27
1022
1018
1028
28
1020
1018
1029
29
1018
1018
1030
30
1016
1018
1030
31
1024
1019
1023
32
1022
1019
1024
33
1020
1019
1026
34
1018
1019
1027
35
1016
1019
1028
36
1014
1019
1028
Tabla XI
Resultados:
********** MATRIZ DE COVARIANZAS **********
RESULTADOS DEL PROGRAMA
LOS PRIMEROS AUTOVALORES DE LA MATRIZ ORDENADOS
EN FORMA DECRECIENTE, SU % DE VARIANZA EXPLICADA
Y SU ERROR SON:
RANK
EIGENVALUE
% VAR
66
+/- ERROR
1
2
3
.28050880E+02
.13865040E+02
.53408150E+00
66.0798
.661165600E+01
32.6621
.326802200E+01
1.2581
.125884200E+00
Tabla XII
Los autovectores son:

AUTOVECTORES DE LA MATRIZ
u1
u2
.89738
.31310
-.41050
.33389
.16185 -.88909
Tabla XIII
u3
-.31093
-.84853
-.42816
Las componentes principales son:
Nodo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
PC1
678.7
677.1
676.6
674.8
672.5
670.5
676.6
675.2
673.7
672.2
670.4
668.5
674.3
673.0
671.5
670.0
668.2
666.3
671.9
670.4
669.0
667.5
665.9
663.9
668.6
667.1
665.6
PC2
-251.5
-253.0
-260.7
-261.3
-259.3
-259.0
-252.6
-255.0
-257.4
-259.9
-260.5
-260.2
-252.0
-255.3
-257.7
-260.1
-260.8
-260.5
-251.4
-253.8
-256.3
-258.7
-260.2
-259.9
-249.3
-251.7
-254.1
67
PC3
-1619.9
-1619.7
-1622.5
-1621.9
-1620.0
-1619.0
-1620.6
-1620.8
-1621.1
-1621.3
-1620.7
-1619.6
-1620.4
-1621.0
-1621.3
-1621.5
-1620.9
-1619.8
-1620.2
-1620.4
-1620.7
-1620.9
-1620.7
-1619.6
-1621.3
-1621.5
-1621.7
28
29
30
31
32
33
34
35
36
664.0 -255.6
662.4 -257.1
660.6 -257.8
666.2 -248.7
664.6 -250.2
663.1 -252.6
661.5 -254.1
659.8 -255.6
658.0 -256.3
Tabla XIV
-1621.5
-1621.3
-1620.7
-1621.0
-1620.9
-1621.1
-1620.9
-1620.7
-1620.1
-1
-2
-3
-4
-5
-6
1
Figura 6.15: PC1 (66.08%)

La Figura 6.15 muestra como la S-PC1 captura gran parte del proceso generado por el Caso
I (ver Figura 6.14), aunque tambin hay influencia del Caso II (curvatura de las lneas).
Esto se puede apreciar tambin en la matriz de correlaciones de las variables con las
componentes en la Tabla XV.
68
-1
-2
-3
-4
-5
-6
1
Figura 6.16: PC2 (32.66%)

Por su parte la Figura 6.16 captura parte del proceso generado por el CasoII, con mezcla
del proceso generado por el Caso III (ver Figura 6.14). Ver correlaciones en la matriz de
correlaciones de las variables con las componentes en la Tabla XV.
-1
-2
-3
-4
-5
-6
1
Figura 6.17: PC3 (1.26%)

La Figura 6.17 es prcticamente ruido. Es decir que no se ha podido capturar
adecuadamente el proceso dado por el Caso III.
69
MATRIZ DE CORRELACION DE LAS VARIABLES CON

LAS COMPONENTES PRINCIPALES
CP1
CP2
CP3
.9702 .2380 -.0464 Caso I
-.8426 .4819 -.2403 Caso II
.2496 -.9640 -.0911 Caso III
Tabla XV
Aplicamos el programa OFROTADO.FOR , que produce una rotacin ortogonal

utilizando el mtodo Varimax, de la matriz de autovectores dada por la Tabla XIII.
Resultados:
u1R
u 2R
u 3R
1.00000 .00001
.00000
.00000 .00000 -1.00000
.00000 -1.00000
.00000
Tabla XVI
La Tabla XVI, muestra la matriz de los autovectores rotados la que representa una
estructura simple perfecta.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
PC1R PC2R PC3R

1034.0 -1027.0 -1012.0
1032.0 -1028.0 -1012.0
1030.0 -1036.0 -1012.0
1028.0 -1036.0 -1012.0
1026.0 -1033.0 -1012.0
1024.0 -1032.0 -1012.0
1032.0 -1028.0 -1013.0
1030.0 -1030.0 -1013.0
1028.0 -1032.0 -1013.0
1026.0 -1034.0 -1013.0
1024.0 -1034.0 -1013.0
1022.0 -1033.0 -1013.0
1030.0 -1027.0 -1014.0
1028.0 -1030.0 -1014.0
1026.0 -1032.0 -1014.0
1024.0 -1034.0 -1014.0
1022.0 -1034.0 -1014.0
1020.0 -1033.0 -1014.0
1028.0 -1026.0 -1015.0
1026.0 -1028.0 -1015.0
1024.0 -1030.0 -1015.0
70
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
1022.0 -1032.0 -1015.0

1020.0 -1033.0 -1015.0
1018.0 -1032.0 -1015.0
1026.0 -1024.0 -1018.0
1024.0 -1026.0 -1018.0
1022.0 -1028.0 -1018.0
1020.0 -1029.0 -1018.0
1018.0 -1030.0 -1018.0
1016.0 -1030.0 -1018.0
1024.0 -1023.0 -1019.0
1022.0 -1024.0 -1019.0
1020.0 -1026.0 -1019.0
1018.0 -1027.0 -1019.0
1016.0 -1028.0 -1019.0
1014.0 -1028.0 -1019.0
Tabla XVII
Por su parte, la Tabla XVII, muestras las nuevas componentes principales en el sistema
rotado. No es necesario graficar las mismas para ver que PC1R , PC 2 2 y PC 3 R capturan
perfectamente los procesos simulados por el Caso I, Caso II y Caso III. Simplemente
comparando La Tabla XVII con la Tabla XIV, encontramos que: Caso I = PC1R ; CasoIII=
PC 2 2 y Caso III = PC3 R .
La prdida de propiedades del PCA para sistemas de autovectores rotados
Mediante la rotacin del sistema de ejes formado por los autovectores E [e1 e p ] como
fuera descrito anteriormente, un investigador quizs pueda lograr una mejor descripcin
acerca de la estructura de la varianza de la historia de un sistema fsico en un espacio pdimensional. Sin embargo, por lo general, esta ganancia en una mejor descripcin se logra a
expensas de la prdida de otras importantes propiedades de la representacin mediante el
PCA del conjunto de datos Z , tales como la no correlacin de las series de tiempo
representadas por las componentes principales [ j (t ); t
1, , n ]
. Para ver esto,
podemos suponer que el conjunto de datos Z est representado en la forma Z A( E )T
(6.81), y que la matriz ortonormal R de dimensiones ( p p ) es ortogonal en el espacio
Ep
produce una transformacin (rotacin) sobre el sistema de ejes dado por
dado que
, nuestra representacin de
R ( R )T ( R)T R I p
Z A[ R ( R )T ]( E )T ( A R ) ( E R )T
. Entonces ,
toma la forma
como en (6.118). Recordando que la matriz de las
componentes principales originales, A , tiene la propiedad dada por (6.86), es decir
( A)T A diag (1 , , p ) ; vemos que la nueva matriz de las componentes principales
AR A R no tiene por lo general razn de mantener dicha propiedad. Esto puede ser visto
en forma inmediata ya que
( AR )T AR ( A R )T ( A R ) ( R )T [( A)T A] R ( R )T R ;
71
donde no podemos esperar que
sea una matriz diagonal,
( R )T R
con autovalores
(1 , , p ) , a menos que R I .
p
En vista de la observacin hecha anteriormente, un investigador puede an decidir que una
rotacin del sistema de ejes E aun nuevo sistema E R tiene un gran valor prctico para l,
pese a la prdida de ortogonalidad en las nuevas componentes principales.
Alternativa cuando p>n en el modo-S
Hasta el momento hemos supuesto que n>p, esto es que el nmero de estaciones
(locaciones) en nuestro conjunto de datos Z mes menor que el nmero de valores en el

tiempo (longitud de las series). En algunos casos los conjuntos de datos son tales que el
cociente entre p y n es mayor que la unidad. Por ejemplo es comn en las imgenes
satelitales tener valores tales como p=5000 (puntos espaciales, con una resolucin de
1km 1km , con longitudes temporales n=50. En tal caso, la matriz de covarianzas (o de
dispersin) tal como la calculamos en (6.57), tendra dimensiones 5000 5000 , lo que
requiere de procesadores muy poderosos para ser descompuesta por un PCA. Una solucin
alternativa a este problema est basada en el siguiente truco algebraico: La matriz

S ( Z )T Z de dimensiones p p y la matriz ( S )T Z ( Z )T de dimensiones n n
comparten los mismos autovalores no-nulos. En el caso de tener n>p, la matriz ( S )T es
menor que S , entonces podemos calcular el PCA de la matriz ms pequea. Esto es, de
acuerdo a la (6.72)
(6.128)
( S )T E * E * *
Los autovalores en la matriz , coincidirn con los autovalores no-nulos de obtenidos

de S E E . Es decir:
1 0 0
0 0
1 0 0
2
0 0
*
y
(6.129)

0 n 0

0 0 n
0 0
Ahora podemos obtener la matriz de autovectores E proyectando la matriz de los

autovectores dados por la (6.128) sobre la matriz que representa el conjunto de datos de
datos originales Z , en la forma

E Z E*
(6.130)
donde Z es de dimensiones n p y E de dimensiones p p . Entonces E tendr

dimensiones n p . Observemos que, usando este mtodo alternativo, podemos
nicamente calcular los primeros n-autovectores de la matriz E , de los posibles p
autovectores totales del campo p-variado
Z . Sin embargo este no es estrictamente un
72
problema en nuestras aplicaciones, ya que slo nos interesan un conjunto reducido de las
primeras componentes.
73

Componentes de Varimax

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Componentes de Varimax

Caricato da

Copyright:

Formati disponibili

El procedimiento varimax

Sea Z [ zij ] A( E )T la representacin de un conjunto de datos de dimensiones n p .

que A [ a1 , , am ] de dimensiones n m y E [e1 em ] de dimensiones p m ;

obteniendo una nueva representacin de Z , donde

nueva matriz de componentes (n m)

Podemos utilizar la (6.118) para expresar la nueva matriz de componentes, utilizando la

propiedad de ortonormalidad de ER , como

Cada elemento de la (6.120) puede ser escrito como

aiRj zik ekjR

sobre el nuevo eje e Rj . Si calculamos la varianza de

los n puntos de a j proyectados sobre cada nuevo eje e Rj , tenemos que

de los nuevos ejes e Rj ; j 1, , m , estimamos la cantidad

propsito hacemos variar los e Rj ; j 1, , m , sobre todas las posibles orientaciones en

Los autovectores son:

Las componentes principales son:

Figura 6.15: PC1 (66.08%)

Figura 6.16: PC2 (32.66%)

Figura 6.17: PC3 (1.26%)

MATRIZ DE CORRELACION DE LAS VARIABLES CON

Aplicamos el programa OFROTADO.FOR , que produce una rotacin ortogonal

PC1R PC2R PC3R

1022.0 -1032.0 -1015.0

representadas por las componentes principales [ j (t ); t

. Para ver esto,

podemos suponer que el conjunto de datos Z est representado en la forma Z A( E )T

(6.81), y que la matriz ortonormal R de dimensiones ( p p ) es ortogonal en el espacio

produce una transformacin (rotacin) sobre el sistema de ejes dado por

como en (6.118). Recordando que la matriz de las

componentes principales originales, A , tiene la propiedad dada por (6.86), es decir

( A)T A diag (1 , , p ) ; vemos que la nueva matriz de las componentes principales

en forma inmediata ya que

donde no podemos esperar que

sea una matriz diagonal,

En vista de la observacin hecha anteriormente, un investigador puede an decidir que una

(locaciones) en nuestro conjunto de datos Z mes menor que el nmero de valores en el

comparten los mismos autovalores no-nulos. En el caso de tener n>p, la matriz ( S )T es

Los autovalores en la matriz , coincidirn con los autovalores no-nulos de obtenidos

Ahora podemos obtener la matriz de autovectores E proyectando la matriz de los

datos originales Z , en la forma

donde Z es de dimensiones n p y E de dimensiones p p . Entonces E tendr

nicamente calcular los primeros n-autovectores de la matriz E , de los posibles p

autovectores totales del campo p-variado

Z . Sin embargo este no es estrictamente un

Potrebbero piacerti anche