Sei sulla pagina 1di 11

El procedimiento varimax

Sea Z [ zij ] A( E )T la representacin de un conjunto de datos de dimensiones n p .

Ahora ocurre que tanto A como E estn truncados, luego de cierto valor m. es decir, que
slo en los primeros m autovectores y las correspondientes m componentes son retenidas,
luego de haber aplicado algn criterio de seleccin. Entonces suponemos, de aqu en mas,

que A [ a1 , , am ] de dimensiones n m y E [e1 em ] de dimensiones p m ;

donde 0 m p . Sea
una matriz de rotacin (de dimensiones p p ) que aplicaremos a
R

R
R
E de forma tal que ER E R . Entonces ER [e1 em ] . Teniendo en cuenta que

R ( R )T ( R ) T R I p

podemos escribir

Z A[ R ( R )T ]( E )T [ A R ][( E R )T ] AR ( E R )T

(6.118)

obteniendo una nueva representacin de Z , donde

AR A R

nueva matriz de componentes (n m)

ER E R nueva de autovectores ( p m)

(6.119)

Podemos utilizar la (6.118) para expresar la nueva matriz de componentes, utilizando la

propiedad de ortonormalidad de ER , como

(6.120)

AR Z ER

Sea

AR [ a1R amR ]

(6.121)

( n m)

donde

a Rj [ a1Rj anjR ]T

j 1,..., m

(6.122)

Adems

ER [e1R emR ]

(6.123)

( p m)

donde

e Rj [e1Rj e Rpj ]T

j 1,..., m

(6.124)

Cada elemento de la (6.120) puede ser escrito como


p

aiRj zik ekjR

j 1, , m

i 1, , n

k 1

R
j

(6.125)

a [a1Rj anjR ]T

Entonces a Rj es la proyeccin de

aj

sobre el nuevo eje e Rj . Si calculamos la varianza de

los n puntos de a j proyectados sobre cada nuevo eje e Rj , tenemos que


n

(a Rj ) 2 n 1 (akR j ) 2

j 1, , m

k 1

63

(6.126)

Entonces calculando la dispersin respecto a la varianza de las proyecciones sobre cada uno

de los nuevos ejes e Rj ; j 1, , m , estimamos la cantidad


m

[(a ) ( a ) ] ( ER )T [ Z ( Z )T n 1 S ] ER

j 1 k 1
R 2
kj

R 2 2
j

donde hemos tenido en cuenta que la varianza de los puntos proyectados esta dada por

n 1 ( Z ER )T Z ER n 1 ( ER )T [( Z )T Z ] ER n 1 ( ER )T S ER , siendo S la matriz de
dispersin dada por (6.46).

Nuestro objetivo es encontrar un nuevo sistema de ejes ER que maximice . Para este

propsito hacemos variar los e Rj ; j 1, , m , sobre todas las posibles orientaciones en


E p sujetos a las restricciones de ortonormalidad

(eiR )T e Rj i j

i, j 1,..., m

(6.127)
Resolver este problema implica utilizar multiplicadores de Lagrange en forma de una
ecuacin de autovalores no lineal, que debe ser resuelta en forma iterativa. No entraremos
en detalles sobre el procedimiento, slo mencionaremos que existen muchas rutinas que
aplican el mtodo varimax de rotacin.
Ejemplo de aplicacin de una rotacin
Muchas veces los resultados alcanzados al aplicar el PCA no son fciles de interpretar,
especialmente en la dependencia espacial. Este problema es muy frecuentemente en
meteorologa, donde en el estudio de la circulacin atmosfrica o de la precipitacin se
presentan modos espaciales cuyas formas no se ajustan a lo esperado.
Mostraremos la dependencia de las soluciones respecto a las formas de los campos
mediante un ejemplo: Sea el caso de tres campos de presin a nivel del mar de formas
singulares, como los mostrados en la Figura 6.14, sobre una grilla de 36 puntos (6 x 6). El
Caso I corresponde a una circulacin SW-NE, el Caso II a una circulacin zonal W-E; y por
ltimo el Caso III que es una circulacin ciclnica, con su centro de alta presin desplazado
hacia el NE. La correspondiente matriz de datos, digitalizados a partir de la Figura 6.14,
est dada por la Tabla XI. En el proceso de digitalizacin se ha producido cierto ruido.

64

Figura 6.14
Nodo

Caso I

Caso II

Caso III

1034

1012

1027

1032

1012

1028

1030

1012

1036

1028

1012

1036

1026

1012

1033

1024

1012

1032

1032

1013

1028

1030

1013

1030

1028

1013

1032

10

1026

1013

1034

11

1024

1013

1034

12

1022

1013

1033

13

1030

1014

1027

65

14

1028

1014

1030

15

1026

1014

1032

16

1024

1014

1034

17

1022

1014

1034

18

1020

1014

1033

19

1028

1015

1026

20

1026

1015

1028

21

1024

1015

1030

22

1022

1015

1032

23

1020

1015

1033

24

1018

1015

1032

25

1026

1018

1024

26

1024

1018

1026

27

1022

1018

1028

28

1020

1018

1029

29

1018

1018

1030

30

1016

1018

1030

31

1024

1019

1023

32

1022

1019

1024

33

1020

1019

1026

34

1018

1019

1027

35

1016

1019

1028

36

1014

1019

1028

Tabla XI
Resultados:
********** MATRIZ DE COVARIANZAS **********
RESULTADOS DEL PROGRAMA
LOS PRIMEROS AUTOVALORES DE LA MATRIZ ORDENADOS
EN FORMA DECRECIENTE, SU % DE VARIANZA EXPLICADA
Y SU ERROR SON:
RANK

EIGENVALUE

% VAR

66

+/- ERROR

1
2
3

.28050880E+02
.13865040E+02
.53408150E+00

66.0798
.661165600E+01
32.6621
.326802200E+01
1.2581
.125884200E+00
Tabla XII

Los autovectores son:


AUTOVECTORES DE LA MATRIZ

u1

u2

.89738
.31310
-.41050
.33389
.16185 -.88909
Tabla XIII

u3

-.31093
-.84853
-.42816

Las componentes principales son:

Nodo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

PC1
678.7
677.1
676.6
674.8
672.5
670.5
676.6
675.2
673.7
672.2
670.4
668.5
674.3
673.0
671.5
670.0
668.2
666.3
671.9
670.4
669.0
667.5
665.9
663.9
668.6
667.1
665.6

PC2
-251.5
-253.0
-260.7
-261.3
-259.3
-259.0
-252.6
-255.0
-257.4
-259.9
-260.5
-260.2
-252.0
-255.3
-257.7
-260.1
-260.8
-260.5
-251.4
-253.8
-256.3
-258.7
-260.2
-259.9
-249.3
-251.7
-254.1

67

PC3
-1619.9
-1619.7
-1622.5
-1621.9
-1620.0
-1619.0
-1620.6
-1620.8
-1621.1
-1621.3
-1620.7
-1619.6
-1620.4
-1621.0
-1621.3
-1621.5
-1620.9
-1619.8
-1620.2
-1620.4
-1620.7
-1620.9
-1620.7
-1619.6
-1621.3
-1621.5
-1621.7

28
29
30
31
32
33
34
35
36

664.0 -255.6
662.4 -257.1
660.6 -257.8
666.2 -248.7
664.6 -250.2
663.1 -252.6
661.5 -254.1
659.8 -255.6
658.0 -256.3
Tabla XIV

-1621.5
-1621.3
-1620.7
-1621.0
-1620.9
-1621.1
-1620.9
-1620.7
-1620.1

-1

-2

-3

-4

-5

-6
1

Figura 6.15: PC1 (66.08%)


La Figura 6.15 muestra como la S-PC1 captura gran parte del proceso generado por el Caso
I (ver Figura 6.14), aunque tambin hay influencia del Caso II (curvatura de las lneas).
Esto se puede apreciar tambin en la matriz de correlaciones de las variables con las
componentes en la Tabla XV.

68

-1

-2

-3

-4

-5

-6
1

Figura 6.16: PC2 (32.66%)


Por su parte la Figura 6.16 captura parte del proceso generado por el CasoII, con mezcla
del proceso generado por el Caso III (ver Figura 6.14). Ver correlaciones en la matriz de
correlaciones de las variables con las componentes en la Tabla XV.
-1

-2

-3

-4

-5

-6
1

Figura 6.17: PC3 (1.26%)


La Figura 6.17 es prcticamente ruido. Es decir que no se ha podido capturar
adecuadamente el proceso dado por el Caso III.

69

MATRIZ DE CORRELACION DE LAS VARIABLES CON


LAS COMPONENTES PRINCIPALES
CP1
CP2
CP3
.9702 .2380 -.0464 Caso I
-.8426 .4819 -.2403 Caso II
.2496 -.9640 -.0911 Caso III
Tabla XV

Aplicamos el programa OFROTADO.FOR , que produce una rotacin ortogonal


utilizando el mtodo Varimax, de la matriz de autovectores dada por la Tabla XIII.
Resultados:

u1R

u 2R

u 3R

1.00000 .00001
.00000
.00000 .00000 -1.00000
.00000 -1.00000
.00000
Tabla XVI
La Tabla XVI, muestra la matriz de los autovectores rotados la que representa una
estructura simple perfecta.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

PC1R PC2R PC3R


1034.0 -1027.0 -1012.0
1032.0 -1028.0 -1012.0
1030.0 -1036.0 -1012.0
1028.0 -1036.0 -1012.0
1026.0 -1033.0 -1012.0
1024.0 -1032.0 -1012.0
1032.0 -1028.0 -1013.0
1030.0 -1030.0 -1013.0
1028.0 -1032.0 -1013.0
1026.0 -1034.0 -1013.0
1024.0 -1034.0 -1013.0
1022.0 -1033.0 -1013.0
1030.0 -1027.0 -1014.0
1028.0 -1030.0 -1014.0
1026.0 -1032.0 -1014.0
1024.0 -1034.0 -1014.0
1022.0 -1034.0 -1014.0
1020.0 -1033.0 -1014.0
1028.0 -1026.0 -1015.0
1026.0 -1028.0 -1015.0
1024.0 -1030.0 -1015.0
70

22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

1022.0 -1032.0 -1015.0


1020.0 -1033.0 -1015.0
1018.0 -1032.0 -1015.0
1026.0 -1024.0 -1018.0
1024.0 -1026.0 -1018.0
1022.0 -1028.0 -1018.0
1020.0 -1029.0 -1018.0
1018.0 -1030.0 -1018.0
1016.0 -1030.0 -1018.0
1024.0 -1023.0 -1019.0
1022.0 -1024.0 -1019.0
1020.0 -1026.0 -1019.0
1018.0 -1027.0 -1019.0
1016.0 -1028.0 -1019.0
1014.0 -1028.0 -1019.0
Tabla XVII
Por su parte, la Tabla XVII, muestras las nuevas componentes principales en el sistema
rotado. No es necesario graficar las mismas para ver que PC1R , PC 2 2 y PC 3 R capturan
perfectamente los procesos simulados por el Caso I, Caso II y Caso III. Simplemente
comparando La Tabla XVII con la Tabla XIV, encontramos que: Caso I = PC1R ; CasoIII=
PC 2 2 y Caso III = PC3 R .
La prdida de propiedades del PCA para sistemas de autovectores rotados

Mediante la rotacin del sistema de ejes formado por los autovectores E [e1 e p ] como
fuera descrito anteriormente, un investigador quizs pueda lograr una mejor descripcin
acerca de la estructura de la varianza de la historia de un sistema fsico en un espacio pdimensional. Sin embargo, por lo general, esta ganancia en una mejor descripcin se logra a
expensas de la prdida de otras importantes propiedades de la representacin mediante el

PCA del conjunto de datos Z , tales como la no correlacin de las series de tiempo

representadas por las componentes principales [ j (t ); t

1, , n ]

. Para ver esto,

podemos suponer que el conjunto de datos Z est representado en la forma Z A( E )T

(6.81), y que la matriz ortonormal R de dimensiones ( p p ) es ortogonal en el espacio

Ep

produce una transformacin (rotacin) sobre el sistema de ejes dado por

dado que

, nuestra representacin de

R ( R )T ( R)T R I p

Z A[ R ( R )T ]( E )T ( A R ) ( E R )T

. Entonces ,

toma la forma

como en (6.118). Recordando que la matriz de las

componentes principales originales, A , tiene la propiedad dada por (6.86), es decir

( A)T A diag (1 , , p ) ; vemos que la nueva matriz de las componentes principales

AR A R no tiene por lo general razn de mantener dicha propiedad. Esto puede ser visto

en forma inmediata ya que

( AR )T AR ( A R )T ( A R ) ( R )T [( A)T A] R ( R )T R ;

71

donde no podemos esperar que

sea una matriz diagonal,

( R )T R

con autovalores

(1 , , p ) , a menos que R I .
p

En vista de la observacin hecha anteriormente, un investigador puede an decidir que una

rotacin del sistema de ejes E aun nuevo sistema E R tiene un gran valor prctico para l,
pese a la prdida de ortogonalidad en las nuevas componentes principales.
Alternativa cuando p>n en el modo-S
Hasta el momento hemos supuesto que n>p, esto es que el nmero de estaciones

(locaciones) en nuestro conjunto de datos Z mes menor que el nmero de valores en el


tiempo (longitud de las series). En algunos casos los conjuntos de datos son tales que el
cociente entre p y n es mayor que la unidad. Por ejemplo es comn en las imgenes
satelitales tener valores tales como p=5000 (puntos espaciales, con una resolucin de
1km 1km , con longitudes temporales n=50. En tal caso, la matriz de covarianzas (o de
dispersin) tal como la calculamos en (6.57), tendra dimensiones 5000 5000 , lo que
requiere de procesadores muy poderosos para ser descompuesta por un PCA. Una solucin
alternativa a este problema est basada en el siguiente truco algebraico: La matriz


S ( Z )T Z de dimensiones p p y la matriz ( S )T Z ( Z )T de dimensiones n n

comparten los mismos autovalores no-nulos. En el caso de tener n>p, la matriz ( S )T es

menor que S , entonces podemos calcular el PCA de la matriz ms pequea. Esto es, de
acuerdo a la (6.72)

(6.128)

( S )T E * E * *

Los autovalores en la matriz , coincidirn con los autovalores no-nulos de obtenidos



de S E E . Es decir:
1 0 0
0 0
1 0 0
2

0 0

*
y
(6.129)


0 n 0


0 0 n

0 0

Ahora podemos obtener la matriz de autovectores E proyectando la matriz de los


autovectores dados por la (6.128) sobre la matriz que representa el conjunto de datos de

datos originales Z , en la forma


E Z E*

(6.130)

donde Z es de dimensiones n p y E de dimensiones p p . Entonces E tendr


dimensiones n p . Observemos que, usando este mtodo alternativo, podemos

nicamente calcular los primeros n-autovectores de la matriz E , de los posibles p

autovectores totales del campo p-variado

Z . Sin embargo este no es estrictamente un

72

problema en nuestras aplicaciones, ya que slo nos interesan un conjunto reducido de las
primeras componentes.

73

Potrebbero piacerti anche