Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Ahora ocurre que tanto A como E estn truncados, luego de cierto valor m. es decir, que
slo en los primeros m autovectores y las correspondientes m componentes son retenidas,
luego de haber aplicado algn criterio de seleccin. Entonces suponemos, de aqu en mas,
donde 0 m p . Sea
una matriz de rotacin (de dimensiones p p ) que aplicaremos a
R
R
R
E de forma tal que ER E R . Entonces ER [e1 em ] . Teniendo en cuenta que
R ( R )T ( R ) T R I p
podemos escribir
Z A[ R ( R )T ]( E )T [ A R ][( E R )T ] AR ( E R )T
(6.118)
AR A R
ER E R nueva de autovectores ( p m)
(6.119)
(6.120)
AR Z ER
Sea
AR [ a1R amR ]
(6.121)
( n m)
donde
a Rj [ a1Rj anjR ]T
j 1,..., m
(6.122)
Adems
ER [e1R emR ]
(6.123)
( p m)
donde
e Rj [e1Rj e Rpj ]T
j 1,..., m
(6.124)
j 1, , m
i 1, , n
k 1
R
j
(6.125)
a [a1Rj anjR ]T
Entonces a Rj es la proyeccin de
aj
(a Rj ) 2 n 1 (akR j ) 2
j 1, , m
k 1
63
(6.126)
Entonces calculando la dispersin respecto a la varianza de las proyecciones sobre cada uno
[(a ) ( a ) ] ( ER )T [ Z ( Z )T n 1 S ] ER
j 1 k 1
R 2
kj
R 2 2
j
donde hemos tenido en cuenta que la varianza de los puntos proyectados esta dada por
n 1 ( Z ER )T Z ER n 1 ( ER )T [( Z )T Z ] ER n 1 ( ER )T S ER , siendo S la matriz de
dispersin dada por (6.46).
Nuestro objetivo es encontrar un nuevo sistema de ejes ER que maximice . Para este
(eiR )T e Rj i j
i, j 1,..., m
(6.127)
Resolver este problema implica utilizar multiplicadores de Lagrange en forma de una
ecuacin de autovalores no lineal, que debe ser resuelta en forma iterativa. No entraremos
en detalles sobre el procedimiento, slo mencionaremos que existen muchas rutinas que
aplican el mtodo varimax de rotacin.
Ejemplo de aplicacin de una rotacin
Muchas veces los resultados alcanzados al aplicar el PCA no son fciles de interpretar,
especialmente en la dependencia espacial. Este problema es muy frecuentemente en
meteorologa, donde en el estudio de la circulacin atmosfrica o de la precipitacin se
presentan modos espaciales cuyas formas no se ajustan a lo esperado.
Mostraremos la dependencia de las soluciones respecto a las formas de los campos
mediante un ejemplo: Sea el caso de tres campos de presin a nivel del mar de formas
singulares, como los mostrados en la Figura 6.14, sobre una grilla de 36 puntos (6 x 6). El
Caso I corresponde a una circulacin SW-NE, el Caso II a una circulacin zonal W-E; y por
ltimo el Caso III que es una circulacin ciclnica, con su centro de alta presin desplazado
hacia el NE. La correspondiente matriz de datos, digitalizados a partir de la Figura 6.14,
est dada por la Tabla XI. En el proceso de digitalizacin se ha producido cierto ruido.
64
Figura 6.14
Nodo
Caso I
Caso II
Caso III
1034
1012
1027
1032
1012
1028
1030
1012
1036
1028
1012
1036
1026
1012
1033
1024
1012
1032
1032
1013
1028
1030
1013
1030
1028
1013
1032
10
1026
1013
1034
11
1024
1013
1034
12
1022
1013
1033
13
1030
1014
1027
65
14
1028
1014
1030
15
1026
1014
1032
16
1024
1014
1034
17
1022
1014
1034
18
1020
1014
1033
19
1028
1015
1026
20
1026
1015
1028
21
1024
1015
1030
22
1022
1015
1032
23
1020
1015
1033
24
1018
1015
1032
25
1026
1018
1024
26
1024
1018
1026
27
1022
1018
1028
28
1020
1018
1029
29
1018
1018
1030
30
1016
1018
1030
31
1024
1019
1023
32
1022
1019
1024
33
1020
1019
1026
34
1018
1019
1027
35
1016
1019
1028
36
1014
1019
1028
Tabla XI
Resultados:
********** MATRIZ DE COVARIANZAS **********
RESULTADOS DEL PROGRAMA
LOS PRIMEROS AUTOVALORES DE LA MATRIZ ORDENADOS
EN FORMA DECRECIENTE, SU % DE VARIANZA EXPLICADA
Y SU ERROR SON:
RANK
EIGENVALUE
% VAR
66
+/- ERROR
1
2
3
.28050880E+02
.13865040E+02
.53408150E+00
66.0798
.661165600E+01
32.6621
.326802200E+01
1.2581
.125884200E+00
Tabla XII
u1
u2
.89738
.31310
-.41050
.33389
.16185 -.88909
Tabla XIII
u3
-.31093
-.84853
-.42816
Nodo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
PC1
678.7
677.1
676.6
674.8
672.5
670.5
676.6
675.2
673.7
672.2
670.4
668.5
674.3
673.0
671.5
670.0
668.2
666.3
671.9
670.4
669.0
667.5
665.9
663.9
668.6
667.1
665.6
PC2
-251.5
-253.0
-260.7
-261.3
-259.3
-259.0
-252.6
-255.0
-257.4
-259.9
-260.5
-260.2
-252.0
-255.3
-257.7
-260.1
-260.8
-260.5
-251.4
-253.8
-256.3
-258.7
-260.2
-259.9
-249.3
-251.7
-254.1
67
PC3
-1619.9
-1619.7
-1622.5
-1621.9
-1620.0
-1619.0
-1620.6
-1620.8
-1621.1
-1621.3
-1620.7
-1619.6
-1620.4
-1621.0
-1621.3
-1621.5
-1620.9
-1619.8
-1620.2
-1620.4
-1620.7
-1620.9
-1620.7
-1619.6
-1621.3
-1621.5
-1621.7
28
29
30
31
32
33
34
35
36
664.0 -255.6
662.4 -257.1
660.6 -257.8
666.2 -248.7
664.6 -250.2
663.1 -252.6
661.5 -254.1
659.8 -255.6
658.0 -256.3
Tabla XIV
-1621.5
-1621.3
-1620.7
-1621.0
-1620.9
-1621.1
-1620.9
-1620.7
-1620.1
-1
-2
-3
-4
-5
-6
1
68
-1
-2
-3
-4
-5
-6
1
-2
-3
-4
-5
-6
1
69
u1R
u 2R
u 3R
1.00000 .00001
.00000
.00000 .00000 -1.00000
.00000 -1.00000
.00000
Tabla XVI
La Tabla XVI, muestra la matriz de los autovectores rotados la que representa una
estructura simple perfecta.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Mediante la rotacin del sistema de ejes formado por los autovectores E [e1 e p ] como
fuera descrito anteriormente, un investigador quizs pueda lograr una mejor descripcin
acerca de la estructura de la varianza de la historia de un sistema fsico en un espacio pdimensional. Sin embargo, por lo general, esta ganancia en una mejor descripcin se logra a
expensas de la prdida de otras importantes propiedades de la representacin mediante el
PCA del conjunto de datos Z , tales como la no correlacin de las series de tiempo
1, , n ]
Ep
dado que
, nuestra representacin de
R ( R )T ( R)T R I p
Z A[ R ( R )T ]( E )T ( A R ) ( E R )T
. Entonces ,
toma la forma
AR A R no tiene por lo general razn de mantener dicha propiedad. Esto puede ser visto
( AR )T AR ( A R )T ( A R ) ( R )T [( A)T A] R ( R )T R ;
71
( R )T R
con autovalores
(1 , , p ) , a menos que R I .
p
rotacin del sistema de ejes E aun nuevo sistema E R tiene un gran valor prctico para l,
pese a la prdida de ortogonalidad en las nuevas componentes principales.
Alternativa cuando p>n en el modo-S
Hasta el momento hemos supuesto que n>p, esto es que el nmero de estaciones
S ( Z )T Z de dimensiones p p y la matriz ( S )T Z ( Z )T de dimensiones n n
menor que S , entonces podemos calcular el PCA de la matriz ms pequea. Esto es, de
acuerdo a la (6.72)
(6.128)
( S )T E * E * *
0 0
*
y
(6.129)
0 n 0
0 0 n
0 0
E Z E*
(6.130)
72
problema en nuestras aplicaciones, ya que slo nos interesan un conjunto reducido de las
primeras componentes.
73