Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Profesor Tiutlar
Departamento de Estadı́stica
Facultad de Ciencias
Universidad Nacional de Colombia
Bogotá D.C.
20 de febrero de 2018
JCorzo ACP
Figura 2: La técnica de componentes
Figura 1: K. Pearson (1901) principales es debida a Hotelling
introdujo la técnica de ajustes (1933)
ortogonales por mı́nimos cuadrados
JCorzo ACP
Problema
JCorzo ACP
En qué consiste el EDM
JCorzo ACP
Procedimiento
JCorzo ACP
Metodologı́a para búsqueda de la representación
JCorzo ACP
Interpretación Geométrica
Xn×3 , matriz de datos, Xi una fila de X
Hi es la proyección (Xi u) de Xi sobre la recta generada por el vector
unitario u (u 0 u = 1).
JCorzo ACP
Sean |Xi Hi | las distancias entre los puntos y sus proyecciones, y
definanse análogamente |OHi | y |OXi |. Entonces se trata de
minimizar la suma de cuadrados de todas las distancias entre los
puntos y su proyección:
n
X
minimizar |Xi Hi |2
i=1
JCorzo ACP
Entonces, Pni=1 |OXi |2 son fijas porque son los datos disponibles
P
Minimizar ni=1 |Xi Hi |2 equivale a maximizar
n
X
|OHi |2
i=1
.
Como las filas del Xu son las proyecciones de las filas de Xi sobre
u, entonces:
n
X
maximizar |OHi |2 = (Xu)0 Xu = maximizar u 0 X 0 Xu (1)
i=1
sujeto a la restricción u 0 u = 1.
JCorzo ACP
X como un conjunto de
p variables en Rn
JCorzo ACP
X como un conjunto de p variables en Rn
u 0 X 0 Xu − λu 0 u = u 0 (X 0 Xu − λu) = 0
donde λ es el multiplicador.
Una solución para u 6= 0 implica resolver el sistema:
X 0 Xu = λu (2)
JCorzo ACP
X como un conjunto de p variables en Rn
JCorzo ACP
X como un conjunto de p variables en Rn
JCorzo ACP
X como un conjunto de
n objetos en Rp
JCorzo ACP
X como un conjunto de n objetos en Rp
XX 0 v = µv (3)
JCorzo ACP
X como un conjunto de n objetos en Rp
X 0 X (X 0 v ) = µ(X 0 v ) (5)
de manera que ahora (X 0 v ) es un vector propio de X 0 X con
respecto al valor propio µ de XX 0 .
Entonces como λ es el mayor valor propio de X 0 X , necesariamente
λ ≥ µ, de lo cual se concluye que
λ=µ
JCorzo ACP
X como un conjunto de n objetos en Rp
JCorzo ACP
Equivalencias entre análisis por filas y análisis por columnas
Rp (variables) Rn (objetos)
X 0 Xu = λu XX 0 v = µv
XX 0 (Xu) = λ(Xu) X 0 X (X 0 v ) = µ(X 0 v )
Xu es v. p. de XX 0 resp a λ || X 0 v es v. p. de X 0 X resp a µ
µ≤λ µ≥λ
µ=λ
JCorzo ACP
Relación entre los análisis de
variables y de objetos:
paso de Rp a Rn y viceversa
Relaciones de transición
JCorzo ACP
Relación entre los análisis de variables y de objetos: paso
de Rp a Rn y viceversa
Sea vα = Xuα el vector propio de XX 0 con respecto al valor propio
λα Entonces por (2) la norma de vα es uα0 X 0 Xuα = λα . Por tanto
el vector propio normado es:
1
vα = √ Xuα (6)
λα
y de manera análoga
1
uα = √ X 0 vα (7)
λα
(6) y (7) se llaman ecuaciones de transición. Y
ψα = Xuα se llama el α-ésimo factor sobre Rp (8)
0 n
ϕα = X vα se llama el α-ésimo factor sobre R (9)
JCorzo ACP
Reconstrucción de la matriz X
JCorzo ACP
Reconstrucción de la matriz X
JCorzo ACP
Representación simultánea de objetos y variables (Biplots)
JCorzo ACP
Propiedades de los componentes principales
Su = λu (14)
JCorzo ACP
Propiedades de los componentes principales
Análisis de la matriz de covarianzas
Para cualquier valor propio λ y cualquier vector propio u de S se
calcula la componente principal:
Z = Xu. (15)
Entonces, dado que las variables están centradas
1 0 1
m(Z ) = Z 1 = u 0 X 0 1 = u 0 m(X ) = 0
n n
y
1 0 1
v (Z ) = Z Z = u 0 X 0 Xu = u 0 Su (16)
n n
Ahora utilizando el hecho de que Su = λu y debido a que u 0 u = 1
se obtiene: u 0 Su = λ y por tanto:
v (Z ) = λ (17)
JCorzo ACP
Propiedades de los componentes principales
Y 0 Yu = λu implica u 0 Y 0 Yu = λ (18)
y por tanto definiendo la componente principal por Z = Yu su va-
rianza es nuevamente:
1 0
v (Z ) = Z Z = u 0 Y 0 Yu = λ
n
JCorzo ACP
Propiedades de los componentes principales
JCorzo ACP
Propiedades de los componentes principales
Covarianzas y correlaciones entre los factores y las variables
Sean λα y uα valor y vector propio de S, de manera que Suα = λα uα
y sea además Zα = Xuα la componente principal definida por uα .
Entonces las covarianzas entre Zα y las p variables se encuentran en
el vector:
1 0 1 1
Cov (Zα ; X ) = Z X = (Xuα )0 X = uα0 X 0 X = uα0 S = λα uα0
n α n n
Con las covarianzas se calcula la correlación entre el factor y la j-
ésima variable se calculan como es usual:
√
cov (Zα , xj ) λα uαj λα
Corr (Zα ; xj ) = p =q = uαj
Var (Zα )Var (xj ) λα sj2 sj
Ejemplo
Cálculo de las componentes principales para el archivo que contiene
los indicadores de # de docentes de tiempo completo o equivalente
de 32 universidades públicas para los años 2008 y 2009.
Dicho archivo es parte del archivo general del Sistema de
Universidades Estatales SUE.
JCorzo ACP
Ejemplo Indicadores SUE
JCorzo ACP
Continuación Ejemplo Indicadores SUE
JCorzo ACP
Ejemplo Indicadores SUE
JCorzo ACP
Continuación Ejemplo Indicadores SUE
JCorzo ACP
Continuación Ejemplo Indicadores SUE
JCorzo ACP
Continuación Ejemplo Indicadores SUE
JCorzo ACP
Interpretación del Biplot
JCorzo ACP
Biplot Universidades DTCE 2008 - 2009
JCorzo ACP
Continuación Ejemplo Indicadores SUE
Docentes TCE con doctorado.
JCorzo ACP
Individuos y Variables Ilustrativas
JCorzo ACP
Individuos y Variables Ilustrativas
JCorzo ACP
Individuos y Variables Ilustrativas
(X + )0 vα
JCorzo ACP
UN y U de Antioquia como Individuos Complementarios
Se retiran UN y U de Antioquia para explorar si es posible identificar
algún otro aspecto que haga diferencias entre las instituciones.
JCorzo ACP
UN y U de Antioquia como Individuos Complementarios
JCorzo ACP
UN y U de Antioquia como Individuos Complementarios
Todas las universidades Sin UN y U de Antioquia
Plano 1 y 2
JCorzo ACP
UN y U de Antioquia como Individuos Complementarios
Plano 2 y 3
En el plano 2-3 se aprecia
claramente que las categorı́as que
parecı́an mezcladas en el plano
1-3 realmente se encuentran
opuestas.
JCorzo ACP
UN y U de Antioquia como Individuos Complementarios
Valores Propios 1 y 3
Las universidades Nacional y de
Antioquia están proyectadas
como objetos ilustrativos.
Se observa cómo la del Valle y la
UIS se orientan ligeramente en la
dirección de las ilustrativas
indicando la relación existente
entre los indicadores de docentes
con doctorado y con maestrı́a.
JCorzo ACP
UN y U de Antioquia como Individuos Complementarios
JCorzo ACP
Código para calcular las componentes:
Biblioteca requerida para el cálculo de las componentes
library(FactoMineR)
library(TeachingDemos)
library(tkrplot)
JCorzo ACP
Preparación de la base para los cálculos
Recuperar nombres de filas que están en la primera columna
de la tabla:
NombresUnis=base[,1]
JCorzo ACP
Algunos Gráficos de Interés
plot(baseFinal) # grafica la matriz de dispersión
de todos los pares de variables
for (k in 1:3){
for(l in 1:3){
plot(baseFinal[,k],baseFinal[,l], xlab=names(baseFinal)[k],
ylab=names(baseFinal)[l])
title("dispersión")
text(baseFinal[,k],baseFinal[,l],NombresUnis)
}
}
JCorzo ACP
Algunos Gráficos de Interés
#histogramas de las variables
par(mfrow=c(3,3))
for (j in 1:9){ #
hist(baseFinal[,j], main=paste("histograma")) }
# cálculo de las componentes
par(mfrow=c(1,1))
JCorzo ACP
El archivo pcaTODAS contiene la siguiente información
Name Description
1 ”$eig” ”eigenvalues”
2 ”$var” results for the variables”
3 ”$var$coord” ”coord. for the variables”
4 ”$var$cor” ”correlations variables - dimensions”
5 ”$var$cos2” ”cos2 for the variables”
6 ”$var$contrib” ”contributions of the variables”
7 ”$ind” results for the individuals”
8 ”$ind$coord” ”coord. for the individuals”
9 ”$ind$cos2” ”cos2 for the individuals”
10 ”$ind$contrib” ”contributions of the individuals”
11 ”$call” ”summary statistics”
12 ”$call$centre” ”mean of the variables”
13 ”$call$ecart.type” ”standard error of the variables”
14 ”$call$row.w” ”weights for the individuals”
15 ”$call$col.w” ”weights for the variables”
JCorzo ACP
Ejercicios del Capı́tulo
JCorzo ACP
Ejercicios del Capı́tulo
JCorzo ACP