Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
open in browser PRO version Are you a developer? Try out the HTML to PDF API pdfcrowd.com
Obsrvese que cada conjunto
puede considerarse una muestra aleatoria para la variable . A partir de los datos
correspondientes a las m variables aleatorias, puede construirse la matriz de correlacin muestral,
que viene definida por:
Puesto que la matriz de correlaciones es simtrica entonces resulta diagonalizable y sus valores
propios verifican:
Debido a la propiedad anterior estos m valores propios reciben el nombre de pesos de cada uno
de los m componentes principales. Los factores principales identificados matemticamente se
representan por la base de vectores propios de la matriz . Est claro que cada una de las
variables puede ser expresada como combinacin lineal de los vectores propios o componentes
principales.
open in browser PRO version Are you a developer? Try out the HTML to PDF API pdfcrowd.com
ello la matriz de covarianza.
Se parte de un conjunto n de muestras cada una de las cuales tiene m variables que las
describen y el objetivo es que, cada una de esas muestras, se describa con solo I variables,
donde l < m. Adems, el nmero de componentes principales l tiene que ser inferior a la menor de
las dimensiones de X.
Los datos para el anlisis tienen que estar centrados a media 0 (restndoles la media de cada
columna) y/o autoescalados(centrados a media 0 y dividiendo cada columna por su desviacin
estndar).
Los vectores son conocidos como scores y contienen la informacin de cmo las muestras
estn relacionadas unas con otras adems, tienen la propiedad de ser ortogonales. Los vectores
se llaman loadings e informan de la relacin existente entre las variables y tienen la cualidad de
ser ortonormales. Al coger menos componentes principales que variables y debido al error de
ajuste del modelo con los datos, se produce un error que se acumula en la matriz .
open in browser PRO version Are you a developer? Try out the HTML to PDF API pdfcrowd.com
Donde es el valor propio asociado al vector propio . Por ltimo,
Esta ecuacin la podemos entender como que son las proyecciones de X en , donde los
valores propios miden la cantidad de varianza capturada, es decir, la informacin que
representan cada uno de los componentes principales. La cantidad de informacin que captura
cada componente principal va disminuyendo segn su nmero es decir, el componente principal
nmero uno representa ms informacin que el dos y as sucesivamente.
Limitaciones [editar]
Suposicin de linealidad: Se asume que los datos observados son combinacin lineal de una
cierta base.
Importancia estadstica de la media y la covarianza: el ACP utiliza los vectores propios de la
matriz de covarianzas y slo encuentra las direcciones de ejes en el espacio de variables
considerando que los datos se distribuyen de manera gaussiana.
Ejemplos [editar]
Referencia [editar]
Se edit esta pgina por ltima vez el 9 sep 2016 a las 18:38.
El texto est disponible bajo la Licencia Creative Commons Atribucin Compartir Igual 3.0; pueden aplicarse clusulas adicionales.
Al usar este sitio, usted acepta nuestros trminos de uso y nuestra poltica de privacidad.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una organizacin sin nimo de lucro.
open in browser PRO version Are you a developer? Try out the HTML to PDF API pdfcrowd.com