Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Massimizzare la varianza è un concetto che si utilizza in diversi ambiti, tra cui l’analisi
delle componenti principali (PCA). In questo contesto, massimizzare la varianza significa
calcolare il peso da attribuire ad ogni variabile di partenza per poterle concentrare in una o
più nuove variabili (dette componenti principali) che saranno combinazione lineare delle
variabili di partenza . 1
Un esempio
Immagina di avere un sacco di giocattoli diversi e di volerli mettere tutti insieme in una scatola più piccola.
Se prendi i giocattoli che sono simili tra loro e li metti insieme, avrai meno scatole e potrai ancora giocare
con tutti i tuoi giocattoli preferiti! Massimizzare la varianza è come cercare di mettere il maggior numero di
giocattoli simili insieme nella stessa scatola.
>> help pca
pca Principal Component Analysis (pca) on raw data.
COEFF = pca(X) returns the principal component coefficients for the N
by P data matrix X. Rows of X correspond to observations and columns to
variables. Each column of COEFF contains coefficients for one principal
component. The columns are in descending order in terms of component
variance (LATENT). pca, by default, centers the data and uses the
singular value decomposition algorithm. For the non-default options,
use the name/value pair arguments.
[COEFF, SCORE] = pca(X) returns the principal component score, which is
the representation of X in the principal component space. Rows of SCORE
correspond to observations, columns to components. The centered data
can be reconstructed by SCORE*COEFF'.
Example:
load hald;
[coeff, score, latent, tsquared, explained] = pca(ingredients);
See also ppca, pcacov, pcares, biplot, barttest, canoncorr, factoran,
rotatefactors.