Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Objetivo:
Transformar un conjunto de variables en un nuevo conjunto, componentes
principales, incorrelacionadas entre sí. Se consigue una representación
simplificada, más sencilla y fácil de ver.
Metodología:
Los datos se presentan en una tabla rectangular con n líneas (individuos) y p
columnas (variables) (matriz R, nxp). Puede ser disimétrica y con variables
heterogéneas. Hay dos espacios:
Rp : n individuos con los valores que toman para cada una de las p variables.
Rn : p variables para cada individuo.
Finalidad:
1
Agrupación de Variables
2
MATRIZ DE DATOS
Cálculo de medias y
desviaciones típicas
R =X´X
MATRIZ DE CORRELACIONES
Diagonalización de R, cálculo de
valores propios, varianza
explicada y correlaciones
COMPONENTES PRINCIPALES
3
Resumen
4
CASO:
Posicionamiento de turistas en Tenerife
Metodología:
5
Datos. Medianas
Nacionalidad Nº Nº visitas Gasto Edad
Noches anteriores noche/persona
Alemana 14,00 ,00 76,6290 42,00
Austriaca 7,00 ,00 35,7452 33,00
Belga 7,00 1,00 46,2028 35,00
Británica 14,00 2,00 37,5633 39,00
Española 7,00 ,00 85,8589 31,00
Europa exc 7,00 ,00 41,7811 24,50
Finlandesa 32,00 50,00 46,9541 73,00
Francesa 7,00 ,00 75,1265 38,00
Holandesa 14,00 ,00 18,9410 26,00
Italiana 7,00 ,00 72,9800 28,00
R. América 29,00 1,00 19,1990 22,50
R. Europa 7,00 ,00 89,0786 34,00
R. mundo 6,00 ,00 117,9486 30,00
Sueca 7,00 ,00 123,5552 30,00
Suiza 7,00 ,00 80,3639 37,00
Tabla de datos:
Matriz con 15 filas, correspondientes a las nacionalidades, y 4
columnas, correspondientes a las 4 variables. Dentro, medianas
6
SPSS
Analizar Reducción de Dimensiones Factor
7
Elección del numero de ejes
Criterio de la media aritmética:
p
Si las variables originales están tipificadas, λ j p , por lo que la media
de la inercia es igual a 1. Se retendrán losj1factores cuya inercia sea
mayor que 1.
8
Resultados ACP 1
Estadísticos descriptivos más importantes de las variables utilizadas
9
Resultados ACP 2
10
Resultados ACP 3
La adecuación de los datos al análisis factorial de componentes principales se contrasta
mediante KMO y prueba de Bartlett
11
Resultados ACP 4
KMO:
Estadístico de prueba de la hipótesis de que las correlaciones parciales entre las
variables son pequeñas. Indica la proporción de varianza de las variables originales que
es común, y que podría ser explicada por factores subyacentes. Valores cercanos a 1: un
análisis factorial puede ser útil para los datos. Valores menores de 0,5: los resultados
probablemente no sean muy útiles.
rij2
i j
KMO rij : coeficiente de correlación lineal de Pearson entre las variables i,j
rij2 a ij2
i j i j aij: coeficiente de correlación parcial entre las variables i,j
KMO = 0,6: Los datos muestran ser adecuados para el análisis ACP.
12
Resultados ACP 5
Matrices anti-imagen
13
Resultados ACP 6
Comunalidades
Inicial Extracción
Nº Noches 1,000 ,835
Nº vis itas anteriores 1,000 ,954
Edad del turista 1,000 ,918
Gas to por pers ona y día 1,000 ,926
Método de extracción: Anális is de Componentes principales .
14
Resultados ACP 7
Varianza total explicada
Las tres primeras columnas se refieren a la solución inicial, y hay tantos valores como
componentes o factores posibles.
Total: Cantidad de varianza explicada por cada componente en las variables observadas.
“% de varianza”: Porcentaje de varianza explicada por las componentes.
“% de varianza acumulado”: Porcentaje acumulado de varianza explicada por la componente
correspondiente y las anteriores.
En nuestro caso los dos primeros factores consiguen explicar prácticamente el 91% de la
varianza de las variables originales, lo que indica un buen modelo factorial.
También se muestran las cantidades de varianza explicada por cada factor extraído una vez
realizada la rotación de los mismos. En ese caso, el factor 1 explica más del 56% de la
varianza, mientras que el segundo factor explica el 34.63%.
15
Resultados ACP 8
Matriz de componentesa
Matriz de casos
Componente
1 2 Nacionalidad F1 F2
Nº vis itas anteriores ,943 ,254 Alemana 0,142 0,380
Nº Noches ,860 -,309
Austriaca -0,201 -0,666
Edad del turista ,848 ,447
Gas to por pers ona y día -,404 ,873 Belga -0,167 -0,331
Método de extracción: Análisis de componentes principales . Británica 0,309 -0,619
a. 2 componentes extraídos
Española -0,505 0,466
Europa excomunista -0,471 -0,805
Cargas factoriales para cada variable
Finlandesa 3,374 0,988
sobre las componentes no rotadas.
Cada valor representa la correlación Francesa -0,254 0,443
16
Resultados ACP 9
Correlaciones reproducidas y residuos
Patrón predictivo de las relaciones. Si la solución es correcta, las correlaciones
reproducidas están próximas a los valores observados, Los residuos indican la
diferencia entre valores reproducidos y observados. La mayoría de estos valores
deberán ser pequeños.
Correlaciones reproducidas
a. Hay 3 (50,0%) residuales no redundantes con valores absolutos mayores que 0,05.
Los valores residuales son pequeños. La bondad del modelo factorial estimado es
bastante alta 17
Resultados ACP 10
Matriz de coeficientes para el cálculo de las
puntuaciones en las componentes
Componente
1 2
Nº Noches ,189 -,397
Nº vis itas anteriores ,437 ,040
Edad del turista ,477 ,211
Gas to por pers ona y día ,194 ,771
Método de extracción: Análisis de componentes principales .
Valores utilizados para el cálculo de las puntuaciones para cada caso. Para cada
nacionalidad, la puntuación factorial se calcula multiplicado los valores de la variable
por los coeficientes de la puntuación factorial.
18
Gráfico ACP: Diagrama de dispersión
19
Rotación de los ejes: Procedimientos
Objetivo:
Obtener nuevos factores más fáciles de interpretar. Cada variable original
tendrá una correlación lo más próxima a 1 con uno de los factores y lo más
próximas a 0 con el resto. Cada factor tendrá correlación alta con un grupo de
variables y baja con el resto.
Componente
1 2
Nº vis itas anteriores ,960 -,182
Edad del turista ,958 ,033
Gas to por pers ona y día ,017 ,962
Nº Noches ,640 -,652
Método de extracción: Análisis de componentes principales .
Explicación:
Componente 1: Los turistas de más edad son los que más veces han repetido
visita a Tenerife, y los que más alargan su estancia durante sus vacaciones.
Componente 2: Los que más gastan por persona y día son los que menor
tiempo de estancia tienen.
21
Resultados Rotación VARIMAX 2
MATRIZ DE CASOS ROTADOS Factor 1:
Nacionalidad F1 F2
Cuadrante positivo:
Alemana 0,293 0,280
Nacionalidades: Finlandesa, Alemana y
Austriaca -0,471 -0,512 Británica.
Belga -0,294 -0,226 Nº visitas anteriores, edad, nº noches
Cuadrante negativo:
Británica 0,008 -0,692
Nacionalidades: Resto
Española -0,252 0,640
Europa excomunista -0,775 -0,520 Factor 2:
Finlandesa 3,467 -0,580
Cuadrante positivo:
Francesa -0,036 0,510
Nacionalidades: Alemana, Española, Francesa,
Holandesa -0,691 -1,370 Italiana, Resto de Europa, Resto del Mundo,
Italiana -0,449 0,281 Sueca y Suirza.
Gasto noche persona
Resto América -0,454 -2,142
Cuadrante negativo:
Resto Europa -0,112 0,769 Nacionalidades: Resto.
Resto mundo -0,123 1,430 Nº noches
Sueca -0,067 1,515
Suiza -0,044 0,616
22
Gráfico ACP rotado: Diagrama de dispersión
23