Analisis Factorial2

Mintab V15 Módulo 10. Estadística Multivariada P. Reyes / Nov.
2007
MINITAB 15 MÓDULO 9. ESTADISTICA MULTIVARIADA
9. Estadística Multivariada
Se usa el archivo IBEROAMERICA.MTW de indicadores sociales de los 22 países
iberoamericanos de 1998.
Componentes principales:
Calcula nuevas variables ("Componentes") en función de las variables disponibles

que sintetizan la información que estas contienen. Estas pocas variables vitales son las
que mejor explican el comportamiento de los datos.
Stat > multivariate > Principal components
Todas
Número de componentes principales

(5)
En Scores se almacenan las

coordenadas de cada observación
(país) en los ejes de los componentes
principales
Componentes: Primero C13, segundo C14, tercero C15
Los valores propios o eigenvalores representan la proporción de la variabilidad total

explicada por ese componente.
Principal Component Analysis: Población (m, Superficie (, % menores 15, Esperan
Eigenanalysis of the Correlation Matrix
Eigenvalue 5.5117 2.0441 1.4691 0.8631 0.5554 0.2638 0.1386 0.0660
Proportion 0.501 0.186 0.134 0.078 0.050 0.024 0.013 0.006
Cumulative 0.501 0.687 0.820 0.899 0.949 0.973 0.986 0.992
Eigenvalue 0.0475 0.0350 0.0056
Proportion 0.004 0.003 0.001
Cumulative 0.996 0.999 1.000
Página 1 de 45
Mintab V15 Módulo 10. Estadística Multivariada P. Reyes / Nov. 2007
Valores propios asociados a cada componente principal
Valores propios = 5.5117 + 2.0441 + 1.4691 + ........... + 0.0056 = 11

Proporción = 50.1% + 18.6% + ...... + 0.001 = 100%
Abajo se presenta la aportación de cada variable a cada compenente principal:
Variable PC1 PC2 PC3 PC4 PC5
Población (miles) 0.016 0.667 El segundo componente
Superficie (km2) 0.024 0.679 está relacionado
% menores 15 años 0.398 0.076 con el tamaño del país
Esperanza vida al nacer 0.358 0.157 0.140 0.125 0.564
Tasa de mortalidad infan 0.370 0.162 0.111 0.096 0.487
Teléfonos por 1.000 hab 0.387 0.033 0.010 0.266 0.320
Usuarios Internet por 1000 hab 0.310 0.030 0.053 0.625 0.045
PIB $/hab 0.380 0.085 0.018 0.235 0.352
% PIB Agricultura 0.334 0.093 0.062 0.561 0.330
% PIB Industria 0.272 0.122 0.555 0.314 0.067
% PIB Servicios 0.019 0.066 0.791 0.197 0.228
El primer componente esta El tercero está centrado en la

formado por aportaciones distribución del PIB y servicios
de las variables ligadas al
desarrollo
Gráfica de Pareto de los valores propios que permite visualizar la importancia de cada
uno de los componentes
Scree Plot of Población (miles), ..., % PIB Servicios La primera componente representa el 50%
6 y la segunda el 18.6% de la variación total
5
4
Eigenvalue
0
La siguiente
1 2 gráfica
3 4representa
5 6 cada
7 8una 9de las
10 observaciones
11 (países) en las
Component Number
coordenadas de los dos primeros componentes. Para identificar a que país corresponde
cada punto puede usarse la opción de Brush.
Página 2 de 45
TAMAÑO
DESARROLLO
Agregando etiquetas a cada punto, seleccionar la gráfica y:
Add > Data Labels: Use Labels from Column: Pais
Score Plot of Población (miles), ..., % PIB Servicios

6 Brasil
4
Second Component
2 México
Argentina
1
Perú
Bolivia España
C olombia Venezuela
0 Ecuador Portugal
Guatemala Chile
C uba Puerto Rico
Rep.ador
El Salv Dominicana
Nicaragua Paraguay
Honduras Uruguay
PanamáCosta Rica
-1
-2
-4 -3 -2 -1 0 1 2 3 4 5
First Component
No siempre se le puede dar un nombre a los componentes

La siguiente gráfica muestra las variables en las coordenadas que corresponden
a sus valores en las dos componentes principales.
Loading Plot of Población (miles), ..., % PIB Servicios

0.7 Superficie (km2)
Población (miles)
0.6
0.5
Second Component
0.4
0.3
0.2
Tasa de mortalidad infan
% PIB Industria
PIB $/hab
0.1
0.0 Usuarios Internet por 1000 hab

% menores 15 años % PIB Servicios
Teléfonos por 1.000 hab
-0.1
% PIB Agricultura
Esperanza vida al nacer
-0.2
-0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4
Desarrollo
La tercera componente que explica el 1.34% de la variabilidad, está relacionada con
Página 3 de 45
la distribución del PIB en la industria y servicios, se puede obtener la gráfica de la

tercera vesus la primera componente como sigue:
Scatterplot of C15 vs C13

3
Panamá
1er
México
2
Colombia
Tercer Componente
Uruguay
Costa Rica Argentina
1 Chile
El Salvador España
Guatemala
Paraguay
0 Brasil
Rep. Dominicana
Perú
Bolivia
Ecuador Puerto Rico
-1 Nicaragua Honduras
Venezuela
Cuba
Portugal
-2
Si se guardan
-4 -3 previamente
-2 -1 0 los1 coeficientes
2 3 de
4 las
5 variables y después se
grafican en una grafica Primer Componente
de dispersión, se pueden btener gráficas de un tercer componente
vesrus el primero, haciendo una columna con los títulos de las variables para usarse como
títulos en los puntos de una gráfica de dispersión, como sigue:
Columna de Pais
variables Población (miles)
Superficie (km2)
% menores 15 años
Teléfonos por 1.000 hab
Usuarios Internet por 1000 hab
PIB $/hab
% PIB Agricultura
% PIB Industria
% PIB Servicios
Scatterplot of C18 vs C16

% PIB Industria
0.75
0.50
0.25
Pais % menores 15 años
C18
Superficie (km2) Usuarios Internet por 1000 hab

0.00 PIB $/hab Población (miles) Teléfonos por 1.000 hab
Esperanza v ida al nacer
-0.25
-0.50 % PIB Agricultura
-0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4

C16
Para agregar líneas a la gráfica, insertar celdas de ceros en las columnas corresponientes a los
coeficientes del tercer y primer componentes (entre cada una de sus celdas):
Seleccionar la gráfica y agregar líneas con: Add > Calculated Line; Y tercer comp; X primer comp
Página 4 de 45
Comp 1 Comp 3
0.0156420 0.1498280
0.0000000 0.0000000
-0.0238230 0.0764970
0.0000000 0.0000000 Scatterplot of Comp 3 vs Comp 1
-0.3978570 0.0080330 % PIB Industria
0.0000000 0.0000000 0.75
0.3576520 0.1395810
0.50
0.0000000 0.0000000
Servicios Industrai
-0.3701140 -0.1109600
0.25
0.0000000 0.0000000 Pais % menores 15 años
Población (miles) Teléfonos por 1.000 hab
0.3873530 0.0098170 Superficie (km2)
0.00 Usuarios Internet por 1000 hab
0.0000000 0.0000000 PIB $/hab
Esperanza v ida al nacer
0.3095390 0.0527510
-0.25
0.0000000 0.0000000
0.3799270 0.0179240 -0.50 % PIB Agricultura
0.0000000 0.0000000
-0.3335910 -0.0616860 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4
Desarrollo
0.0000000 0.0000000
0.2722960 -0.5545960
0.0000000 0.0000000
0.0191980 0.7907320
0.0000000 0.0000000
Análisis factorial
Usar el análisis factorial para resumir la estructura de covarianza de los datos en unas
mínimas dimensiones. Aquí el enfasis es la identificación de factores "relevantes" que
puedan explicar las dimensiones asociadas con la variabilidad grande de los datos.
1. Método de los componentes principales

Se registran las siguientes características de 14 registros de censo:
- Población total (Pop)
- Mediana de educación escolar (School)
- Empleo total (Employ)
- Empleo en servicios de salud (Health)
- Mediana de valor de casa (Home)
Se trata de investigar que "factores" explican la mayor parte de la variabildiad.

Como primer paso se usa el análisis de componentes para examinar la gráfica de los eigenvalores
(scree plot) para decidir sobre el número de factores a considerar.
1 File > Open worksheet EXH_MVAR.MTW.

2 Stat > Multivariate > Factor Analysis.
3 En Variables, seleccionar Pop-Home.
4 Click Graphs y seleccionar Scree plot. Click OK cada cuadro de diálogo.
Los resultados se muestran a continuación:

Factor Analysis: Pop, School, Employ, Health, Home
Principal Component Factor Analysis of the Correlation Matrix
Unrotated Factor Loadings and Communalities
Variable Factor1 Factor2 Factor3 Factor4 Factor5 Communality
Pop 0.972 0.149 0.006 0.170 0.067 1.000
School 0.545 0.715 0.415 0.140 0.001 1.000
Employ 0.989 0.005 0.089 0.083 0.085 1.000
Health 0.847 0.352 0.344 0.200 0.022 1.000
Página 5 de 45
Home 0.303 0.797 0.523 0.005 0.002 1.000
Variance 3.0289 1.2911 0.5725 0.0954 0.0121 5.0000
% Var 0.606 0.258 0.114 0.019 0.002 1.000
Factor Score Coefficients
Variable Factor1 Factor2 Factor3 Factor4 Factor5
Pop 0.321 0.116 0.011 1.782 5.511
School 0.180 0.553 0.726 1.466 0.060
Employ 0.327 0.004 0.155 0.868 6.988
Health 0.280 0.272 0.601 2.098 1.829
Home 0.100 0.617 0.914 0.049 0.129
Scree Plot of Pop, ..., Home
3.0
2.5
2.0
Eigenvalue
1.5
1.0
0.5
0.0
1 2 3 4 5
La proporción de la varianza explicada por los últimos dos factores es mínima (0.019, 0.002)
Factor Number
y se pueden eliminar. Los primeros dos factores reunen el 86% de la variabilidad y con tres factores
se explica el 98% de la vairabilidad. Por tanto queda por decidir si usar el modelo con 2 o 3 factores.
Con un análisis de dos o tres factores por separado, se examinan las comunalidades para ver como
se representan las variables individuales. Si hay alguna no bien representada por el modelo de dos
factores, se puede seleccionar un modelo de tres o más factores.

2 Stat > Multivariate > Factor Analysis.
3 En Variables, seleccionar Pop-Home.
4 En Number of factors to extract, poner 2.
5 En Method of Extraction, seleccionar Maximum likelihood.
6 Enr Type of Rotation, seleccionar Varimax.
7 Click Graphs y seleccionar Loading plot for first 2 factors.
8 Click Results y seleccionar Sort loadings. Click OK en cada cuadro de diálogo.
Factor Analysis: Pop, School, Employ, Health, Home
Maximum Likelihood Factor Analysis of the Correlation Matrix
* NOTE * Heywood case
Ocurre en el análisis factorial caundo el método de estimación por máxima verosimilitud converge
Página 6 de 45
a valores de varianza únicos (específicos) menores a un límite inferior preestablecido, en este

caso es 0 con comunalidad de 1.
Unrotated Factor Loadings and Communalities
Variable Factor1 Factor2 Communality
Pop 0.971 0.160 0.968
School 0.494 0.833 0.938
Employ 1.000 0.000 1.000
Health 0.848 0.395 0.875
Home 0.249 0.375 0.202
Variance 2.9678 1.0159 3.9837
% Var 0.594 0.203 0.797
Rotated Factor Loadings and Communalities
Varimax Rotation
Loading Plot of Pop, ..., Home
Pop 0.718 0.673 0.968
1.0 School
School 0.052 0.967 0.938
Employ 0.831 0.556 1.000 0.8
Health 0.924 0.143 0.875 Pop
Home 0.415 0.173 0.202
Second Factor
0.6 Employ
Variance 2.2354 1.7483 3.9837 0.4
% Var 0.447 0.350 0.797
Variance 2.2354 1.7483 3.9837 0.2 Home
Health
% Var 0.447 0.350 0.797
0.0
Factor Score Coefficients En la gráfica, el factor 1 -0.50 -0.25

tiene alta 0.00
ponderación 0.25
en Pop,0.50
First Factor
0.75 1.00
Variable Factor1 Factor2 Employ y Health y ponderación negativa en Home.

Pop 0.165 0.246 Pudiera nombrarse "health care - population size".
School 0.528 0.789
Employ 1.150 0.080 El factor 2 tiene una alta ponderación positiva en School.
Health 0.116 0.173 Pudiera nombrarse "education - popùlation size"
Home 0.018 0.027
Los resultados indican que se trata de un caso Heywood. Hay tres tablas de ponderaciones
y comunalidades: no rotada, rotada y ordenada y rotada. Los factores no rotados explican el 79.7%
de la variabilidad de los datos (ver última línea de comunalidad) y los valores de la comunalidad
indican que los valores indicados por las variables sin Home están bien representadas por los estos
dos factores (comunalidades de 0.202 para Home y 0.0875 a 1 para las otras). El porcentaje de
la variabilidad total representada por los factores no cambia con la rotación, sin emabrgo después de la
rotación, los factores están más balanceados en el porcentaje de variabilidad que representan, con
el 44.7% y el 35% respectivamente.
Después de listan las ponderaciones de cada factor de manera ordenada.

Sorted Rotated Factor Loadings and Communalities
Health 0.924 0.143 0.875
Employ 0.831 0.556 1.000
Pop 0.718 0.673 0.968
Home 0.415 0.173 0.202
School 0.052 0.967 0.938
Minitab 15 Análisis de preguntas
Página 7 de 45
Se usa para evaluar con que confiabilidad varias preguntas en una encuesta miden el mismo constructo.
Se presentan varios tipos de estadísticos para determinar la confiabilidad en general y pregunta por
pregunta.
- El alfa de Cronbach mide el grado de consistencia interna para todas las preguntas incluidas.
Es una medida de consistencia interna. Siendo la consistencia interna uan evaluación de que tan
confiable es una encuesta o preguntas diseñadas para medir el mismo cosntructo, realmente lo hagan.
Un constructo es un tema relevante, o habilidad tal como comprensión de lectura o satisfacción del
cliente. Para aplicar las mediciones de consistencia interna, las preguntas generalmente se colocan
en un mismo instrumento y se aplican a un grupo de gente en una sola ocasión para evitar que
confundan las variables.
El alfa de Cronbach evalúa que tan confiablemente preguntas

de una encuesta diseñadas para medir el mismo constructo. Realmente lo hacen. Tiene valores
entre 0 y 1 donde valores altos sugieren alta consistencia. Como referencia se utiliza el valor de 0.7
para indicar que hay buena consistencia para evaluar el mismo constructo.
Por ejemplo, en un banco se quiere evaluar la satisfacción de sus clientes con oportunidad del servicio:
Se pide a 60 clientes a responder a las siguientes tres preguntas usando una escala de 1 a 5 para
indicar su nivel de acuerdo. 1-Muy satisfecho; 2-Insatisfecho; 3-Neutral; 4-Satisfecho; 5-Muy satisfecho
1 - Mi teléfono, email o carta de dudas fue constestada en un tiempo razonable.

2 - Estoy satisfecho con la oprtunidad del servicio proporcionado
3 - El tiempo que esperé para el servicio fue razonableMe gustaría recomendar la empresa a otros
4 - Estoy satisfecho con el servicio recibido
Si el alfa de Cronbach es alta, hay evidencia de que las preguntas miden el mismo constructo,
de otra forma, si su valor es bajo, las preguntas tiene poco en común y no son buenos indicadores
del mismo constructo.
1 File > Open worksheet CRONBACH.MTW.

Item 1 Item 2 Item 3 Item 4
1 1 2 4
4 3 4 2
4 2 4 2
4 5 5 2 Etcetera…
2 Stat > Multivariate > Item Analysis.

3 En Variables, seleccionar Item 1 - Item 4.
4 Click Graphs y seleccionar Matrix plot of data with smoother.
6 Click OK en cada cuadro de diálogo.
Results for: Cronbach.MTW

Item Analysis of Item 1, Item 2, Item 3, Item 4
Correlation Matrix
Item 1 Item 2 Item 3
Item 2 0.814
Matrix Plot of Item 1, Item 2, Item 3, Item 4
Item 3 0.795 0.789 5
Item 4 0.038 0.017 0.003
Item 2
Cell Contents: Pearson correlation
3
Página
5
8 de 45
Item 3
1
Mintab V15 Módulo 10.5 Estadística Multivariada P. Reyes / Nov. 2007
Item 2
3
Item and Total Statistics 1
5
Total
Variable Count Mean StDev 3
Item 3
Item 1 60 3.450 1.333
1
Item 2 60 3.383 1.415 5
Item 3 60 3.317 1.255
Item 4
3
Item 4 60 2.167 0.827
Total 60 12.317 3.83 En la1 gráfica de correlaciones, los items 1, 2 y 3 tienen una
1 3 5 1 3 5 1 3 5
correlación positiva,
Item 1 mientrasItemque
2 el 4o. No laItemtiene.
3
Cronbach's Alpha = 0.7853 > 0.7

Sugiere que algunos items miden el mismo constructo
Omitted Item Statistics
Adj. Squared
Omitted Adj. Total Total ItemAdj. Multiple Cronbach's
Variable Mean StDev Total Corr Corr Alpha
Item 1 8.867 2.665 0.818768 0.725307 0.599499
Item 2 8.933 2.603 0.802999 0.717877 0.606279
Item 3 9.000 2.768 0.785333 0.691912 0.625996
Item 4 10.150 3.727 0.019250 0.004488 0.921674
De esta tabla se observa que el Item 4 tiene valores bajos de correlación, y si se omite se incrementa
el valor del alfa de Cronbach.
Por tanto solo las preguntas 1 a 3 miden la satisfacción del cliente en oportunidad de servicio, por lo
que la pregunta 4 se debe omitir o replantear.
Análisis de conglomerados (Clusters)

Se trata de distribuir las observaciones en grupos afines inicialmente no conocidos.
Ahora se trata de dividir los países en grupos similares (conglomerados) de acuerdo con la
información disponible:
1. File > Open worksheet IBEROAMERICA.MTW
2. Stat > Multivariate > Cluster observations
3. Linkage Method: Single Distance Measure: Euclidean Number of Clusters 3
4. Seleccionar Show Dendogram
5. En Storage poner C13 - Para tener identificado a que cluster corresponde cada observación
6. OK
Se muestra la secuencia de formación de Clusters, cada uno tiene un color diferente:
Dendrogram with Single Linkage and Euclidean Distance
81.25
Los Clusters se identifican fácilmente

87.50 ya que para cada uno las líneas son
Similarity
de diferente color
93.75
Fila del País
100.00
1 2 14 9 5 8 18 11 6 15 7 12 3 16 4 13 17 20 10 19 22 21
Observations Página 9 de 45
93.75
100.00
1 2 14 9 5 8 18 11 6 15 7 12 3 16 4 13 17 20 10 19 22 21
Con esto se puede hacer Observations
una gráfica de dispersión para analizar los clusters, por ejemplo para
Esperanza de vida y PIB por habitante se tiene:
Seleccionando la gráfica y editando los símbolos por grupos correspondientes a los clusters.
Scatterplot of Esperanza vida al nacer vs PIB $/hab

80 C luster
España 1
Costa Rica 2
C uba 3
Chile Portugal Puerto Rico
75
Panamá
Venezuela Uruguay Argentina
México
Rep. Dominicana
C olombia
Ecuador Paraguay
70 El Salvador
Nicaragua Perú Brasil
Honduras
65 Guatemala
Bolivia
60
Number of obs.
0 2000 4000 6000 8000 10000 12000 14000 16000
of Similarity Distance Clusters New in new
PIB $/hab
Step clusters level level joined cluster cluster
1 21 99.6131 54.06 2 14 Primer Cluster
2 20 99.4939 70.73 7 12 Segundo Cluster
3 19 99.2755 101.25 2 9 Tercer con 3
4 18 99.2675 102.37 2 5 observaciones 2, 14, 9
5 17 98.9909 141.02 8 18 etc..
6 16 98.9137 151.81 2 8 2 6
7 15 98.7540 174.12 3 16 3 2
8 14 98.7458 175.28 2 11 2 7
9 13 98.1957 252.15 6 15 6 2
10 12 97.9917 280.66 3 4 3 3
11 11 97.9498 286.51 2 6 2 9
12 10 97.2457 384.91 2 7 2 11
13 9 96.6741 464.79 13 17 13 2
14 8 95.7750 590.44 1 2 1 12
15 7 95.4151 640.73 1 3 1 15
16 6 94.7709 730.75 1 13 1 17
17 5 93.5426 902.41 1 20 1 18
18 4 87.1791 1791.70 19 22 Se forma un solo Cluster
19 3 85.3070 2053.32 10 19 al final
20 2 84.7016 2137.93 10 21 10 4
21 1 81.2502 2620.26 1 10 1 22
Number of clusters: 3
Within Average Maximum
cluster distance distance
Number of sum of from from
observations squares centroid centroid
Cluster1 18 36798918 1151.26 3319.75
Página 10 de 45
Cluster2 3 7382783 1319.42 1962.60
Cluster3 1 0 0.00 0.00
Cluster Centroids Grand
Variable Cluster1 Cluster2 Cluster3 centroid
% menores 15 años 34.50 23.0 16.0 32.09
Esperanza vida al nacer 70.59 74.5 77.9 71.45
Tasa de mortalidad infan 32.31 13.2 5.5 28.48
Teléfonos por 1.000 hab 78.78 284.3 385.0 120.73
Usuarios Internet por 1000 hab 2.78 8.0 31.0 4.77
PIB $/hab 2442.39 10251.0 14350.0 4048.45
% PIB Agricultura 14.09 2.9 5.9 12.19
% PIB Industria 29.71 43.6 37.8 31.96
% PIB Servicios 56.57 53.6 56.3 56.15
Distances Between Cluster Centroids
Cluster1 Cluster2 Cluster3
Cluster1 0.0 7811.37 11911.6
Cluster2 7811.4 0.00 4100.3
Cluster3 11911.6 4100.32 0.0
Ejemplo: Se trata de distribuir las variablies en grupos afines inicialmente no conocidos.
Otro ejemplo con el archivo COCHES.MTW
Stat > Multivariate > Cluster Variable

Linkage Method: Single Distance Measure: Correlation Number of Clusters 7
Seleccionar Show Dendogram
En Storage poner C13 - Para tener identificado a que cluster corresponde cada observación
OK
Dendrogram with Single Linkage and Correlation Coefficient Distance
59.47
72.98
Similarity
86.49
100.00
Cluster 1 formado por 6 variables afine Los otros 6 clusters se forman de una variable cada uno
indicados con un color diferente
Variables
Ejemplo:
Se hacen mediciones en cinco características nutricionales (proteinas, carbohidratos, grasas,
calorías, porcentaje de vitamina A) de 12 marcas de cereales. Utilizar el método de liga completa,
distancia euclidiana al cuadrado, y estandarización dado que las variables tienen diferentes unidades.
Se requiere un dendograma y asignación de diferentes líneas y colores para cada conglomerado.
Página 11 de 45
1 File > Open worksheet CEREAL.MTW.

2 Seleccionar Stat > Multivariate > Cluster Observations.
3 En Variables or distance matrix, seleccionar Protein-VitaminA.
4 En Linkage Method, seleccionar Complete y de Distance Measure sel. Squared Euclidean.
5 Seleccionar Standardize variables.
6 En Specify Final Partition by, seleccionar Number of clusters poner 4.
7 Seleccionar Show dendrogram.
8 Click Customize. En Title, escribir Dendrograma para datos de Cereal
9 Click OK en cada uno de los cuadros de diálogo.
Se muestra el proceso de amalgamiento de los clusters de forma detallada:
Cluster Analysis of Observations: Protein, Carbo, Fat, Calories, VitaminA
Standardized Variables, Squared Euclidean Distance, Complete Linkage
Amalgamation Steps
Number
of obs.
Number of Similarity Distance Clusters New in new
1 11 100.000 0.0000 5 12 5 2
2 10 99.822 0.0640 3 5 3 3
3 9 98.792 0.4347 3 11 3 4
4 8 94.684 1.9131 6 8 6 2
5 7 93.406 2.3730 2 3 2 5
6 6 87.329 4.5597 7 9 7 2
7 5 86.189 4.9701 1 4 1 2
8 4 80.601 6.9810 2 6 2 7
9 3 68.079 11.4873 2 7 2 9
10 2 41.409 21.0850 1 2 1 11
11 1 0.000 35.9870 1 10 1 12
Final Partition
Average Maximum
Within distance distance
Number of cluster sum from from
observations of squares centroid centroid
Cluster1 2 2.48505 1.11469 1.11469
Cluster2 7 8.99868 1.04259 1.76922
Cluster3 2 2.27987 1.06768 1.06768
Cluster4 1 0.00000 0.00000 0.00000
Cluster Centroids
Variable Cluster1 Cluster2 Cluster3 Cluster4 Grand centroid
Protein 1.92825 0.333458 0.20297 1.11636 0.0000000
Carbo 0.75867 0.541908 0.12645 2.52890 0.0000000
Fat 0.33850 0.096715 0.33850 0.67700 0.0000000
Calories 0.28031 0.280306 0.28031 3.08337 0.0000000
VitaminA 0.63971 0.255883 2.04707 1.02353 0.0000000
Página 12 de 45
Cluster1 Cluster2 Cluster3 Cluster4
Cluster1 0.00000 2.67275 3.54180 4.98961
Cluster2 2.67275 0.00000 2.38382 4.72050
Cluster3 3.54180 2.38382 0.00000 5.44603
Cluster4 4.98961 4.72050 5.44603 0.00000
Dendograma para datos de Cereal
0.00
33.33
Similarity
66.67
100.00
1 4 2 3 5 12 11 6 8 7 9 10
El dendograma muestra la información de la tabla de amalgamamiento en la forma de un diagrama
Observations
de árbol, los cereales 1 a 4 forman el primer conglomerado, los cereales 2,3,4,12,11,6 y 8 forman el
segundo; los cereales 7 y 9 forman el tercero y el cereal 10 forma el cuarto.
Conglomerado de variables
Se usa para clasificar variables en grupos, cuando no se conocen inicialmente y reducir su número.
Esta técnica puede proporcionar variables nuevas que sean más comprensibles que las obtenidas
del análisis de componentes.
El proceso es un método aglomerativo jerárquico que inicia con todas las variables por separado,
cada una formando su propio conglomerado. En el primer paso, las dos variables más cercanas se
reunen, después una tercera variable se junta a los dos anteriores, etc. El proceso continua hasta
tener un solo conglomerado o se le puede indicar con cuantos conglomerados termine.
Por ejemplo se trata de investigar el cambio de presión sanguinea a largo plazo en Peruanos que
emigran a las ciudades desde las montañas. Se toman 39 hombres mayores de 21 años.
El objetivo es reducir el número de variables regsitradas.
1 File > Open worksheet PERU.MTW.

Age Years Weight Height Chin Forearm Calf
21 1 71 1629 8 7 12.7
22 6 56.5 1569 3.3 5 8
24 5 56 1561 3.3 1.3 4.3
24 1 61 1619 3.7 3 4.3
25 1 65 1566 9 12.7 20.7
27 19 62 1639 3 3.3 5.7
Age Pulse Systol Diastol

21 88 170 76
22 64 120 60
Página 13 de 45
Continua.. 24 68 125 75
24 52 148 120
25 72 140 78
27 72 106 72 Etcetera…
2 Stat > Multivariate > Cluster Variables.

3 En Variables or distance matrix, seleccionar Age-Diastol.
4 En Linkage Method, seleccionar Average.
5 Seleccionar Show dendrogram. Click OK.

Cluster Analysis of Variables: Age, Years, Weight, Height, Chin, Forearm, ...
Correlation Coefficient Distance, Average Linkage
Amalgamation Steps
Number
of obs.
Number of Similarity Distance Clusters New in new
1 9 86.7763 0.264474 6 7 6 2
2 8 79.4106 0.411787 1 2 1 2
3 7 78.8470 0.423059 5 6 5 3
4 6 76.0682 0.478636 3 9 3 2
5 5 71.7422 0.565156 3 10 3 3
6 4 65.5459 0.689082 3 5 3 6
7 3 61.3391 0.773218 3 8 3 7
8 2 56.5958 0.868085 1 3 1 9
9 1 55.4390 0.891221 1 4 1 10
Dendrogram
Average Linkage, Correlation Coefficient Distance
55.44
70.29
Similarity
85.15
100.00
Si se pide una
Agepartición final,Systol
Years Weight se obtiene unaForearm
Diastol Chin lista deCalfvariables quedan en cada conglomerado.
Pulse Height
El dendograma sugiere variables que Variables
pueden ser combiandas con su total o proemdio. En este caso
Chin, Forearm y Calf skin se pueden combinar. La edad y año de migración también son similares.
El peso y las dos mediciones de presión sanguinea son similares, se decide dejar el peso por
separado y combinar las presiones.
Página 14 de 45
Conglomerado de K medias de observaciones

Sirve para clasificar observaciones en grupos cuando son desconocidos. Usa un procedimiento no
jerárquico de acuerdo a MacQueen. Este método trabaja mejor cuando hay información suficiente para
hacer asignaciones de conglomerados iniciales adecuadas.
Por ejemplo, se atrapan 43 osos. Se les mide su longitud total y longitud de cabeza, peso total y peso
de la cabeza, y diámetro de cuello y de naríz. Se desea clasificar a los 143 osos como pequeños,
medianos y grandes. Se sabe que el 2o., el 78 y el 15 están en las categorías 1, 2 y 3 respectivamente.
Se crea una columna de partición inicial con las tres categorías designadas como 1=pequeño,
2= mediano y 3= grande y los restantes 0=desconocida para indicar la membresía inicial.
Despúes se hace un análisis de congloemerados de K medias y se almacena la membresía en una +
columna denominada BearSize.
1 File > Open worksheet BEARS.MTW.
ID Age Month Sex Head.L Head.W Neck.G

39 19 7 1 10 5 15
41 19 7 2 11 6.5 20
41 20 8 2 12 6 17
41 23 11 2 12.5 5 20.5
41 29 5 2 12 6 18
43 19 7 1 11 5.5 16
43 20 8 1 12 5.5 17
Continuación.
ID Length Chest.G Weight Obs.No Name BearSize
39 45 23 65 1 Allen 1
41 47.5 24 70 1 Berta 1
41 57 27 74 2 Berta 1
41 59.5 38 142 3 Berta 2
41 62 31 121 4 Berta 2
43 53 26 80 1 Clyde 1
43 56 30.5 108 2 Clyde 1
2 Para crear la columna de partición inicial, seleccionar Calc > Make Patterned Data > Simple Set of Numbers.
3 En Store patterned data in, poner Initial como el nombre de la columna.
4 En ambos From first value y From last value, poner 0.
5 En List each value, poner 143. Click OK.
6 Ir a Data window y poner 1, 2, y 3 en el segundo, setenta y ochoavo y quinceavao renglones de la columna Initial.
7 Selecionar Stat > Multivariate > Cluster K-Means.

8 En Variables, seleccionar 'Head.L'-Weight.
9 En Specify Partition by, seleccionar Initial.
10 Seleccionar Standardize variables.
11 Click Storage. En Cluster membership column, poner BearSize.
12 Click OK en cada cuadro de diálogo

Results for: Bears.MTW
Kmeans Cluster Analysis: Head.L, Head.W, Neck.G, Length, Chest.G, Weight
Standardized Variables
Final Partition
Página 15 de 45
Within Average Maximum
cluster distance distance
Number of sum of from from
observations squares centroid centroid
Cluster1 41 63.075 1.125 2.488
Cluster2 67 78.947 0.997 2.048
Cluster3 35 65.149 1.311 2.449
Cluster Centroids
Grand
Variable Cluster1 Cluster2 Cluster3 centroid
Head.L 1.0673 0.0126 1.2261 0.0000
Head.W 0.9943 0.0155 1.1943 0.0000
Neck.G 1.0244 0.1293 1.4476 0.0000
Length 1.1399 0.0614 1.2177 0.0000
Chest.G 1.0570 0.0810 1.3932 0.0000
Weight 0.9460 0.2033 1.4974 0.0000
Cluster1 Cluster2 Cluster3
Cluster1 0.0000 2.4233 5.8045
Cluster2 2.4233 0.0000 3.4388
Cluster3 5.8045 3.4388 0.0000
El conglomerado de K medias calsifica 143 osos en:

41 pequeños; 67 medianos y 35 grandes.
En la primera tabla se muestra el número de observaciones en cada conglomerado,
la suma de cuadrados dentro de clusters, la distancia promedio de la observacióna al
centroide del cluster, y la distancia máxima de la observación al centroide del cluster.
En general un conglomerado o cluster con una suma de cuadrados pequeña es más compacto
que otro con una grande. El centroide es el vector de medias de variables para las
observaciones en ese conglomerado y se usa como su punto medio.
Los centroides para los congloemrados individuales se muestran en la segunda tabla y en la tercera
se da la distancia entre centroides de los conglomerados.
La columna de BearSize contiene las designaciones de los conglomerados.
Análisis discriminante
Este análisis se aplica cuando ya se sabe a que grupo pertenece cada observación y lo que se desea
saber es cómo la variables disponibles afectan a la clasificación para poder asignar una nueva
observación de la que se conocen los valores de las variables pero no el grupo al que pertenece.
Se tienen dos alterantivas de análisis discriminante: Lineal y cuadrático, en el lineal se asume

que todos los grupos tienen la misma matriz de covarianza. El cuadrático no asume esto.
Para el caso de clasificar nuevas observaciones en dos categorías, la regresión logística puede
ser superior al análisis discriminante.
Ejemplo: Con los datos del archivo COCHES.MTW se usan los primeros 150 coches y considerando
solo los de 4, 6 y 8 cilindros:
Data > Code > Numeric to Numeric
Página 16 de 45
Code Data from columns 'Num.Cil' Into Columns 'Num.Cil'

Original Values 2, 5, 12 por New *
OK
Data > Subset worksheet

Name: Coches 1:150
Seleccionar Especify which rows to include: Row Numbers 1:150
OK
Utilizando esta nueva hoja ahora se realiza el análisis discriminate con:
Stat > Multivariate > Discriminant Analysis

Groups: 'Num.Cil' Predictors: PVP 'Cil(cc)' - 'Acele.'
Linear Discriminant function C15 C16 C17 - Columnas para la función de discriminación
OK
Linear Discriminant Function for Groups
4 6 8
Constant 1136.2 1098.4 1136.1
PVP 0.0 0.0 0.0
Cil.(cc) 0.0 0.0 0.0
Pot.(CV) 1.1 1.1 1.1
Long. 0.3 0.3 0.4
Anch. 12.1 11.8 12.1
Altu. 3.0 3.0 2.9
Malete. 0.3 0.3 0.2
Peso 0.0 0.0 0.0
Consumo 15.1 14.6 15.7
Velo.max 11.2 5.6 8.2
Acele. 10.1 10.3 10.8
Se van a aplicar estas funciones de discriminación de los primeros 150 coches a los 97 restantes:ç
Manip > Subset Worksheet

Name: Coches 151:247
Specify which rows to include Row numbers 151:247
OK
Copiar columnas C15, C16 y C17 de la hoja COCHES 1:150 que corresponden a las funciones de
discriminación a la hoja COCHES 151:247.
Por medio de Matrices se tiene:
1. Insertar una columna de unos entre Modelo y PVP
2. Crear la matriz de datos y las matrices con los coeficientes de las funciones de discriminación
Editor > Enable comands
MTB > copy c3 c4 c6-c15 m1 - c5 (no. cil.) se excluye ya que es el valor que se trata de predecir.
MTB > copy c16 m2
MTB > copy c17 m3 Matrices de coeficientes de las tres funciones de discriminación
MTB > copy c18 m4 para 4, 6 y 8 cilindros
3. Obtener las funciones de discriminación para cada observación
MTB > multi m1 m2 m5
Página 17 de 45
MTB > multi m1 m3 m6 Valores de la función de discrimianción para 4, 6 y 8 cilindros

MTB > multi m1 m4 m7
4. Pasar los valores de las matrices del paso 3 a las columna C19, C20 y C21
Editor Enable comands
MTB > copy m5 c19 MTB > copy c3 c4 c6c15 m1
MTB > copy m6 c20 MTB > copy c16 m2
MTB > copy m7 c21 MTB > copy c17 m3
MTB > copy c18 m4
5. Identificar cual es la función que da el valor máxi MTB > multi m1 m2 m5
cada coche MTB > multi m1 m3 m6
MTB > rmax c19-c21 c22 (Calc > Row Statistics) MTB > multi m1 m4 m7
MTB > copy m5 c19
MTB > let c23=c19=c22 MTB > copy m6 c20
MTB > let c24=c20=c22 MTB > copy m7 c21
MTB > let c25=c21=c22 MTB > rmax c19c21 c22
MTB > let c23=c19=c22
6. Colocar en c26 el número de cilindros asignado MTB > let c24=c20=c22
MTB > let c25=c21=c22
MTB > let c26=4*c23+6*c24+8*c25 MTB > let c26=4*c23+6*c24+8*c25
MTB > code (18) '*' c26 c26
Para poner * en los valores missing de las funciones MTB > .
discriminantes en C26
MTB > Code (18) '*' c26 c26
7. Para comparar mediante una tabla cruzada
Stat > Tables > Descrpitive statistics

Categorical variables:
For rows 'Num.Cil.' For columns 'c26'
OK
Tabulated statistics: Num.Cil., C26
Rows: Num.Cil. Columns: C26
4 6 8 Missing All
4 80 3 0 4 83
6 0 5 1 1 6
8 0 0 0 2 0
Missing 0 1 0 0 *
All 80 8 1 * 89
Cell Contents: Count
De los 89 coches se han acertado a clasificar como de 4 cilindros 80. De los 6 de 6 cilindros
se han clasificado bien 5 y el de 8 cilindros no se clasificaron 2. La mejor discriminación
fue con los de 4 por tener mas coches en la muestra.
Minitab 15 Ejemplo:
Para regular la pesca de salmón, se desea identificar si tienen su origen en Alaska o en Canadá.
50 peces de cada origen se capturan y se miden sus dimensiones de cuando vivian en agua dulce
y cuando posteriormente vivian en agua salada. La idea es poder identificar de donde vienen las
nuevas capturas.

2 Stat > Multivariate > Discriminant Analysis.
3 En Groups, seleccionar SalmonOrigin.
Página 18 de 45
4 En Predictors, seleccionar Freshwater Marine. Click OK.
Seleccionar Cross Validation si se quiere reducir la tasa de error aparente en clasificaciones erroneas
se usa para compensar un error que sea optimista.
SalmonOriginFreshwater Marine
Alaska 108 368
Alaska 131 355
Alaska 105 469
Alaska 86 506
Alaska 99 402
Alaska 87 423 Etcetera…
Los resultados son como sigue:

Discriminant Analysis: SalmonOrigin versus Freshwater, Marine
Linear Method for Response: SalmonOrigin
Predictors: Freshwater, Marine
Group Alaska Canada
Count 50 50
Summary of classification
True Group
Put into Group Alaska Canada
Alaska 44 1
Canada 6 49
Total N 50 50
N correct 44 49
Proportion 0.880 0.98 Prob. de clasificar correctamente peces de Alaska o Canadá
N = 100 N Correct = 93 Proportion Correct = 0.930
Squared Distance Between Grou Identificación correcta
Alaska Canada
Alaska 0.00000 8.29187
Canada 8.29187 0.00000
Linear Discriminant Function Para un caso dado se selecciona la función discriminante

Alaska Canada que tenga el valor mayor al final
Constant 100.68 95.14
Freshwater 0.37 0.50
Marine 0.38 0.33
Summary of Misclassified Observations
Posterior
Observation True Group Pred Group Group Distance Probability
1** Alaska Canada Alaska 3.544 0.428
Canada 2.960 0.572
Canada 0.2729 0.981
Canada 0.7270 0.882
Canada 0.7270 0.882
Canada 1.429 0.711
Canada 1.985 0.536
Página 19 de 45
71** Canada Alaska Alaska 2.045 0.948
Canada 7.849 0.052
Análisis de correspondencia simple

Este análisis ayuda a explorar las relaciones en una clasificación de dos vías. También puede operar
en tres y cuatro vías dado que pueden ser transformadas a tablas de dos vías. Este procedimiento
descompone una tabla de contingencia de manera similar que el análisis de componentes descompone
los datos continuos multivariados. Se realiza un análisis de eigenvalores y la variabilidad se divide
en dimensiones relevantes y asociadas con filas y columnas.
Ejemplo:
Se clasifica a 790 investigadores en 10 disciplinas académicas y cinco categorías de fondeo,
donde A es la categoría más alta de fondeo, D la más baja y E sin fondos. Los renglones son
las disciplinas y las categorías de fondeo son las columnas.
Se desea conocer como se comparan las disciplinas entre sí respecto a las categorías de fondeo.
Se hace un análisis de correspondencia desde una orientaciòn de filas. Se incluyen datos
compmentarios como son: una fila para investigadores de museos no incluidos en el estudio, y una fila
de ciencias matemáticas, que es la suma de matemáticas y estadística.
1 File > Open worksheet EXH_TABL.MTW.

Categorias de fondeo
ColNames A B C D E
RowNames CT1 CT2 CT3 CT4 CT5
Geology 3 19 39 14 10
Biochemistry 1 2 13 1 12
Chemistry 6 25 49 21 29
Zoology 3 15 41 35 26
Physics 10 22 47 9 26
Engineering 3 11 25 15 34
Microbiology 1 6 14 5 11
Botany 0 12 34 17 23
Statistics 2 5 11 4 7
Mathematics 2 11 37 8 20
ColNames RowSupp1 RowSupp2 RSNames

A 4 4 Museums
B 12 16 MathSci
C 11 48
D 19 12
E 7 27
2 Stat > Multivariate > Simple Correspondence Analysis.

3 Seleccionar Columns of a contingency table, y seleccionar CT1-CT5.
En Row names, poner RowNames. En Column names, poner ColNames.
4 Click Results y seleccionar Row profiles. Click OK.
5 Click Supp Data. En Supplementary Rows, seleccionar RowSupp1 RowSupp2.
En Row names, poner RSNames. Click OK.
6 Click Graphs. Seleccionar Show supplementary points in all plots.
Sel. Symmetric plot showing rows only y Asymmetric row plot showing rows and columns.

Simple Correspondence Analysis: CT1, CT2, CT3, CT4, CT5
Página 20 de 45
Row ProfilDa las proporciones de cada renglón de categorías por columna, por ejemplo Geología:
A B C D E Mass
Geology 0.035 0.224 0.459 0.165 0.118 0.107
Biochemistry 0.034 0.069 0.448 0.034 0.414 0.036
Chemistry 0.046 0.192 0.377 0.162 0.223 0.163
Zoology 0.025 0.125 0.342 0.292 0.217 0.151
Physics 0.088 0.193 0.412 0.079 0.228 0.143
Engineering 0.034 0.125 0.284 0.170 0.386 0.111
Microbiology 0.027 0.162 0.378 0.135 0.297 0.046
Botany 0.000 0.140 0.395 0.198 0.267 0.108
Statistics 0.069 0.172 0.379 0.138 0.241 0.036
Mathematics 0.026 0.141 0.474 0.103 0.256 0.098
Mass 0.039 0.161 0.389 0.162 0.249
Analysis of Contingency Table
Muestra la descomposición de la inercia total. Da un resumen de la descomposición de la tabla de
contingencia 10 x 5 en cuatro componentes.
Chi2 / n 65.972/796
Axis Inertia Proportion Cumulative Histogram
1 0.0391 0.4720 0.4720 ******************************
2 0.0304 0.3666 0.8385 ***********************
3 0.0109 0.1311 0.9697 ********
4 0.0025 0.0303 1.0000 *
Total 0.0829
Row Contributions
Como no se especificó el número de componentes, Minitab calcula 2.
Contribución de cada renglón a la proporción de inercia total. Contribución del compo-

Proporción de la clase en el conjunto completo de datos nente a la inercia de renglón
Proporción de la inercia de renglón representad por los dos componentes
ID Name Qual Mass Inert Coord CContribución de cada fila
1 Geology 0.916 0.107 0.137 0.076 0.al eje de inercia.
2 Biochemistry 0.881 0.036 0.119 0.180 0.119 0.030
3 Chemistry 0.644 0.163 0.021 0.038 0.134 0.006
4 Zoology 0.929 0.151 0.230 0.327 0.846 0.413 Contribución principal.
5 Physics 0.886 0.143 0.196 0.316 0.880 0.365
6 Engineering 0.870 0.111 0.152 0.117 0.121 0.039
7 Microbiology 0.680 0.046 0.010 0.013 0.009 0.000
8 Botany 0.654 0.108 0.067 0.179 0.625 0.088
9 Statistics 0.561 0.036 0.012 0.125 0.554 0.014
10 Mathematics 0.319 0.098 0.056 0.107 0.240 0.029
Component 2
ID Name Coord Corr Contr
1 Geology 0.303 0.861 0.322
2 Biochemistry 0.455 0.762 0.248
3 Chemistry 0.073 0.510 0.029
4 Zoology 0.102 0.083 0.052
5 Physics 0.027 0.006 0.003
6 Engineering 0.292 0.749 0.310
7 Microbiology 0.110 0.671 0.018
8 Botany 0.039 0.029 0.005
9 Statistics 0.014 0.007 0.000
Página 21 de 45
10 Mathematics 0.061 0.079 0.012
Supplementary Rows Similar a la tabla de contribución de renglones.
Component 1 Component 2
ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr
1 Museums 0.556 0.067 0.353 0.314 0.225 0.168 0.381 0.331 0.318
2 MathSci 0.559 0.134 0.041 0.112 0.493 0.043 0.041 0.066 0.007
Column ContributionsContraste de ciencias Constraste de bioquímica e ingeniería

biológicas con física con geología
1 A 0.587 0.039 0.187 0.478 0.574 0.228 0.072 0.013 0.007
2 B 0.816 0.161 0.110 0.127 0.286 0.067 0.173 0.531 0.159
3 C 0.465 0.389 0.094 0.083 0.341 0.068 0.050 0.124 0.032
4 D 0.968 0.162 0.347 0.390 0.859 0.632 0.139 0.109 0.103
5 E 0.990 0.249 0.262 0.032 0.012 0.006 0.292 0.978 0.699
Row Plot
0.5 Biochemistry
0.4
Engineering
0.3
0.2
Component 2
Microbiology
0.1 Mathematics
MathSci Botany
Phy sics Statistics
0.0
Chemistry
Zoology
-0.1
-0.2
Geology
-0.3
Museums
-0.4
-0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5
Zoología y física muestra estas dos clases con signo contrario
Component 1
Asymmetric Row Plot
2
E
1
Biochemistry
Engineering
Microbiology
Component 2
Mathematics
MathSci
Botany
Statistics
Physics
Chemistry
Zoology
0 CGeology
A Museums
D
B
-1
-2
-3
-3 -2 -1 0 1 2
Component 1 Página 22 de 45
-2
Física tiende a-3tener el nivel más alto de fondeo y zoología el menor

-3 -2 -1 0 1 2
Component 1
Análisis de correspondencia múltiple

Extiende el análisis de correspondencia simple al caso de tres o más variables categóricas.
Realiza un análisis de correspondencia simple en una matriz de variables indicadoras, donde cada
columna dela matriz corresponde a un nivel de la variable categórica. La tabla multivía se resume en
una dimensión. Se gana en información sobre un mayor número de variables pero puede perderse
información en como se relacionan las filas con las columnas.
Ejemplo:
Los accidentes de auto se clasifican de acuerdo al tipo de accidente (colisión o volteo), la severidad
del accidente (no severo o severo), si o no el conductor fue expulsado, y el tamaño del coche (pequeño
o estándar). El análisis de correspondencia múltiple se utilizó para examinar como se relacionan entre
categorías en esta tabla de cuatro vias.
1 File > Open worksheet EXH_TABL.MTW.
CarWt DrEject AccType AccSever AccNames

1 1 1 1 Small
1 1 1 1 Standard
1 1 1 1 NoEject
1 1 1 1 Eject
1 1 1 1 Collis
1 1 1 1 Rollover
1 1 1 1 NoSevere
1 1 1 1 Severe Etcetera…
2 Seleccionar Stat > Multivariate > Multiple Correspondence Analysis.

3 Seleccionar Categorical variables, seleccionar CarWt DrEject AccType AccSever.
4 En Category names, seleccionar AccNames.
5 Click Graphs. seleccionar Display column plot.
Analysis of Indicator Matrix
Axis Inertia Proportion Cumulative Histogram
1 0.4032 0.4032 0.4032 ******************************
2 0.2520 0.2520 0.6552 ******************
3 0.1899 0.1899 0.8451 **************
4 0.1549 0.1549 1.0000 ***********
Total 1.0000
Esta tabla da un resumen de la descomposición de variables. La columna denominada inercia es el

estadístico Chi cuadrado / n para cada componente. De la inercia total de 1, 40.3%, 25.2%, 19.9%, y
15.5% se contabilizan para los cuatro componentes respectivamente.
Column Contributions
1 Small 0.965 0.042 0.208 0.381 0.030 0.015 2.139 0.936 0.771
2 Standard 0.965 0.208 0.042 0.078 0.030 0.003 0.437 0.936 0.158
3 NoEject 0.474 0.213 0.037 0.284 0.472 0.043 0.020 0.002 0.000
4 Eject 0.474 0.037 0.213 1.659 0.472 0.250 0.115 0.002 0.002
Página 23 de 45
5 Collis 0.613 0.193 0.057 0.426 0.610 0.087 0.034 0.004 0.001
6 Rollover 0.613 0.057 0.193 1.429 0.610 0.291 0.113 0.004 0.003
7 NoSevere 0.568 0.135 0.115 0.652 0.502 0.143 0.237 0.066 0.030
8 Severe 0.568 0.115 0.135 0.769 0.502 0.168 0.280 0.066 0.036
Esta tabla se usa para interpretar los diferentes componentes. Como no se especificó el número de
componentes, Minitab calcula 2.
- La columna Qual o quality, esla proporción de la inercia de la columna, representada por todos los
componentes calculados. Las categorías de tamaño de coche, están mejor representadas por la
división de los dos componentes con Qual = 0.965, mientras que la expulsión tiene el menor valor
Qual = 0.474.
- La columna denominada Masa es la proporción de la clase en conjunto de datos completo. En este

ejemplo, el CarWt, DrEject, AccType, y AccServer calses, se combian para una proporicón de 0.25
- La columna denominada Inert es La proporción de Inercia a La que contribuye cada columna. Las
categorías carros pequeños, expulsiones y colisiones, tienen la mayor inercia, sumando 61.4%, lo cual
indica que éstas categorías están más disociadas que las otras.
Minitab muestra información para cada uno de los dos componentes (ejes):
- La co lumna Coord da las coordenas de la columna. Eject y Rollover tienen las coordenadas
absolutas más largas para el componente 1 y Small tiene la coordenada mayor absoluta para el
componente 2. El signo y tamaño relativo de las coordenadas son útiles para interpretar componentes.
- La columna Corr representa la contribución del componente respectivo a la inercia de los renglones.
Aquí, el componente 1 representa el 47 del 61% de la inercia de las categorías: expulsión,
tipo de colisión y severidad del accidente. Pero solo explica el 3% de la inercia del tamaño del carro.
- La columna Contr es la contribución de la fila al eje de inercia, muestra como expulsión y volteo
son los que contribuyen más al componente 1 (Contr = 0.250 y 0.291, respectivamente).
El componente 2, por otra parte suma 93.6% de la inercia de las categorías de tamaño de coche,
contribuyendo el pequeño (small con 77.1% del eje de inercia.,
Column Plot
2
1
Standard
Severe
Component 2
Eject
CNoEject
ollis
0 Rollover
NoSevere
-1
-2 Small
Como indican los valores-2 para el-1componente

0 1,1 Expulsión
2 y volteo están más distantes del origen.
Este componente contrasta las categorías
Component de
1 expulsión y volteo y en alguna medida severo contra
no severo.
El componente 2 separa pequeño con otras categorías. Los dos componentes pueden no explicar
adecuadamente la variabilidad de estos datos.
Página 24 de 45
speran
0.0660
0.006
0.992
Página 25 de 45
Pop
Employ
Health
0.75 1.00
Página 26 de 45
tructo.
Página 27 de 45
...
Página 28 de 45
Set of Numbers.
e la columna Initial.
Página 29 de 45
Página 30 de 45
Página 31 de 45
ARCHIVO IBEROAMERICA.MTW
Esperanza Tasa de Teléfonos

Población Superficie % menores vida al mortalidad por 1.000
Pais (miles) (km2) 15 años nacer infan hab
México 95831 1958201 34 72,4 30,9 96
Guatemala 11621 108899 44 64,2 45,9 27
Honduras 6147 112088 43 69,8 34,9 29
Nicaragua 4464 130000 42 68,2 43,9 23
El Salvador 6059 21041 36 69,4 38,8 53
Costa Rica 3650 51100 34 76,8 12,1 164
Panamá 2767 75517 32 74 21,4 114
Cuba 11115 110861 22 76 9 32
Rep. Dominic 8232 48734 34 71 33,5 73
Puerto Rico 3806 8875 24 75,3 10,8 332
Colombia 37685 1138914 33 70,9 24 100
Venezuela 23242 912050 35 72,8 20,9 111
Brasil 165158 8547403 30 67,9 42,1 75
Ecuador 12175 283561 35 69,9 45,4 65
Perú 24797 1285216 34 68,3 44,9 47
Bolivia 7958 1098051 40 61,4 65,5 47
Chile 14824 756626 29 75,2 12,7 132
Paraguay 5223 406752 40 69,7 39,1 34
Argentina 36123 2780400 28 73,1 21,8 160
Uruguay 3239 177414 24 72,8 16,5 196
España 39754 505992 16 77,9 5,5 385
Portugal 9798 91982 17 75 6,9 361
ARCHIVO COCHES
Marca Modelo PVP Num.Cil. Cil.(cc) Pot.(CV) Long.

Alfa Romeo 145 1.4 Bas 1780000 4 1351 90 409
Alfa Romeo 145 1.6 Bas 1940000 4 1596 103 409
Alfa Romeo 155 1.7Twi 2399000 4 1749 115 444
Alfa Romeo 155 2.5 V6 4105000 6 2492 166 444
Alfa Romeo 164 3.0 Su 5837000 6 2959 210 466
Audi 80 2.3 E 3931000 5 2309 133 448
Audi 80 2.8 E 4836000 6 2771 174 448
Audi A6 2.6 V6 4867000 6 2598 150 480
Audi Coupé 2.0 E3695000 4 1984 115 437
Audi Cabrio 2.6 6055000 6 2598 150 436
Audi 80 2.6 Quat 4650000 6 2598 150 448
Audi 80 Avant S2 7197000 5 2226 230 451
Audi A6 2.8 V6 6102000 6 2771 174 480
Audi Coupe 2.6 5110000 6 2598 150 436
BMW 316 I 3295000 4 1596 102 443
BMW 318 I 3615000 4 1796 115 443
BMW 318 IS 3825000 4 1796 140 443
BMW 320 I 4140000 6 1991 150 443
BMW 325 I 5015000 6 2949 192 443
BMW 325 I Cabrio 6090000 6 2494 192 443
BMW M3 7780000 6 2990 286 443
BMW 518 I 4155000 4 1796 113 472
BMW 525 I 5805000 6 2494 192 472
BMW 530 I 7155000 8 2997 218 472
BMW M5 12080000 6 3795 340 472
BMW 730 I 8296000 8 2997 218 498
BMW 740 I 10270000 8 3982 286 498
BMW 850 CSI 18035000 12 5576 380 478
CITROEN AX 10 First 1171110 4 954 50 352
CITROEN AX 11 First 1242168 4 1124 60 352
CITROEN AX First To 1367817 4 1124 60 352
CITROEN AX 11 Pres 1361660 4 1124 60 352
CITROEN AX GT 3p 1558657 4 1360 75 352
CITROEN ZX Reflex 1749000 4 1360 75 407
CITROEN ZX Avanta 1950820 4 1360 75 407
CITROEN ZX Avanta 2026820 4 1360 75 426
CITROEN ZX Aura 1.8 2274970 4 1761 103 407
CITROEN ZX 2.0 I 16 3033889 4 1998 150 408
CITROEN ZX Prestig 2218620 4 1905 71 407
CITROEN Xantia 1.6 I 2303956 4 1580 90 444
CITROEN Xantia1.8 I 2711166 4 1761 103 444
CITROEN Xantia 2.0 3353458 4 1998 123 444
CITROEN Xantia 16V 4101899 4 1998 150 444
CITROEN XM 2.0 I 1 3903782 4 1998 135 471
CITROEN XM V6 I B 5669829 6 2963 170 496
FERRARI F355 Berlin 18626560 8 3496 380 425
FERRARI 456 GT 34089000 12 5474 442 473
FIAT Cinquecen 880000 2 704 31 323
FIAT Uno 60 Sti 1075000 4 1108 51 369
FIAT Punto 55 S 1295000 4 1108 55 376
FIAT Punto 75 S 1385000 4 1242 75 377
FIAT Punto 90 S 1720000 4 1581 88 377
FIAT Punto GT 2155000 4 1372 136 377
FIAT Coupé 16V 3635000 4 1995 142 425
FIAT Tipo 1.4S 3 1740000 4 1372 71 396
FIAT Tipo 1.6SX 2050000 4 1581 76 396
FIAT Tipo 1.8GTI 2270000 4 1756 105 396
FIAT Tempra 1.4 1860000 4 1372 71 435
FIAT Tempra 1.6 2000000 4 1581 90 435
FIAT Tempra 1.8 2450000 4 1756 105 435
FIAT Croma 2.0IE3065000 4 1995 117 452
FIAT Ulysse 2.0S 3135000 4 1998 123 445
FORD Fiesta Che 1349000 4 1118 50 374
FORD Fiesta New 1539000 4 1297 60 374
FORD Fiesta SI 1 1669000 4 1393 75 374
FORD Fiesta SI1 1779000 4 1597 90 374
FORD Fiesta XR 2259000 4 1796 130 380
FORD Escort Val 1769000 4 1299 60 423
FORD Escort Atla 2049000 4 1598 90 404
FORD Escort Ghia 2219000 4 1796 105 423
FORD Escort RS 2839000 4 1998 150 404
FORD Probe 2.0I 3709000 4 1991 115 458
FORD Mondeo CL 2469000 4 1597 90 448
FORD Mondeo Ghi 3239000 4 1988 136 448
FORD Scorpio Se 3459000 4 1998 120 474
FORD Escort Cos 5429000 4 1993 227 421
HONDA Civic DX 1 2100000 4 1343 75 408
HONDA Civic Dre 2850000 4 1590 125 408
HONDA CRX ESI 1 3200000 4 1595 125 400
HONDA Concerto 2150000 4 1493 90 426
HONDA Accord 2.0I 2550000 4 1997 115 468
HONDA Accord Co 3380000 4 1977 136 467
HONDA Legend 3.2 7550000 6 3206 204 494
HYUNDAI Accent 1.3 1595000 4 1341 82 412
HYUNDAI Accent 1. 1880000 4 1495 90 412
HYUNDAI Lantra 1.8 2190000 4 1836 126 439
HYUNDAI Sonata 2. 2890000 4 1997 139 470
JAGUAR XJ6 3.2 5950000 6 3239 200 499
JAGUAR XJ6 4.0 S 7500000 6 3980 223 499
LADA Samara 1.3 796160 4 1288 61 401
LADA Samara 1.5 899000 4 1499 68 420
LANCIA Y-10 Mia 1227000 4 1108 51 342
LANCIA Delta 1.4IE 1820000 4 1372 71 401
LANCIA Delta 1.8IE 2174000 4 1750 101 401
LANCIA Delta 2.0 2673000 4 1995 139 401
LANCIA Dedra 1.6LE2231000 4 1581 90 434
LANCIA Dedra 2.0 3760000 4 1995 139 434
LANCIA Thema 2.0I 3905000 4 1995 117 460
LANCIA Thema 3.0 5612000 6 2959 175 460
MASERATI Spyder E 6995200 6 2790 225 406
MASERATI Ghibli 8499200 6 2790 279 422
MASERATI Shamal 11975500 8 3217 326 410
MAZDA 121 1.3 16V 1688960 4 1324 73 380
MAZDA MX-5 1.8 16 3687000 4 1839 133 395
MAZDA 626 2.0 1 2852600 4 1991 117 469
MAZDA Xedos 6 4212600 6 1995 146 456
MERCEDES C180 4307000 4 1799 122 449
MERCEDES C200 5252000 4 1998 136 449
MERCEDES C220 5667000 4 2199 150 449
MERCEDES E200 5297000 4 1998 136 474
MERCEDES E220 5792000 4 2199 150 474
MERCEDES E280 6512000 6 2799 193 474
MERCEDES S280 8832000 6 2799 193 511
MERCEDES E320 7401000 6 3199 220 474
MERCEDES S320 10497000 6 3199 231 511
MERCEDES E420 9334000 8 4196 279 474
MERCEDES S500 13337000 8 4973 320 511
MERCEDES S600 19632000 12 5987 394 511
MITSUBISHI Colt 1600G 2325000 4 1597 113 399
MITSUBISHI Galant 20 3044220 4 1997 137 462
NISSAN Micra 1.0L 1245000 4 998 55 369
NISSAN Micra 1.3B 1455000 4 1275 75 369
NISSAN Sunny LX1.41860000 4 1392 87 423
NISSAN Sunny SLX 2170000 4 1597 102 414
NISSAN Sunny LX 2 2000000 4 1974 75 414
NISSAN Primera 1. 2115000 4 1597 102 440
NISSAN Primera 2. 2635000 4 1998 125 440
NISSAN 100NX 2.16 3395000 4 1998 143 413
NISSAN Serena LX 2207000 4 1597 98 431
NISSAN Serena SLX 3010000 4 1998 126 431
NISSAN Serena LX 22308000 4 2283 75 431
OPEL Corsa City1 1317000 4 1195 45 373
OPEL Corsa Swi 1498000 4 1195 45 373
OPEL Corsa Swi 1560000 4 1389 60 373
OPEL Corsa GSI 2057000 4 1598 106 373
OPEL Astra Base 1718000 4 1389 60 405
OPEL Astra GL 1. 1985000 4 1389 82 405
OPEL Astra GLS 2356000 4 1598 100 424
OPEL Astra Spor 2514000 4 1799 115 405
OPEL Astra Cabri 3268000 4 1799 115 424
OPEL Astra GL 1 2108000 4 1700 68 405
OPEL Vectra Meri 2515000 4 1998 115 443
OPEL Vectra Spor 3265000 4 1998 136 443
OPEL Vectra CDX 3819000 6 2498 170 443
OPEL Vectra GL 2749000 4 1686 82 443
OPEL Calibra 2.0 3527000 4 1998 115 449
OPEL Omega 2.0 3879000 4 1998 136 479
OPEL Omega 3.0 5633000 6 2962 211 479
PEUGEOT 106 Kid 3p 1205000 4 954 50 356
PEUGEOT 106 1.4 XT 1850000 4 1360 75 356
PEUGEOT 106 Midnig 1663000 4 1527 58 356
PEUGEOT 205 Mito 1. 1343000 4 1124 60 370
PEUGEOT 205 Mito D 1549000 4 1769 60 370
PEUGEOT 306 XN 1.4 1756000 4 1360 75 400
PEUGEOT 306 Style 1 2009000 4 1360 75 400
PEUGEOT 306 XS 1.6 2160000 4 1587 90 400
PEUGEOT 306 XT 1.6 2292000 4 1587 90 400
PEUGEOT 306 XND 5p 2063000 4 1905 71 400
PEUGEOT 405 Embas 2368000 4 1761 103 441
PEUGEOT 405 Embass2645000 4 1905 70 441
PEUGEOT 605 SLI 3825000 4 1998 123 472
PEUGEOT 605 SLDT 4268000 4 2088 110 472
PEUGEOT 806 SR 2.0 3235000 4 1998 123 445
PORSCHE 968 CS 7651840 4 2990 240 432
PORSCHE 911 Turbo 19645440 6 3600 360 425
RENAULT Twingo 1210000 4 1239 55 343
RENAULT R-19 RL 1. 1765000 4 1171 60 425
RENAULT R-19 Drive 1890000 4 1390 80 416
RENAULT R-19 S 1.8 2085000 4 1794 95 416
RENAULT R-19 Driv 2015000 4 1870 65 425
RENAULT R-19 S 1.9 2435000 4 1870 93 425
RENAULT R-21 Nev 2625000 4 1721 95 469
RENAULT R-21 GTD 2580000 4 2068 74 446
RENAULT Laguna RN 2350000 4 1794 95 451
RENAULT Laguna RXE3075000 4 1998 115 451
RENAULT Safrane RN 3465000 4 2165 110 474
RENAULT Safrane RT 5540000 6 2963 170 474
RENAULT Safrane R 4655000 4 2499 115 474
ROLLS ROYC Corniche C 37760000 8 6750 225 520
ROLLS ROYC Touring Li 44652800 8 6750 225 598
ROVER 114 SLI 3p 1395000 4 1396 75 352
ROVER 214 I 3p 1631000 4 1396 75 442
ROVER 220 GSI 3p 2468000 4 1994 136 442
ROVER 218 SLD 5p 2442000 4 1769 88 422
ROVER 414 SLI 2195000 4 1396 103 437
ROVER 420 GSI 2591000 4 1994 136 437
ROVER Montego 2. 1685000 4 1994 104 447
ROVER 620 I 2900000 4 1997 115 465
ROVER 623 SI 3830000 4 2259 158 465
ROVER 827 SI 4910000 6 2677 169 488
ROVER 825 SD 4367000 4 2499 118 488
SAAB 900 S 2.0 I 3368320 4 1985 130 464
SAAB 900 S 2.3 I 3905920 4 2290 150 464
SAAB 900 SE 2.5 4597120 6 2498 170 464
SAAB 9000 CS 2.34520320 4 2290 146 476
SAAB CD 2.3 I 4520320 4 2290 146 478
SEAT Marbella 775000 4 903 42 347
SEAT Ibiza 1.05 1289000 4 1043 45 381
SEAT Ibiza 1.4 I 1407700 4 1391 60 381
SEAT Ibiza 1.4 I 1474300 4 1391 60 381
SEAT Ibiza 1.6 1628000 4 1598 75 381
SEAT Ibiza 1.6 I 1743600 4 1598 75 381
SEAT Ibiza 1.8 1907000 4 1781 90 381
SEAT Ibiza 2.0 G 2293000 4 1984 115 381
SEAT Ibiza 1.9 1702300 4 1896 68 381
SEAT Ibiza 1.9 2038600 4 1896 75 381
SEAT Cordoba 1 1650000 4 1397 60 411
SEAT Cordoba 1 1807000 4 1598 75 411
SEAT Cordoba 1 2066000 4 1781 90 411
SEAT Cordoba 1 1932000 4 1896 68 411
SEAT Toledo 1.8 1980000 4 1781 90 432
SEAT Toledo 2.0 2678000 4 1984 115 432
SEAT Toledo 1.9 2182000 4 1896 68 432
SUZUKI Swift 1.0 GL 1244000 4 993 56 374
SUZUKI Swift 1.3 G 1545000 4 1299 71 374
TOYOTA Celica 2.0 4339800 4 1998 175 442
TOYOTA Carina E 1 2491300 4 1587 116 453
TOYOTA Carina E 2999800 4 1998 133 453
TOYOTA Camry 2.2 4178800 4 2164 136 472
TOYOTA Lexus GS 3 7769000 6 2997 212 495
VOLKSWAGENPolo 1.0 F 1289000 4 1043 45 471
VOLKSWAGENPolo 1.3 F 1397000 4 1296 55 471
VOLKSWAGENPolo 1.3 C 1626000 4 1296 55 471
VOLKSWAGENPolo 1.6 C 1595000 4 1598 75 471
VOLKSWAGENGolf 1.4 CL 1770000 4 1391 60 402
VOLKSWAGENGolf 1.6 CL 2005000 4 1598 75 402
VOLKSWAGENGolf 1.8 GL 2195000 4 1781 90 402
VOLKSWAGENGolf 2.0 GT 2793000 4 1984 115 402
VOLKSWAGENGolf 2.0 G 3248000 4 1984 150 402
VOLKSWAGENGolf 1.9 C 1995000 4 1896 64 402
VOLKSWAGENVento 1.6 C 2010000 4 1598 75 438
VOLKSWAGENVento 1.8 G 2395000 4 1781 90 438
VOLKSWAGENVento 2.0 G 3000000 4 1984 115 438
VOLKSWAGENPassat 1.8 2600000 4 1781 90 460
VOLKSWAGENPassat 2.0 3185000 4 1984 115 460
VOLKSWAGENPassat VR6 3910000 6 2792 174 460
VOLKSWAGENCorrado 16V4065000 4 1984 135 405
VOLVO 440 GLE 1.82695000 4 1794 90 431
VOLVO 440 GLT 3190000 4 1998 110 431
VOLVO 460 GLE 1.82695000 4 1794 90 440
VOLVO 460 Turbo 3370000 4 1721 120 440
VOLVO 480 S 3395000 4 1998 110 426
VOLVO 850 GLE 4195000 4 2435 144 466
VOLVO 850 GLT 4730000 5 2435 170 466
VOLVO 940 GLE 2.33620000 4 2316 116 479
VOLVO 940 GLT 3950000 4 1986 155 479
VOLVO 960 2.5 24V 4890000 6 2473 170 487
Usuarios
Internet por % PIB % PIB % PIB
1000 hab PIB $/hab Agricultura Industria Servicios
3,7 3670 5,4 26,3 68,3
0,8 1470 24,1 19,6 56,3
0,9 660 21,7 30,9 47,4
1,6 380 34,2 21,9 43,9
0,3 1700 13,1 26,8 60,1
12,1 2640 15,5 24,1 60,4
1,4 3080 8,2 18,4 73,4
0,1 1983 6,9 46,3 46,8
0 1600 12,9 31,6 55,5
0,3 12213 0,9 46,8 52,3
1,8 2140 16,3 19,9 63,8
2,1 3020 4,1 46,5 49,4
4,2 4400 14 35,9 50,1
0,9 1500 11,9 36,7 51,4
2,6 2420 7,4 36,9 55,7
0,7 830 17 28,5 54,5
13,1 4860 8,4 35,9 62,3
0,5 1850 23,7 22,1 54,2
5,3 8380 6 30,7 63,3
3,2 5760 8,9 26,4 64,7
31 14350 5,9 37,8 56,3
18,3 10160 1,7 53,2 45,1
Raiz cuadrada de Pot.(CV)

Anch. Altu. Malete. Peso Consumo Velo.max Acele. Pot2
171 143 320 1140 6,3 178 12,5 94,868
171 143 320 1160 6,1 185 11 101,489
170 144 525 1205 6,4 191 11,8 107,238
170 144 525 1290 7,3 215 8,4 128,841
176 139 504 1500 7,5 240 8 144,914
169 141 430 1270 6,4 200 9,8 115,326
169 141 430 1330 6,7 220 8 131,909
178 143 510 1440 7 209 9,9 122,474
172 137 295 1190 6 196 10,9 107,238
172 138 250 1370 6,7 222 8 122,474
169 141 430 1430 7,9 210 9,5 122,474
169 139 370 1560 7,7 242 6,1 151,658
178 143 510 1540 8 218 9,1 131,909
172 137 230 1400 7,9 212 9,5 122,474
170 139 435 1190 5,6 195 12,7 100,995
170 139 435 1205 5,7 201 11,3 107,238
170 139 435 1240 6,4 213 10,2 118,322
171 139 435 1315 6,8 214 10 122,474
170 139 435 1330 6,6 233 8 138,564
171 135 230 1450 6,8 229 8,6 138,564
171 133 405 1460 6,5 250 6 169,115
175 141 460 1360 6,6 211 10,6 106,301
175 141 460 1480 6,8 230 8,6 138,564
175 141 460 1565 8 235 7,7 147,648
175 139 460 1650 9 250 5,9 184,391
186 142 500 1725 8 235 8,3 147,648
186 142 500 1790 8,5 250 6,9 169,115
185 133 320 1865 8,5 250 6 194,936
155 135 265 690 4,6 151 17,4 70,711
155 135 265 690 4,5 167 11,9 7,746
155 135 265 690 4,5 167 11,9 7,746
155 135 265 705 4,6 151 17,4 7,746
160 135 265 772 5,1 176 10 86,603
170 140 343 935 5,4 172 11,9 86,603
170 140 343 960 5,4 172 11,9 86,603
170 146 488 1015 5,5 165 13,6 86,603
170 140 343 1030 5,6 188 10,2 101,489
172 137 343 1150 5,9 220 8,5 122,474
170 140 343 1035 4,4 167 13,7 84,261
175 139 480 1170 5,8 175 13,4 94,868
175 138 480 1176 6,1 187 11 101,489
175 138 480 1238 6,2 198 10,1 110,905
175 139 480 1325 6,4 213 9,6 122,474
179 138 455 1310 6,5 205 9,8 11,619
179 146 720 1505 8 217 10,1 130,384
194 117 220 1350 * 295 4,7 194,936
192 130 * 1690 11,6 302 5,2 210,238
149 143 170 675 4,3 127 28 55,678
156 141 271 760 4,8 152 16 71,414
162 145 275 840 4,7 150 16,5 74,162
162 145 275 880 5,3 170 12 86,603
162 145 275 965 6 178 11,5 93,808
162 144 275 1000 5,5 200 8 116,619
177 134 295 1250 7 208 9,2 119,164
170 144 350 1030 5,4 161 15,5 84,261
170 145 350 1050 6,1 170 12,4 87,178
170 143 350 1150 6,9 183 12 10,247
169 144 500 1030 5,4 163 14,4 84,261
169 144 500 1035 * * * 94,868
169 144 500 1140 6,7 188 12 10,247
176 143 500 1220 6,4 190 10,5 108,167
182 171 340 1510 7,2 177 13,1 110,905
160 132 250 785 5,1 143 18,1 70,711
160 132 250 825 4,4 153 14,8 7,746
160 132 250 830 5,6 167 12,8 86,603
160 132 250 925 6,2 177 11,2 94,868
163 133 250 955 6,3 200 8,5 114,018
168 135 490 1065 5,4 153 17,7 7,746
168 135 380 1085 5,5 177 12,3 94,868
168 135 490 1120 6,3 187 10,6 10,247
168 135 380 1165 6,1 208 8,7 122,474
177 131 360 1215 6,1 204 10,6 107,238
175 137 480 1215 5,5 180 13,5 94,868
175 137 480 1287 6,3 204 9,6 116,619
176 139 490 1245 6,2 192 11,2 109,545
173 142 267 1275 7,9 232 6,1 150,665
170 135 190 925 5,4 170 11,3 86,603
170 135 190 985 5,9 195 8,7 111,803
169 125 300 1050 6,4 190 9,3 111,803
169 139 370 * 6,3 172 * 94,868
171 138 405 1240 6,5 197 10,8 107,238
178 139 436 1295 7,1 200 10,2 116,619
181 140 430 1550 8,3 223 8,1 142,829
162 139 303 905 * 174 12,8 90,554
162 139 303 905 * 176 11,7 94,868
168 138 352 1130 7 189 10 11,225
177 141 373 1280 6,5 192 10,2 117,898
179 138 430 1800 7,8 211 9 141,421
179 138 430 1825 8 219 9 149,332
162 133 330 920 5,9 145 16 78,102
162 140 440 920 5,8 150 14 82,462
151 143 195 800 4,7 150 15,8 71,414
170 140 320 1100 * * * 84,261
170 140 320 1200 7,3 185 11,8 100,499
176 140 320 1250 7,2 206 9,6 117,898
170 143 480 1140 5,2 180 13,4 94,868
170 143 480 1260 6,8 210 9,4 117,898
175 143 550 1250 6,7 190 12,6 108,167
175 143 550 1330 7,7 220 8,1 132,288
171 131 400 1335 10,5 230 6,2 15
177 130 420 1400 * 258 5,7 167,033
185 130 420 1415 9,1 270 5,3 180,555
165 147 290 835 5,3 164 11,4 8,544
167 123 135 990 6 197 8,7 115,326
175 140 452 4455 6,1 200 10,4 108,167
170 136 450 1230 6,3 216 9,3 12,083
172 142 430 1350 6,4 193 12,2 110,454
172 142 430 1365 6,5 198 10,8 116,619
172 142 430 1410 6,5 210 10,4 122,474
174 143 520 1360 6,6 200 11,5 116,619
174 143 520 1370 6,6 210 10,6 122,474
174 143 520 1490 7,9 230 9,1 138,924
189 149 525 1890 8,6 215 10,8 138,924
174 143 520 1490 8,2 235 8,3 148,324
189 150 525 1890 10,3 225 8,9 151,987
174 143 520 1620 9,4 250 7,2 167,033
189 150 525 2000 10 250 8,3 178,885
189 150 525 2180 11,8 250 6,5 198,494
169 136 240 945 5,6 190 9,8 106,301
173 140 450 1270 6,3 205 9,8 117,047
158 143 206 795 4,8 150 16,4 74,162
158 143 206 810 4,9 170 12 86,603
167 139 440 1075 5,1 177 12,6 93,274
167 139 431 1075 5,3 184 11,2 100,995
167 139 431 1105 4,5 168 17 86,603
170 139 480 1075 5,4 190 10,6 100,995
170 139 480 1160 6,3 205 10 111,803
168 131 328 1150 6,5 210 8,2 119,583
169 183 750 1405 7,8 150 18 98,995
171 182 750 1485 8,3 170 13 11,225
169 183 750 1480 * * * 86,603
161 142 260 835 5,2 145 19,5 67,082
161 142 280 870 5,2 145 19,5 67,082
161 142 280 885 6 145 18 7,746
161 142 260 905 5,3 192 9,8 102,956
169 141 360 930 5,1 160 16 7,746
169 141 360 1005 5,7 175 13 90,554
169 141 500 1090 5,3 190 11,5 10
169 141 360 1095 6,1 200 9,5 107,238
169 141 360 1150 6,1 200 9,5 107,238
169 141 360 1070 4,5 164 16 82,462
170 140 530 1150 5,8 198 10,5 107,238
170 140 530 1240 6 210 9,5 116,619
170 140 530 1290 6,7 233 7,8 130,384
170 140 530 1180 4,8 176 14,5 90,554
169 132 300 1220 6,1 205 10 107,238
179 145 530 1455 6,6 210 11 116,619
179 145 530 1605 7,2 240 8,8 145,258
157 137 215 760 5,1 150 19,2 70,711
157 137 215 820 5,3 172 13,1 86,603
158 140 215 860 3,7 155 16,9 76,158
157 137 290 765 5,2 164 13,9 7,746
157 137 290 880 3,9 156 15,1 7,746
169 138 340 1020 5 165 14,9 86,603
169 138 340 1020 5 165 14,9 86,603
169 138 340 1060 5,4 180 12,9 94,868
169 138 340 1060 5,4 180 12,9 94,868
169 138 340 1080 4,6 162 16,9 84,261
169 141 470 1100 5,5 185 11,9 101,489
169 141 470 1125 4,9 165 16,4 83,666
180 142 497 1325 6,8 199 12,1 110,905
180 142 497 1430 4,9 192 11,6 104,881
182 171 340 1510 7,2 177 13,1 110,905
173 125 250 1320 7,2 252 6,5 154,919
177 131 123 1470 8,3 280 4,8 189,737
163 142 168 790 5,1 150 14 74,162
170 141 463 965 5,3 155 * 7,746
170 141 386 945 5,1 173 12,2 89,443
170 141 386 1025 6 181 10,7 97,468
170 141 463 1030 4,6 161 15,7 80,623
170 141 463 1080 4,4 183 11,3 96,437
173 143 674 1065 5,9 185 10,7 97,468
173 139 420 1125 4,5 170 12,5 86,023
175 143 452 1240 6,3 180 13,9 97,468
175 143 452 1280 6,1 200 10,6 107,238
181 141 480 1380 7 189 11,9 104,881
181 141 480 1465 8,2 220 9,6 130,384
181 141 480 1565 5,5 195 12,9 107,238
183 152 380 2430 11,5 210 * 15
183 153 380 2640 12 200 * 15
156 138 230 835 5 166 10,7 86,603
168 140 357 1030 * 163 13,6 86,603
168 140 357 1170 6 202 8,8 116,619
168 140 357 1170 4,3 175 13,6 93,808
168 140 410 1020 5,5 180 11,4 101,489
168 140 410 1170 5,8 202 8,8 116,619
171 142 520 1075 6,8 180 10,5 10,198
172 138 430 1255 6,5 196 10,8 107,238
172 138 430 1320 6,9 217 8,8 125,698
173 139 530 1460 7,5 214 8,9 13
173 139 530 1460 4,9 190 11,3 108,628
171 144 451 1285 7 200 11 114,018
171 144 451 1285 6,6 210 10 122,474
171 144 451 1285 7 225 9,2 130,384
176 142 485 1355 6,9 210 10 12,083
176 142 560 1355 6,9 210 10 12,083
150 144 262 680 5,1 135 19,2 64,807
164 142 270 895 5,4 138 22,3 67,082
164 142 270 905 5,3 157 15,8 7,746
164 142 270 930 5,3 157 15,8 7,746
164 142 270 905 5,6 170 12,1 86,603
164 142 270 930 5,6 170 12,1 86,603
164 142 270 985 5,5 182 11,4 94,868
164 142 270 1030 5,7 195 10,3 107,238
164 142 270 1000 4,4 161 15,2 82,462
164 142 270 1030 4,4 165 14,4 86,603
164 141 455 1020 5,3 157 16,1 7,746
164 141 455 1030 5,6 170 12,5 86,603
164 141 455 1080 5,6 182 11,7 94,868
164 141 455 1100 4,5 161 16,5 82,462
166 142 550 1090 5,5 182 12 94,868
166 142 550 1105 6,3 196 10,5 107,238
166 142 550 1105 4,2 165 16,5 82,462
157 135 363 730 4,1 145 * 74,833
157 135 365 780 4,7 165 * 84,261
175 130 283 1250 6,5 225 8,1 132,288
169 141 470 1085 5,5 195 11,3 107,703
169 141 470 1150 5,9 205 9 115,326
177 140 515 1180 6,5 205 9,7 116,619
179 142 404 1680 7,8 230 8,8 145,602
165 142 245 955 5,3 145 21,4 67,082
165 142 245 955 4,9 156 16,3 74,162
165 142 245 970 4,9 156 16,3 74,162
165 142 245 990 5,3 172 12,5 86,603
169 140 400 1000 5,2 157 16,7 7,746
169 140 400 1045 5,3 168 14 86,603
169 140 400 1035 5,6 180 12,1 94,868
169 140 400 1140 5,8 198 10,9 107,238
170 140 400 1195 6,3 215 8,7 122,474
169 140 400 1085 4,3 156 17,6 8
169 142 550 1060 5,8 168 14,4 86,603
169 142 550 1075 6 180 12,5 94,868
169 142 550 1105 6 198 10,4 107,238
172 143 495 1220 5,8 178 14,4 94,868
172 143 495 1240 6 195 11,8 107,238
172 143 495 1365 7,4 224 8,7 131,909
169 131 370 1175 6 208 9,3 11,619
169 139 330 1020 5,1 175 11,5 94,868
169 139 330 1035 5,8 185 10,5 104,881
169 139 400 1035 5,1 175 11,5 94,868
169 139 400 1060 6,4 200 9 109,545
171 133 160 1030 5,9 185 10,5 104,881
176 140 514 1300 6,4 203 10,3 12
176 140 514 1330 6,6 215 8,9 130,384
175 141 500 1370 7,1 190 11,2 107,703
175 141 500 1400 7,1 200 9,6 124,499
175 141 491 1600 * 210 9,7 130,384
Esperanza Tasa de Teléfonos Usuarios
% menores vida al mortalidad por 1.000 Internet por % PIB % PIB
15 años nacer infan hab 1000 hab PIB $/hab Agricultura Industria
34 72,4 30,9 96 3,7 3670 5,4 26,3
44 64,2 45,9 27 0,8 1470 24,1 19,6
43 69,8 34,9 29 0,9 660 21,7 30,9
42 68,2 43,9 23 1,6 380 34,2 21,9
36 69,4 38,8 53 0,3 1700 13,1 26,8
34 76,8 12,1 164 12,1 2640 15,5 24,1
32 74,0 21,4 114 1,4 3080 8,2 18,4
22 76,0 9,0 32 0,1 1983 6,9 46,3
34 71,0 33,5 73 0,0 1600 12,9 31,6
24 75,3 10,8 332 0,3 12213 0,9 46,8
33 70,9 24,0 100 1,8 2140 16,3 19,9
35 72,8 20,9 111 2,1 3020 4,1 46,5
30 67,9 42,1 75 4,2 4400 14,0 35,9
35 69,9 45,4 65 0,9 1500 11,9 36,7
34 68,3 44,9 47 2,6 2420 7,4 36,9
40 61,4 65,5 47 0,7 830 17,0 28,5
29 75,2 12,7 132 13,1 4860 8,4 35,9
40 69,7 39,1 34 0,5 1850 23,7 22,1
28 73,1 21,8 160 5,3 8380 6,0 30,7
24 72,8 16,5 196 3,2 5760 8,9 26,4
16 77,9 5,5 385 31,0 14350 5,9 37,8
17 75,0 6,9 361 18,3 10160 1,7 53,2
Raiz cuadrada de Pot.(CV)

% PIB
Servicios
68,3
56,3
47,4
43,9
60,1
60,4
73,4
46,8
55,5
52,3
63,8
49,4
50,1
51,4
55,7
54,5
62,3
54,2
63,3
64,7
56,3
45,1

Analisis Factorial2

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Analisis Factorial2

Caricato da

Copyright:

Formati disponibili

Mintab V15 Módulo 10. Estadística Multivariada P. Reyes / Nov.

MINITAB 15 MÓDULO 9. ESTADISTICA MULTIVARIADA

Calcula nuevas variables ("Componentes") en función de las variables disponibles

Stat > multivariate > Principal components

Número de componentes principales

En Scores se almacenan las

Componentes: Primero C13, segundo C14, tercero C15

Los valores propios o eigenvalores representan la proporción de la variabilidad total

Valores propios asociados a cada componente principal

Valores propios = 5.5117 + 2.0441 + 1.4691 + ........... + 0.0056 = 11

Abajo se presenta la aportación de cada variable a cada compenente principal:

El primer componente esta El tercero está centrado en la

Agregando etiquetas a cada punto, seleccionar la gráfica y:

Add > Data Labels: Use Labels from Column: Pais

Score Plot of Población (miles), ..., % PIB Servicios

No siempre se le puede dar un nombre a los componentes

Loading Plot of Población (miles), ..., % PIB Servicios

0.0 Usuarios Internet por 1000 hab

La tercera componente que explica el 1.34% de la variabilidad, está relacionada con

la distribución del PIB en la industria y servicios, se puede obtener la gráfica de la

Scatterplot of C15 vs C13

Scatterplot of C18 vs C16

Superficie (km2) Usuarios Internet por 1000 hab

-0.50 % PIB Agricultura

-0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4

0.0000000 0.0000000 0.75

1. Método de los componentes principales

Se trata de investigar que "factores" explican la mayor parte de la variabildiad.

1 File > Open worksheet EXH_MVAR.MTW.

Los resultados se muestran a continuación:

Scree Plot of Pop, ..., Home

1 File > Open worksheet EXH_MVAR.MTW.

Los resultados se muestran a continuación:

a valores de varianza únicos (específicos) menores a un límite inferior preestablecido, en este

Factor Score Coefficients En la gráfica, el factor 1 -0.50 -0.25

Variable Factor1 Factor2 Employ y Health y ponderación negativa en Home.

Después de listan las ponderaciones de cada factor de manera ordenada.

Minitab 15 Análisis de preguntas

El alfa de Cronbach evalúa que tan confiablemente preguntas

1 - Mi teléfono, email o carta de dudas fue constestada en un tiempo razonable.

1 File > Open worksheet CRONBACH.MTW.

2 Stat > Multivariate > Item Analysis.

Los resultados se muestran a continuación:

Cronbach's Alpha = 0.7853 > 0.7

Análisis de conglomerados (Clusters)

Dendrogram with Single Linkage and Euclidean Distance

Los Clusters se identifican fácilmente

Fila del País

Scatterplot of Esperanza vida al nacer vs PIB $/hab

Stat > Multivariate > Cluster Variable

Dendrogram with Single Linkage and Correlation Coefficient Distance

1 File > Open worksheet CEREAL.MTW.

Los resultados se muestran a continuación:

Se muestra el proceso de amalgamiento de los clusters de forma detallada:

Dendograma para datos de Cereal

1 File > Open worksheet PERU.MTW.

Age Pulse Systol Diastol

2 Stat > Multivariate > Cluster Variables.

Los resultados se muestran a continuación:

Conglomerado de K medias de observaciones

1 File > Open worksheet BEARS.MTW.

ID Age Month Sex Head.L Head.W Neck.G

7 Selecionar Stat > Multivariate > Cluster K-Means.