Sei sulla pagina 1di 19

EXAMEN UNIDAD 3

EAP: Ing. Sistemas e Informtica


Multidimensional

Anlisis

Ejercicio 1: Se elabor un test que tienen 04 escalas de tem. Se


considera que las cuatro escalas sirven para diagnosticar, para
discriminar entre paranoides, alcohlicos y personalidad lmite. Se
eligieron 05 sujetos por grupo. Los datos son los siguientes:
E1
E4
5
2
4
5
6
3
8
2
7
3

Paranoide
E2

E3

Alcohlicos
E1
E2
E4
7
4
8
5
4
9
8
2
6
6
3
9
4
2
8

E3
6
7
6
5
6

Personalidad Lmite
E1
E2
E3
E4
4
4
1
6
8
2
3
5
7
3
2
5
5
2
1
4
6
4
3
5

Realice el Anlisis Discriminante e interpretar los


resultados.
Mi variable de clasificacin fue ITEM
Se definio el valomr minimo y mximo de sus categoras, que son 1 y 4
Todas las variables sobrantes se colocaron dentro de la independientes del
anlisis discriminante. Adems se selecciono el mtodo de paso a paso, ya que
se realiza la introduccin de las variables explicativas en funcin de sus niveles
de significancia.
Dentro del anlisis discriminante, en el modo estadstico se evalu el lado
descriptivo, dentro de esta la medias, y los ANOVAs univariados ya que
muestran un anlisis de varianza para comprobar que las medidas de las
variables explicativas son diferentes en los grupos.Mientras que en la zona de
coeficientes de la funcin se uso la de Fisher y la de No tipificados para hacer
predicciones sobre futuras observaciones. Ambos coeficientes producen las
mismas predicciones.

Siguiendo con mi desarrollo de analisis discriminantes en la zona de


clasificacion seleccin dentro de vizualizacion que se muestre la tabla de
resumen, ya que infroma el grado de predccion del modelo.

Estadsticos de grupo
ITEM
N vlido (segn lista)
No
Desv. ponderado Ponderad
Media
tp.
s
os
E1
Paranoide
6,00
1,581
5
5,000
Alcohlicos
6,00
1,581
5
5,000
Personalidad_Li
6,00
1,581
5
5,000
mite
E2
Paranoide
8,00
,707
5
5,000
Alcohlicos
3,00
1,000
5
5,000
Personalidad_Li
3,00
1,000
5
5,000
mite
E3
Paranoide
7,00
1,225
5
5,000
Alcohlicos
6,00
,707
5
5,000
Personalidad_Li
2,00
1,000
5
5,000
mite
E4
Paranoide
3,00
1,225
5
5,000
Alcohlicos
8,00
1,225
5
5,000
Personalidad_Li
5,00
,707
5
5,000
mite
Total Paranoide
6,00
2,224
20
20,000
Alcohlicos
5,75
2,124
20
20,000
Personalidad_Li
4,00
1,919
20
20,000
mite

Aqu se muestra la diferencia entre las variables explicativas, la visualizacion


de las medias tiene utilidad limitada pero revela que el grupo que aceptaria la
oferta del servicio es aproximadamente EN E2 PARANOIDE ES MAYOR A LAS
DEMAS CON 8.00
EN E4 ALCOHOLICOS ES MAYOR A LAS DEMAS CON 8.00
EN E1 PERSONALIDAD_LIMITE ES MAYOR CON 6.00 QUE EN LAS DEMAS .E2e2

Pruebas de igualdad de las medias de los grupos


Lambda de
Wilks
F
gl1
gl2
Sig.
Paranoide
,255 15,556
3
16
,000
Alcohlicos
,257 15,455
3
16
,000
Personalidad_Lim
,286 13,333
3
16
,000
ite
En la siguiente tabla, nos proporciona pistas acerca de cuales variables
explicativas nos van hacer utiles en nuestra funcion discriminante.
Como se conoce se debe buscar la variable mas significativa, en la columna de
lambda tendra que ser la menor y en la columna de F tendra que ser el mayor,
asi vemos que es la variable PARANOIDE la mas significativa ademas porque
esta en la columna de Sig tiene un valor de .000. Y TIENE LA MENOR LAMBDA
CON 0.255 Y MAYOR EN F CON 15,556

Esta tabla muestruna lista de las variables mas significativas , ignorando las
dems.
La variable PARANOIDE se introduce en primer lugar seguida de
PERSONALIDAD_LIMITE y ALCOHOLICOS.
Se aprecia que ningina de las demas variables creo una diferencia significativa
despues de ajustarse a las primeras tres variables.

Variables en el anlisis
Paso
Toleranc F para
ia
salir
1
Paranoide
1,000
15,556
2
Paranoide
,867
11,247
Personalidad_Li
,867
9,518
mite
3
Paranoide
,860
4,257
Personalidad_Li
,854
8,938
mite
Alcohlicos
,984
5,184

Lambda
de Wilks
,286
,255
,080
,121
,088

En la siguiente tabla se muestra las variables incluidas en el analisis en cada


paso.
Tolerance: Mide el grado de independencia de las variables explicativas (que no
se parezcan), una tolerancia entre 0,7 y 1 es lo ideal, pero una tolerancia entre
0 y 0,69 problemas.
Asi que esas 3 variables son las mas importantes para la prediccion de la
funcion discriminante.
Variables no incluidas en el anlisis
Paso
Toleranc Tolerancia
F para
ia
mn.
entrar
0
Paranoide
1,000
1,000
15,556
Alcohlicos
1,000
1,000
15,455
Personalidad_Li
1,000
1,000
13,333
mite
1
Alcohlicos
,998
,998
5,512
Personalidad_Li
,867
,867
9,518
mite
2
Alcohlicos
,984
,854
5,184

Lambda
de Wilks
,255
,257
,286
,121
,088
,042

En esta tabla , nos proporciona informacin sobre las variables que compiten
por entrar en la ecuacin, En cada paso se introduce la variable con menor
lambda o con mayor F.
Podemos ver lo que ya afirmamos arriba que la variable PARANOIDE se
introduce primero, luego PERSONALIDAD_LIMITE y ALCOHOLICOS , Las
dems variables estn fuera del rango de introduccin y extraccin de la F
(2,71 3,84)

Proporciona un test mutivariado de diferencias significativas entre los grupos.


Si este test no fuera significativo mayor a 0,05(en este caso es altamente
significativo), no tendramos base suficiente para proceder con el DA.

Autovalores
Funci
n
Autoval
or
d1
5,587a
i 2
1,838a
m3
,284a
e
n
s
i
o
n
0

%
% de
acumulad Correlaci
varianza
o
n cannica
72,5
72,5
,921
23,8
96,3
,805
3,7
100,0
,470

Esta tabla mide la fuerza de relacin entre la variable predictora y los grupos.
Se han empleado las 3 primeras funciones discriminantes cannicas en el
anlisis.

Coeficientes estandarizados de las


funciones discriminantes cannicas
Funcin
1
2
3
Paranoide
-,561
,485
,783
Alcohlicos
,689
-,170
,716
Personalidad_Li
,305 1,030
,134
mite
En la siguiente tabla, se intenta cuantificar la importancia relativa de cada
predictor en la funcin discriminante. De modo no sorprendente la variable
PARANOIDE es otra vez el factor dominante, seguido por ALCOHOLICOS y
PERSONALIDAD_LIMITE.
Los signos debemos interpretarlos de la misma manera, Coeficientes elevados,
tanto positivos como negativos, sern los que mas contribuirn a la
discriminacin de las funciones.

Matriz de estructura
Funcin
1
2
3
*
Alcohlicos
,684
-,289
,669
*
Personalidad_Li
,444
,869
-,220
mite
Paranoide
-,702
,116
,703*
Correlaciones intra-grupo combinadas
entre las variables discriminantes y las
funciones discriminantes cannicas
tipificadas
Variables ordenadas por el tamao de
la correlacin con la funcin.
*. Mayor correlacin absoluta entre cada
variable y cualquier funcin
discriminante.
En la tabla muestra las correlaciones entre cada vairable y la funcin
discriminante

Funciones en los
centroides de los grupos
ITEM
Funcin
1
2
3
E1
,692 1,805
,392
E2
-2,804
,270
-,521
E3
-,856 -1,482
,552
E4
2,968
-,593
-,424
Funciones discriminantes
cannicas no tipificadas
evaluadas en las medias de
los grupos
En esta tabla se determina las caracteristicas diferenciadoras de cada grupo,
son el punto medio de cada grupo
Coeficientes de las funciones
cannicas discriminantes
Funcin
1
2
3
Paranoide
-,458
,396
,639
Alcohlicos
,588
-,145
,611
Personalidad_Li
,272
,921
,120
mite
(Constante)
-1,722 -5,224 -7,826
Coeficientes no tipificados
Es esta tabla los coeficiente se pueden emplear para la prediccion de si
aceptaran el servicio o si no lo aceptara

Coeficientes de la funcin de clasificacin


ITEM
E1
E2
E3
E4
Paranoide
6,930 7,339 6,440 4,418
Alcohlicos
5,416 3,028 5,082 6,603
Personalidad_Li
8,114 5,638 4,684 6,427
mite
(Constante)
62,767 43,742 43,856 50,494
Funciones discriminantes lineales de Fisher
Esta tabla muestra los coeficientes de la funcion clasificacion(llamados
coeficientes de clasificacion de fisher) utilizados para clasificar ITEM

Resultados de la clasificacina
ITEM
Grupo de pertenencia
pronosticado
Total
E1
E2
E3
E4
Origin Recuen E1
4
0
0
1
5
al
to
E2
0
5
0
0
5
E3
0
0
5
0
5
E4
0
0
0
5
5
%
E1
80,0
,0
,0
20,0 100,0
E2
,0 100,0
,0
,0 100,0
E3
,0
,0 100,0
,0 100,0
E4
,0
,0
,0 100,0 100,0
a. Clasificados correctamente el 95,0% de los casos agrupados
originales.
b.
EL MODELO ES PRECISO EN UN 95% DE LOS CASOS, LO CUAL ES EXCELENTE

Ejercicio 2: En un estudio realizado por una compaa encuestadora


regiones de:

a las

1. Ancash
2. La libertad
3. Puno
4. Cuzco
5. Tumbes
6. Tacna
7. Cajamarca
8. Piura
9. Lima
10.
Arequipa
11.
Hunuco
12.
Amazonas.
Esta tiene las siguientes caractersticas medibles las cuales son
ndice
exportacin agrcola, ndice de produccin industrial, ndice de mortalidad,
ndice de natalidad, poblacin alfabetizada, nmero de viviendas de material
noble, numero de colegios e ndice de pobreza.

Regio
nes
1

Expor
tac
27,88

Produ
cc
47,07

Mortal Natalid Pob_Alf


id
ad
ab
62,26 28,76
20,51

Vivien
das
2915

Coleg
ios
715

64,92

45,80

28,49

74,89

50,32

2679

738

75,20

30,32

21,99

78,63

33,41

2608

634

44,95

41,65

43,35

60,09

68,99

1123

723

37,40

98,97

81,38

44,21

49,44

2065

754

89,72

76,13

22,82

49,34

41,99

2313

727

33,91

43,56

94,67

70,31

42,70

1453

673

99,12

21,96

40,35

63,47

60,57

2190

597

Pobr
ez
81,9
4
55,8
2
66,6
2
81,5
5
51,6
6
53,6
0
80,7
3
23,0

53,30

43,35

10

51,51

70,40

11

62,72

72,90

12

53,32

92,42
Realice

4
93,16 35,51
75,31
2502
696
28,2
8
65,39 46,73
39,20
1871
773
82,4
7
83,63 20,11
59,63
2400
512
79,8
5
94,63 70,18
74,07
1697
666
48,3
0
el Anlisis de Cluster e interpretar los resultados.

Solucin 02:
Anlisis Cluster

de los Modelos Jerrquicos con SPSS

Matriz de distancias: Esta matriz seala las distancias entre los individuos
(ndice de exportacin agrcola, ndice de produccin industrial, ndice de
mortalidad, ndice de natalidad, poblacin alfabetizada, nmero de viviendas
de material noble, numero de colegios e ndice de pobreza..) segn la
distancia eucldea al cuadrado. Esta matriz es simtrica y si la observamos
veremos que el primer cluster observado estar formado por aquellos regiones
ms cercamos (con menor distancia entre ellos) que son 1.1 y 5.5.

Caso
1:1
,000
15,063
16,641
23,362
13,592
17,224
15,718
33,366
20,262
8,665

2:2
15,063
,000
3,964
13,011
13,739
5,417
15,083
11,170
13,973
9,774

3:3
16,641
3,964
,000
17,789
23,511
8,835
16,236
10,041
22,750
15,081

4:4
23,362
13,011
17,789
,000
14,701
16,321
7,022
21,643
18,138
8,093

Matriz de distancias
distancia eucldea al cuadrado
5:5
6:6
7:7
8:8
13,592 17,224 15,718 33,366
13,739 5,417 15,083 11,170
23,511 8,835 16,236 10,041
14,701 16,321 7,022 21,643
,000 11,435 11,808 27,807
11,435
,000 20,609 12,440
11,808 20,609
,000 24,947
27,807 12,440 24,947
,000
10,927 16,760 17,954 13,686
4,792 8,312 6,922 25,698

9:9
20,262
13,973
22,750
18,138
10,927
16,760
17,954
13,686
,000
16,106

10:10
8,665
9,774
15,081
8,093
4,792
8,312
6,922
25,698
16,106
,000

11:11
18,248
24,392
23,089
22,861
17,301
19,494
19,170
23,251
15,405
17,520

12
29
15
23
12
6
16
10
20
10
12

1:1
2:2
3:3
4:4
5:5
6:6
7:7
8:8
9:9
10:1
0
11:1 18,248 24,392 23,089 22,861 17,301 19,494 19,170 23,251 15,405 17,520
,000 16
1
12:1 29,032 15,756 23,730 12,249 6,715 16,395 10,788 20,210 10,686 12,426 16,892
2
Esta es una matriz de disimilaridades

2 Historial de conglomeracin: Nos va indicando el orden de las uniones y


la distancia a la que lo hacen. Por ejemplo: Las dos columnas primeras
columnas indican cuando se forman por primera vez un multicluster, es decir,
un grupo de ms de dos individuos, que son el paso 2 con 2 y 5, con un valor
de 3,964 y 4,792 respectivamente. Asi respectivamente.

Etap
a

1
d2
i3
m
4
e5
n
6
s
i7
o8
n9
010
11

Historial de conglomeracin
Etapa en la que el
Conglomerado que se
conglomerado aparece
combina
por primera vez
Conglomer Conglomer Coeficient Conglomer Conglomer
ado 1
ado 2
es
ado 1
ado 2
2
3
3,964
0
0
5
10
4,792
0
0
4
7
7,022
0
0
2
6
7,126
1
0
5
12
9,571
2
0
4
5
10,760
3
5
2
8
11,217
4
0
4
9
14,762
6
0
2
4
17,677
7
8
1
11
18,248
0
0
1
2
19,615
10
9

Prxima
etapa
4
5
6
7
6
8
9
9
11
11
0

3 Dendograma: En el Dendograma la distancia de agrupamiento aparece en


el eje y los sujetos en el otro En nuestro ejemplo, en la primera etapa, se
agrupan las regiones 2.2 y 3.3, despus las regiones 6.6:, 8.8; y 4.4.

Luego de haber visto el Dendograma repetimos el procedimiento y a travs de


la opcin Guardar se le puede indicar que se guarde en forma de nuevas
variables el grupo al que estara asociado cada pas. Por ejemplo podemos
pedirle que se agrupe a los pases en tres grupos.

Cluster 1
Letonia
Lituania

Cluster 2
Estonia
Repblica Checa
Hungra

Cluster 3
Polonia
Eslovaquia

Ejercicio 3: En la tabla siguiente se presentan las distancias, en kilmetros,


entre las 8 ciudades europeas indicadas.

Madri
d
Paris
Brusel
as
Amst.
Berln
Roma
Lisboa
Londre
s

Madri
d
0

Paris

Amst.

Berln

Roma

1260

Brusel
as
1556

1735

2360

2066

Lisboa Londr
es
644
1725

1260
1556

0
296

296
0

475
198

1100
789

1437
1545

1792
2088

465
374

1735
2360
2066
644
1725

475
1100
1437
1792
465

198
789
1545
2088
374

0
685
1766
2267
344

685
0
1529
2892
996

1766
1529
0
2730
1902

2267
2892
2730
0
2257

344
996
1902
2257
0

Realice el Anlisis Multidimensional e interpretar los


resultados.

Escala inicial

Iteraciones para dos dimensiones

Coordenadas segn estmulos

Datos ptimamente escalados

Prueba de Bondad de Ajuste y Stress

Medidas de ajuste y stress


Stress bruto normalizado

,00371

Stress-I

,06088a

Stress-II

,12992a

S-Stress

,00683b

Dispersin explicada (D.A.F.)

,99629

Coeficiente de congruencia de Tucker

,99815

PROXSCAL minimiza el stress bruto normalizado.


a. Factor para escalamiento ptimo = 1.004.
b. Factor para escalamiento ptimo = .990.
Como nuestro S-stress es bajo con un 0,006 podemos afirma que nuestros
datos sirven para realizar un escalamiento multidimensional.
6. Matriz de Coordenadas
Coordenadas finales
Dimensin
1

Madrid

,729

,275

Paris

-,195

,322

Brucelas -,572

,096

Berlin

-,343

-,443

Amsterda -,427
m

,137

Lisboa

1,106

-,001

Roma

,151

-,690

Londres

-,350

,203

En la tabla anterior se muestran las coordenadas de la ubicacin de cada


ciudad de Europa.
Grfica de las dimensiones encontradas