Sei sulla pagina 1di 51

TECNICAS ESTADÍSTICAS

MULTIVARiADAS

Autora: Mg. Jessica Vicuña Villacorta


jvericka@hotmail.com

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO


Las técnicas del Análisis Multivariable

Tipología de las técnicas

 De análisis de la dependencia
 De análisis de la interdependencia
 Otras técnicas

https://books.google.com.pe/books?id=m8-GYngyIggC&printsec=frontcover&dq=ANALISIS+MULTIVARIANTE&hl=es-
419&sa=X&ved=0ahUKEwjClfnq-anZAhWBtVMKHT18B9YQ6wEIKjAB#v=onepage&q=ANALISIS%20MULTIVARIANTE&f=false

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO 2


Análisis de correspondencias

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO 3


ANÁLISIS DE CORRESPONDENCIA

Es una técnica multivariante de interdependencia que se utiliza


para examinar gráficamente las relaciones entre dos conjuntos
de variables o categorías, generalmente con valores absolutos
en un espacio bidimensional, denominado mapa perceptual.

Se basan en la asociación entre objetos y un conjunto de


características descriptivas o atributos, especificados por el
investigador.

Por ejemplo: En investigación de mercados, se puede estar


interesado en relacionar por un lado los productos, las
empresas, las marcas y en el otro lado suele ser los atributos ,
las características.
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO 4
Análisis de correspondencia

Objetivo:

Analizar relaciones entre variables categóricas y trabaja con


las frecuencias o matrices de valores absolutos.
Analizar las semejanzas y diferencias entre las categorías de
una misma variable.
Analizar la relación de semejanzas y diferencias entre las
categorías de las distintas variables incluidas en el análisis

Variables:

Variables : Categóricas (nominal, ordinal)

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO 5


Análisis de correspondencia

Si se relaciona 2 variables Correspondencia


categóricas simple

Si se relaciona más de 2 variables Correspondencia


categóricas múltiple.

Estudios de preferencias de consumo en Investigación de Mercados.

Estudios que buscan tipologías de individuos respecto a variables cualitativas


(comportamiento de especies en biología, patrones de enfermedades en medicina,
perfiles psicológicos, etc.).

Estudios de posicionamiento de empresas a partir de las preferencias de


consumidores.

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO 6


Ejemplo 1. Atributos
Correspondencia simple
Facilid
Condicion ad de
Rapidez de Informa Trato del es de acces
En un estudio sobre el Empresas Precios Marcas entrega ción personal pago o
mercado de material E1 16 6 20 11 28 21 21
eléctrico, se entrevistó a E2 17 15 20 13 25 21 21
una muestra de clientes E3 18 18 23 12 25 20 21
E4 19 17 21 17 22 24 23
de nueve empresas, con E5 16 27 29 20 30 27 26
el fin de determinar el E6 45 20 20 16 26 22 15
posicionamiento de E7 15 2 18 15 24 18 16
dichas empresas con E8 19 14 19 10 22 21 18
E9 18 53 25 44 26 24 21
respecto a siete
atributos. Cada cliente
tuvo que asociar a cada
atributo a una o más
empresas

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO


Desarrollo del ejemplo 1 (Correspondencia simple) en SPSS

Ingresamos el
código y luego
el nombre de
la categoría

Ingresamos a
vista de
variables ,
para asignar
sus nombres

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO 8


DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
Click en
definir rango.,
ingresamos 1
y 9 por ser 9
empresas

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO


DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
Resultados AC

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO


La proporción de la La D2 explica el 27.5% de
inercia, es la cantidad de la información, las 2
información contenida primeras dimensiones
en cada dimensión explican el 91.1% de la
información total

Mide la importancia de En resumen si son independientes


cada dimensión. A mayor habrá poca inercia y si son
inercia e las 2 primeras dependientes (están relacionadas)
dimensiones, representa habrá mucha inercia, es decir, mucha
mejor similitudes y dispersión
diferencias en las variables
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
La Inercia:

Es el estadístico que mide la dispersión de la nube de puntos. La


inercia es el promedio de las distancias de los distintos puntos a su
centro de gravedad, estando cada distancia ponderada por la masa
del punto correspondiente.

La inercia total es igual al cociente entre el estadístico Chi-cuadrado


de la tabla, y el total de las observaciones.

Es decir, si las variables son muy dependientes, tanto las filas como
las columnas serán distintas entre sí, mientras que si son
independientes serán parecidas

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO


Refleja el grado en que el atributo ha influido
a la formación de la dimensión.
En este caso la marca es el atributo más
importante para la dimensión 1 y el precio
para la dimensión 2

Los atributos que tienen mejor inercia, juegan


un rol importante en la explicación de cada
DIRECCIÓN DEdimensión.
INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
Proximidad entre dos
atributos, quiere decir
que tienen perfiles
parecidos, están
fuertemente
intercorrelacionados.

Ejemplo

Trato de personal y
condiciones de pago.

Empresa 1 y 7, en este
caso podría
interpretarse que
tienen las mismas
fortalezas y
debilidadades.
Proximidad entre dos
atributos y empresas,
existe una fuerte
asociación

Ejemplo

La empresa 9 y el
atributo marca o la
empresa 6 y el
atributo precio

Empresa 1 y 7, en este
caso podría
interpretarse que
tienen las mismas
fortalezas y
debilidadades.
ANALISIS FACTORIAL

 Es una técnica que consiste en resumir la información


contenida en una matriz de datos con V variables.
 En el A. F. se identifican un reducido número de factores F,
siendo el número de factores menor que el número de
variables.
 Los factores “F” representan a las variables originales, con
una pérdida mínima de información.
Mg. Jessica Vicuña Villacorta
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
TIPOS DE ANALISIS FACTORIAL
EXPLORATORIO CONFIRMATORIO

Se caracteriza En el análisis de
porque no se tipo confirmatorio,
conoce apriori el los factores están
número de fijados a priori,
factores, y es en la utilizándose
aplicación empírica contrastaciones
donde se empíricas para su
determina este corroboración.
número.

Mg. Jessica Vicuña Villacorta


PASOS EN EL ANALISIS FACTORIAL

1. Examen de la matriz de correlaciones de todas las


variables (conocida habitualmente como matriz R).
2. Extracción de los factores necesarios para representar los
datos.
3. Rotación de los factores con objeto de facilitar su
interpretación. Representación gráfica.
4. Calcular las puntuaciones factoriales de cada individuo .

Mg. Jessica Vicuña Villacorta


DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
1º PASO:
examen de la matriz de correlaciones

Requisito : Las variables deben estar altamente correlacionadas. Los


métodos que pueden utilizarse son:

 El determinante de la matriz de correlaciones:


 Test de Esfericidad de Bartlett:
 Índice KMO de Káiser-Meyer-Olkin
 Correlación Anti-imagen.
 Correlación Múltiple

Mg. Jessica Vicuña Villacorta


DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
 El determinante de la matriz de correlaciones:

Un determinante muy bajo indicará altas intercorrelaciones entre las


variables, pero no debe ser cero, pues esto indicaría que algunas de las
variables son linealmente dependientes.

 Test de Esfericidad de Bartlett:

Ho: R = I Ausencia de correlación significativa entre las variables


Ho: | R| = 1.

La formula correspondiente asume la siguiente expresión:

Donde:
n =tamaño muestral.
p =número de variables.
gl = p ( p-1)/2 Ln=logaritmo neperiano.
R =matriz de correlaciones.

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD


Mg. JessicaCÉSAR
Vicuña VALLEJO
Villacorta
 Indice KMO de Kaiser-Meyer-Olkin:

Valores bajos del índice KMO desaconsejan la utilización de Análisis


Factorial. Como baremo para interpretar el índice KMO podría tomarse
según Kaiser:

o.9 <= KMO <= 1 muy bueno


0.8 <= KMO < 0.9 meritorio
0.7 <= KMO < 0.8 mediano
0.6 <= KMO < 0.7 mediocre
0.5 <= KMO < 0.6 bajo
KMO < 0.5 inaceptable
Donde: rij= correlación simple.
aij= correlación parcial.

 Correlación Anti-imagen:
Es el negativo del coeficiente de correlación parcial. Si existe factores
comunes, esperamos que los coeficientes de correlación parcial sean
pequeños, para que sea razonable la aplicación del Análisis Factorial.

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSARVicuña


Mg. Jessica VALLEJO
Villacorta
 Medida de Adecuación de la muestra (MSA): Valores bajos
desaconsejan el uso del análisis factorial.

Donde: rij= correlación simple.


aij= correlación parcial.

 Correlación Múltiple: Deberá ser alto, sobre todo si la técnica a


utilizar es un análisis factorial.

DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO


m0 m25 m50 m75 w0 w25 w50 w75
Algeria 63 51 30 13 67 54 34 15
Cameroon 34 29 13 5 38 32 17 6
Madagascar 38 30 17 7 38 34 20 7
Ejemplo: Se considera Mauritius 59 42 20 6 64 46 25 8
una muestra de los años Reunion 56 38 18 7 62 46 25 10
Seychelles 62 44 24 7 69 50 28 14
de vida esperados por South Africa(C) 50 39 20 7 55 43 23 8
país, edad y sexo. South Africa(W) 65 44 22 7 72 50 27 9
Tunisia 56 46 24 11 63 54 33 19
Canada 69 47 24 8 75 53 29 10
Costa Rica 65 48 26 9 68 50 27 10
Dominican Rep 64 50 28 11 66 51 29 11
El Salvador 56 44 25 10 61 48 27 12
Greenland 60 44 22 6 65 45 25 9
Grenada 61 45 22 8 65 49 27 10
Guatemala 49 40 22 9 51 41 23 8
Honduras 59 42 22 6 61 43 22 7
Jamaica 63 44 23 8 67 48 26 9
Mexico 59 44 24 8 63 46 25 8
Nicaragua 65 48 28 14 68 51 29 13
Panama 65 48 26 9 67 49 27 10
Trinidad(62) 64 63 21 7 68 47 25 9
Trinidad (67) 64 43 21 6 68 47 24 8
United States (66) 67 45 23 8 74 51 28 10
United States
(NW66) 61 40 21 10 67 46 25 11
United States
(W66) 68 46 23 8 75 52 29 10
United States (67) 67 45 23 8 74 51 28 10
Argentina 65 46 24 9 71 51 28 10
Chile 59 43 23 10 66 49 27 12
Columbia 58 44 24 9 62 47 25 10
DIRECCIÓN DE INVESTIGACIÓN Ecuador Mg. Jessica Vicuña
57 Villacorta
46 28UNIVERSIDAD
9 60 CÉSAR
49VALLEJO
28 11
2º PASO: Extracción de los factores
En esta etapa es necesario adoptar dos decisiones:

(a) El método que se va a emplear para extraer los factores .


(b) Cuántos factores van a ser extraídos.

MÉTODOS PARA LA EXTRACCIÓN DE FACTORES

 Componentes principales : Es adecuado cuando se trata de resumir la mayor parte posible de la


información inicial (varianza) en el menor número de factores posibles

 Ejes principales o de las componentes principales iteradas.


Adecuado cuando se trata de identificar factores o dimensiones que reflejen lo que las variables comparten
en común.

 Mínimos cuadrados, Máxima verosimilitud, Método alfa.

También se siguió la sugerencia de Peña (2002) de que el número máximo de factores a extraer ha de ser menor a
la mitad del número inicial de variables menos 1.

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO


El número de factores es una variable relacionada directamente con la
pérdida de información e inversamente con la interpretabilidad de los
resultados.

CRITERIOS DEL NÚMERO DE FACTORES

 Criterio de los auto valores: Káiser (1960)

Factores cuyos valores propios (eigenvalues) son mayores a la unidad.

 Criterio de porcentaje de varianza explicada.

El fin de este criterio es asegurar la significativita de los resultados del análisis


factorial, aunque no se ha establecido unos niveles objetivos, se considera que en las
ciencias naturales hay que extraer factores hasta que se explique, por lo menos el
95% de la varianza, mientras que en las ciencias sociales el 60%

 Criterio del gráfico de sedimentación.(Uriel, 1995)


Representa en ordenadas las raíces características y en abscisas el número de
factores.
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
Mg. Jessica Vicuña Villacorta
EXTRACCIÓN DE Factores: Método de Componentes
Principales

% de la %
Componente Autovalores varianza acumulado
1 5.602 70.030 70.030
2 1.358 16.977 87.007
3 0.499 6.242 93.249
4 0.308 3.852 97.101
5 0.155 1.934 99.034
6 0.059 0.733 99.767
7 0.013 0.160 99.927
8 0.006 0.073 100.000

DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO


MATRIZ FACTORIAL:

Comunalidades Varianza específica

F1 F2
M0 .846 -.504 .969 0.031
M25 .793 -.265 .700 0.300
M50 .864 .207 .789 0.211
M75 .675 .632 .855 0.145
W0 .831 -.505 .947 0.053
W25 .972 -.110 .957 0.043
W50 .948 .177 .929 0.071
W75 .723 .541 .815 0.185
5.602 1.358

DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO


3º PASO: Rotación de los factores

Consiste en realizar un giro de los ejes de ordenadas de los factores respecto a


las variables para que las correlaciones entre ellas sean o muy pequeñas
(próximas a cero) o muy grandes (próximas a uno). Su finalidad es facilitar la
explicación y conocer qué variables pertenecen a cada factor y con cuanta fuerza
lo hacen.

Existen dos formas de realizar la rotación de los factores:

 La rotación ortogonal (Método Varimax, Quartimax, Ecuamax ).

 La rotación oblicua (Oblimin, Oblimax, Promax y otros).

Mg. Jessica Vicuña Villacorta


DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
4º PASO: PUNTUCIONES FACTORIALES

Una vez realizado el análisis factorial es importante calcular las puntuaciones


factoriales de los sujetos investigados para conocer cuánto poseen o cuánto
puntúan en cada factor (o conocer las coordenadas para obtener un mapa
situacional de todos los sujetos en cada uno de los factores.

Pif = Puntuación del sujeto i en el factor f.


Zji = Puntuación típica del sujeto i en la variable j.
R-1 = Inversa de la matriz de correlaciones entre
Pif = Zji . R-1 . Ljf las variables.
Ljf = Matriz completa de los número pesos
rotados.
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD
Mg. JessicaCÉSAR VALLEJO
Vicuña Villacorta
Aplicación del ejemplo en el
Spss

DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO


DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO
Mg. Jessica Vicuña Villacorta
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO
Mg. Jessica Vicuña Villacorta
DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO
Gráfico de sedimentación

4
Autovalor

1 2 3 4 5 6 7 8
Número de componente

DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO


Matriz de componentes(a) Matriz de componentes rotados(a)

Componente Componente
1 2 1 2
W25 .972 -.110 M0 .970 .166
W50 .948 .177 W0 .960 .155
M50 .864 .207 W25 .811 .547
M0 .846 -.504 M25 .776 .313
W0 M75 .103 .919
.831 -.505
M25 W75 .198 .881
.793 -.265
W50 .606 .749
W75 .723 .541
M50 .523 .718
M75 .675 .632

Método de extracción: Análisis de componentes


Método de extracción: Análisis de
principales.
componentes principales. Método de rotación: Normalización Varimax con
a 2 componentes extraídos Kaiser.

DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica Vicuña Villacorta UNIVERSIDAD CÉSAR VALLEJO


Para interpretar los factores, es necesario ver, mediante las cargas factoriales,
qué variables utilizar. Dado que todas las variables cargan en mayor o menor
medida, es necesario tener algún criterio para seleccionar las cargas más
importantes.
Normalmente se utiliza el siguiente criterio, según el tamaño de la muestra:

Tamaño de
muestra Carga Factorial
350 0.3
250 0.35
200 0.4
150 0.45
120 0.5
100 0.55
85 0.6
70 0.65
60 0.7
DIRECCIÓN DE INVESTIGACIÓN
50 0.75 Mg. Jessica Vicuña Villacorta
UNIVERSIDAD CÉSAR VALLEJO
CONCLUSION.

De lo observado, en la matriz factorial rotada , se aprecia que la


variables M0, W0, M25 Y W25 se agrupan en el primer factor.
además las variables W50, M50 W75 y M75, se agrupan en el
segundo factor.

Primer factor: Relacionado con la esperanza de vida de los


hombres y mujeres al momento de nacer y en la juventud.

Segundo Factor: Tiene los pesos factoriales más altos con


respecto ala esperanza de vida en los hombres y mujeres entre
50 a 75 años.
DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica CÉSAR
UNIVERSIDAD Vicuña Villacorta
VALLEJO
Bibliografía
 TEXTOS:

 Análisis Multivariante Aplicado


Autores: Ezequiel Uriel Jiménez – Joaquín Aldás Manzano

 Técnicas estadísticas multivariantes.


Autor: Félix Calvo Gómez.

DIRECCIÓN DE INVESTIGACIÓN Mg. Jessica


UNIVERSIDAD CÉSAR Vicuña Villacorta
VALLEJO
Bibliografía utilizada:

Álvarez Cáceres R. (2007) “Estadística aplicada a las Ciencias de la


salud”.Ed. Díaz de Santos.

Carmona Potanque F. (2005). “Modelos lineales”. Ed. Universitat de


Barcelona.
Heinz Kohler A.C (1996). “Estadística para negocios y economía” Editorial.
Continental S.A. México.

Pedroza H. y Dicovskyi (2006) “Sistema de análisis estadístico con SPSS”


Editorial Managua IICA

https://books.google.com.pe/books?id=J1MbiCsG8AMC&pg=PA365&dq=ANALISIS+DE+CORRESPONDENCIA+
MULTIPLE&hl=es-
419&sa=X&ved=0ahUKEwjZ0bro9MfZAhWqs1kKHaITDO8Q6AEIJTAA#v=onepage&q=ANALISIS%20DE%20COR
RESPONDENCIA%20MULTIPLE&f=false

https://books.google.com.pe/books?id=Zn8smJf99dkC&printsec=frontcover&dq=ANALISIS+DE+CORRESPOND
ENCIA+MULTIPLE&hl=es-
419&sa=X&ved=0ahUKEwjZ0bro9MfZAhWqs1kKHaITDO8Q6AEIKzAB#v=onepage&q&f=false

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO


Saber no es suficiente, debemos aplicar.
Desear no es suficiente, debemos hacer.

Johann W. Von Goethe

¡Gracias!

DIRECCIÓN DE INVESTIGACIÓN UNIVERSIDAD CÉSAR VALLEJO

Potrebbero piacerti anche