Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Anlisis de correspondencias
Pedro Lpez-Roldn
Departamento de Sociologa
Centro de Estudios Sociolgicos sobre la Vida Cotidiana y el Trabajo (QUIT)
Instituto de Estudios del Trabajo (IET)
Universidad Autnoma de Barcelona
Pedro.Lopez.Roldan@uab.cat
Sandra Fachelli
Departamento de Sociologa y Anlisis de las Organizaciones
Universidad de Barcelona
Grupo de Investigacin en Educacin y Trabajo (GRET)
Universidad Autnoma de Barcelona
Sandra.Fachelli@ub.edu
Agosto de 2015
Presentacin: el anlisis de correspondencias
2 variantes principales:
Anlisis de Correspondencias Simples (ACS)
Anlisis de Correspondencias Mltiples (ACM)
Otras variantes:
Anlisis de Correspondencias Mltiples Condicional (ACMC)
Anlisis de Correspondencias Asimtrico (ACA)
Anlisis de Componentes Principales Categrico (ACPC)
Es una tcnica de anlisis factorial
Busca factores que son la expresin de combinaciones de las variables
originales
Expresan los principales factores de diferenciacin (inercia explicada)
Ordenados jerrquicamente
Reducen los datos: Prdida de informacin y ganancia en significacin
La representacin grfica es una ayuda para la interpretacin: la proximidad en
el espacio significa correlacin entre categoras: correspondencias
Variable 1
Categora 1
Categora 2
Categora 3
Categora 4 Factor 1
Variable 2
Categora 1
Categora 2
Categora 3
Variable 3
Categora 1
Categora 2
Categora 3 Factor 2
Categora 4
Variable 4
Categora 1
Categora 2
Categora 3
Contribucin fuerte
Contribucin moderada
Sin flecha Contribucin dbil
Perfiles fila y columna: distribuciones condicionales por fila y por columna (en %)
EDAD Edad del entrevistado/a
Perfiles fila 1 2 3 4 5 6
Menos de 26 26-35 36-45 46-55 56-65 Ms de 65 Total
1 Lo habla y lo escribe 38,3% 21,7% 12,7% 9,6% 7,5% 10,2% 100,0%
conocimiento del
LENGUA Nivel
2 Lo habla pero no escribe 4,7% 15,5% 20,5% 20,3% 18,9% 20,1% 100,0%
3 Lo entiende solamente 7,4% 12,6% 20,0% 23,8% 19,9% 16,3% 100,0%
cataln
2 Lo habla pero no escribe 7,4% 27,1% 35,3% 35,6% 37,5% 37,2% 29,4%
conocimiento del
hiperplano de ecuacin:
I nij
n 1 W
Habla y escribe
26-35
Dualmente espacio J
Representacin simultnea
Objetivo del anlisis: comparar las filas y las columnas para determinar las
correspondencias que se dan entre la diferentes categoras o modalidades
Procedimiento tcnico:
1) Mtrica para determinar la proximidad: medida de distancia 2
2
J
1 fij fi ' j
d 2 (i, i ' )
j 1 f j fi fi '
2) La suma de la distancias de cada punto al centro de gravedad es la inercia.
La inercia total es
3) La distancia 2 se transforma en euclidiana y se
obtiene la Matriz de Inercia (o de Varianzas y
Covarianzas)
4) Como en ACP se procede a la Diagonalizacin:
a la obtencin de los vectores propios (factores)
y valores propios (inercia explicada por los
factores)
Resultados e interpretacin
Vectores propios: son los factores, se extraen un total de mn I , J 1
Valores propios: expresan la inercia relativa (la varianza explicada) de cada eje
Criterios del nmero de factores a retener
1. Considerar el nmero de ejes que acumulan en torno al 70% de la inercia total
2. Representar grficamente los factores
y los valores: Grfico de sedimentacin
Scree test (Catell, 1966)
3. Interpretabilidad y pertinencia conceptual
de los ejes obtenidos
Resultados e interpretacin
Representacin grfica
Buscar las categoras con mayor contribucin absoluta
De estos se distinguen entre los positivos y los negativos para definir las
polaridades del eje
Se estudia la calidad de la representacin de los puntos, las valores ms altos
de contribucin relativa
Interrelacionan los ejes para dar cuenta de la estructura de relaciones teniendo
en cuenta el orden jerrquico de cada eje
Una categora que coincide con el perfil medio se ubicar en el centro del
espacio cercano al origen ("tipo ideal promedio"). Si se aleja difiere de este
promedio.
Si dos filas (o columnas) tienen perfiles similares se situarn prximos en el
espacio.
Equivalencia distribucional: las distancias entre dos modalidades no se alteran si
se juntan. Criterio de recodificacin.
Modalidades suplementarias (ilustrativas)
Resultados e interpretacin
Representacin grfica
Procedimiento Corbi
ACS a partir de una tabla de
contingencia en una base de
datos .sba
Procedimiento Table+Corbi
ACS a partir de una matriz
de datos de individuos por
variables, donde primero se
construye la tabla de
contingencia
Gallery of
Graphics
Factorial
Result Graph Editor
Editor
Seleccin Gallery of
de casos Graphics
filas
Opciones de
Excel
Factores listados
Opciones de Excel
Contribuciones Contribuciones
absolutas relativas
1
Peso relativo: % total
(nj100) / n
Factor 1
Filas (casos) y
columnas
(frecuencias) ms
relevantes de
cada eje o factor
Factor 3
etiquetamos:
trazamos segmentos
Ejemplo 4: Resultados
Ejemplo 4: Resultados
Cada categora es el punto medio de los individuos que la componen, ponderado por
el coeficiente
La proporcin de inercia explicada por los ejes factoriales es dbil (pesimista). Es
necesaria una frmula de clculo de transformacin y obtener as los valores
propios corregidos:
a) Benzcri (1979) propuso la frmula:
1) Calcular la inversa del nmero de variables: 1/p
2) Seleccionar los valores propios superiores a: 1/p
2 2
3) Calcular los valores propios corregidos con: p 1
Cj j
p 1 p
4) Calcular de nuevo la proporcin de varianza explicada
La inercia explicada por una categora es mayor cuanto menos frecuente. En este
sentido considerar:
Como mnimo el error muestral. En general un mnimo del 5%
En SPAD, procedimiento CORMU, permite ventilar (de hecho imputar el valor
medio) las categoras con una frecuencia inferior al 2% (ajustable)
En SPAD es posible la seleccin de modalidades en COREMA (ACM con seleccin
de categoras), se eliminan pero se visualizan como ilustrativas
Proceso de anlisis
de un ACM
Rouanet, H., Ackermann, W., Le Roux, B. (2001). El anlisis geomtrico de encuestas: la leccin de La
Distincin de Bourdieu. Revista Colombiana de Sociologa, 6, 1, 139-145.
http://www.revistas.unal.edu.co/index.php/recs/article/viewFile/11063/11729
Espacio Social:
Las diferencias de clases (y de fracciones) se distribuye entre aquellos
que estn mejor provistos (capital econmico y cultural) y aquellos que
estn menos provistos.
El espacio social es una representacin abstracta, un mapa, para
comprender la realidad social.
Hbitus:
No slo es una estructura estructurante, la cual organiza prcticas y la
percepcin sobre las prcticas, sino tambin una estructura estructurada:
el principio de divisin entre la lgica de clases la cual organiza la
percepcin del mundo social. Es en s mismo el producto de
internalizacin de la divisin entre clases sociales.
Gusto:
Es el operador prctico de la transmutacin de cosas en signos
distintos y distintivos, de una distribucin continua en oposiciones
discontinuas. Las diferencias inscriptas a nivel fsico se traslada al
orden simblico, se trata de distinciones significantes.
Es la fuente del sistema de diferentes caractersticas, las cuales no
fallan al ser percibidas como una expresin sistemtica de una clase
particular de condiciones de existencia.
Variables Activas:
Decoracin del hogar (12 categoras)
Amigos (12 categ.)
Platos que se sirven a los amigos (6 categ.)
Estilos de muebles (6 categ.)
Cantantes preferidos (12 categ.)
Obras de msica clsica (15 categ.)
Visita a museos (4 categ.)
Pintura (5 categ.)
Variables ilustrativas:
Edad
Profesin del padre
Nivel de instruccin
Ingresos
Anlisis Factorial de Correspondencias 35
Anlisis Factorial de Correspondencias 36
Anlisis Factorial de Correspondencias 37
Anlisis de Correspondencias Mltiples con SPAD
CORMU: Anlisis de
Correspondencias Mltiples
ACM
CORMU: Multiple Correspondence Analysis
DEFAC: Description of Factorial Axes
ACL
RECIP/SEMIS: Factor Based Cluster Analysis
PARTI-DECLA: Cut the tree & Cluster Description
Guardar variables
ESCAL: Storing of Factorial Axis & Partitions
Matriz de datos
Actitud.sba
Anlisis Factorial
CORMU: Anlisis de
Correspondencias Mltiples
Exportacin a Excel
de los resultados
Gallery of
Graphics
Factorial
Graph Editor
Ponderacin: variable
Seleccin V4 de frecuencia
de variables
Activas categricas
Ilustrativas categricas
Ilustrativas continuas Nmero de factores retenidos
Factores listados
Eliminacin de
Seleccin categorias
de casos frecuencia < 2%
Taula de Burt
(optativa)
Opciones de
Excel
Coordenadas o
factores de carga
+ i 1
Distancia de
Chi-cuadrado al origen 100%
d2(j,G)=(n/nj)1 100% 100%/7=14,3%
Si > 2 la categora
es significativamente
diferente de 0, se
aleja del centro de
gravedad G
Nuevo grfico
Casos activos
Casos ilustrativos
Variables activas categricas
Escollir
eixos