Sei sulla pagina 1di 14

- 1 -

Inconvenientes metodolgicos
del anlisis de correspondencias
para el tratamiento de variables mixtas
Soluciones aplicadas al estudio de la estratificacin social en Chile



Adrin Leguina
Departamento de Estadstica, Facultad de Matemtica,
Pontificia Universidad Catlica de Chile
anleguin@uc.cl









1. Introduccin
En estudios de caracterizacin y/o construccin de perfiles, es usual utilizar variables cualitativas y
cuantitativas. A este tipo de variables multidimensionales, se les conoce como variables mixtas. Para
el tratamiento conjunto de variables cualitativas y cuantitativas, encontramos diferentes tipos de
discretizacin para variables numricas, las que generalmente consisten en transformar las variables
continuas en variables cualitativas multiestado, asumiendo que este proceso implica perder
informacin. Dentro de estas posibilidades encontramos la codificacin de variables continuas de
Escofier (Escofier 1979).
Para el anlisis estadstico de variables mixtas, se propone aplicar la codificacin de Escofier a
variables cuantitativas, transformar cada categora de variables cualitativas multiestado en variables
dicotmicas, y finalmente aplicar anlisis de correspondencias (AC) a toda la matriz de datos.
Comparando los resultados del AC slo para variables cuantitativas codificadas, con la aplicacin
de anlisis de componentes principales a las variables originales, es posible verificar el grado de
informacin perdida debido a la codificacin de variables (Leguina 2009).


- 2 -
Esta propuesta se aplic al estudio de la problemtica de estratificacin social en Chile (Seplveda y
Leguina 2008). Los resultados muestran que al aplicar AC a variables continuas codificadas
utilizando la propuesta de Escofier, se obtienen resultados considerablemente mejores que los
encontrados a travs de realizar la aplicacin a datos codificados arbitrariamente. De esta forma, se
pone de manifiesto la importancia de esta etapa previa al anlisis de datos.

2. VARIABLES MIXTAS Y PROBLEMAS EN SU UTILIZACIN

Usualmente, se trabaja en forma simultneamente con grandes matrices de datos multivariantes,
que contienen variables de distinta naturaleza. A este tipo de variables multidimensionales se le
conoce como variables mixtas. Los investigadores sociales, constantemente analizan e interpretan
este tipo de variables, a pesar de no ser siempre concientes de ello. Por ejemplo, en modelos
lineales (de cualquier tipo y/o complejidad) se pueden utilizar variables dicotmicas (dummies) para
estudiar la capacidad predictiva de una variable independiente, no necesariamente continua, sobre
una variable dependiente.

Segn Benzcri (2002) se subentiende la distincin entre variable cualitativa y cuantitativa: no
deberamos decir que un valor continuo corresponde a datos cuantitativos, y un valor que toma una
cantidad finita de modalidades equivale a datos aproximadamente cualitativos. Eso no siempre ser
cierto, ya que dependiendo de la unidad estadstica de anlisis, no siempre somos capaces de medir
variables numricas con la precisin esperada. La distincin entre variables debe provenir de su
significado. Lo anterior, hace que plantear el tipo de variable que se necesita y utiliza en una
investigacin, sea una tarea ms difcil de lo que parece, produciendo que los propios investigadores
no sean capaces de reconocer los tipos de variables que operacionalizan. Por lo tanto, el sustento
terico de la investigacin debe guiar la conceptualizacin de las variables utilizadas, incluyendo su
posible (re)codificacin.

El procedimiento clsico para el manejo de datos en AC, a travs de la construccin de la tabla
disyuntiva completa, considera que todas las variables son de tipo cualitativas. Su aplicacin directa
a datos cuantitativos continuos o discretos
1

1
En estricto rigor, no es posible construir una tabla disyuntiva completa a variables continuas con recorrido en los
nmeros reales, debido a que tendran infinitas modalidades.
genera discontinuidades en la nueva variable, que
implican prdida de informacin. El paso progresivo de una categora a otra implica que valores
cercanos a la frontera de dos categoras no son muy diferentes en sus valores originales.


- 3 -
Tabla 1. Ejemplo de codificaciones arbitrarias

Calidad de TV 2 categoras 3 categoras 4 categoras 5 categoras 6 categoras
8 2 3 4 4 6
4,2 1 2 2 3 3
7 2 3 3 4 6
10 2 3 4 6 6
5,4 2 2 3 3 4
Fuente: Elaboracin propia

Lo anterior es posible demostrarlo empricamente a travs de un pequeo ejemplo. La tabla 1
contiene informacin de la variable cuantitativa percepcin de la calidad del canal de televisin
que ve con mayor frecuencia para las primeras 5 observaciones. Imaginemos que deseamos
codificar esta variable en categoras discretas. El primer problema que se enfrenta es definir el
nmero ptimo de categoras para discretizar la variable. En este caso se codificar utilizando 2, 3,
4, 5 y 6 categoras. Ahora, Qu ancho tendrn cada uno de los intervalos? Esto corresponde a otra
posible interrogante dentro de la discretizacin arbitraria, que se podra resolver (sin claros
beneficios) definiendo intervalos de igual ancho. Notemos que aplicando este procedimiento se
pierde la posibilidad de interpretar el sentido de orden presente en la variable cuantitativa original
2

,
adems de existir una clara prdida de informacin.
Grfico 1. Correlaciones entre distancias

Fuente: Elaboracin propia

2
Este problema se ve acentuado al aplicar AC sobre una variable discretizada de esta manera.
0,50
0,81
0,35
0,82
0,67
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1 2 3 4 5 6 7
Nmero de intervalos
Correlacin


- 4 -
Para enfatizar an ms en este problema, se calcular la distancia
3
entre individuos, utilizando la
variable original y la variable discretizada en distinta cantidad de intervalos. Si la codificacin
arbitraria fuera buena, debera capturar la mayor cantidad de informacin acerca de las diferencias
entre individuos, es decir, estar altamente correlacionada con las distancias entre individuos
respecto a la variable original. El grfico 1 muestra la evolucin de la correlacin de Spearman entre
la distancia euclideana estandarizada y el coeficiente de disimilaridad
4
de emparejamiento simple
extendido
5

para distinta cantidad de intervalos. En el grfico podemos observar que las
correlaciones varan considerablemente, dependiendo del nmero de intervalos utilizados. De esta
forma, se demuestra que la aplicacin de una codificacin arbitraria para discretizar una variable
continua, no es un procedimiento adecuado, ni entregar los resultados esperados. Adicionalmente
notemos que a medida que se aumenta el nmero de intervalos, la correlacin no aumenta,
tendiendo a fluctuar y disminuir sinusoidalmente.
3. CODIFICACIN DE ESCOFIER

La codificacin de Escofier (Escofier 1979), utilizada como paso previo al AC, tiene como fin
poder analizar en forma simultnea variables cuantitativas y cualitativas. El procedimiento consiste
en transformar cada variable cuantitativa en dos nuevas variables:

( )
( )

1 2
1 2
i
i
x
x



Donde
i
x es el valor estandarizado de la variable para el individuo i. Notamos que al igual que para
una variable cualitativa binaria, la variable recodificada queda definida por dos columnas, que para
una misma variable siempre la suma ser igual a 1. Las variables cuantitativas codificadas de esta
manera se pueden analizar simultneamente con variables cualitativas con 2 ms categoras
presentadas en forma de tabla disyuntiva completa.


3
En estadstica, la distancia cuantifica la proximidad o lejana entre individuos o poblaciones (Cuadras 2007).
4
Se le llama disimilaridad al clculo de la distancia entre individuos cuando se utiliza variables cualitativas.
5
Este coeficiente se calcula como 1 - (#de similitudes / #variables totales) (Cuadras 2007)


- 5 -
4. ANLISIS DE CORRESPONDENCIAS

El anlisis de correspondencias
6

puede ser definido como una tcnica descriptiva para casi
cualquier tipo de matriz de datos con entradas no negativas, especialmente til para representar
tablas de contingencia que resuman informacin cualitativa, de una forma exploratoria y
reduciendo sus caractersticas multivariantes a la menor cantidad de dimensiones posibles. El
mtodo resulta ser una forma sencilla de graficar los resultados, permitiendo su rpida comprensin
e interpretacin (Greenacre 2007). A pesar de que AC es muy flexible para trabajar con distintos
tipos de variables, es la codificacin la que aporta aun ms a esta capacidad (Murtagh 2005).
Dentro de las principales ventajas de la tcnica, se encuentra que su principio geomtrico permite
representar simultneamente individuos y variables en un mismo espacio, construyendo una
cartografa del espacio social de los encuestados, y caracterizando mediante las variables principales
(o factoriales) resultantes la existencia de distintos perfiles. Para enriquecer los resultados e
interpretaciones, AC permite incluir variables y/o individuos suplementarios, que no participan
en la construccin del espacio geomtrico de las variables. Adems, sus resultados grficos facilitan
la comprensin e interpretacin de los datos.

5. ANLISIS DE DATOS GEOMTRICOS, SOCIOLOGA Y ESTRATIFICACIN
SOCIAL

Desde sus principios, el anlisis de datos geomtricos (ADG) ha sido utilizado en las ms diversas
disciplinas de las ciencias. El anlisis de correspondencias, es la tcnica ms importante de ADG,
donde es posible encontrar que una parte importante de su historia, est muy relacionada con la
sociologa. Para explicar la razn, en primer lugar se debe tener en cuenta una de las diferencias
ms importantes entre la metodologa propuesta por el ADG y la estadstica tradicional aplicadas
a la sociologa (Roux y Rouanet 2005):

En la estadstica tradicional, los indicadores numricos como coeficientes de regresin y
valores p, son el centro de todo anlisis. Desde esta perspectiva se busca la sociologa de las
variables.

6
En este artculo no se presentar la formulacin matemtica del anlisis de correspondencias. Para una completa
definicin se recomienda consultar Murtagh (2005), Roux y Rouanet (2005) y Greenacre (2007).


- 6 -
En ADG, las nubes de puntos son el centro de atencin. Desde esta perspectiva se busca
construir el espacio social de las variables.

Las caractersticas especiales del ADG (y especficamente de AC) resultaron ser bastante deseables
por toda una escuela de sociologa. El marco conceptual del libro La Distincin del socilogo
francs Pierre Bourdieu (19302002), considerado uno de los ms importantes socilogos
contemporneos, nace del uso exhaustivo de teora y evidencia emprica de tipo cualitativa
(entrevistas) y cuantitativa (encuestas). A grandes rasgos, Bourdieu (1979) especifica tres tipos de
capitales (econmico, cultural y social
7

), como las dimensiones bsicas del espacio social de los
estilos de vida. De esta forma, una serie de interrelaciones entre los capitales se asocian al lugar o
posicin de los individuos en la estratificacin social, definiendo la forma en que se relacionan y
diferencian entre s. En este contexto, el AC, junto con el uso de metodologas cualitativas, fueron
capaces de caracterizar mediante grficos de sus ejes factoriales, con notable precisin y detalle, a la
sociedad francesa de la dcada de los 60s. No solo en esta rea Bourdieu aplic el anlisis de
correspondencias, sino que en gran parte de sus investigaciones empricas.
La obra de Bourdieu y sus seguidores, ha tenido un gran impacto sobre el AC. Sin lugar a dudas,
entre los ms importantes encontramos el dar a conocer la tcnica a nivel mundial, generar
discusin e inters a nivel terico, tanto sociolgico como estadstico, lo cual produjo muchos
avances tericos paralelos en la obra de Benzcri.
Desde el punto de vista estadstico, se puede notar que en estudios de estratificacin social es difcil
diferenciar las variables entre dependientes e independiente
8
En Chile tambin se puede ver un gran inters por el tema, donde en los ltimos aos se han
generado varios proyectos relacionados. Por ltimo, y no menos importante, esta investigacin es
clara la influencia de la obra de Benzcri y Bourdieu en el apartado estadstico y aplicado
respectivamente.
, de la forma en la que usualmente
se hace en modelos lineales u otras tcnicas. Definir relaciones causales, o incluso explicativas en el
estudio de la estratificacin social, ha sido cuestionado incluso antes de la aparicin de La
Distincin (Bourdieu 1979; Savage et al. 2005), donde aun no se tiene del todo clara la existencia de
relaciones explicativas entre los capitales, y mucho menos la forma de esta relacin.


7
Para sus definiciones, se recomienda ver Seplveda y Leguina (2009).
8
Esto es vlido especficamente para la lnea originada por la obra de P. Bourdieu. Otros investigadores en
estratificacin social, como J ohn Goldthorpe y Erik Olin Wright, discrepan al respecto.


- 7 -
6. APLICACIN A DATOS REALES DE ESTRATIFICACIN SOCIAL EN CHILE
9


La investigacin propuesta por Seplveda y Leguina (2008) tiene como objetivo aportar a los
estudios de estratificacin social, mediante un concepto de desigualdad social, que define una
distincin global y otra local. Dichos conceptos, provenientes de investigaciones anteriores,
consideran que adems de las variables tradicionalmente utilizadas en estratificacin social (ingreso,
educacin, posesin de bienes, etc.), existen otros factores para distinguir a las personas en grupos
sociales. Bajo este contexto se profundiz la instrumentalizacin de los conceptos de nivel de
informacin que tiene una persona, el cul est sujeto a la calidad, la rapidez, el tipo de
informacin y qu valor le genera en la interaccin con su entorno (Seplveda 2008) y acceso a la
informacin que tiene relacin a la disponibilidad de los distintos medios informacionales
(Seplveda 2008). Desde esta mirada, se pretendi demostrar estadsticamente que los sujetos se
pueden distinguir a travs de nuevos factores no analizados bajo el enfoque clsico de los estudios
de estratificacin social.

Con el fin de caracterizar tanto el nivel como el acceso a la informacin se lleva a cabo un anlisis
de correspondencias mltiples, seleccionando las variables de la encuesta
10

que definen de la mejor
manera posible su nivel y acceso a la informacin. Para su implementacin se utiliz el programa
estadstico R (R Development Core Team 2008). El detalle de las dimensiones, sus indicadores y
definiciones tcnicas pueden verse en Seplveda y Leguina (2008).
El problema detectado en Leguina y Seplveda (2008), es que junto a variables cualitativas
nominales, se analiza variables de tipo cuantitativas ordinales (entre 5 y 6 categoras, adems de
continuas) recodificadas en 3 4 categoras consideradas como nominales. Esta recodificacin se
llev a cabo arbitrariamente. Leguina (2009) presenta un estudio detallado acerca de los
inconvenientes de realizar este procedimiento arbitrariamente, sufriendo severos problemas de
prdida de informacin, que llevan a una incorrecta construccin de la nube de puntos, falta de
ortogonalidad de la solucin factorial, y finalmente, a interpretaciones incorrectas.



9
El desarrollo completo de la investigacin aplicada, incluyendo la conceptualizacin sociolgica, se encuentra en
Seplveda (2008), Seplveda y Leguina (2008), y en la presentacin realizada por Denisse Seplveda y Adrin Leguina
en el GT-3 de este Congreso.
10
Los datos provienen de la 3 Encuesta Nacional de Opinin Pblica de la Universidad Diego Portales (2007), cuyo
objetivo es contribuir a la comprensin de los cambios en las percepciones de los chilenos(as) en diversas reas donde
el pas evidencia transformaciones cruciales


- 8 -
7. RESULTADOS PRINCIPALES

Para el anlisis codificando arbitrariamente las variables cuantitativas, la solucin con tres variables
principales es capaz de explicar un 61,6 % de la variabilidad total de los datos. Los resultados se
resumen en la tabla 2. A continuacin, para cada variable principal, se descompone su variabilidad
segn las siete componentes de nivel y acceso a la informacin, de manera de determinar cual(es)
de ella(s) mejor la explican.

Tabla 2. Contribuciones relativas de los componentes de nivel y acceso a la informacin por las
variables principales aplicando codificaciones arbitrarias y de Escofier.
C. arbitraria C. Escofier
Vp1 Vp2 Vp3 Vp1 Vp2 Vp3 Vp4
% de varianza expresado por la
variable principal 36,4 % 14,5 % 10,7 % 17,9 % 13,6 % 9,0 % 6,8 %
Rapidez/Frecuencia de la
informacin 23,5 % 2,7 % 4,0 % 26,4 % 2,8 % 7,6 % 11,0 %
Tipo de informacin 14,2 % 0,9 % 3,0 % 13,0 % 1,6 % 32,2 % 36,6 %
Influencia de los medios 9,3 % 39,3 % 46,5 % 6,8 % 39,8 % 4,4 % 0,4 %
Influencia de la elite 7,1 % 32,1 % 33,3 % 4,8 % 32,5 % 5,0 % 0,2 %
Influencia propia 2,7 % 2,7 % 11,1 % 2,8 % 2,8 % 0,2 % 0,0 %
Calidad de la informacin 14,2 % 1,8 % 2,0 % 12,9 % 1,5 % 32,2 % 43,9 %
Acceso a la informacin 29,0 % 20,5 % 0 % 33,2 % 19,1 % 18,3 % 7,8 %
TOTAL 100 % 100 % 100 % 100 % 100 % 100 % 100 %
Fuente: Leguina y Seplveda (2008)

La codificacin de datos mediante la tcnica de Escofier se llev a cabo tal como se present en la
seccin 4. La tabla 2 presenta el resumen de los resultados de la aplicacin del AC. Se opta por una
solucin con cuatro variables principales, capaces de explicar un 47,3 % de la variabilidad total. La
componente de influencia propia no figura en ninguna de las primeras cuatro variables principales,
considerando que no tiene importancia suficiente como para ser interpretada dentro del anlisis.
Gracias a la comparacin de los resultados anteriores, podemos visualizar las diferencias entre los
anlisis. Por ejemplo, codificando arbitrariamente pareciera que se explica un mayor porcentaje de
varianza total, pero eso se debe a la violacin del supuesto de ortogonalidad
11

11
Las variables principales construidas mediante AC son independientes entre s. Si dos variables principales se
conforman con las mismas modalidades, estas no sern independientes, ya que estarn asociadas a travs de la variacin
en la respuesta de estas modalidades comunes.
de las variables
principales. Aunque se explique un menor porcentaje de la varianza total, utilizando codificacin de
Escofier se obtiene una solucin ms realista, donde cada variable principal est asociada a distintas
modalidades componentes del nivel y acceso a la informacin.


- 9 -
Desde el punto de vista interpretativo, la solucin mediante codificacin de Escofier nos lleva a un
correcto anlisis del nivel de importancia que adquiere cada una de las modalidades sobre las
variables principales, anulando el efecto de influencia propia, pero incluyendo la percepcin de
calidad de la informacin, e incluso diferenciando entre medios, incluyendo a diarios (VP3) y
televisin (VP4) como factores jerarquizados y diferenciadores sociales. Esto es de gran
importancia para comprender adecuadamente los fenmenos sociales detrs de la posicin que
adquieren los individuos en la estratificacin social, mediante el nivel y acceso de la informacin.
Leguina (2009) analiza en detalle los resultados numricos, profundizando en las ventajas de aplicar
la codificacin de Escofier.

Para decidir si efectivamente es la estrategia que presenta mejores resultados, es necesario
preguntarse si existe prdida de informacin en la codificacin. Para demostrarlo empricamente, se
propone verificar qu ocurre con los porcentajes de varianza explicados y calidad de
representacin, comparndolos con la aplicacin de un anlisis de componentes principales (ACP)
slo para las variables cuantitativas. No se detallar la teora de ACP, pero esta tcnica es posible
entenderla como realizar un AC sobre variables cuantitativas, donde se busca una proyeccin
geomtrica segn la cual los datos sean mejor representados en trminos de mnimos cuadrados.


Tabla 3. Comparacin de resultados para variables cuantitativas
1 VP 2 VP 3 VP 4 VP
ACP


Valor propio 2,777 1,640 1,090 1,015
% relativo 27,800 16,400 10,900 10,200
% relativo
acumulado 27,800 44,200 55,100 65,200
C.arbitraria

Valor propio 0,215 0,157 0,103 0,082
% relativo 11,041 9,365 7,281 5,241
% relativo
acumulado 11,041 20,406 27,688 32,962
C. Escofier


Valor propio 0,277 0,164 0,109 0,101
% relativo 27,800 16,400 10,900 10,200
% relativo
acumulado 27,800 44,200 55,100 65,200
Fuente: Leguina (2009)



- 10 -
La investigacin de Bramardi et al. (2006) demuestra matemticamente este resultado para la
codificacin de Escofier. Este resultado, lo podemos corroborar en la tabla 3, que corresponde al
resumen de los resultados obtenidos en la comparacin, donde los valores propios, aunque en otra
escala, y porcentajes de varianza son idnticos a los obtenidos con ACP. Codificar arbitrariamente,
explica un 32% menos de variabilidad que al utilizar ACP.

Los grficos 2, 3 y 4 muestran la posicin de los(as) encuestados(as) en los dos primeros ejes
factoriales para los distintos anlisis realizados. La nube que se utiliza como referencia, es la
obtenida mediante ACP, ya que corresponde a la tcnica que se aplicara originalmente.
Visualmente, es posible verificar la precisin de las soluciones bajo las distintas tcnicas de
codificacin, comparando la forma de las nubes de puntos representadas. Una buena estrategia de
codificacin ser la que entregue resultados similares en calidad y porcentajes de varianza explicada,
a la obtenida con ACP. La comparacin de las representaciones grficas de los resultados, se
convierte en una importante herramienta de anlisis en la evaluacin de la calidad de codificacin
de datos.

Comparando los resultados de la propuesta de codificacin (grfico 4) con la nube de referencia
(grfico 2) y el anlisis original (grfico 3), es posible sustentar la superioridad de la codificacin de
Escofier. Su representacin grfica es idntica a la obtenida con ACP, excepto por un cambio de
escala, lo cual haba sido puesto en manifiesto por Bramardi et al. (2006). Resulta interesante
observar que el anlisis con variables codificadas arbitrariamente (grfico 3) resulta tan diferente a
lo que debi obtenerse. Esto pone en manifiesto lo crtico de la seleccin de la estrategia de
codificacin. Una inadecuada codificacin de datos, conducirn a cometer errores en la solucin, y
finalmente, en las interpretaciones y conclusiones desprendidas de esta.



- 11 -
Grfico 2. Resultados de ACP para encuestados. Se utilizaron solo las variables cuantitativas.

Fuente: Leguina (2009)


Grfico 3. Resultados de ACM con codificacin arbitraria para encuestados. Se utilizaron solo las
variables cuantitativas.

Fuente: Leguina (2009)




- 12 -
Grfico 4. Resultados de AC para encuestados. Se utilizaron solo las variables cuantitativas aplicando
codificacin de Escofier.


Fuente: Leguina (2009)




- 13 -
8. CONCLUSIONES

Un aspecto fundamental de cualquier investigacin que requiera anlisis estadstico de datos, es el
tipo de variables a utilizar. Deben ser ellas las que guen la seleccin de la tcnica a usar. Dentro de
este contexto, la codificacin de datos es un aspecto usualmente dejado de lado, pero como ha sido
demostrado en este artculo, ayuda de sobremanera a enfocar la fotografa de los datos. A travs
de la comparacin de resultados, se concluye que la aplicacin de alguna tcnica adecuada de
codificacin para trabajar con variables cuantitativas en AC, aporta una considerablemente mejor
calidad en la representacin del espacio geomtrico de las variables.

De forma emprica, y con datos de una investigacin real, se demuestra en qu grado existe prdida
de informacin para las distintas codificaciones, o en el caso de Escofier, que no existe prdida de
informacin alguna, comparndolo con la aplicacin de anlisis de componentes principales.
Adems fue posible verificar las variaciones en la nube de puntos generadas para el anlisis con
variables codificadas arbitrariamente, demostrando que siempre es mejor implementar Escofier, en
lugar de recodificar subjetivamente o dejar en su estado original las variables cuantitativas.

Para evaluar la calidad de una propuesta de codificacin, se propone la utilizacin del anlisis de
componentes principales, y la comparacin numrica y grfica de sus resultados, con los obtenidos
para las codificaciones alternativas. De esta forma, es posible cuantificar (al menos visualmente) la
prdida de informacin y calidad de la alternativa de codificacin. Esta herramienta de anlisis, es
posible implementarla previa a la aplicacin de cualquier anlisis de datos que requiera codificar
variables cuantitativas.



- 14 -
Bibliografa

o Benzcri, J.-P. (2002). In memorian: P.Bourdieu.
o Bourdieu, P. (1979). La distinction: Critique sociale du jugement. (traduccin al espaol: La distincin:
Criterio y bases sociales del gusto (2006). Buenos Aires: Taurus). Paris: Editions de Minuit.
o Bramardi, S., Reeb, P., De Bernardin, F., Tasille, V., & Ferrer, M. (2006). Codificacin de Escofier: una
discretizacin sin prdida de informacin. In Actas del VII Congreso Latinoamericano de Sociedades de
Estadstica. Rosario, Argentina.
o Cuadras, C. M. (2007). Nuevos Mtodos de Anlisis Multivariante Barcelona: CMC Editions.
o Escofier, B. (1979). Traitement simultan de variables qualitatives et quantitatives en analyse factorielle
(qualitatives et quantitatives). Les Cahiers de lAnalyse des Donnes, 4 , 137146.
o Greenacre, M. (2007). Correspondence analysis in practice (Segunda ed.). Boca Raton: Chapman & Hall/CRC.
o Leguina, A. (2009). Anlisis de Correspondencias Mltiples para el Tratamiento de Variables Mixtas: Un
Estudio Aplicado a la Problemtica de Estratificacin Social en Chile. Tesis para optar al grado de Magster
en Estadstica. Facultad de Matemticas, Pontifica Universidad Catlica de Chile.
o Leguina, A., & Seplveda-Snchez, D. (2008). El nivel de informacin como una nueva forma de distincin
social. Una aplicacin de estadstica multivariante. En Actas de las VIII Jornadas Latinoamericanas de
Sociedades de Estadstica. Montevideo, Uruguay.
o Murtagh, F. (2005). Correspondence analysis and data coding with Java and R. Boca Raton: Chapman &
Hall/CRC.
o R Development Core Team. (2007). R: A language and environment for statistical computing [Computer
software manual]. Vienna, Austria. Available from http://www.R-project.org.
o Roux, B., & Rouanet, H. (2005). Geometric data analysis. New York: Kluwer Academic Publishers.
o Savage, M., Gayo-Cal, M., Warde, A., & Tampubolon, G. (2005). Cultural capital in the uk: A preeliminary
report using correspondence analysis. CREST Working Paper Series, 4 .
o Seplveda, D. (2008). Una nueva perspectiva de clases sociales en Chile: Global y local. En IX Jornadas de
estudiantes de postgrado en Humanidades, Artes, Ciencias Sociales y Educacin: Amrica Latina en el
Nuevo Milenio, Procesos, Crisis y Perspectivas. Santiago, Chile.
o Seplveda, D., Leguina A. (2008). El nivel de la informacin como una nueva forma de distincin social.
Actas del Encuentro preALAS Chile 2008 50 aos de Sociologa en Chile, Santiago, Chile.
o Universidad Diego Portales. (2007). Tercera Encuesta Nacional de Opinin Pblica UDP 2007. Santiago,
Chile: ICSO-UDP.

Potrebbero piacerti anche