Sei sulla pagina 1di 37

Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Análisis de Datos Categóricos II

Segundo M. Sigüeñas
msiguenas@socialdata-peru.com

Social Data Consulting

Dirección de Formación Académica

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Análisis de Datos Categóricos II


1 Análisis de Datos Categóricos II
Introducción

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Análisis de Datos Categóricos II


1 Análisis de Datos Categóricos II
Introducción
2 Coeficiente de Asociación
Coeficiente de Contingencia de Pearson
De Cramer
Phi para tablas 2x2
Consideraciones Finales

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Análisis de Datos Categóricos II


1 Análisis de Datos Categóricos II
Introducción
2 Coeficiente de Asociación
Coeficiente de Contingencia de Pearson
De Cramer
Phi para tablas 2x2
Consideraciones Finales
3 Coeficientes de Correlación
De Spearman
De Kendall
De Kendall Parcial

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Introducción

Datos Categóricos

- Un concepto opuesto al de independencia es el de asociación. Se


dice que dos variables A y B están asociadas cuando aparecen jun-
tos en mayor número de casos que el que cabrı́a esperar si fuesen
independientes.
- Según la tendencia a coincidir o no coincidir este más o menos
marcada, tendremos distintos grados de asociación. Para medirlos
se han ideado diversos coeficientes de asociación

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Coeficiente de Contingencia de Pearson

Aspectos Generales

- Es una medida de asociación o relación entre dos conjuntos de


datos provenientes de variables categóricas

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Coeficiente de Contingencia de Pearson

Supuestos

Con las variables analizadas se puede formar una tabla de con-


tingencia simple.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Coeficiente de Contingencia de Pearson

Supuestos

Con las variables analizadas se puede formar una tabla de con-


tingencia simple.
Los datos deben estar en una escala de tipo nominal u ordinal
y si se trabaja con variables de tipo intervalo o razón se deben
categorizar.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Coeficiente de Contingencia de Pearson

Procedimiento

Utilizar la tabla de contingencia de dimensión rxc.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Coeficiente de Contingencia de Pearson

Procedimiento

Utilizar la tabla de contingencia de dimensión rxc.


Calcular el estadı́stico de la prueba (Chi Cuadrado).

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Coeficiente de Contingencia de Pearson

Procedimiento

Utilizar la tabla de contingencia de dimensión rxc.


Calcular el estadı́stico de la prueba (Chi Cuadrado).
Cuando la Contingencia de Pearson tiende a cero hay un menor
grado de asociación entre las categorı́as.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Coeficiente de Contingencia de Pearson

Procedimiento

Utilizar la tabla de contingencia de dimensión rxc.


Calcular el estadı́stico de la prueba (Chi Cuadrado).
Cuando la Contingencia de Pearson tiende a cero hay un menor
grado de asociación entre las categorı́as.
Cuando la Contingencia de Pearson se acerca a CCmáx mayor
será el grado de asociación entre las categorı́as.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Cramer

Aspectos Generales

- Otro coeficiente que depende de x2 el V de Cramer, se define


como:

- Donde:
- x2 : Estadı́stico Chi Cuadrado
- m=min{ (f-1), (c-1) }
- n: Tamaño de la muestra

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Cramer

Aspectos Generales

- Se trata de un coeficiente que toma el valor 1 cuando hay asocia-


ción perfecta entre las variables, cualquiera que sea el tamaño de la
tabla de contingencia.
- Cuando la tabla es cuadrada V = T y en caso contrario V > T.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Phi para tablas 2x2

Aspectos Generales

- Evalúa la asociación entre 2 variables de tipo binaria.


- Es idéntico en valor al coeficiente V de Cramer.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Phi para tablas 2x2

Supuestos

- Con las variables analizadas se puede formar una tabla de contin-


gencia simple 2x2.
- Los datos deben estar en una escala de tipo nominal binaria.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Phi para tablas 2x2

Procedimiento

- Arreglar los datos en una tabla de contingencia 2x2.

- Calcular el coeficiente Phi mediante la siguiente fórmula:

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Consideraciones Finales

Consideraciones Finales

- Es deseable que un ı́ndice de correlación muestre al menos las


siguientes caracterı́sticas:
Cuando las variables sean independientes y exista una carencia
completa de asociación, el valor del ı́ndice debe ser cero.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Consideraciones Finales

Consideraciones Finales

- Es deseable que un ı́ndice de correlación muestre al menos las


siguientes caracterı́sticas:
Cuando las variables sean independientes y exista una carencia
completa de asociación, el valor del ı́ndice debe ser cero.
Cuando las variables muestran completa dependencia una de la
otra, el estadı́stico debe ser igual a unidad.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

Consideraciones Finales

Consideraciones Generales

- El V de Cramer tiene la primera caracterı́stica, pero cuando el valor


de V es igual a 1 no necesariamente es una correlación perfecta entre
las variables.
- Una limitación de los coeficientes que dependen de x2 es que los
valores esperados deben ser mayores a 5 (mas del 20 % de celdas
como mı́nimo) y ninguna frecuencia esperada menor a 1.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Spearman

Aspectos Generales

- Es una medida de asociación entre dos variables que requieren


que ambas variables se encuentren medidas en al menos una esca-
la ordinal, de tal manera que los individuos en estudio puedan ser
colocados en rangos en dos series ordenadas.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Spearman

Supuestos

Los datos deben estar en una escala al menos de tipo ordinal.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Spearman

Supuestos

Los datos deben estar en una escala al menos de tipo ordinal.


La muestra es aleatoria.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Spearman

Procedimiento

Se obtiene los rangos para cada una de las variables (X e Y) de


manera independiente.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Spearman

Procedimiento

Se obtiene los rangos para cada una de las variables (X e Y) de


manera independiente.
Se calcula la diferencia de rangos di para cada pareja de obser-
vaciones, restando el rango de Yi menos el rango de Xi.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Spearman

Hipótesis

- En R se utiliza la función: cor.test(x,y,alternative, method= “spear-


man”).
- Esta función permite probar la asociación entre muestras pareadas,
utilizando uno de los coeficientes de correlación.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall

Aspectos Generales

- Es una medida de asociación de uso muy similar al de Spearman.


- Sin embargo, una ventaja de este coeficiente sobre el de Spearman
es que puede ser generalizada a un coeficiente de correlación parcial.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall

Supuestos

Los datos deben estar en una escala al menos de tipo ordinal.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall

Supuestos

Los datos deben estar en una escala al menos de tipo ordinal.


La muestra es aleatoria.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall

Procedimiento

Se obtiene los rangos para cada una de las variables (X e Y) de


manera independiente.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall

Procedimiento

Se obtiene los rangos para cada una de las variables (X e Y) de


manera independiente.
Ordenar los rangos con respecto a la variable X.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall

Procedimiento

Se obtiene los rangos para cada una de las variables (X e Y) de


manera independiente.
Ordenar los rangos con respecto a la variable X.
Determinar el grado de correspondencia entre las variables X e
Y (número de acuerdos y desacuerdos).

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall

Hipótesis

- En R se utiliza la función: cor.test(x,y,alternative, method=“kendall”)


- Esta función permite probar la asociación entre muestras pareadas,
utilizando uno de los coeficientes de correlación.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall Parcial

Aspectos Generales

- Cuando se observa la correlación entre 2 variables, existe la posi-


bilidad de que la correlación se deba a la asociación entre cada una
de las dos variables y una tercera variable.
- Este problema puede ser analizado por métodos de correlación
parcial. En correlación parcial se eliminan los efectos de la variación
en una tercera variable sobre la relación entre las variables X e Y, es
decir se encuentra la correlación entre X e Y manteniendo constante
la tercera variable Z.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall Parcial

Supuestos

- Los datos deben estar en una escala al menos de tipo ordinal.


- La muestra es aleatoria.

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall Parcial

Procedimiento

- Calcular las correlaciones de Kendall para cada uno de los pares de


combinaciones de las variables (XY, XZ y YZ).
- Calcular:

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II
Análisis de Datos Categóricos II Coeficiente de Asociación Coeficientes de Correlación

De Kendall Parcial

Hipótesis

Sigüeñas, S.M. Social Data Consulting S.A.C.


Análisis de Datos Categóricos II

Potrebbero piacerti anche