Sei sulla pagina 1di 5

COEFICIENTE DE CORRELACIÓN

El coeficiente de correlación describe la fuerza de la relación entre dos conjuntos de variables


en escala de intervalo o de razón. Se designa con la letra r, y con frecuencia se le conoce como
r de Pearson y coeficiente de correlación producto-momento. Puede adoptar cualquier valor
de –1.00 a +1.00, inclusive. Un coeficiente de correlación de –1.00 o bien de +1.00 indica una
correlación perfecta.

En la gráfica 1 se muestra cómo aparecería el diagrama de dispersión si la relación entre los


dos conjuntos de datos fuera lineal y perfecta.

Grafica 1. Diagramas de dispersión con correlación negativa perfecta y correlación positiva


perfecta

Si no hay ninguna relación entre los dos conjuntos de variables, la r de Pearson es cero. Un
coeficiente de correlación r cercano a 0 (sea 0.08) indica que la relación lineal es muy débil. Se
llega a la misma conclusión si r = –0.08. Los coeficientes de –0.91 y + 0.91 tienen una fuerza
igual; los dos indican una correlación muy fuerte entre las dos variables. Por tanto, la fuerza de
la correlación no depende de la dirección (ya sea – o bien +). En la gráfica 2 se muestran los
diagramas de dispersión para r = 0, una r débil (sea –0.23), y una r fuerte (sea +0.87). Observe
que, si la correlación es débil, se presenta una dispersión considerable respecto de la recta
trazada a través del centro de los datos. Para el diagrama de dispersión que representa una
fuerte relación, hay muy poca dispersión respecto de la recta

En la siguiente gráfica se resume la fuerza y la dirección del coeficiente de correlación.


COEFICIENTE DE CORRELACIÓ.- Medida de la fuerza de la relación lineal entre dos variables.

CARACTERÍSTICAS DEL COEFICIENTE DE CORRELACIÓN

1. El coeficiente de correlación de la muestra se identifica por la letra minúscula r.


2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables en escala
de intervalo o en escala de razón.
3. Varía de –1 hasta +1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las variables.
5. Un valor cercano a 1 indica una asociación directa o positiva entre las variables.
6. Un valor cercano a –1 indica una asociación inversa o negativa entre las variables.

Formula del coeficiente de correlación

Σ(𝑋 − 𝑋̅)(𝑌 − 𝑌̅)


𝑟=
(𝑛 − 1)𝑆𝑥 𝑆𝑦
EJEMPLO.

El gerente de ventas de Copier Sales of America, que tiene una fuerza de ventas muy
grande en Estados Unidos y Canadá, desea determinar si hay alguna relación entre el
número de llamadas de ventas en un mes y el número de copiadoras vendidas ese
mes. El gerente selecciona una muestra aleatoria de 10 representantes de ventas y
determina el número de llamadas de ventas que cada uno hizo el mes pasado y el
número de copiadoras vendidas. La información muestral aparece en la tabla

Número de llamadas de ventas y copiadoras vendidas para 10 vendedores

Llamadas Copiadoras
Representante
de Ventas Vendidas
de Ventas
(X) (Y)
Tom Keller 20 30
Jeff Hall 40 60
Brian Virost 20 40
Greg Fish 30 60
Susan Welch 10 30
Carlos Ramirez 10 40
Rich Niles 20 40
Mike Kiel 20 50
Mark Reynolds 20 30
Soni Jones 30 70

Llamadas Copiadoras
Representante ̅ (𝑿 − 𝑿̅ )𝟐 ̅ ̅ )𝟐 ̅ )(𝒀 − 𝒀
̅)
de Ventas Vendidas 𝑿 − 𝑿 𝒀−𝒀 (𝒀 − 𝒀 (𝑿 − 𝑿
de Ventas
(X) (Y)
Tom Keller 20 30 -2 4 -15 225 30
Jeff Hall 40 60 18 324 15 225 270
Brian Virost 20 40 -2 4 -5 25 10
Greg Fish 30 60 8 64 15 225 120
Susan Welch 10 30 -12 144 -15 225 180
Carlos Ramirez 10 40 -12 144 -5 25 60
Rich Niles 20 40 -2 4 -5 25 10
Mike Kiel 20 50 -2 4 5 25 -10
Mark Reynolds 20 30 -2 4 -15 225 30
Soni Jones 30 70 8 64 25 625 200
220 450 760 1850 900
̅
𝑋 = 22 𝑆𝑥 = 9,189

𝑌̅ = 45 𝑆𝑦 = 14,337
Se traza una recta vertical con los valores de datos en la media de los valores X y una recta
horizontal en la media de los valores Y.

En este caso la raya vertical indica el número medio de llamadas de ventas es 22 y la recta
horizontal el número medio de unidades vendidas es 45. Estas rectas pasan por el
“centro” de los datos y dividen el diagrama de dispersión en cuatro cuadrantes.
Considere mover el origen de (0, 0) a (22, 45).

Gráfica de matriz de Copiadoras Vendi vs. Llamadas de Vent


22
70
IV I
Copiadoras Vendidas (Y)

60

50

45

40
III II

30

10 15 20 25 30 35 40
Llamadas de Ventas (X)

Dos variables tienen una relación positiva cuando el número de copiadoras vendidas está por
arriba de la media y el número de llamadas de ventas también se encuentra arriba de la media.
Estos puntos aparecen en el cuadrante superior derecho (cuadrante I).

De manera similar, cuando el número de copiadoras vendidas es menor que la media, también
lo es el número de llamadas de ventas. Estos puntos se encuentran en el cuadrante inferior
izquierdo de la gráfica (cuadrante III).

Por ejemplo, la última persona en la lista de la tabla Soni Jones, hizo 30 llamadas de ventas y
vendió 70 copiadoras. Estos valores se encuentran arriba de sus medias respectivas, por tanto,
este punto se ubica en el cuadrante I, que es el cuadrante superior derecho. Soni hizo 8
(𝑋 − 𝑋̅) = (30 − 22) más llamadas de ventas que la media y vendió 25 (𝑌 − 𝑌̅) =
(70 − 45) más copiadoras que la media.

Las desviaciones del número medio de llamadas de ventas y para el número medio de
copiadoras vendidas se resumen en la tabla para los 10 representantes de ventas. La suma de
los productos de las desviaciones de las medias respectivas es 900. Es decir, el término
Σ(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) = 900
Determinar el coeficiente de correlación:
Σ(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) 900
𝑟= = = 0,759
(𝑛 − 1)𝑆𝑥 𝑆𝑦 (10 − 1)(9,189)(14,337)

¿Cómo se interpreta una correlación de 0,759? Primero, es positiva, por lo que se observa una
relación directa entre el número de llamadas de ventas y el número de copiadoras vendidas.
Esto confirma el razonamiento basado en el diagrama de dispersión, gráfica 2. El valor de
0,759 está muy cercano a 1.00, y por ende se concluye que la asociación es fuerte.

Debe tener mucho cuidado con la interpretación. La correlación de 0,759 indica una asociación
positiva fuerte entre las variables. La señora Bancer acierta al motivar al personal de ventas
para hacer llamadas adicionales, debido a que el número de llamadas de ventas hechas se
relaciona con el número de copiadoras vendidas. Sin embargo, ¿más llamadas de ventas
ocasionan más ventas? No, aquí no se ha demostrado la causa y el efecto, sólo que hay una
relación entre las dos variables, llamadas de ventas y copiadoras vendidas.

Potrebbero piacerti anche