Sei sulla pagina 1di 53

Métodos Correlacionales

CURSO: INNOVACIONES METODOLÓGICAS PARA LA TOMA DE DECISIONES


PROFESOR: Gonzalo J. Muñoz, PhD.
E-MAIL: gonzalo.munoz@uai.cl
TELÉFONO: (2) 2331-1161
OFICINA: Edificio B, of. 201

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 1


Correlación

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 2


Correlación
• ¿Qué es la correlación?
• Asociación entre variables
• Tendencia de las variables a variar juntas
• ¿Cómo medimos la correlación?
• El coeficiente de correlación producto-momento de
Pearson
• Se llama así por Karl Pearson

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 3


Coeficiente de correlación
r es útil porque captura dos aspectos de la
asociación entre variables:
• Magnitud
• Fuerza de asociación
• Indicado por el valor absoluto de r
• Su métrica es una proporción (de la máxima
covarianza posible).
• Dado que es una proporción, el rango de valores
absolutos de r es 0 a 1 (rango del valor con signo de r
es −1 to +1).

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 4


Coeficiente de correlación
r es útil porque captura dos aspectos de la
asociación entre variables:
• Dirección
• Indicado por el signo de r
• Signo positivo indica que valores altos de una variable
tienden a estar asociados con valores altos en la otra
variable.
• Signo negativo indica que valores altos de una
variable tienen a estar asociados con valores bajos en
la otra variable.

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 5


Y Gráfico de dispersión
Asociación positiva
fuerte

r = .91
X
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 6
Y Gráfico de dispersión
Esta es una
asociación mucho
más débil.

r = .21
X
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 7
Y Gráfico de dispersión
Esta es una
asociación cercana a
cero

r = −.01
X
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 8
Gráfico deXdispersión

Si los puntos están


repartidos en todos
los cuadrantes, r ≈ 0. Y

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 9


Fórmula para obtener el coeficiente de
correlación
Esta es la fórmula para obtener el
coeficiente de correlación de
Pearson:

∑(X − X)(Y − Y)
r=
∑(X − X)2∑(Y − Y)2

(Por ahora no vamos a ver en detalle


cómo “funciona” la correlación)
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 10
Caso: Promoviendo el autocuidado
Actividad:
• Haga un gráfico de dispersión para visualizar la
asociación entre inteligencia (GMA) y
desempeño (desempeño_tarea)
• Obtenga el coeficiente de correlación entre
ambas variables usando la herramienta
“Análisis de datos” de Excel
• ¿Qué puede decir sobre los resultados
obtenidos?
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 11
Inferencia Estadística: La lógica
de la prueba de hipótesis

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 12


Estadística inferencial
• Los estadísticos descriptivos describen y
resumen los puntajes de una muestra
• La estadística inferencial dice cómo los
resultados de la muestra se generalizan a la
población.

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 13


Estadística inferencial

Muestreo Estadística
descriptiva
Población Muestra
Estadística
inferencial

¿Qué sabemos acerca de a población?


02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 14
¿Qué es un estadístico?
• Un estadístico es una función de los valores de
una muestra en una o más variables
• Media
• Mediana
• Varianza
• Correlación (r)
• F = Varianza entre medias de los grupos / varianza
promedio dentro de los grupo

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 15


Estadísticos y parámetros
• Un estadístico es descriptivo. Nos dice algo
sobre la muestra.
• La población es aquello sobre lo que
queremos saber
• El valor de la población correspondiente a un
estadístico muestral se llama parámetro.

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 16


Estadísticos y parámetros
• Los estadísticos típicamente se etiquetan
usando letras Romanas:
• Media = 𝑋
• Varianza = s2
• Los parámetros se etiquetan usando letras
Griegas:
• Media = μ
• Varianza = σ2
• (Pero no siempre esto es así, e.g. α de
Cronbach)
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 17
Prueba de Hipótesis
• La prueba de hipótesis requiere proponer dos
hipótesis contrapuestas:
• Hipótesis nula
• Hipótesis alternativa
• Un estadístico se usa para evaluar la hipótesis
nula y llegar a una de las siguientes conclusiones:
• Rechazar la hipótesis nula
• No rechazar la hipótesis nula (ojo, no es lo mismo que
“Aceptar” la hipótesis nula)

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 20


Ejemplo prueba de hipótesis

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 21


Ejemplo prueba de hipótesis

• “Si tiene cola


entonces debe ser un
mono”
• Esta formulación no
sirve porque la ciencia
no opera vía
confirmación, sino vía
desconfirmación

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 22


Ejemplo prueba de hipótesis

• “Esto no es un gorila”
• La probabilidad de
que sea un gorila es
muy baja
• No sé si es un mono,
pero tengo mucha
confianza de que no
es un gorila

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 23


Ejemplo prueba de hipótesis
• “No puedo rechazar la
idea de que sea un gorila”
• La probabilidad de que sea
un gorila es muy alta
• No hay suficiente
evidencia para decir que
es un mono, pero sé que
podría ser un gorila
• (Al mismo tiempo no
puedo aceptar que sea un
gorila)
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 24
Ejemplo prueba de hipótesis
Uh-uh … yo soy
la hipótesis
nula

ih ih… yo soy la
hipótesis
alternativa
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 25
Algunas pruebas estadísticas para
contrastar hipótesis
• Para comparar dos medias
– Prueba t para diferencia de medias independientes
– Prueba t para diferencia de medias dependientes
• Para comparar dos o más medias
– Prueba F (i.e., ANOVA)
• Prueba t para correlaciones
• Prueba Chi cuadrado para asociación entre
variables categóricas
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 26
¿Qué quiere decir que una
correlación sea estadísticamente
significativa?

…ahora si!

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 27


Prueba de significancia estadística de r
Prueba t para probar Ho: 𝜌 = 0

𝑟 𝑟
𝑡= =
𝑠𝑟 1 − 𝑟2
𝑣
Los grados de libertad
se calculan como
𝑣=n-2

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 28


Prueba de significancia estadística de r
0,45 0,16

0,4
𝑟 𝑟 0,14

𝑡= =
0,35 𝑠𝑟 1 − 𝑟2 0,12

0,3
𝑣
0,1

0,25
0,08
0,2

0,06
0,15

0,04
0,1

0,05 0,02

0 0
-3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 29


Prueba de significancia estadística de r
En una muestra de 82 alumnos se encontró una
asociación positiva entre nivel socioeconómico y
notas (r = .154)

𝑟 0.154
𝑡= = = 1,39
𝑠𝑟 1 − 0.1542
82 − 2 valor t observado

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 30


Prueba de significancia estadística de r
𝑟 0.154
𝑡= = = 1,39
𝑠𝑟 1− 0.1542 t observado
0,45 0,16
82 − 2
0,4 0,14

0,35
0,12

0,3
0,1

0,25
0,08
0,2

0,06
0,15

0,04
0,1

0,05 0,02

0 0
-3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 31


Prueba de significancia estadística de r
α = 0.05

ν = n – 2 = 82 – 2 = 80 valor t crítico = 1.99

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 32


Prueba de significancia estadística de r
𝑟 0.154
𝑡= = = 1,39
𝑠𝑟 1− 0.1542 t observado
0,45 0,16
82 − 2 t critico
0,4 0,14

0,35
0,12

0,3
0,1

0,25
0,08
0,2

0,06
0,15

0,04
0,1

0,05 0,02

0 0
-3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 33


Prueba de significancia estadística de r
Los resultados mostraron que la asociación
entre nivel socioeconómico y notas no era
estadísticamente significativa, r = .15, t(80) =
1.39, p > .05.

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 34


Prueba de significancia estadística de r
¿A partir de qué valor r sería estadísticamente
significativo cuando n = 82?

𝑡 𝑐𝑟í𝑡𝑖𝑐𝑎
𝑟 𝑐𝑟í𝑡𝑖𝑐𝑎 =
(𝑡 𝑐𝑟í𝑡𝑖𝑐𝑎)2 + 𝜈

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 35


Prueba de significancia estadística de r
¿A partir de qué valor r sería estadísticamente
significativo cuando n = 82?

1.99
𝑟 𝑐𝑟í𝑡𝑖𝑐𝑎 = = 0.2171783
(1.99)2 + 80

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 36


Prueba de significancia estadística de r
Los resultados mostraron que la asociación
entre nivel socioeconómico y notas era
estadísticamente significativa, r = .22, t(80) =
1.99, p > .05.
(aquí estoy usando un valor
aproximado para el valor
exacto de r crítico; para r = .22
el valor t exacto sería 2.01)

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 37


Tipos de error en prueba de hipótesis
Decisión
No rechazar H0 Rechazar H0

No Rechazo
H0 es verdadera Error Tipo I
correcto
Realidad
Error Tipo II Rechazo
H0 es falsa
(falla de poder) Correcto (poder)

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 38


Regresión

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 39


Línea de regresión

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 40


Línea de regresión y el criterio de
mínimos cuadrados
Y
Y − ^Y
^
Y ^
Y
Y − ^Y

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 41


Estimando la pendiente y el intercepto
• El símbolo de la pendiente es BYX (o B1 , o b1).
sY
B1 = rXY
sX
• El símbolo del intercepto es B0 (o b0).
B0 = Y − B1X

• Estas fórmulas producen una línea que


satisface el criterio de mínimos cuadrados.
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 42
Criterio de mínimos cuadrados
• Las diferencias entre los puntajes observados
^
y predichos de Y (Y −Y) se llaman residuos.
• Algunos residuos serán positivos y otros
negativos.
• El criterio de mínimos cuadrados toma los
residuos los eleva al cuadrado para que todos
^ 2
sean positivos: ∑(Y − Y)
• Esta suma de residuos al cuadrados es lo que
el criterio de mínimos cuadrados minimiza.
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 43
La línea de regresión
La línea de regresión se define por
dos valores (estadísticos).

El intercepto Y indica
La pendiente indica
la altura de la línea
cuánto cambia la
cuando X = 0.
línea en unidades Y
20 unidades de por cada aumento de
aumento in X
→2.76 unidades
una unidad en X.
de aumento en Y; Pendiente = .14
2.76/20 ≈ .14

Intercepto Y = .88
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 44
¿Qué tan bueno es mi modelo de
regresión?
• Medidas usadas para evaluar qué tan
predictivo es un modelo de regresión:
• R2
• Error estándar de estimación
• Tests the hipótesis nula
• F se usa para R2
• t se usa para B1

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 45


Ejemplo resuelto
5

4
desempeño_tarea

1
60 80 100 120 140
GMA

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 46


Ejemplo resuelto
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,24
Coeficiente de determinación R^2 0,06
R^2 ajustado 0,05
Error típico 0,61
Observaciones 217

ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 4,94 4,94 13,14 0,00
Residuos 215 80,79 0,38
Total 216 85,73

Inferior Superior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% 95,0% 95,0%
Intercepción 2,64 0,26 9,98 0,00 2,11 3,16 2,11 3,16
GMA 0,01 0,00 3,63 0,00 0,00 0,01 0,00 0,01

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 47


Ejemplo resuelto
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,24
Coeficiente de determinación R^2 0,06
R^2 ajustado 0,05
Error típico 0,61
Observaciones 217

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 48


R2
Varianza Varianza
de X de Y
Varianza
^
de Y

• R2 indica la sobreposición entre la varianza de X e Y como


proporción de la varianza total de Y.
• Como es una proporción, su rango es de 0 a 1.
^
• La sobreposición es también la varianza de Y.
^
• Y no tiene varianza que no esté relacionada con Y.
^
• Y siempre tiene menos varianza que Y. ^
• X no tiene varianza que esté asociada con Y pero no con Y.
02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 49
Error estándar de estimación
El error estándar de
estimación nos dice cuán
grande son los residuos
(en promedio).

Y − ^Y

sY−Y^ = 19.67 = 4.44

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 50


Ejemplo resuelto
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 4,94 4,94 13,14 0,00
Residuos 215 80,79 0,38
Total 216 85,73

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 51


Prueba F de R2
• Podemos probar la hipótesis nula de que el
valor verdadero de R2 (ρ2) = 0.
• H0: ρ2 = 0
• H1: ρ2 > 0
• La prueba compara varianzas, por lo que es
una prueba F.

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 52


Ejemplo resuelto

Desempeño = 2,64 + 0,01 ∗ GMA

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Supe


Intercepción 2,64 0,26 9,98 0,00 2,11
GMA 0,01 0,00 3,63 0,00 0,00

Inferior Superior
Estadístico t Probabilidad Inferior 95% Superior 95% 95,0% 95,0%
6 9,98 0,00 2,11 3,16 2,11 3,16
0 3,63 0,00 0,00 0,01 0,00 0,01

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 53


Ejemplo resuelto

Desempeño = 2,64 + 0,01 ∗ GMA

• Intercepto: cuando GMA = 0 el desempeño es


2,64
• Pendiente: por cada punto adicional de GMA
aumenta en 0,01 puntos el desempeño

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 54


Métodos Correlacionales

CURSO: INNOVACIONES METODOLÓGICAS PARA LA TOMA DE DECISIONES


PROFESOR: Gonzalo J. Muñoz, PhD.
E-MAIL: gonzalo.munoz@uai.cl
TELÉFONO: (2) 2331-1161
OFICINA: Edificio B, of. 201

02-08-2017 DGEEP UAI Copyright Gonzalo J. Muñoz 55

Potrebbero piacerti anche