“UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO”
“FACULTAD DE ARQUITECTURA E INGENIERIA CIVIL”
“DEPARTAMENTO DE MATEMATICAS Y ESTADÍSTICA”
ESTADÍSTICA Y PROBABILIDADES
DOCENTE: Dr. ALFREDO VALENCIA TOLEDO
TERCERA LECTURA: CORRELACIÓN LINEAL Y ANÁLISIS DE REGRESIÓN
N° APELLIDOS Y NOMBRES CÓDIGO
1 CONTRERAS-CHALCO-GIAN POWEL 141414
CUSCO-PERÚ
2020 RESUMEN: CORRELACIÓN LINEAL Y ANÁLISIS DE REGRESIÓN
Definición de correlación lineal, es la cuantificación de la intensidad de
relación lineal entre dos variables, mediante el parámetro de correlación lineal de Pearson “r” que oscila entre -1 y +1. En el caso de que r=0, solo indica que no hay correlación lineal, pero puede existir otro tipo de correlación. Definición y características del concepto de regresión lineal, o ajuste lineal es un modelo matemático que tiene la forma: y=β 0 + β 1∗x 1 +…+ β p∗x p + ε , (recta de mínimos cuadrados); donde “ y” es la variable dependiente, explicada o regresando,“β” son parámetros que miden la influencia de las variables independientes o regresores (x ¿ sobre la variable dependiente “ y” y un término aleatorio “ε” , su gráfica en el plano 2d se llama diagrama de dispersión. La recta de mínimos cuadrados que se ajusta mejor a la nube de puntos hace que la diferencia entre el valor observado y el valor predecido mediante la ecuación de regresión lineal, sea la mínima; a esta medida se le llama error estándar de estimación“ε” que tiene un concepto similar al de desviación estándar, pero en este caso se mide la dispersión alrededor de la línea de regresión. Interpretación de los coeficientes estimados, cuando el valor de r se aproxima a +1 la correlación tiende a ser lineal directa, en cambio, si se aproxima a -1 la correlación tiende a ser lineal inversa. Si no hay correlación de ningún tipo entre dos variables entonces tampoco habrá correlación lineal. Supuestos del modelo de regresión lineal 1. En la población, la relación entre las variables debe ser aproximadamente lineal: y=β 0 + β 1∗x 1 +…+ β p∗x p + ε , donde ε representa los residuos. 2. Los residuos se distribuyen según una normal de media 0, ε ≈ N ( 0 ,σ 2). 3. Los residuos son independientes unos de otros. 4. Los residuos tienen varianza σ 2 constate. Nota: no es necesario que se cumplan con exactitud (en particular las tres últimas). Definición del coeficiente de determinación, R2 o bondad de ajuste, indica el porcentaje del ajuste o porcentaje de varianza que se ha logrado con la regresión lineal, oscila entre 0 y 1 y es igual al cuadrado del coeficiente de correlación. Por otro lado, 1-R 2 indica que porcentaje de las variaciones no se explica a través del modelo de regresión. Inferencia en el modelo de regresión, para ello se verifica si la regresión en efecto es válida y la podemos utilizar para predecir, entonces, una vez que el coeficiente correlación lineal r, este próximo a 1 o a -1, entre los valores de la muestra, se debe garantizar que también estén correlacionadas en la población, para ello se debe verificar que la pendiente de la recta de regresión poblacional β sea significativamente distinto de cero.