Sei sulla pagina 1di 26

CORRELACIÓN Y ANALISIS DE REGRESIÓN LINEAL

Mgtra. Estelina Ortega de Gómez


Modelos de Regresión y Coeficientes de Correlación en datos de
Salud
Cuando se estudian en forma conjunta dos características de una población o
muestra, se dice que se está analizando una variable bidimensional.

Correlación Correlación según el valor cuantitativo


Es el grado de relación que existe entre • Correlación perfecta: Igual al uno (1)
ambas características, • Correlación imperfecta: Menor a 1 ya sea
en sentido + 0 –
• Correlación nula: Coeficiente igual a cero
(0)

Regresión
Es la forma de expresar matemáticamente
dicha relación.
CALCULO DEL COEFICIENTE DE CORRELACIÓN
Calcular un coeficiente de correlación lineal r a partir de la
muestra, como aproximación de la verdadera relación lineal ρ
(rho) entre las variables.

n  xy    x  y 
r
n x 2
  x  2
 n y 2
  y
2

1  r  1
1. El valor absoluto de r indica la fuerza de la relación entre Y y X.
2. El signo la dirección de la relación (directa o inversamente
proporcional)

r=1 correlación positiva perfecta.


r = -1 correlación negativa perfecta.
r=0 no hay relación lineal entre Y y X.
EJEMPLO
Se presenta las estaturas en centímetros de una muestra de 10 niños
menores de 6 años y su peso en kilogramo.Y se desea saber si existe
alguna relación entre la estatura del niño y su peso

Niño 1 2 3 4 5 6 7 8 9 10

Estatura (cm) x 121 123 108 118 111 109 114 103 110 115

Peso (kg) y 25 22 19 24 19 18 20 15 20 21
Correlación en Excel
• En la matriz 1 se coloca el rango de la variable 1
• Insertar Función (Independiente)
• Función Estadística • En la matriz 2 se coloca el rango de la variable 2
• Coeficiente de Correlación (dependiente)
• Se acepta
ANÁLISIS DE REGRESIÓN LINEAL

Una de las aplicaciones más


importantes de la estadística
implica la estimación del
valor medio de una variable
de respuesta o la predicción
de algún valor futuro de y
con base el conocimiento de
un conjunto de variables
independientes relacionadas,
x 1, x 2, . . . x k.
Variable Variable
Independiente Dependiente
Tipos de Variables
(X) (Y)

Ejemplo:
Se pretende estudiar la relación entre estrés laboral y la
variable turno en el trabajo

Variable dependiente Y: estrés laboral


Variable independiente X: tipo de turno: fijo o variable
Al relacionar una variables dependiente (y)
con una variables independiente (x),
estamos estimando un modelo de regresión
o modelos estadístico lineal.

Ya que expresan el valor medio de y para


valores dados de x1, x2, . . . xk como una
función lineal de un conjunto de parámetros
desconocidos.
Qué es el análisis de
regresión lineal ?

Es modelar la dependencia de la variable Y de la


variable X a través de una recta
RECTA DE REGRESIÓN MÍNIMO CUADRÁTICA

Y = a0 + a1X + e

n  xy    x  y 
a1  a 0  y  a1x
n  x 2   x 
2
Definición de Variable

 Variable Independiente X : Estatura

 Variable Dependiente Y : Peso


Diagrama de Dispersión
• Seleccionar los datos
• Insertar Gráfico
• Tomar el gráfico de Dispersión
Realizando los cálculos

n  xy    x  y 
Estatura Peso a1 
n  x 2   x 
2
(X) (Y) XY X^2
121 25 3025 14641
123 22 2706 15129
108 19 2052 11664 a0  y  a1x
118 24 2832 13924
111 19 2109 12321
109 18 1962 11881
114 20 2280 12996
103 15 1545 10609 suma XY = 23126
110 20 2200 12100 suma x = 1132 1464
115 21 2415 13225
Suma y = 203 3476
Suma = 1132 203 23126 128490 Suma X^2 = 128490 a1= 0.4212

Medias= 113.2 20.3


Suma de X al 2 = 1281424 a0= -27.377
n =10
RECTA DE REGRESIÓN

Peso
30
y = 0.4212x - 27.377
25

20

15 Peso
Lineal (Peso)

10

0
100 105 110 115 120 125
PROPIEDADES DE LA RECTA DE REGRESIÓN
MÍNIMO CUADRÁTICA

 La media de las observaciones es igual a la media de Y


estimadas.

 Los errores tienen media cero X , Y 


 La recta de mínimos cuadrados pasa por el punto:
 Las medias de las observaciones es igual a
la media de Y estimadas
Estatura Peso Y Y = -27.377 + 0.4212 Peso
121 25 24
123 22 24
108 19 18
118 24 22
Media de peso Y = 20.3
111 19 19
109 18 19 Media de Y = 20.3
114 20 21
103 15 16
110 20 19
115 21 21
 Los errores tienen media cero

Estatura Peso Y Error


121 25 24 1
123 22 24 -2
Media del error = 0
108 19 18 1
118 24 22 2
111 19 19 0
109 18 19 -1
114 20 21 -1
103 15 16 -1
110 20 19 1
115 21 21 0
 La Recta de mínimo cuadrado pasa por los
puntos

X , Y 
Peso
30
y = 0.4212x - 27.377

25

20

15 Peso
Lineal (Peso)

10

0
100 105 110 115 120 125

Media de Estatura (X)= 113


Media de Peso (Y )= 20.3
Evaluación de la Ecuación de Regresión

Una vez obtenida la recta de regresión es importante evaluarla


y determinar si la misma explica la relación entre las variables
de estudio.
COEFICIENTE DE DETERMINACIÓN 𝑅2

 Nos indica el porcentaje del ajuste que se ha conseguido con


el modelo lineal, es decir el porcentaje de la variación de Y
que se explica a través del modelo lineal que se ha estimado.

 Mide la proximidad del ajuste de la ecuación de regresión de


la muestra a los valores observados de Y.
 A mayor porcentaje mejor es nuestro modelo para
predecir el comportamiento de la variable Y
2
Calculo del 𝑅

2 𝑥𝑖 2 − 𝑥𝑖 2 /𝑛
𝑅 = 𝑦𝑖 2
𝑦𝑖 2 −
𝑛

 Cuando 𝑅 2 es grande; la ecuación ha explicado una gran


proporción de la variabilidad total en los valores
observados.
 Cuando 𝑅 2 es pequeña, indica una falla de la regresión.
A TRABAJAR
Ejemplo No.2
Un grupo de profesionales especialistas en salud mental de un hospital
psiquiátrico, donde los pacientes permanecen mucho tiempo, deseaba
estimar el nivel de respuesta de pacientes retraídos en un programa de terapia
de remotivación. Con este fin, se contaba con una prueba pero tardaba para
administrarla. Para superar este problema se desarrollo una prueba más fácil
de aplicar.
Para probar la utilidad del nuevo instrumento el grupo decidió estudiar la
relación entre las calificaciones obtenidas con la prueba original y las
calificaciones obtenidas de la nueva prueba.

El objetivo del estudio era utilizar la nueva prueba sí se podía


demostrar que era un buen elemento para pronosticar la
calificación de un paciente .
Calificación
Número de
Nueva Prueba
Pacientes
Prueba (X) Original (Y)
1 50 61
2 55 61 a. Identifique las variables.
3 60 59 b. Grafique el Diagrama de dispersión
4 65 71 c. Encuentre la recta de regresión
5 70 80 d. Determine si la recta explica el
6 75 76 comportamiento de los datos
7 80 90
8 85 106
9 90 98
10 95 100
11 100 114

Potrebbero piacerti anche