Sei sulla pagina 1di 6

2 REGRESION LINEAL MULTIPLE Y CORRELACION 2.

1 Modelos de regresin mltiple


El modelo de regresin que involucra ms de un variable regresadora se llama modelo de regresin mltiple. Como un ejemplo, supngase la vida eficaz de una herramienta de corte depende de la velocidad y del ngulo de corte. Un modelo de regresin mltiple que podr describir esta relacin es Y= vida de la herramienta X1= rapidez de corte X2=ngulo de corte Donde y representa la vida de la herramienta, x1, la rapidez de corte y, x2, el ngulo de corte. Este es un modelo de regresin lineal mltiple con dos regresores. El trmino lineal se emplea debido a que la ecuacin 15-1 es la funcin lineal de los parmetros desconocidos 0, 1 y 2. Ntese que el modelo describe un plano en el espacio bidimensional x1, x2. Parmetro 0 define la ordenada al origen del plano. Unas veces llamados a 1 y 2 coeficientes de regresin parciales, Porque 1 mide el cambio esperado en y por un cambio unitario en x1 cuando x2 se mantiene constante, y 2 cambio esperado en y por cambio unitario x2 cuando x1 se mantiene constante. En General la variable dependiente o respuesta y puede relacionarse con k variables independientes. El modelo de regresin mltiple (lineal) Coeficientes de regresin Se denomina modelos de regresin lineal mltiple con k variables independientes. Los parmetros j, j= 0, 1,. . . , k, se llaman coeficientes de regresin . Este modelo describe un hiperplano en elespacio k-dimensional de las variables regresoras {xj}. El parmetro j representa el cambio esperado en la respuesta y por cambio unitario en xj todas las variables independientes restantes xj (ij) se mantienen constantes. Los parmetros j, j = 1, 2,. . ., k, se denominan algunas veces coeficientes de regresin parciales, porque ellos describen el efecto parcial de una variable independiente cuando las otras variables independientes en el modelo se mantienen constantes. Los modelos de regresin lineal mltiple se utilizan a menudo como funciones de aproximacin. Esto es, la verdadera relacin funcional entre y y x1, x2. Se desconoce, aunque sobre ciertos intervalos de las variables independientes

En general, cualquier modelo de regresin que es lineal en los parmetros (los parmetros) es un modelo de regresin lineal, sin importar la forma de la superficie que genera.

2.2 Estimacin de la ecuacin de regresin mltiple


En la correlacin simple (bivariada, entre dos variables) tenemos una recta de regresin, que es el mejor ajuste de la nube de puntos del diagrama de dispersin. Ya hemos visto que de manera intuitiva nos permite ver la posibilidad de predecir Y a partir de X, o dicho desde otra perspectiva, podemos ver el impacto de X sobre Y. El coeficiente b nos dice en cuntas unidades aumenta Y (criterio) al aumentar X (predictor o variable independiente) en una unidad; lo mismo nos dice cada coeficiente beta, pero en puntuaciones tpicas. En la regresin mltiple tenemos una nica variable criterio (Y) y mltiples variables predictoras o independientes (X1, X2, etc.) y no es tan fcil visualizarla grficamente porque requiere un espacio multidimensional. La ecuacin de regresin mltiple incluye un coeficiente por cada predictor: 1, 2, etc. La constante a ha desaparecido porque ahora es igual a 0 (es la media de las puntuaciones tpicas). La ecuacin de regresin es ahora: zy (predicha) = 1z1 + 2z2 + kzk Como ya se ha indicado, la utilidad de esta ecuacin para el investigador est en que puede comparar entre s los distintos coeficientes beta () y ver cules tienen un mayor poder predictivo o explican una mayor proporcin de la varianza de la variable criterio.

2.3 Matriz de varianzas/covarianzas


Cuando en un estudio se mide la relacin bivariada entre ms de dos variables, frecuentemente la informacin se expresa en forma matricial. La estructura de esta matriz, de naturaleza simtrica, y conocida como matriz de varianzas/covarianzas es la siguiente: X1 X2 X3 X1 S2x1 Sx1.x2 Sx1.x3 Sx2.x3 X2 Sx2.x1 S2x2

X3 Sx3.x1 Sx3.x2 S2x3

En la diagonal principal se contiene la informacin de la varianza de la variable, as la celda (1,1) contendr la varianza de la primera variable estudiada, en la celda (2,2) la varianza de la segunda y en la celda (3,3) la de la tercera. En el resto de las celdas se reflejar el estadstico de covarianza para cada par de variables.

2.4 Pruebas de hiptesis para los coeficientes de regresin.


H0 : H1 : = 0 (equivale a plantear que no hay relacin entre Y y Xi ) 0 (equivale a plantear que s hay relacin entre Y y Xi )

Si se acepta la de hiptesis nula, se est aceptando que no hay relacin entre Y y Xi, por lo tanto, sta variable se debe sacar del modelo. La estadstica de trabajo se resuelve suponiendo que la hiptesis nula (H0) es verdadera. Dicha estadstica de trabajo es:

Regla de decisin . Si el nmero de observaciones es mayor que 30, los valores de Z se hallan en la distribucin normal. Si el nmero de observaciones es menor o igual a 30 , los valores de Z se hallan en la distribucin t con n-k-1 grados de libertad. Siendo k el nmero de variables independientes en el modelo.

Figura 4.6 Regla de decisin, prueba de hiptesis para Si <T< se acepta la hiptesis nula, en caso contrario se rechaza

Una vez elegidas las variables independientes que realmente influyen en el comportamiento de Y, se pueden construir intervalos de confianza para cada uno de los coeficientes de regresin poblacional ( ) Este intervalo nos proporciona, con una confiabilidad del (1- )%, los valores dentro de los cuales variar Y si Xi vara en una unidad y las dems variables permanecen constantes. El intervalo se construye as:

Como en el caso de la prueba de hiptesis, si n 30 los valores de Z se hallan en la distribucin normal, y si n < 30 los valores de Z se hallan en la distribucin t con n-k-1 grados de libertad.

2.5 Correlacin lineal mltiple


Sirve para medir la adecuacin del modelo hallado (bondad del ajuste de la recta de regresin al conjunto de observaciones), en el caso de tener una variable dependiente y varias independientes. Dicha medida nos la da el coeficiente de determinacin R2, que verifica 0R21. Cuanto ms cercano a uno sea su valor, mayor es el grado de asociacin lineal que existe entre la variable dependiente y las independientes o predictoras. Nos mide la proporcin de la variacin total de las observaciones que se explican mediante la ecuacin (recta) de regresin. A partir de estos coeficientes de correlacin parcial se pueden obtener los coeficientes de regresin parcial: _(Y;X_1;X_2 )=_(Y;X_2 )/_(X_1;X_2 ) _(Y,X_1;X_2 ) _(Y;X_2;X_1 )=_(Y;X_1 )/_(X_2;X_1 ) _(Y,X_2;X_1 ) Con ellos se define el plano de regresin y-_Y=_(Y;X_1;X_2 ) (x_1-_(X_1 ) )+_(Y;X_1;X_2 ) (x_2-_(X_2 ) ) A partir del plano de regresin se define la prediccin puntual: Y =_Y+_(Y;X_1;X_2 ) (x_1-_(X_1 ) )+_(Y;X_1;X_2 ) (x_2-_(X_2 ) ) El coeficiente de correlacin mltiple de Y con respecto a X_1 y X_2 es: _Y(X_1,X_2 ) =_(Y,Y ) Nunca es negativo. Es posible calcular este coeficiente de correlacin mltiple a partir de las siguientes frmulas: _Y(X_1,X_2 ) =(1-(1-_(Y,X_1)^2 )(1-_(Y,X_2;X_1)^2 ) ) _Y(X_1,X_2 ) =(1-(1-_(Y,X_2)^2 )(1-_(Y,X_1;X_2)^2 ) ) _Y(X_1,X_2 ) =((_(Y,X_1)^2+_(Y,X_2)^2-2_(Y,X_1 ) _(Y,X_2 ) _(X_1,X_2 ))/(1-_(X_1,X_2)^2 ))

2.6 Aplicaciones
Mediante el siguiente problema podremos ilustrar la aplicacin de Regresin Multiple: En la Facultad de Ingeniera de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar una

muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de Datos y Programacin como se muestran en el siguiente cuadro.
Alumno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 PHP 13 13 13 15 16 15 12 13 13 13 11 14 15 15 15 Algoritmos 15 14 16 20 18 16 13 16 15 14 12 16 17 19 13 Base de Datos 15 13 13 14 18 17 15 14 14 13 12 11 16 14 15 Programacin 13 12 14 16 17 15 11 15 13 10 10 14 15 16 10

Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Base de Datos y Programacin. Se presentara la siguiente ecuacin a resolver: Utilizando las frmulas de las ecuaciones normales a los datos obtendremos los coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de Clculo de Excel podemos calcular tambin los coeficientes de regresin:

Por lo tanto podemos construir la ecuacin de regresin que buscamos:

El 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programacin

Potrebbero piacerti anche