Sei sulla pagina 1di 5

DEFINICIN DE REGRESIN LINEAL

La regresin estadstica o regresin a la media es la tendencia de una


medicin extrema a presentarse ms cercana a la media en una segunda medicin.
La regresin se utiliza para predecir una medida basndonos en el conocimiento de
otra.
MODELO DE REGRESIN LINEAL
Regresin lineal
En estadstica la regresin
lineal o ajuste
lineal es
un mtodo matemtico que modeliza la relacin entre una variable dependiente Y,
las variables independientes Xi y un trmino aleatorio . Este modelo puede ser
expresado como:

La regresin lineal puede ser contrastada con la regresin no lineal.


Regresin lineal simple
Slo se maneja una variable independiente, por lo que slo cuenta con dos parmetros.
Son de la forma:

Dado el modelo de regresin simple, si se calcula la esperanza (valor esperado) del


valor Y, se obtiene:

Obteniendo dos ecuaciones denominadas ecuaciones


siguiente solucin para ambos parmetros

normales que

generan

la

La interpretacin del parmetro beta 2 es que un incremento en Xi de una unidad, Yi


incrementar en beta 2
Maneja varias variables independientes. Cuenta con varios parmetros. Se expresan de la
forma:8

Regresin lineal simple


Dadas dos variables (Y: variable dependiente; X: independiente) se trata de encontrar una
funcin simple (lineal) de X que nos permita aproximar Y mediante: = a + bX
(ordenada en el origen, constante)
(pendiente de la recta)
A la cantidad e=Y- se le denomina residuo o error residual.
As, en el ejemplo de Pearson: = 85 cm + 0,5X
Donde es la altura predicha del hijo y X la altura del padre: En media, el hijo gana 0,5
cm por cada cm del padre.
Regresin no lineal
En estadstica, la regresin no lineal es un problema de inferencia para un modelo tipo:

Y= F (X,0)+E
basado en datos multidimensionales x,y, donde f es alguna funcin no lineal respecto a
algunos parmetros desconocidos . Como mnimo, se pretende obtener los valores de
los parmetros asociados con la mejor curva de ajuste (habitualmente, con el mtodo de
los mnimos cuadrados). Con el fin de determinar si el modelo es adecuado, puede ser
necesario utilizar conceptos de inferencia estadstica tales como intervalos de confianza
para los parmetros as como pruebas de bondad de ajuste.
El objetivo de la regresin no lineal se puede clarificar al considerar el caso de
la regresin polinomial, la cual es mejor no tratar como un caso de regresin no lineal.
Cuando la funcin ftoma la forma:
F(X) = AX2 + BX + C
la funcin f es no lineal en funcin de x pero lineal en funcin de los parmetros
desconocidos a, b, yc. Este es el sentido del trmino "lineal" en el contexto de la regresin
estadstica. Los procedimientos computacionales para la regresin polinomial son
procedimientos de regresin lineal (mltiple), en este caso con dos variables
predictoras x y x2. Sin embargo, en ocasiones se sugiere que la regresin no lineal es
necesaria para ajustar polinomios. Las consecuencias practicas de esta mala
interpretacin conducen a que un procedimiento de optimizacin no lineal sea usado
cuando en realidad hay una solucin disponible en trminos de regresin lineal. Paquetes
(software) estadsticos consideran, por lo general, ms alternativas de regresin lineal que
de regresin no lineal en sus procedimientos.
DEFINICIN DE CORRELACIN LINEAL
En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin
entre dos variables aleatorias.
Por ejemplo, podemos preguntarnos si hay alguna relacin entre las notas de la
asignatura Estadstica I y las de Matemticas I. Una primera aproximacin al problema
consistira en dibujar en el plano R2 un punto por cada alumno: la primera coordenada de
cada punto sera su nota en estadstica, mientras que la segunda sera su nota en
matemticas. As, obtendramos una nube de puntos la cual podra indicarnos visualmente
la existencia o no de algn tipo de relacin (lineal, parablica, exponencial, etc.) entre
ambas notas.
Otro ejemplo, consistira en analizar la facturacin de una empresa en un periodo
de tiempo dado y de cmo influyen los gastos de promocin y publicidad en dicha
facturacin. Si consideramos un periodo de tiempo de 10 aos, una posible
representacin sera situar un punto por cada ao de forma que la primera coordenada de
cada punto sera la cantidad en euros invertidos en publicidad, mientras que la segunda
sera la cantidad en euros obtenidos de su facturacin. De esta manera, obtendramos
una nube de puntos que nos indicara el tipo de relacin existente entre ambas variables.
En particular, nos interesa cuantificar la intensidad de la relacin lineal entre dos variables.
El parmetro que nos da tal cuantificacin es el coeficiente de correlacin lineal de
Pearson r, cuyo valor oscila entre 1 y +1 :

Siendo Sx y Sy las desviaciones tpicas de x e y. Este coeficiente es adimensional y


siempre estar entre 1 y 1.
Si hay relacin lineal positiva, rxy>0 y prximo a 1.
Si hay relacin lineal negativa rxy<0 y prximo a 1.
Si no hay relacin lineal rxy ser prximo a 0.
Nota: Cuando las variables x e y son independientes, Sxy =0, y por tanto rxy=0. Es
decir, si dos variables son independientes su covarianza vale cero. No podemos
asegurar lo mismo en sentido contrario. Si dos variables tienen covarianza cero, no
podemos decir que son independientes. Sabemos que linealmente no tienen
relacin, pero podran tener otro tipo de relacin y no ser independientes.
Ejemplo: A partir de los siguientes datos, vamos a calcular la Covarianza y el coeficiente
de correlacin:
Altura 175 180 162 157 180 173 171 168 165 165
Peso 80 82 57 63 78 65 66 67 62 58
Los clculos que necesitamos:

Ahora se puede calcular el coeficiente de correlacin lineal rxy y el de determinacin lineal


R2
que nos indica que las variables estn relacionadas.
El valor de r se aproxima a +1 cuando la correlacin tiende a ser lineal directa
(mayores valores de X significan mayores valores de Y), y se aproxima a 1 cuando la
correlacin tiende a ser lineal inversa. Es importante notar que la existencia de correlacin
entre variables no implica causalidad. Atencin!: si no hay correlacin de ningn tipo
entre dos v.a., entonces tampoco habr correlacin lineal, por lo que r = 0. Sin embargo,
el que ocurra r = 0 slo nos dice que no hay correlacin lineal, pero puede que la haya de
otro tipo. El siguiente diagrama resume el anlisis del coeficiente de correlacin entre dos
variable:
Correlacin negativa perfecta.. -1

Correlacin negativa fuerte moderada dbil -0,5


Ninguna correlacin. 0
Correlacin positiva moderada Fuerte. +0,5
Correlacin positiva perfecta... + 1
EJERCICIOS

Potrebbero piacerti anche