Sei sulla pagina 1di 11

Universidad Tecnolgica de Panam

Facultad de Ingeniera Industrial


Ingeniera Industrial
Regresin Lineal

Nombre:

Eliecer Gonzalez
8-893-1351

Carrera:
Ingeniera Industrial

Profesor:
Sotero Sols
Asignatura:
Estadstica 1
Grupo:
1RH-121

2015

Introduccin
En estadstica la regresin lineal o ajuste lineal es
un mtodo matemtico que modela la relacin entre una variable Y,
las variables independientes Xi y un trmino aleatorio . Este modelo puede ser
expresado como:

: variable dependiente, explicada o regresando.


: variables explicativas, independientes o regresores.
: parmetros, miden la influencia que las variables
explicativas tienen sobre el regresando.
donde es la interseccin o trmino "constante", las
son los
parmetros respectivos a cada variable independiente, y es el nmero de
parmetros independientes a tener en cuenta en la regresin. La regresin
lineal puede ser contrastada con la regresin no lineal.

La regresin como una tcnica estadstica, una de ellas la regresin lineal simple y la
regresin multifactorial, analiza la relacin de dos o ms variables continuas, cuando
analiza las dos variables a esta se le conoce como variable bivariantes que pueden
corresponder a variables cualitativas, la regresin nos permite el cambio en una de las
variables llamadas respuesta y que corresponde a otra conocida como variable explicativa,
la regresin es una tcnica utilizada para inferir datos a partir de otros y hallar una respuesta
de lo que puede suceder.
Siendo as la regresin una tcnica estadstica, por lo tanto para interpretar situaciones
reales, pero a veces se manipula de mala manera por lo que es necesario realizar una
seleccin adecuada de las variables que van a construir las formulas matemtica, que
representen a la regresin, por eso hay que tomar en cuenta variables que tiene relacin, de
lo contraria se estara matematizando un galimatas.
Se pueden encontrar varios tipos de regresin, por ejemplo:
Regresin lineal simple
Regresin mltiple ( varias variables)
1. Simple
2. Mltiple, etc.
Tipos de rectas de regresion

Expresndolo en forma simple, la regresin lineal es una tcnica que permite cuantificar la
relacin que puede ser observada cuando se grafica un diagrama de puntos dispersos
correspondientes a dos variables, cuya tendencia general es rectilnea (Figura la); relacin
que cabe compendiar mediante una ecuacin del mejor ajuste de la forma:
y = a + bx

(1)

En esta ecuacin, y representa los valores de la coordenada a lo largo del eje vertical en
el grfico (ordenada); en tanto que x indica la magnitud de la coordenada sobre el eje
horizontal (absisa). El valor de a (que puede ser negativo, positivo o igual a cero) es
llamado el intercepto; en tanto que el valor de b (el cual puede ser negativo o positivo) se
denomina la pendiente ocoeficiente de regresin.
Tabla 1
Serie de datos para el clculo de una regresin (a y b) y del coeficiente de correlacin
(r)
Nmero

Valores de x

Valores de y

Nmero

Valores de x

Valores de y

9,0

0,50

6,7

1,00

9,4

0,50

8,4

0,50

7,4

1,23

8,0

0,50

9,7

1,00

10

10,0

0,50

10,4

0,30

11

9,2

0,50

5,0

1,50

12

6,2

1,00

13

7,7

0,50

El procedimiento para obtener valores de a y b para una serie de pares de datos de x


y de y (tal como la presentada en la Figura 1 y/o en la Tabla 1) es como sigue:
Paso 1

Calcule, para cada par de valores de x e y, las cantidades x, y, y x.y.

Paso 2

Obtenga las sumas () de estos valores para todos los pares de datos de x e
y, as como las sumas del total de los valores de x e y. Los resultados de
los Pasos 1 y 2 aparecern en forma similar a la siguiente:
Nmero de pares de datos

x.y

Monto de las sumas

x x y y xy

Paso 3

Estime la pendiente (b) por medio de la relacin:

Paso 4 Estime el intercepto (a) por medio de la relacin:

A partir de esos valores de a y de b obtenidos mediante las Ecuaciones 2 y 3, es posible


trazar a lo largo de los puntos dispersos de un grfico la lnea recta mejor ajustada a los
mismos, y verificar visualmente si tales puntos estn bien expresados por la lnea (Figura
1b).
Correlacin
El anlisis de correlacin se encuentra estrechamente vinculado con el anlisis de regresin
y ambos pueden ser considerados de hecho como dos aspectos de un mismo problema.
La correlacin entre dos variables es - otra vez puesto en los trminos ms simples - el
grado de asociacin entre las mismas. Este es expresado por un nico valor llamado
coeficiente de correlacin (r), el cual puede tener valores que ocilan entre -1 y +1. Cuando
r es negativo, ello significa que una variable (ya sea x o y) tiende a decrecer cuando
la otra aumenta (se trata entonces de una correlacin negativa, correspondiente a un valor
negativo de b en el anlisis de regresin). Cuando r es positivo, en cambio, esto
significa que una variable se incrementa al hacerse mayor la otra (lo cual corresponde a un
valor positivo de b en el anlisis de regresin).

Los valores de r pueden calcularse fcilmente en base a una serie de pares de datos de
x e y, utilizando la misma table y montos que se indican en el Paso 2 de la seccin
regresin de este captulo. De este modo r puede ser obtenido - indirectamente - a partir
de la relacin:

Figura 1a Diagrama de puntos dispersos correspondientes a pares de valores de x y de


y. Ntese que y tiende a decrecer con el aumento de x, lo cual sugiere coeficientes de
regresin y de correlacin negaticos (basado en la Tabla 1)

Figura 1b Los mismos datos que en 1a Fig. 1a, pero ajustados en base a la regresin y =
2,16 - 0,173x, con r = 0,75
la cual proporciona el valor del coeficiente de determinacin (r). Entonces, lo nico
necesario es calcular

es decir, tomar la raz indicada del coeficiente de determinacin a los fines de obtener el
valor absoluto de r, y luego agregar el signo (+ o -) de acuerdo a que la correlacin sea
positiva o negativa (lo cual puede ser establecido visualmente a partir del grfico, o bien en
base al clculo del valor de b de la correspondiente regresin y utilizando para r el
mismo signo).
Cuando se calculan los valores de r se querr saber, sin embargo, hasta qu punto la
correlacin identificada pudiera haber surgido nicamente por casualidad. Esto puede ser
establecido verificando si el valor estimado de r es significativo, es decir si el valor
absoluto de r es mayor o igual que un valor crtico de r indicado en las tablas
estadsticas (ver Tabla de valores crticos de r en el Apndice 1).
Ejercicio: Calcule a, b y r a partir de los datos presentados en la Tabla 1 y verifique,
por medio de la Tabla del Apndice 1, hasta qu punto el valor estimado de r es
significativo para valores de P = 0,01 y de P = 0,05

Transformacin Lineal en el Anlisis de Regresin


Como se indicara anteriormente, tanto el anlisis de regresin como el de correlacin se
basan en la asuncin de una relacin lineal entre las dos variables de referencia (lo cual
significa que la mejor lnea de ajuste es una recta). Hay muchos casos en biologa pesquera,
sin embargo, en los cuales la relacin entre ambas variables no es lineal, y un buen ejemplo
de ello es la relacin largo-peso, donde:
W = Lb

(6)

ecuacin que indica que el peso (W) es proporcional a una cierta potencia (b) de la longitud
(L) (ver Figura 2a).
Los datos largo-peso, sin embargo, pueden ser ajustados a una regresin lineal si se toma el
logaritmo de ambos miembros, de manera que:
log10W = a + b log10L

(7)

Como puede observarse en la Figura 2b, los logaritmos de la longitud y del peso se ajustan
extremadamente bien a una regresin lineal, donde:
y = log10W

(8a)

y
x = log10L

(8b)

Ejemplos resueltos de regresin Lineal


Una compaa de seguros considera que el nmero de vehculos (y) que circulan por una
determinada autopista a ms de 120 km/h , puede ponerse en funcin del nmero
de accidentes (x) que ocurren en ella. Durante 5 das obtuvo los siguientes resultados:
Accidentes xi

Nmero de vehculos yi

15

18

10

20

Calcula el coeficiente de correlacin lineal.


Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que circulaban por
la autopista a ms de 120 km / h?
Es buena la prediccin?
Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno. Debemos
conocer la media aritmtica de las dos variables, las varianzas, las desviaciones tpicas y la
covarianza.

Media
aritmtica

Varianza

Covarianza

fi

xi

yi

xi2

yi2

xi . yi

15

25

225

75

18

49

324

126

10

100

20

64

20

81

400

180

24

71

160

1113

409

Conclusin

dos herramientas para

Regresin y
correlacin lineal son
investigar la
dependencia de una

variable dependiente y en funcin


de una variable
independiente x. y = f(x)

y=
variable dependiente que se desea explicar o predecir, tambin se llama
regresor o respuesta
x = variable independiente, tambin se llama variable explicativa,
regresor o predictor
Regresin lineal - la relacin entre x y y se representa por medio de una
lnea recta
Regresin curvilinea - la relacin entre x y y se representa por medio de
una curva.

Las tcnicas de regresin y correlacin cuantifican la asociacin estadstica


entre dos o ms variables. La regresin lineal simple expresa la relacin entre
una variable dependiente Y y una variable independiente X, en trminos de la
pendiente y la interseccin de la lnea que mejor se ajuste a las variables.
La correlacin simple expresa el grado o la cercana de la relacin entre las
dos variables en trminos de un coeficiente de correlacin que proporciona
una medida indirecta de la variabilidad de los puntos alrededor de la mejor
lnea de ajuste- Ni la regresin ni la correlacin dan pruebas de relaciones
causa efecto.

Potrebbero piacerti anche