Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Nombre:
Eliecer Gonzalez
8-893-1351
Carrera:
Ingeniera Industrial
Profesor:
Sotero Sols
Asignatura:
Estadstica 1
Grupo:
1RH-121
2015
Introduccin
En estadstica la regresin lineal o ajuste lineal es
un mtodo matemtico que modela la relacin entre una variable Y,
las variables independientes Xi y un trmino aleatorio . Este modelo puede ser
expresado como:
La regresin como una tcnica estadstica, una de ellas la regresin lineal simple y la
regresin multifactorial, analiza la relacin de dos o ms variables continuas, cuando
analiza las dos variables a esta se le conoce como variable bivariantes que pueden
corresponder a variables cualitativas, la regresin nos permite el cambio en una de las
variables llamadas respuesta y que corresponde a otra conocida como variable explicativa,
la regresin es una tcnica utilizada para inferir datos a partir de otros y hallar una respuesta
de lo que puede suceder.
Siendo as la regresin una tcnica estadstica, por lo tanto para interpretar situaciones
reales, pero a veces se manipula de mala manera por lo que es necesario realizar una
seleccin adecuada de las variables que van a construir las formulas matemtica, que
representen a la regresin, por eso hay que tomar en cuenta variables que tiene relacin, de
lo contraria se estara matematizando un galimatas.
Se pueden encontrar varios tipos de regresin, por ejemplo:
Regresin lineal simple
Regresin mltiple ( varias variables)
1. Simple
2. Mltiple, etc.
Tipos de rectas de regresion
Expresndolo en forma simple, la regresin lineal es una tcnica que permite cuantificar la
relacin que puede ser observada cuando se grafica un diagrama de puntos dispersos
correspondientes a dos variables, cuya tendencia general es rectilnea (Figura la); relacin
que cabe compendiar mediante una ecuacin del mejor ajuste de la forma:
y = a + bx
(1)
En esta ecuacin, y representa los valores de la coordenada a lo largo del eje vertical en
el grfico (ordenada); en tanto que x indica la magnitud de la coordenada sobre el eje
horizontal (absisa). El valor de a (que puede ser negativo, positivo o igual a cero) es
llamado el intercepto; en tanto que el valor de b (el cual puede ser negativo o positivo) se
denomina la pendiente ocoeficiente de regresin.
Tabla 1
Serie de datos para el clculo de una regresin (a y b) y del coeficiente de correlacin
(r)
Nmero
Valores de x
Valores de y
Nmero
Valores de x
Valores de y
9,0
0,50
6,7
1,00
9,4
0,50
8,4
0,50
7,4
1,23
8,0
0,50
9,7
1,00
10
10,0
0,50
10,4
0,30
11
9,2
0,50
5,0
1,50
12
6,2
1,00
13
7,7
0,50
Paso 2
Obtenga las sumas () de estos valores para todos los pares de datos de x e
y, as como las sumas del total de los valores de x e y. Los resultados de
los Pasos 1 y 2 aparecern en forma similar a la siguiente:
Nmero de pares de datos
x.y
x x y y xy
Paso 3
Los valores de r pueden calcularse fcilmente en base a una serie de pares de datos de
x e y, utilizando la misma table y montos que se indican en el Paso 2 de la seccin
regresin de este captulo. De este modo r puede ser obtenido - indirectamente - a partir
de la relacin:
Figura 1b Los mismos datos que en 1a Fig. 1a, pero ajustados en base a la regresin y =
2,16 - 0,173x, con r = 0,75
la cual proporciona el valor del coeficiente de determinacin (r). Entonces, lo nico
necesario es calcular
es decir, tomar la raz indicada del coeficiente de determinacin a los fines de obtener el
valor absoluto de r, y luego agregar el signo (+ o -) de acuerdo a que la correlacin sea
positiva o negativa (lo cual puede ser establecido visualmente a partir del grfico, o bien en
base al clculo del valor de b de la correspondiente regresin y utilizando para r el
mismo signo).
Cuando se calculan los valores de r se querr saber, sin embargo, hasta qu punto la
correlacin identificada pudiera haber surgido nicamente por casualidad. Esto puede ser
establecido verificando si el valor estimado de r es significativo, es decir si el valor
absoluto de r es mayor o igual que un valor crtico de r indicado en las tablas
estadsticas (ver Tabla de valores crticos de r en el Apndice 1).
Ejercicio: Calcule a, b y r a partir de los datos presentados en la Tabla 1 y verifique,
por medio de la Tabla del Apndice 1, hasta qu punto el valor estimado de r es
significativo para valores de P = 0,01 y de P = 0,05
(6)
ecuacin que indica que el peso (W) es proporcional a una cierta potencia (b) de la longitud
(L) (ver Figura 2a).
Los datos largo-peso, sin embargo, pueden ser ajustados a una regresin lineal si se toma el
logaritmo de ambos miembros, de manera que:
log10W = a + b log10L
(7)
Como puede observarse en la Figura 2b, los logaritmos de la longitud y del peso se ajustan
extremadamente bien a una regresin lineal, donde:
y = log10W
(8a)
y
x = log10L
(8b)
Nmero de vehculos yi
15
18
10
20
Media
aritmtica
Varianza
Covarianza
fi
xi
yi
xi2
yi2
xi . yi
15
25
225
75
18
49
324
126
10
100
20
64
20
81
400
180
24
71
160
1113
409
Conclusin
Regresin y
correlacin lineal son
investigar la
dependencia de una
y=
variable dependiente que se desea explicar o predecir, tambin se llama
regresor o respuesta
x = variable independiente, tambin se llama variable explicativa,
regresor o predictor
Regresin lineal - la relacin entre x y y se representa por medio de una
lnea recta
Regresin curvilinea - la relacin entre x y y se representa por medio de
una curva.