Sei sulla pagina 1di 6

ESCUELA SUPERIOR POLITCNICA

DE CHIMBORAZO

Nombres: Rodrguez Eder (744)


Vaca Vanner (745)
Yerovi Guillermo (819)
REGRESIN LINEAL SIMPLE
El propsito de este estudio es proporcionar los conceptos y tcnicas
para determinar una ecuacin que describa de manera razonable a
un conjunto de datos dado. Este estudio se denomina anlisis de
regresin y la ecuacin emprica obtenida se denomina ecuacin
de regresin la cual sustituye a un modelo terico no disponible
En este primer enfoque se supondr que se tiene un conjunto de n
mediciones u observaciones y1, y2, ..., yn de una variable Y
denominada variable de respuesta las cuales corresponden a un
conjunto x1, x2, ..., xn que representan los valores de una variable X
denominada variable de prediccin.
Se supondr que existe una correspondencia de X a Yde tal manera
que cada valor yi est asociado con un valor xi.
Es importante reconocer que cada valor yi es el resultado de una
medicin, por lo tanto, es posible que pudiesen haber otros valores yi
para el mismo valor dado xi. Esto nos permite reconocer que yi
proviene de una variable aleatoria Yi la cual debe tener alguna
distribucin de probabilidad. Tratemos de visualizarlo en el siguiente
grfico:

ESCUELA SUPERIOR POLITCNICA


DE CHIMBORAZO
Supondremos que existe una relacin lineal entre X y Y. Este hecho
puede reconocerse graficando los puntos (xi, yi), i = 1, 2, ..., n y
observando la tendencia lineal de los puntos. Esta representacin
se denomina grfico de dispersin.
Se propone un modelo lineal que tome en cuenta la aleatoriedad de Y
y permita luego explicar los errores de medicin.
Modelo probabilista propuesto:
Y

siendo el componente aleatorio de Y


Se supondr que para cada variable aleatoria Yi el componente
aleatorio i tiene la misma distribucin de probabilidad y que adems
son independientes.
i N(0, 2) (distribucin normal con media 0 y varianza
2)
Por lo tanto, el valor esperado de este modelo, es una recta terica
(desconocida) con los parmetros 0 y 1 que deben estimarse
E[Y]
.

RECTA DE MNIMOS CUADRADOS

ESCUELA SUPERIOR POLITCNICA


DE CHIMBORAZO
Es un procedimiento matemtico para estimar los parmetros 0 y 1
de la recta de regresin utilizando los datos dados.
El objetivo es colocar una recta entre los puntos de tal manera la
suma de las distancias de esta recta a los puntos sea la menor
posible.
Definicin


y 0 1 x

0 , 1
Es la recta de mnimos cuadrados.
1

xi

Para cada valor

son los estimadores de 0 y

yi

se tiene el valor observado


y un valor

yi 0 1 x i
obtenido con la recta de mnimos cuadrados:

Sea

ei =

yi

yi

yi

e i2

Entonces, el criterio de mnimos cuadrados consiste en minimizar


para todos los puntos. El cuadrado puede interpretarse como una
manera de cuantificar las distancias. No importa si el punto est
sobre o debajo de la recta
Criterio de mnimos cuadrados

ESCUELA SUPERIOR POLITCNICA


DE CHIMBORAZO
n

e
SCE =

i 1

2
i

n
n

( y i y i ) 2 ( y i 0 1x i ) 2
i 1

i 1

(Lea SCE: Suma de Cuadrados del Error)


El procedimiento matemtico para realizar esta optimizacin es:
SCE
0,
0

SCE
0
1

Con facilidad se llega al sistema de ecuaciones lineales:


n

n
0n 1 x i y i
i 1

i 1

0 x i 1 x i2 x i y i
n

i1

i 1

i 1

0 , 1
De donde se obtienen finalmente los estimadores
Ejemplo
Los siguientes datos corresponden a una muestra aleatoria de 10
estudiantes que han tomado cierta materia. Los datos incluyen la
calificacin parcial y la calificacin final. Se pretende encontrar un
modelo de regresin que permita predecir la calificacin final que
obtendra un estudiante dada su calificacin parcial.
Estudian
te
1
2
3
4
5
6
7
8
9
10

Nota
Parcial
39
43
21
64
57
43
38
75
34
52

Nota final
65
75
52
82
92
80
73
98
56
75

Solucin
Primero representamos los datos en un diagrama de dispersin

ESCUELA SUPERIOR POLITCNICA


DE CHIMBORAZO

Se observa que al incrementar x (variable de prediccin) tambin se


incrementa y ( variable de respuesta)
Obtencin de la recta de mnimos cuadrados
Clculos
i
1
2
3
4
5
6
7
8
9
10

xi
39
43
21
64
57
43
38
75
34
52

yi
65
75
52
82
92
80
73
98
56
75

x2i
1521
1849
441
4096
3249
1849
1444
5625
1156
2704

xiyi
2535
3225
1092
5248
5244
3440
2774
7350
1904
3900

466

748

23934

36712

10

i1

Sustituimos en el sistema de ecuaciones lineales:

10 0 466 1 748

466 0 23934 1 36712

0 35.83,
De donde se obtienen:

1 0.836

ESCUELA SUPERIOR POLITCNICA


DE CHIMBORAZO

y
Ecuacin de mnimos cuadrados:

= 35.83 + 0.836 x

Grfico de la recta de mnimos cuadrados


Ahora pretendamos predecir la calificacin final que obtendr un
estudiante que obtuvo 50 en su calificacin parcial:

y
= 35.83 + 0.836 (50) = 77.63

Potrebbero piacerti anche