Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
LINEAL SIMPLE
Una de las aplicaciones mas
importantes de la estadística implica la
estimación del valor medio de una
variable de respuesta y o la predicción
de algún valor futuro de y con base el
conocimiento de un conjunto de
variables independientes relacionadas,
x1, x2, . . . xk.
Los modelos que se emplean para
relacionar una variable dependiente y
con las variables independientes x1, x2, . .
. xk se denominan modelos de regresión
o modelos estadísticos lineales porque
expresan el valor medio de y para
valores dados de x1, x2, . . . xk como una
función lineal de un conjunto de
parámetros desconocidos.
Los conceptos de análisis de regresión
se presentan empleando un modelo de
regresión muy sencillo, uno que
relaciona y con una sola variable x.
Aprenderemos a ajustar este modelo a
un conjunto de datos mediante el
método de los mínimos cuadrados.
Examinaremos los diferentes tipos de
inferencias que pueden hacerse a partir
de un análisis de regresión.
Un modelo de regresión simple:
supuestos
TABLA # 1
En la figura 1 se muestra una gráfica
de los datos, llamada diagrama de
dispersión. y
4
Figura 1. 2
0 1 2 3 4 X
y
0 1 2 3 4 X
y
4
0 1 2 3 4 X
y
4
3
Supongamos que
creemos que el
2
valor de y tiende a
1
aumentar de forma
0 1 2 3 4 5 X lineal conforme x
aumenta
Entonces, podríamos escoger un modelo
que relacione a y con x trazando una
línea recta a través de los puntos de la
figura.
y
4
0 1 2 3 4 5 X
2
̂1 pendiente
1
0
̂0 ordenada al origen 1 2 3 4 X
Modelo de regresión lineal simple
(probabilístico)
y 0 1 x
Donde: y = variable dependiente
x = variable independiente
E ( y) 0ˆ+
E(y)=
ˆx x
0 1 1 es el componente
determinístico (la ecuación de una línea
recta) = componente de error aleatorio
̂00 = punto en que la línea corta el eje y
ˆ1 = pendiente de la línea
Si queremos ajustar un modelo de
regresión lineal simple a un conjunto
de datos, debemos encontrar
estimadores para los parámetros
00 y ˆ11.
desconocidos, ̂
Los supuestos, que se resumirán a
continuación, son básicos para todo
análisis de regresión estadístico.
SUPUESTO 1:
La media de la distribución de
probabilidad de es cero. Es decir, la
media de los errores a lo largo de una
serie infinitamente larga de
experimentos es cero para cada valor de
la variable independiente x. Este
supuesto implica que el valor medio de
y, E(y), para un valor dado de x es
( y) ˆ00+1ˆ1xx
EE(y)=
SUPUESTO 2:
La varianza de la distribución de
probabilidad de es constante para
todos los valores de la variable
independiente x
SUPUESTO 3:
La distribución de probabilidad de es
normal
SUPUESTO 4:
0
1 2 3 4 X
y
4
0
1 2 3 4 X
y
4
0
1 2 3 4 X
n
SS xx ( xi x ) 2
i 1
Ejercicio:
A continuación tenemos las estaturas en
centímetros (muestra x) y el peso en
kilogramos (y) de niños de 6 años.
Niño 1 2 3 4 5 6 7 8 9 10
Estatura
121 123 108 118 111 109 114 103 110 115
(cm) x
Peso
25 22 19 24 19 18 20 15 20 21
(kg) y
Ejercicio:
Calcular: las medidas centrales, el
primero y segundo cuartil, los percentiles
30 y 70, el diagrama de dispersión
Ejercicio 1:
Con esta información encontrar la
ecuación de la línea recta E(y)=?
Niño 1 2 3 4 5 6 7 8 9 10
Estatura
121 123 108 118 111 109 114 103 110 115
(cm) x
Peso
25 22 19 24 19 18 20 15 20 21
(kg) y