Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
4a Edicin
Captulo 12
Regresin Lineal Simple
Chap 12-1
Objetivos de Aprendizaje
En este captulo, usted aprender:
Introduccin al
Anlisis de Regresin
Relacin curvilnea
X
Y
X
Y
Relacin dbil
X
Y
X
Y
X
Y
Variable de
Respuesta
Intercepto
poblacional
con Y
Coeficiente
poblacional
de la
pendiente
Variable
explicativa
Trmino
de error
aleatorio
Yi 0 1Xi i
Componentes lineales
Componente de error
aleatorio
(continuacin)
Yi 0 1Xi i
Valor observado
de Y para Xi
Valor
pronosticado
de Y para Xi
Pendiente = 1
Error aleatorio para
este valor de Xi
Intercepto =
0
Xi
Estimacin
del intercepto
de la
regresin
Estimacin de la
pendiente de
regresin
Yi b0 b1Xi
Valor de X
para la
observacin i
2
2
Clculo de la ecuacin de
Mnimos Cuadrados
b1 es la estimacin de el cambio en el
valor promedio de Y como resultado
de el cambio de una unidad en el valor
de X
245
1400
312
1600
279
1700
308
1875
199
1100
219
1550
405
2350
324
2450
319
1425
255
1700
Grfico de Dispersin
Salidas de Excel
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
41.33032
Observations
ANOVA
10
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Intercepto
= 98.248
Interpretacin de la pendiente, b1
precio casa 98.24833 0.10977 (ft)
Predicciones mediante la
ecuacin de regresin
El precio pronosticado para el valor de una
casa con un tamao de 2000 ft:
No es aconsejable extrapolar
los resultados por fuera de los
valores observados de las Xs
SST
SSR
Suma de
cuadrados totales
Suma de cuadrados
de la regresin
SST ( Yi Y )2
SSR ( Yi Y )2
SSE
Suma de cuadrados
del error
SSE ( Yi Yi )2
donde:
Medidas de Variacin
(continuacin)
Y
Yi
SSE = (Yi - Yi )2
Xi
_
Y
Coeficiente de Determinacin, r2
SST
suma de cuadrados totales
2
Note que:
0 r 1
2
Ejemplos de valores
aproximados de r2
Y
r2 = 1
r2 = 1
El 100% de la variacin en Y
es explicada por la variacin
en X
r =1
2
Ejemplos de valores
aproximados de r2
Y
0 < r2 < 1
Ejemplos de valores
aproximados de r2
r2 = 0
r2 = 0
Los valores de Y no
dependen de X. (La
variacin de Y NO es
explicada por la variacin
de X)
Salidas de Excel
SSR 18934.9348
r
0.58082
SST 32600.5000
2
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
41.33032
Observations
ANOVA
10
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
S YX
SSE
n2
(
Y
Y
)
i i
i1
n2
Donde
SSE = suma de cuadrados del error
n = tamao de la muestra
Salida de Excel
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
41.33032
Observations
ANOVA
S YX 41.33032
10
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
sYX pequeo
sYX grande
Supuestos de la regresin
Linealidad
No lineal
residuales
residuales
Lineal
Anlisis grfico de
Independencia de los errores
residuales
Independencia
X
residuales
residuales
No hay independencia
0
-3
-2
-1
Residuales
x
No hay homogeneidad
residuales
residuales
Hay homogeneidad
Residuales
251.92316
-6.923162
273.87671
38.12329
284.85348
-5.853484
304.06284
3.937162
218.99284
-19.99284
268.38832
-49.38832
356.20251
48.79749
367.17929
-43.17929
254.6674
64.33264
10
284.85348
-29.85348
Medicin de la Autocorrelacin:
El estadstico Durbin-Watson
Autocorrelacin
El estadstico de Durbin-Watson
2
(
e
e
)
i i1
i 2
2
e
i
i1
Prueba inconclusa
dL
No rechace H0
dU
(continuacin)
Hay autocorrelacin?
(continuacin)
Salida de Excel/PHStat:
Clculos de Durbin-Watson
Suma de cuadrados
Diferencia de Residuales
3296.18
Suma de cuadrados
Residuales
3279.98
Estadstico
Durbin-Watson
1.00494
n
(e e
i 2
ei
i 1
i1
)2
3296.18
1.00494
3279.98
(continuacin)
Inconclusa
dL=1.29
No rechazo H0
dU=1.45
S YX
Sb1
SSX
S YX
(X X)
donde:
Sb1
S YX
SSE
= Error estndar de la estimacin del modelo
n2
Salidas de Excel
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
Observations
ANOVA
Sb1 0.03297
41.33032
10
df
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Sb1 pequo
Sb1 grande
Estadstico de Prueba
b1 1
t
Sb1
g.l. n 2
donde:
b1 = coeficiente de la pendiente
de regresin
1 = Valor hipottico de la
pendiente
1
Sb = error estndar de la
pendiente
ft
(x)
245
1400
312
1600
279
1700
308
1875
199
1100
219
1550
405
2350
324
2450
319
1425
255
1700
H1: 1 0
Coefficients
Intercept
Square Feet
b1
Standard Error
Sb1
t Stat
P-value
98.24833
58.03348
1.69296
0.12892
0.10977
0.03297
3.32938
0.01039
b1 1 0.10977 0
t
3.32938
t
Sb1
0.03297
H0: 1 = 0
H1: 1 0
Coefficients
Intercept
Square Feet
g.l. = 10-2 = 8
/2=.025
Rechace H0
/2=.025
No rechace H0
-t/2
-2.3060
Rechace H
0
t/2
2.3060 3.329
b1
Standard Error
Sb1
t Stat
P-value
98.24833
58.03348
1.69296
0.12892
0.10977
0.03297
3.32938
0.01039
Decisin:
Rechace H0
Conclusin:
Hay suficiente evidencia de
que el tamao de las casas
afecta su precio de venta
valor-p = 0.01039
H0: 1 = 0
Salidas de excel:
H1: 1 0
Coefficients
Intercept
Square Feet
Valor-p
Standard Error
t Stat
P-value
98.24833
58.03348
1.69296
0.12892
0.10977
0.03297
3.32938
0.01039
MSR
F
MSE
Estadstico de prueba F:
donde
MSR
SSR
k
MSE
SSE
n k 1
Salida de excel
Regression Statistics
Multiple R
0.76211
R Square
0.58082
Adjusted R Square
0.52842
Standard Error
41.33032
Observations
ANOVA
MSR 18934.9348
F
11.0848
MSE 1708.1957
10
df
Con 1 y 8 grados de
libertad
SS
MS
F
11.0848
Regression
18934.9348
18934.9348
Residual
13665.5652
1708.1957
Total
32600.5000
Coefficients
Intercept
Square Feet
Standard Error
Valor-p para
la prueba F
t Stat
P-value
Significance F
0.01039
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
(continuacin)
Estadstico de prueba:
H 0 : 1 = 0
MSR
F
11.08
MSE
H 1 : 1 0
= .05
gl1= 1
gl2 = 8
Decisin:
Rechace H0 a un nivel
= 0.05
Valor
crtico:
F = 5.32
Conclusin:
= .05
No rechace H0
RechaceH0
F.05 = 5.32
b1 t n2Sb1
g.l. = n - 2
Standard Error
t Stat
P-value
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
(continuacin)
Coefficients
Intercept
Square Feet
Standard Error
t Stat
P-value
Lower 95%
Upper 95%
98.24833
58.03348
1.69296
0.12892
-35.57720
232.07386
0.10977
0.03297
3.32938
0.01039
0.03374
0.18580
Hiptesis
H0 : = 0
H1 : 0
Estadstico de prueba:
r -
t (con
n 2 grados de libertad)
2
1 r
n2
donde
r r 2 si b1 0
r r 2 si b1 0
H1: 0
(Existe correlacin)
=.05 , gl = 10 - 2 = 8
r
1 r 2
n2
.762 0
1 .762 2
10 2
3.329
r
1 r 2
n2
.762 0
1 .762 2
10 2
3.329
Conclusin:
Hay evidencia de
una asociacin
lineal a un nivel
de significancia
del 5%
g.l. = 10-2 = 8
/2=.025
Rechace H0
-t/2
-2.3060
/2=.025
No rechace H0
Rechace H0
t/2
2.3060
Decisin:
Rechace H0
3.329
Y = b0+b1Xi
Intervalo de
prediccin para un
valor individual Y,
dado un Xi
Xi
1 (Xi X)2 1
(Xi X)2
hi
n
SSX
n (Xi X)2
Y t n-2S YX
1
(Xi X)2
317.85 37.12
2
n (Xi X)
Y t n-1S YX
1
(Xi X)2
1
317.85 102.28
2
n (Xi X)
En Excel, use
PHStat | regression | simple linear regression
Active el comando de
intervalos de confianza y prediccin para X=
en la caja de dilogo correspondiente y entre el
valor de X y el nivel de confianza deseado
(continuacin)
Valores de entrada
Y
Intervalo de confianza para Y|X=Xi
Intervalo de prediccin para YX=Xi
Dificultades en el anlisis de
regresin
(continuacin)