Sei sulla pagina 1di 49

2015

REGRESIN LINEAL SIMPLE

Curso
: ESTADSTICA
DECISIONES

PARA

Profesor : VICENTE ARMAS, EDGAR

LA

TOMA

Integrante

ZORRILLA CANCHANYA, JHONY JULIN

Ciclo

: IV

Aula

: 304

Turno

DE

: MAANA

Ciudad Universitaria, Septiembre

DEDICATORIA:
Dedicado a mis padres
que siempre me orientan
a tomar decisiones acertadas

INTRODUCCIN

La finalidad de este trabajo es presentar un modelo estadstico bsico. Este es


el modelo de regresin lineal, que se usa para expresar la relacin lineal que
pueda existir entre los valores de una variable y los valores de un conjunto de
una o ms variables. Por ejemplo, un modelo de este tipo puede ser utilizado
para explicar la variabilidad de las ventas de una empresa en trminos de la
inversin que se realiza en publicidad. El modelo que trata de explicar la
variable dependiente (ventas) mediante una relacin lineal y usando solo una
variable independiente (inversin en publicidad) se llama modelo de regresin
lineal simple. Algunos modelos de regresin incorporan ms de una variable
independiente, y su forma puede ser de lo ms complicada posible. Los
modelos de regresin que incorporan ms de una variable independiente se
llaman modelos de regresin mltiple. Los modelos de regresin fueron
introducidos por Laplace y Gauss. Posteriormente fueron usados por Galton en
trabajos que trataban de explicar la relacin de las estaturas de los padres con
las de sus hijos, encontrando lo que l llam regresin a la media, expresin
usada para indicar que los hijos de los padres altos, en promedio, no eran tan
altos como los padres, y que los hijos de los padres bajos, en promedio, eran
ms altos que los padres. Haba una regresin hacia el promedio. Se aplican
en casi todos los campos de la ciencia, como el de la ingeniera, de las ciencias
fsicas, de las ciencias econmicas, de las ciencias sociales, etc., y en muchos
casos se utilizan para: predecir rendimientos futuros de un proceso y analizar la
influencia de ciertos factores en los valores de una variable y de esta manera
conocer, controlar y mejorar un proceso productivo.

MARCO TERICO
ANLISIS DE CORRELACIN.- Grupo de tcnicas para medir la
asociacin entre dos variables. La idea bsica del anlisis de correlacin
es reportar la asociacin entre dos variables. El primer paso habitual es
trazar los datos en un diagrama de dispersin.
COEFICIENTE DE CORRELACIN.- Medida de la fuerza de la relacin
lineal entre dos variables. Su signo indica la direccin de la relacin
entre dos variables, directa o inversa.

COEFICIENTE DE DETERMINACIN.- Proporcin de la variacin total


en la variable dependiente Y que se explica, o contabiliza, por la
variacin en la variable dependiente X. Se expresa como sigue:

DIAGRAMA DE DISPERSIN.- Grfica de puntos en una cuadrcula;


las coordenadas X y Y de cada punto corresponden a las dos

mediciones hechas sobre un elemento particular de la muestra; el patrn


de puntos ilustra la relacin entre las dos variables. Ejemplo:

ECUACIN

DE

ESTIMACIN.-

Frmula

matemtica

que

relaciona la variable desconocida con las variables conocidas en el


anlisis de regresin.
ERROR ESTNDAR DE LA ESTIMACIN.- Medida de la dispersin de
los valores observados respecto de la recta de regresin, esto es, de
qu manera los valores observados varan de sus valores pronosticados
sobre la recta de regresin.

ERROR ESTNDAR DEL COEFICIENTE DE REGRESIN.- Medida de


la variabilidad del coeficiente de regresin de la muestra alrededor del
coeficiente de regresin verdadero de la poblacin. Frmula:

MTODO

DE

MNIMOS

CUADRADOS.- Determina una ecuacin de regresin al minimizar la


suma de los cuadrados de las distancias verticales entre los valores
reales de Y y los valores pronosticados de Y. Ejemplo:

ORDENADA Y.- Constante para cualquier lnea recta dada cuyo valor
representa el valor de la variable Y cuando el valor de la variable X es 0.
Se expresa por la letra a:

PENDIENTE.cualquier

lnea

Constante

para

recta dada cuyo valor

representa cunto cambia la variable dependiente con un cambio de una


unidad de la variable independiente. Se expresa por la letra b:
RECTA

DE

lnea ajustada a

REGRESIN.-

Una

un conjunto de datos

para estimar la relacin entre dos variables.

REGRESIN LINEAL.- Tambin conocida como mtodo de mnimos


cuadrados. Proceso general para predecir una variable a partir de otra

mediante medios estadsticos utilizando datos histricos, es decir,


consiste en encontrar la ecuacin de una recta que mejor se ajuste a un
conjunto de puntos (datos).
RELACIN CURVILNEA.- Asociacin entre dos variables que se
describe por una lnea curva.

RELACIN

DIRECTA.Relacin

entre

dos

variables

en

al

aumentar el

valor de

la

donde,
variable

independiente, aumenta el valor de la variable dependiente.

RELACIN INVERSA.- Relacin entre dos variables en donde, al


aumentar la variable independiente, la variable dependiente disminuye.

RELACIN LINEAL.- Tipo particular de asociacin entre dos variables que


puede describirse matemticamente mediante una lnea recta.

VARIABLE DEPENDIENTE.- Variable que se predice o estima. Se


muestra en el eje Y.
VARIABLE INDEPENDIENTE.- Variable que proporciona la base para la
estimacin. Es la variable de pronstico. Se muestra en el eje X.

RESOLUCIN DE EJERCICIOS
12-16 Las ventas de lnea blanca varan segn el estado del mercado de casas
nuevas: cuando las ventas de casas nuevas son buenas, tambin lo son las de
lavaplatos, lavadoras de ropa, secadoras y refrigeradores. Una asociacin de
comercio compil los siguientes datos histricos (en miles de unidades) de las
ventas de lnea blanca y la construccin de casas.

a) Desarrolle una ecuacin para la relacin entre las ventas de lnea blanca
(en miles) y la construccin de casas (en miles).
-

Diagrama de dispersin

b) Calcular los Coeficientes a y b.

a=

y . x 2 x . x . y =
2
n x 2 ( x )

(75.5147.18)(37.2289.2)
=
(1037.2)37.22

1.168145

x 2
n
n . x . y x . y
b=

^y =a+bx
^y =1.168145+1.715553 X

1.715553

b) Interprete la pendiente de la recta de regresin.


Por cada mil casas construidas, las ventas de lneas blancas se incrementarn
en 1756 unidades.
c) Calcule e interprete el error estndar de la estimacin.
S yx=

Y 2a Y b XY
nk

147.181.168145 ( 75.5 )1.715553( 289.2)


=0.3737
8
Interpretacin: Los valores observados en la muestra estn dispersos con
respecto a la recta de regresin en 0.3737 mil unidades de ventas de lneas
blancas.
S yx =

d) La construccin de casas durante el ao prximo puede ser mayor que


el intervalo registrado; se han pronosticado estimaciones hasta de 8.0
millones de unidades. Calcule un intervalo de prediccin de 90% de
confianza para las ventas de lnea blanca, con base en los datos
anteriores y el nuevo pronstico de construccin de casas.

Nos piden:
Y^ t c S yx ; Y^ t c S yx >
1 PASO: Hallar ^y para X = 8000
^y =1.168145+1.715553(8000) = 13725.59215
2 PASO: n = 10 , =0.1 , utilizamos la t ( nk ) g. l .=t ( 8) g .l .

3 PASO: ERROR ESTNDAR DE ESTIMACIN


S yx=

Y 2a Y b XY
nk

= 0.3737

4 PASO:
13725.592151.86(0.3737); 2.7215591.86 (0.3737)>
13724.89707; 13726.28723>
Estamos 90% seguros que las ventas de lneas blancas estarn entre 13 724
897 y 13 726 287 unidades, cuando la construccin de nuevas casas sea de 8
millones.
12-17 Durante partidos recientes de tenis, Diane ha observado que sus
lanzamientos no han sido eficaces, pues sus oponentes le han regresado
algunos de ellos. Algunas de las personas con las que juega son bastante
altas, as que se pregunta si la estatura de su contrincante podra explicar el
nmero de lanzamientos no regresados durante un partido. Los siguientes
datos se sacaron de cinco partidos recientes.

a) Cul es la variable dependiente?


El nmero de lanzamientos no regresados durante un partido
b) Cul es la ecuacin de estimacin de mnimos cuadrados para estos
datos?
- Graficar el diagrama de dispersin

Calcular los Coeficientes a y b.

a=

y . x 2 x . x . y =
2
n x 2 ( x )

(25158.5)(28131)
=
(5158.5)282

34.647059

x 2
n
n . x . y x . y
b=

-5.294118

^y =a+bx
^y =34.6470595.294118 X

Interpretacin: Por cada incremento de un pie en la estatura de los


contrincantes, el nmero de lanzamientos no regresados disminuir en 5
aproximadamente.
c) Cul es su mejor estimacin del nmero de lanzamientos no
regresados en su partido de maana con un oponente de 5.9 pies de
estatura?
^y =34.6470595.294118(5.9) = 3.41

Es decir, el nmero de lanzamientos no regresados en su partido de maana


con un oponente de 5.9 pies de estatura ser de 3 aproximadamente.
12-18 Un estudio elaborado por el Departamento de Transporte de Atlanta, Georgia,
acerca del efecto de los precios de boletos de autobs sobre el nmero de
pasajeros produjo los siguientes resultados.
Precio de boleto (X)
Pasajeros por 100 millas

25 30 35 40 45 50 55 60
800 80 780 660 640 600 620 620

a) Grafique los datos

Y X 2 X XY 550015500340227200

a=
=
=952.619048
2
8155003402
n x2 ( x )
n XY X Y 82272003405500
b=
=
=6.238095
2
2
2
815500340
n x ( x )

b) Desarrolle la ecuacin de estimacin que mejor describa estos datos.

Y^ =952.6190486.238095 x
c) Pronostique el nmero de pasajeros/100millas si el precio del boleto fuera de 50
centavos. Utilice un intervalo de prediccin del 95% de aproximacin.

Y^ t i S xy , Y^ + t i S xy >

#1 Paso
Y^ =952.6190486.23809550=640.7143

Y^ =641

Pasajeros por cada 100 millas

#2 Paso
n = 8,

=5

utilizamos la t(n-k) g.l.= t (6) g.l.

#3 Paso
S yx =

y 2a yb xy =
nk

3830800952.6190485500(6.238095)227200
=38.05802
6

38 pasajeros por 100 millas.

Y^ t i S xy , Y^ + t i S xy >
6412.47738 , 641+ 2.47738> < 547,735>

Estamos 95% seguros que el nmero de pasajeros/100 millas estarn


entre 548 y 735 pasajeros, cuando el precio del boleto sea de 50
centavos.
12-19 William C. Andrews, consultor de comportamiento organizacional de Victory
Motorcycles, ha diseado una prueba para mostrar a los supervisores de la
compaa los peligros de sobre vigilar a sus trabajadores. Un trabajador de la
lnea de ensamble tiene a su cargo una serie de tareas complicadas. Durante
el desempeo del trabajador, un inspector lo interrumpe constantemente
para ayudarlo a terminar las tareas. El trabajador, despus de terminar su
trabajo, recibe una prueba psicolgica diseada para medir la hostilidad del
trabajador hacia la autoridad. A ochos trabajadores se les asignaron las
tareas y luego se les interrumpi para darles instrucciones tiles un nmero
no variable de veces (lnea X). Sus calificaciones en la prueba de hostilidad
estn en el regln Y.
X
Y

5
58

10
41

10
45

15
27

15
26

20
12

20
16

25
3

Y X 2 X XY 22821001202580

a=
=
=70.5
2
821001202
n x2 ( x )
n XY X Y 82580120228
b=
=
=2.8
2
2
82100120
n x 2( x )
a) Graficar

b) Ecuacin de proyeccin

Y^ =70.52.8 x

c) Interrumpido 18 veces

^ =70.52.8 ( 18 )=20.1
Y
La calificacin esperada de la prueba si el trabajador es
interrumpido 18 veces es de
20.1
12-20 El editor en jefe de un importante peridico metropolitano ha
intentado convencer al dueo para que mejore las condiciones de trabajo en
la imprenta. Est convencido de que, cuando trabajan las prensas, el grado
de ruido crea niveles no saludables de tensin t ansiedad. Recientemente
hizo que un siclogo realizara una prueba durante la cual situaron a los
prensistas en cuadros con niveles variables de ruido y luego les hicieron otra
prueba para medir niveles de humor y ansiedad.
a) Grafique estos datos

DIAGRAMA DE DISPERSIN
50
f(x) = 4.57x + 16.52
R = 0.72

40

DIAGRAMA DE
DISPERSIN

30

Linear (DIAGRAMA DE
DISPERSIN)

20
10
0
0

b) Desarrolle una ecuacin de estimacin que describa los datos.

y . x 2 x . x . y (260128)(281047)

a=
=
=
2
(8128)282
n x 2 ( x )

16.516667

2
x
n
n . x . y x . y
b=

4.566667

Ecuacin de la recta de mejor ajuste a estos datos y representarla


sobre la grfica.

^y =a+bx
^y =16.516667+ 4.566667 x
c) Pronostique el grado de ansiedad que podramos esperar
cuando el nivel de ruido sea 5.

^y =16.516667+ 4.566667(5)

^y =39.350002
Interpretacin= El grado de ansiedad que podramos esperar cuando el
nivel de ruido es 5 es de 39.350002.
12-21 Una compaa administra a sus vendedores en capacitacin una
prueba de ventas antes de salir a trabajar. La administracin de la compaa
est interesada en determinar la relacin entre las calificaciones de la
prueba y las ventas logradas por esos vendedores al final de un ao de
trabajo. Se recolectaron los siguientes datos de 10 agentes de ventas que
han estado en el campo un ao.

a) Encuentre la recta de regresin de mnimos cuadrados que


podra usarse para predecir las ventas a partir de las
calificaciones en la prueba de capacitacin.

y . x 2 x . x . y (260128)(281047)

a=
=
=
2
(8128)282
n x 2 ( x )

16.516667

2
x
n
n . x . y x . y
b=

4.566667

Ecuacin de la recta de mejor ajuste a estos datos y representarla


sobre la grfica.

^y =a+bx
^y =16.516667+ 4.566667 x
b) En cunto se incrementa el nmero esperado de unidades
vendidas por cada incremento de 1 punto en una calificacin
de la prueba?
Por cada punto adiciona, el nmero de unidades vendidas aumentar en
41.680912
c) Utilice la recta de regresin de mnimos cuadrados para
predecir el nmero de unidades que vendera un capacitado
que obtuvo una calificacin promedio en la prueba.
Nmero de unidades que vendera un capacitado que obtuvo una
calificacin promedio en la prueba.

Calif.

promedio

n. x . y x . y 2.6+3.7+2.4 +4.5+2.6 +5.0+2.8+3.0+ 4.0+3.4

=3.4
10
^y =16.516667+ 4.566667(3.4)

^y =137.100001
Interpretacin: El nmero de unidades que vendera un capacitado que
obtuvo una calificacin promedio en la prueba es de 137.100001

12-22 El consejo municipal de la ciudad de Bowie, Maryland, ha recabado


datos del nmero de accidentes menores de trfico y el nmero de partidos de
ftbol de jvenes que tienen lugar en la ciudad el fin de semana.

a) Grafique estos datos.

b) Desarrolle la ecuacin de estimacin que mejor describa estos datos.


- Calcular los Coeficientes a y b.

a=

y . x 2 x . x . y =
2
n x 2 ( x )

(483550)(1461101)
=
(73550)1462

2.731749

x 2
n
n . x . y x . y
b=

0.197793

^y =a+bx
^y =2.73174 +0.197793 X

Interpretacin: Por cada incremento de un partido de ftbol, el nmero de


accidentes menores aumenta en 0.19 aproximadamente.
c) Pronostique el nmero de accidentes menores de trfico que ocurrirn
en un fin de semana durante el cual tendrn lugar 33 partidos de ftbol
en Bowie.
^y =2.73174 +0.197793(33) = 2.9295
Por los tanto, el nmero de accidentes menores de trfico que ocurrirn en un
fin de semana durante el cual tendrn lugar 33 partidos de ftbol en Bowie ser
de 3 aproximadamente.
d) Calcule el error estndar de la estimacin.
S yx=

Y 2a Y b XY
nk

3522.73174 ( 48 )0.197793 (1101)


=0.7881
5
Interpretacin: Los valores observados en la muestra estn dispersos con
respecto a la recta de regresin en 0.78 accidente de trfico menor.
12-23 En economa, la funcin de demanda de un producto a menudo se estima
mediante una regresin de la cantidad vendida (Q) sobre el precio (P). La
compaa Bamsy est tratando de estimar la funcin de demanda para su nueva
mueca Ma am y ha recabado los siguientes datos:
S yx =

Cantida
d
vendida
(Q) Y
125
156
183
190
212
238

Precio (P)
X
20
17.5
16
14
12.05
10

X.Y
2500
2730
2928
2660
2554.6
2380

X2
400
306.25
256
196
145.2025
100

Y2
15625
24336
33489
36100
44944
56644

250
276

8
6.5

2000
1794

Y =

X =

X . Y =

1630

x
y

104.05

x
= 8 =

104.05
8
1630
8

y
= 8 =

19546.6

64
42.25

62500
76176

X =
150

Y =
3

9.7025

49814

= 13.00625
= 203.75

a. Grafique los datos:

DIAGRAMA DE DISPERSIN
300
250
DIAGRAMA DE
DISPERSIN

200
150
100
50
0
4

10 12 14 16 18 20 22

b. Calcule la recta de regresin de mnimos cuadrados:

y . x 2 x . x . y =
a=
n x 2 x2
341.262886

104.05
(81509.70)( 2)=
(16301509.70)(104.0519546.6)

104.05
x 2
n
n . x . y x . y
b=

-10.572831

Ecuacin de regresin:
^y =341.2610.57 x
c. Trace la recta de regresin ajustada en la grfica:

DIAGRAMA DE DISPERSIN
300
f(x) = - 10.57x + 341.26
R = 0.99

250
200

DIAGRAMA DE
DISPERSIN

150

Linear (DIAGRAMA
DE DISPERSIN )

100
50
0
4

8 10 12 14 16 18 20 22

12-24 Una compaa fabricante de llantas est interesada en eliminar


contaminantes de los tubos de emisin de su fbrica y el costo es una preocupacin.
La compaa ha recolectado datos de otras compaas respecto al monto gastado
en medidas ambientales y la cantidad de contaminantes eliminada que result
(como porcentaje de la emisin total).
A. Compaa 1:
Dinero
Porcentaje
gastado
de
(miles de contamina
dlares) X dos
Y
8.4

35.9

10.2

31.8

16.5

24.7

21.7

25.2

9.4

36.8

8.3

35.8

11.5

33.4

x=
8

Y =

223.6

(y-y*) 2
X.Y

X
= 7 =

x
= 7 =

Y*

301.56

70.56

1288.81

35.543515

324.36

104.04

1011.24

33.875563

407.55

272.25

610.09

28.037731

546.84

470.89

635.04

23.219203

345.92

88.36

1354.24

34.616875

297.14

68.89

1281.64

35.636179

132.25

1115.56

32.670931

384.1

x . y=
260

7.47

x =
1207

a. Calcule la ecuacin de regresin:


X

86
7 = 12.285714
223.6
= 31.942857
7

.24

y =
729

6.62

22
3.599997

0.1270815
6
4.3079617
7
11.140448
2
3.9235567
6
4.7660347
7
0.0268373
2
0.5315416
1

24.82
3462

b=

x . yn . x . y
x 2n . x2

12.285714
1207.247 ( 2)=
2607.47(7)(12.285714)(31.942857)

-0.926640

31.942857+ 0.926640 (12.285714) = 43.327291

a= y b x =

Ecuacin de regresin:
^y =43.3272910.926640 x

DIAGRAMA DE DISPERSIN
40
35

f(x) = - 0.93x + 43.33


R = 0.84

30
25

DIAGRAMA DE
DISPERSIN
Linear (DIAGRAMA DE
DISPERSIN)

20
15
10
5
0
6

10 12 14 16 18 20 22 24

b. Pronostique el porcentaje de contaminantes eliminados si se gastan 20,000


en medidas de control:
y=43.3272910.926640 x

y=43.3272910.926640(20)

Y = 24.79
24.79 es el porcentaje de contaminantes eliminados si se gastan 20,000 en
medidas de control.
c. Calcule el error estndar de estimacin:
S yx =

(Y Y )2

nk
24.82
S yx=
72
S yx =2.228

B. Compaa 2:
Dinero
gastado Porcentaje de
(miles de contaminados
dlares)
Y
X

(y-y*) 2
X.Y

Y2

X2

Y*

25.4
31.4
27.4
15.8
31.5
28.9

467.36
524.38
528.82
448.72
148.05
355.47

645.16
985.96
750.76
249.64
992.25
835.21

338.56
278.89
372.49
806.56
22.09
151.29

y=
160.

x . y=
24

y 2=
4458

x 2=
1969.

18.4
16.7
19.3
28.4
4.7
12.3

x=

99.8

72.8

.98

88

24.9394282
26.5696041
24.0763939
15.3501582
38.0767281
30.7888829

159
.801195

0.21212638
23.3327246
11.0463575
0.20235765
43.2533525
3.56787861

a. Calcule la ecuacin de regresin:


x
y

x
= 6 =

y
= 6 =

99.8
6
160.4
6

x . yn . x . y =
b=
x 2n . x2
a= y b x =

= 16.633333
= 26.7333333
16.633333
1969.886( 2)=
2472.5( 6)(16.633333)(27.733333)

-0.952927

26.733333+ 0.952927 (16.633333) = 42.583685

Ecuacin de regresin:
^y =42.5836850.958927 x

DIAGRAMA DE DISPERSIN
35
30
DIAGRAMA DE
DISPERSIN

25
20

Linear (DIAGRAMA DE
DISPERSIN )

15
10
5
0
0

10

15

20

25

30

b. Pronostique el porcentaje de contaminantes eliminados si se gastan 20,000


en medidas de control:
y=42.5836850.958927 x

y=42.5836850.958927 (20)

Y= 23.41

81.61
47972

23.41 es el porcentaje de contaminantes eliminados si se gastan 20,000 en


medidas de control.
c. Calcule el error estndar de estimacin:
S yx =

(Y Y )2

nk
81.61
S yx=
62
S yx =4.52

12-34 Neds Beds est considerando contratar a una compaa de publicidad para
estimular el negocio. Fred, el hermano de Ned, investigo el campo de la
publicidad de camas y recolecto los siguientes datos de la cantidad de
ganancias (Y) Que logra una compaa de camas y la cantidad gastada en
publicidad (X).Si Fred calcula la ecuacin de regresin, la pendiente de la
recta indicara el incremento en la ganancia por dlar gastado en publicidad.
Ned har la publicidad solo si la gaancina de cada $1 invertido excede $ 1.50.
Calcule la pendiente de la ecuacin y pruebe si es mayor que 1.50. Para un
nivel de significancia de 0.05.

Y X 2 X XY = 306.951633.41128.73786.029 =4.646752
2
2
121633.41128.7
n x2 ( x )
n XY X Y 123786.029128.7306.95
b=
=
=1.951740
2
2
2
121633.41128.7
n x ( x )
a=

1 PASO: Formulacin de hiptesis


H 0 : 1.5
H 1 : >1.5
2 PASO: n = 12 , =0.05 , utilizamos la

t ( nk ) g. l .=t (10 ) g .l .

3 PASO: Regla de decisin


Rechazar H 0 t 0> 1.812
4 PASO: Hallar el t 0
S yx=

Y 2a Y b XY

nk
8838.5924.646756306.951.9517403786.029
S yx =
=9.659993
10

S b=

S yx

X n X 2
2

9.659993
=0.607196
1633.4112(10.725)2

b 1.9517401.5
=
=0.743977
Sb
0.607196
5 PASO: Conclusiones y recomendaciones
Rechazar H 0 y aceptar H 1 , por lo tanto Ned no har la publicidad.
t 0=

12-35 Un corredor de una empresa de inversin local ha estudiado


la relacin entre el incremento en el precio del oro(X) y las
peticiones de sus clientes de liquidar las acciones (Y). Del conjunto
de datos basado en 15 observaciones, se encontr que la pendiente
de la muestra era 2.9. Si el error estndar del coeficiente de la
pendiente de regresin es 0.18, existe una razn para pensar (a
0.05 de nivel de significancia) que la pendiente cambio de su valor
anterior de 3.2)
25

0.0

Y^ =a+2.9 x

S b=0.18

n= 15
=3.2

b = 2.9

PRUEBA DE HIPOTESIS
1 PASO: FORMULACION DE HIPOTESIS
H0:
=3.2
H1:
3.2
2 PASO
n= 15 y se conoce = 5%, utilizamos t 13 g. l

0.025
3 PASO: REGLA DE DECISION
Rechazar H0 si y solo si t 0<2.160 t 0 >2.160
4 PASO: CLCULO DEL ESTADSTICO

b 2.93.2
=
Sb
0.18
t 0= 1.67
t 0=

5 PASO:CONCLUSIONES Y RECOMENDACIONES
Aprobamos H0 y rechazamos H1 por lo tanto la pendiente de la recta de regresin de
la poblacin sigue siendo 3.2 con un nivel de significacin de 0.05. Por ello decimos
que cada unidad adicional al incremento del precio del oro aumenta las peticiones de
los clientes 3.2 aprox.

^y =a+50 x
1paso: Formulacin de hiptesis
H0: = 1.50
H1: 1.50
2paso: n = 25,

=5

; utilizamos la t(n-k) g.l.= t (23) g.l.

-tc= -2.069
3paso: Regla de decisin

t0

Rechazar H0

tc=2.069

-2.069 o t0 2.069

4paso: Calculo del estadstico (t0)

S b=

t0

S yx

( x x )

b
=
Sb

=0.11

1681818

5 Conclusiones y recomendaciones:
- Aceptar H0 y rechazar H1, por lo tanto compruebo la veracidad de B= 0.150 y no ha
cambiaodo al nivel de significacin 5%

y . x 2 x . x . y

a=
=
2
n x 2 ( x )

15.970818

2
x
n
n . x . y x . y
b=

55.957580

Recta de regresin:
^y =a+bx
^y =15.970818+55.957580 x
Error estndar de estimacin:
S yx=
B)

Y 2a Y b XY
nk

= 3.447674

^y =a+50 x

1paso: Formulacin de hiptesis


H0: = 0
H1: 0
2paso: n = 6,

=1

; utilizamos la t(n-k) g.l.= t (4) g.l.

-tc= -1.833
3paso: Regla de decisin
Rechazar H0

t0

tc=1.833

-1.833 o t0 1.833

4paso: Calculo del estadstico (t0)

S b=

t0

S yx

( x x )2

b
=
Sb

=4.424115

11.301605

5 Conclusiones y recomendaciones:
- Aceptar H1 y rechazar H0, por lo tanto existe una relacin negativa entre el rea y el valor.

btc Sb , b+tc Sb>


Sb = 0.147
2paso: n = 18 ,

-tc= -1.746

=1

; utilizamos la t(n-k) g.l.= t (16) g.l.

tc=1.746

3paso: Regla de decisin

t0

Rechazar H0

-1.746o t0 1.746

4paso: Calculo del estadstico (t0)

S b=

t0

S yx

( x x )

b
=
Sb

=5.424115

13.4721

Por lo tanto :

0.14713.4(5.42), 0.147+ 13.4(5.42)>


Desarrollamos el intervalo de confianza:

72.81+394.4405 >
12-39 La compaa local de telfonos siempre ha supuesto que el nmero promedio de las
llamadas diarias aumenta en un1.5 por cada persona adicional en una casa. Se ha sugerido
que la gente es ms platicadora que lo que esto refleja. Se tom una muestra de 64
personas y se calcul que la pendiente de regresin de Y (numero promedio de las
llamadas diarias) sobre X (tamao de la casa) era 1.8 con un error estndar del coeficiente
de la pendiente de regresin de 0.2. Pruebe si se hacen significativamente ms llamadas
por persona adicional de lo que la compaa de telfonos supone: = 0.05. Establezca las
hiptesis y las conclusiones explicitas.
DATOS:
= 1.5
b =1.8

Sb

n= 64

=0.2

Prueba de hiptesis de la existencia de la regresin ( )


Nivel de significacin = 5%
1PASO: FORMULACIN DE HIPTESIS
H0: = 1.5
H1: 1.5
2PASO: n = 64,

=5

; utilizamos la z/2

2.22
z/2 =1.96
8

z/22.22
=-1.96

3PASO: REGLA DE DECISIN


Rechazar H0

t0

-1.96

t0

1.96

4PASO: CALCULO DEL ESTADSTICO (t0)


S b= 0.2

z0

b
=
Sb

1.81.5
0.2

= 1.5

5 CONCLUSIONES Y RECOMENDACIONES:
- Aceptar H0 y rechazar H1, por lo tanto existe una relacin entre las horas y las unidades
producidas.
12- 40. Los funcionarios universitarios responsables de la admisin
constantemente buscan variables con las cuales predecir los promedios de las
calificaciones de los aspirantes. Una variable de uso comn es el promedio de
calificaciones del bachillerato. Para la universidad, los datos anteriores
indicaban que la pendiente era 0.85. Un pequeo estudio reciente de 20
estudiantes encontr que la pendiente de la muestra era 0.70 y que el error

2
X 2n X
era igual que 0.25. al

estndar de la estimacin era 0.60. La cantidad

nivel de la significancia de 0.01. Debera concluir la universidad que la


pendiente ha cambiado?

Y^ =a+0.70 x

n = 20 b = 0.70

( X 2 )n X 2=0.25

S YX =0.60

= 0.85

5
PRUEBA DE HIPOTESIS
0.00

1 PASO: FORMULACION DE HIPOTESIS


H0:
=0.85
H1:
0.85

2 PASO
n= 20 y se conoce = 1%, utilizamos

t 18 g .l

0.005
3 PASO: REGLA DE DECISION
Rechazar H0 si y solo si t 0<2.878 t 0 >2.878
4 PASO: CLCULO DEL ESTADSTICO

b 0.700.85
=
Sb
1.2
t 0= 1.29
t 0=

S b=

SYX

( X )n X
2

0.60
=1.2
0.25

5 PASO:CONCLUSIONES Y RECOMENDACIONES
Aprobamos H0 y rechazamos H1 por lo tanto la pendiente de la recta de regresin de
la poblacin sigue siendo 0.85 con un nivel de significacin de 0.01. Por ello decimos

que cada unidad adicional al nmero de los aspirantes aumenta el nmero de


calificaciones de los aspirantes promedio de 0.85 aprox.

EJERCICIOS DE LA DIAPOSITIVAS
PRIMER EJERCICIO DE LA DIAPOSITIVA
1. Construir la Tabla Bidimensional, con la muestra de 20 familias donde estamos
interesados en conocer nmero de hijos y el ingreso familiar mensual en miles
de dlares siendo los datos los siguientes: (X: Hijos; Y:Ingreso familiar) (3;21),
(5;45), (4;50),(2;35), (1;20), (2;53), (1;32), (2;44), (2;22), (1;32), (3;54), (3;28),
(3;40), (2;34), (4;28), (1;33), (4;60), (2;25), (3;25), (3;53) Calcular frecuencia
absoluta, relativa, porcentual, conjunta y marginal., frecuencias condicionales,
existencia de independencia, COVARIANZA.
FRECUENCIA ABSOLUTA BIDIMENSIONAL
FRECUENCIA
MARGINAL
MARGINAL
FRECUENCIA MARGINAL

FRECUENCIA
CONJUNTA

FRECUENCIA RELATIVA BIDIMENSIONAL


FRECUENCIA
MARGINAL
FRECUENCIA MARGINAL

FRECUENCIA
CONJUNTA

FRECUENCIA PORCENTUAL BIDIMENSIONAL

Media de x:
14 +26+36+43+51
x =
=2.55
20
Media de y:
245+327+401+483+564
y =
=37.6
20
Covarianza:

1 fila hasta la 5 columna:


C11 = (1-2.55)*(24-37.6)*(1) = 21.08
C12= (1-2.55)*(32-37.6)*(3) = 26.04
C13= (1-2.55)*(40-37.6)*(0) = 0
C14 = (1-2.55)*(48-37.6)*(0) = 0
C15= (1-2.55)*(56-37.6)*(0) = 0
2 fila hasta la 5 columna:
C21 = (2-2.55)*(24-37.6)*(2) = 14.96
C22= (2-2.55)*(32-37.6)*(2) = 6.16
C23= (2-2.55)*(40-37.6)*(0) = 0
C24 = (2-2.55)*(48-37.6)*(1) = -5.72
C25= (2-2.55)*(56-37.6)*(1) = -10.12
3 fila hasta la 5 columna:
C31 = (3-2.55)*(24-37.6)*(2) = -12.24
C32= (3-2.55)*(32-37.6)*(1) = -2.52
C33= (3-2.55)*(40-37.6)*(1) = 1.08
C34 = (3-2.55)*(48-37.6)*(0) = 0
C35= (3-2.55)*(56-37.6)*(2) = 16.56
4 fila hasta la 5 columna:
C41 = (4-2.55)*(24-37.6)*(0) = 0
C42= (4-2.55)*(32-37.6)*(1) = -8.12
C43= (4-2.55)*(40-37.6)*(0) = 0
C44 = (4-2.55)*(48-37.6)*(1) = 15.08
C45= (4-2.55)*(56-37.6)*(1) = 26.68

5 fila hasta la 5 columna:


C51 = (5-2.55)*(24-37.6)*(0) = 0
C52= (5-2.55)*(32-37.6)*(0) = 0
C53= (5-2.55)*(40-37.6)*(0) = 0
C54 = (5-2.55)*(48-37.6)*(1) = 25.48
C55= (5-2.55)*(56-37.6)*(0) = 0
Xi
( X )(Y i y )nij
COV (X, Y) =
= S xy
N

21.08+ 26.04+14.96+6.165.7210.1212.242.52+ 1.08+ 16.568.12+15.08+ 26.68+ 25.48


S xy =
20
114.4
20
S xy =5.72
S xy =

- La covarianza es 5.72, es decir, es mayor a 0, por lo tanto evidencia una relacin


positiva.
EJERCICIO DE LA DIAPOSITIVA:
Construir la tabla bidimensional, conla muestra de 20 familias donde
estamos interesados en conocer nmero de hijos y el ingreso familiar
mensual en miles de dlares siendo los datos los siguientes: (X:hijos;
Y:ingreso familiar) (3;21), (4; 45), (4; 50), (2; 35), (1; 20), (2; 53), (1; 32), (2;
44), (2; 22), (1; 32), (3;54), (3; 28), (3; 40), (2; 34), (4;28), (1;33), (4; 60), (2;
25), (3; 25), (3;53).
Calcular frecuencia absoluta relativa, porcentual, conjunta y
marginal, existencia de independencia, covarianza.
FRECUENCIAS ABSOLUTAS CONJUNTAS Y MARGINALES

H IJ

%=

N IJ
N

* 100%

FRECUENCIAS RELATIVAS CONJUNTAS Y MARGINALES

FRECUENCIAS PORCENTUALES CONJUNTAS Y MARGINALES


COVARIANZA:

x =
I=1

xi .
=
n
5

y =

14 +26 +36+43+ 51
20

.j
=
yin
n
j=1

= 2.55

245+ 327+ 401+ 483+564


20

Syx= Cov (x; y)=


C11 = (1-2.55) (24 - 37.6) (1) = 21.08
C12 = (1-2.55) (32 - 37.6) (3) = 26.04
C21 = (2-2.55) (24 37.6) (2) = 14.96
C22 = (2-2.55) (32 37.6) (2) = 6.16
C24 = (2-2.55) (48 37.6) (1) = -5.72
C25 = (2-2.55) (56 37.6) (1) = -10.12
C31 = (3-2.55) (24 37.6) (2) = -12.24
C32 = (3-2.55) (32 37.6) (1) = -2.52
C33 = (3-2.55) (40 37.6) (1) = 1.08
C35 = (3-2.55) (56 37.6) (2) = 16.56
C42 = (4-2.55) (32 37.6) (1) = -8.12
C44 = (4-2.55) (48 37.6) (1) = 15.08
C45 = (4-2.55) (56 37.6) (1) = 26.68
C54 = (5-2.55) (48 37.6) (1) = 25.48
Cov (x, y) = Sxy = 114.4/20 = 5.72
Evidencia de una relacin positiva
EXISTENCIA DE INDEPENDENCIA:

= 37.6

.
n . j
N
n ij
=
N
N
n 2.
n .3
N
n 23
=
N
N
0.30 * 0.05 0
Por lo tanto, no hay existencia de independencia

SEGUNDO EJERCICIO DE LA PIZARRA

RECTA DE LA REGRESION DE MEJOR AJUSTE :

Y X 2 X XY =60.033531
2
n x2 ( x )
n XY X Y 123786.029128.7306.95
b=
=
=0.04071
2
2
2
121633.41128.7
n x ( x )
a=

DIAGRAMA DE DISPERSIN
50
40
DIAGRAMA DE
DISPERSIN

30
20
10
0
400

500

600

700

800

900

1000

Cuadro ANOVA

SUMA CUADRADO DE ERRORES DE SCT ,SCR,SCE

DESVIACIN ESTNDAR DE LA REGRESIN

S yx =

(Y Y )2

nk
S yx =5.138
Coeficiente de determinacin ( r 2 :

r 2=

SCR
=0.66
SCT

Coeficiente de correlacin( r :

r=+ r 2
r=0.81
.

Prueba de hiptesis de la existencia de la regresin ( )


Nivel de significacin = 5%

1paso: Formulacin de hiptesis


H0: = 0
H1: 0
2paso: n = 10,

=5

; utilizamos la t(n-k) g.l.= t (8) g.l.

3paso: Regla de decisin

t0

Rechazar H0

-2.306 o t0 2.306

4paso: Calculo del estadstico (t0)

S b=

t0

S yx

( xx )

b
=
Sb

=0.000001

40710

5 paso: conclusiones y recomendaciones:


- Rechazar H0 y aceptar H1, por lo tanto existe una relacin negativa entre en nmero de
embarcaciones y puertos de embarque
- Recomendamos hacer la prueba de la linealidad del modelo.
Prueba de hiptesis de la linealidad del modelo
Nivel de significacin = 5%
1paso: Formulacin de hiptesis
H0: = 0
H1: 0
2paso: n = 10,

; utilizamos la t(n-k) g.l.= t (8) g.l.

=5

3paso: Regla de decisin


Rechazar H0

t0

-2.306 o t0 2.306

4paso: Clculo del estadstico (t0)

Sr =

t0

1r 2
=0.206155
nk

r
=
Sr

3.93

5 paso: Conclusiones y recomendaciones


- Rechazamos H0 y aceptamos H1, por lo tanto existe linealidad negativa entre el numero de
embarcaciones y captura por embarque

- Recomendamos hacer la prueba de hiptesis de la confiabilidad del modelo para hacer el


pronstico.
Prueba de hiptesis de la confiabilidad del modelo
Nivel de significacin = 5%
1paso: Formulacin de hiptesis
H0: el modelo no es confiable .
H1: el modelo es confiable .
F(1, 8)
2paso: n = 10, =5 ; utilizamos la tabla F (V 1 ,V 2 ) g.l.

3paso: Regla de decisin


Rechazar H0

Fc

5.32

4paso: Calculo del estadstico (t0)

SCR
k 1
F0 =
SCE
nk

= 15.52

5 paso: Conclusiones y recomendaciones


- Rechazamos H0 y aceptamos H1, por lo tanto existe confiabilidad del modelo.
- Recomendamos utilizar el modelo dado para hacer los pronsticos.

TERCER EJERCICIO DE LA PIZARRA


X: Horas

Y: Unidades

X*Y

X2

Y2

80

300

24000

6400

90000

79

302

23858

6241

91204

83

315

26145

6889

99225

84

330

27720

7056

108900

78

300

23400

6084

90000

60

250

15000

3600

62500

82

300

24600

6724

90000

85

340

28900

7225

115600

79

315

24885

6241

99225

84

330

27720

7056

108900

80

310

24800

6400

96100

62

240

14880

3844

57600

936

3632

285908

73760

1109254

x
=
=
12

936
12
3632
12

y
= 12 =

= 302.666667
78
7376012( 2)=
285908(12)(78)(302.666667)

x . yn . x . y =
b=
x 2n . x2
a= y b x =

= 78

3.473404

302.666667 3.473404 (78) = 31.741155

Ecuacin de regresin:

^y =31.741155+ 3.473404 x

DIAGRAMA DE DISPERSION
400
350
300

f(x) = 3.47x + 31.74


R = 0.91

250

DIAGRAMA DE
DISPERSION
Linear (DIAGRAMA DE
DISPERSION)

200
150
100
50
0
55

60

65

CUADRO ANOVA
Concepto

70

75

80

85

90

suma cuadrado

g.l.

cuadrado medio

SCR

9072.457397

9072.457397

SCE

896.206848

10

73.8356737

SCT

9968.664245

11

98.70744282

Desviacin estndar de la regresin (error estndar de estimacin)

S yx =

(Y Y )2

nk
896.206848
S yx =
10
S yx =9.466820

Coeficiente de determinacin ( r 2 :

r 2=

SCR
=0.91
SCT

El 91% de la variacin de y es explicado por la variacin de x.


Coeficiente de determinacin ( r :

r=+ r 2
r=+ 0.91
r=+ 0.95
Hay un alto grado de asociacin entre las las horas y unidades producidas
Prueba de hiptesis de la existencia de la regresin ( )
Nivel de significacin = 5%
1PASO: FORMULACIN DE HIPTESIS
H0: = 0
H1: 0
2PASO: n = 12,

=5

; utilizamos la t(n-k) g.l.= t (10) g.l.

2.22
3PASO: REGLA DE DECISIN
Rechazar H0

t0

2.22
8

-2.228 o t0 2.228

4PASO: CALCULO DEL ESTADSTICO (t0)

S b=

t0

S yx

9.466824

( x x ) 7376012( 78 )

b
=
Sb

3.4734040
0.345219

= 0.345219

= 10.061451

5 CONCLUSIONES Y RECOMENDACIONES:
- Rechazar H0 y aceptar H1, por lo tanto no existe una relacin negativa entre las horas y las
unidades producidas.

- Recomendamos hacer la prueba de hiptesis de la linealidad del modelo.


Prueba de hiptesis de la linealidad del modelo ( )
Nivel de significacin = 5%
1PASO: FORMULACIN DE HIPTESIS
H0: = 0
H1: 0

=5

2PASO: n = 12,

; utilizamos la t(n-k) g.l.= t (10) g.l.

2.22
3PASO: REGLA DE DECISIN
Rechazar H0

t0

2.22
8

2.228 o t0 2.228

4PASO: CALCULO DEL ESTADSTICO (t0)

Sr =

t0

1r 2
10.91
=
nk
10

r
=
Sr

0.910
0.094817

0.094817

= 10.019300

5 CONCLUSIONES Y RECOMENDACIONES:
- Rechazamos H0 y aceptamos H1, por lo tanto existe linealidad negativa entre las horas de
produccin y las unidades producidas.
- Recomendamos hacer la prueba de hiptesis de la confiabilidad del modelo para hacer el
pronstico.
Prueba de hiptesis de la confiabilidad del modelo ( )
Nivel de significacin = 5%
1PASO: FORMULACIN DE HIPTESIS
H0: el modelo no es confiable.
H1: el modelo es confiable .
2PASO: n = 12,

=5

; utilizamos la tabla F

(V 1 ,V 2 )

g.l.

F(1, 10)

4.96
3PASO: REGLA DE DECISIN
Rechazar H0

Fc

4.96

4PASO: CALCULO DEL ESTADSTICO (t0)

SCR
k 1
F0 =
SCE
nk

9072.457397/1
=101.231735
596.206848 /10

5 CONCLUSIONES Y RECOMENDACIONES:
- Rechazamos H0 y aceptamos H1, por lo tanto existe confiabilidad del modelo.
- Recomendamos utilizar el modelo dado para hacer los pronsticos.

CONCLUSIONES

En el anlisis de regresin, la seleccin cuidadosa y el uso consistente


de la mejor base de datos lleva a la ecuacin de estimacin ms valiosa.
Regresin y correlacin lineal son dos herramientas para investigar la
asociacin de una variable dependiente en funcin de una variable
independiente. Por eso, es de suma importancia para la produccin, ya
que es aqu en donde se presentan variables de respuesta e
independientes las cuales se relacionan para generar las caractersticas
de un proceso en particular, predecir valores de la variable dependiente
y examinar el grado de fuerza con que se relacionan dichas variables.
La regresin lineal simple analiza la relacin de dos variables continuas
bivariantes. La finalidad de una ecuacin de regresin es la de estimar
los valores de una variable con base en los valores conocidos de la otra.
Es decir, se puede intuir una relacin de causa y efecto entre dos o ms
variables, aunque en muchos casos no existe una relacin de esta
forma.
Por otro lado, Al ajustar un modelo de regresin simple o mltiple a una
nube de observaciones es importante disponer de alguna medida que
permita medir la bondad del ajuste. Esto se consigue con los
coeficientes de determinacin. Si el modelo que se ajusta es un modelo
de regresin lineal, a

r2

se le denomina coeficiente de correlacin,

que representa el porcentaje de variabilidad de la Y que es explicado por


la variacin de la X.

Estas tcnicas estadsticas constituyen una herramienta til para el


anlisis de las variables de un proceso ya que a travs de la aplicacin
de estas, es factible conocer el modelo que siguen.

RECOMENDACIONES

Antes de dedicar tiempo al clculo de una recta de regresin para un


conjunto de datos, es conveniente realizar un diagrama de dispersin
para esos valores. Esto permitir averiguar los puntos distantes, ya que
quiz algunos datos no representen el problema que se desea resolver.
El mtodo de la regresin lineal simple servir de herramienta para
orientar a los gerentes en la toma de decisiones.
Utilizar las pruebas de hiptesis de la existencia de la regresin, de la
linealidad del modelo y de la confiabilidad del modelo, para recin tener
la certeza de poder usar la ecuacin de los mnimos cuadrados o recta
de mejor ajuste en los pronsticos.
Combinar el uso de la regresin lineal simple con otros mtodos
estadsticos para obtener un mejor modelo que permita realizar
pronsticos de mayor confiabilidad.

BIBLIOGRAFA

Estadstica descriptiva e inferencial. Crdova Zamora, Manuel. Editorial


Moshera S.R.L. 5 Edicin, Per 2003.
Estadstica para administracin y economa. Levin, Richard Runbin,
David. Editorial Pearson Educacin 7 Edicin, Mxico 2010.
Estadstica aplicada a los negocios y a la economa XIII edicin Lind/
Marchal/ Wathem, Mxico 2008. McGRAW-HILL/INTERAMERICANA
EDITORES, S. A. de C. V.
Estadstica para administracin y economa. Mason, Lind, Marchal.
Editorial Alfaomega 10 Edicin, Colombia 2002.

Potrebbero piacerti anche