Sei sulla pagina 1di 7

CENTRO DE INVESTIGACIN EN MATEMTICAS, A.C.

UNIDAD AGUASCALIENTES
ESPECIALIDAD EN MTODOS ESTADSTICOS

Especialidad en Mtodos Estadsticos


MIII - Mtodos Estadsticos Bsicos

Tarea 1. Anlisis de Regresin


Lineal Simple y Mltiple

Periodo: Nov 2011 - Ene 2012


Academia: Mtodos Estadsticos Avanzados B

Puntaje total: 10 puntos


Fecha de entrega:

Profesor: MCE Paul Ramrez De la Cruz


Nombre:___________________________________________

Registros

350

200

450

50

400

150

350

300

150

500

100

400

200

50

250

E/S disco

36

20

45

40

18

38

32

21

54

11

43

19

26

a.
b.
c.
d.
e.
f.
g.
h.

Elabore la grfica de dispersin. Parece existir una relacin lineal entre las variables?
Estime puntualmente los coeficientes del modelo de regresin lineal simple e interprtelos
en el contexto del problema. Grafique la recta de regresin sobre la dispersin.
Proporcione una estimacin por intervalo del 90% de confianza para 0. Interprete el
resultado
Proporcione una estimacin por intervalo del 90% de confianza para beta 1. Interprete el
resultado
Calcule el valor de r y r2 e interprete ambos resultados. Corresponden con lo observado
en el inciso a)?
Estime puntualmente el nmero medio de operaciones de E/S (en miles) que se tendra si
se procesa un archivo de 444 (miles de) registros
Estime con un intervalo de confianza de 95% el nmero medio de operaciones de E/S (en
miles) que se tendra si se procesa un archivo de 444 (miles de) registros
Estime con un intervalo de confianza de 95% el nmero observado de operaciones de E/S
(en miles) que se tendra si se procesa un archivo de 444 (miles de) registros

[Ejercicio suplementario 11.57 Mendenhall] Un nuevo paquete de software de consulta se dise


con el objetivo de lograr un acceso y un mantenimiento ms eficientes de los conjuntos de datos a
gran escala. La eficiencia se mide en trminos del nmero de operaciones de entrada/salida (E/S)
de disco (llamadas bloques de almacenamiento) necesarias para acceder al conjunto de datos y
darle mantenimiento; cuanto menor sea el nmero de bloques ledos, con mayor rapidez se
efectuar la operacin. A fin de evaluar el desempeo del nuevo sistema de software, se registr el
nmero de operaciones de E/S de disco necesarias para acceder a un conjunto de datos a gran
escala, para cada uno de una muestra de 15 conjuntos de datos de diversos tamaos (donde el
tamao se mide como el nmero de registros contenidos en el conjunto de datos)

Pgina

1.

Calificacin: __________________

i.

Nmero de vehculos
Tiempo de
congestionamiento en
minutos
a.
b.

10

11

12

13

14

15

0.02

0.04

0.04

0.04

0.03

0.04

0.05

d.

Construya un diagrama de dispersin para los datos


Existe evidencia de que el nmero de vehculos explica la variacin en el tiempo de
congestionamiento? Realice el contraste de hiptesis del Anlisis de Varianza con = 0.05.
Encuentre la lnea de mnimos cuadrados que relaciona el nmero de vehculos (X) con el
tiempo de congestionamiento (Y)
Trace la lnea de mnimos cuadrados en la grfica del inciso a)

e.

Interprete los valores de 0 y 1

c.

[Milton. Seccin 11.3 Prob. 16 y ss.] En los problemas de flujo de produccin en las fbricas, el
rendimiento suele evaluarse con base en el tiempo de produccin mnimo, que es el total
transcurrido desde el inicio de la primera tarea en la primera mquina hasta que se completa la
ltima tarea en la ltima mquina. En un flujo de trabajo especfico, este parmetro se evala en
relacin con el nmero de tareas realizadas. Sea X una variable independiente que denota el
nmero de tareas, y Y, la variable dependiente que denota el tiempo de produccin (en unidades
estandarizadas):

Nmero de
tareas (X)
Tiempo de
produccin (Y)

10

11

12

13

14

15

3.75

4.90

4.88

7.20

7.30

9.10

9.00

11.90

11.50

14.10

13.90

17.50

a.

Elabore el contraste de hiptesis del Anlisis de Varianza para establecer si el modelo es


til para explicar la variacin en el tiempo de produccin.

3.

Pgina

2.

Elabore para los residuos una grfica de dispersin contra X, un histograma, una grfica de
cuantiles normales (probabilidad normal) y una grfica secuencial y analcelas para
establecer si presentan violaciones claras a los supuestos del modelo de regresin lineal
simple
Las bodegas modernas utilizan vehculos guiados computarizados y automatizados para el manejo
de materiales. En consecuencia, la disposicin fsica de la bodega debe disearse con cuidado a
modo de evitar el congestionamiento de los vehculos y optimizar el tiempo de respuesta. En The
Journal of Engineering for Industry (agosto de 1993) se estudio el diseo ptimo de una bodega
automatizada. La disposicin empleada supone que los vehculos no se bloquean entre s cuando
viajan dentro de la bodega, es decir, que no hay congestionamiento. La validez de este supuesto se
verific simulando (en una computadora) las operaciones de la bodega. En cada simulacin se vari
el nmero de vehculos y se registr el tiempo de congestionamiento (el tiempo total que un
vehculo bloque a otro). Los datos se muestran en la siguiente tabla. Algo que interesa a los
investigadores es la relacin entre el tiempo de congestionamiento (Y) y el nmero de vehculos
(X).
Nmero de vehculos
1
2
3
4
5
6
7
8
Tiempo de
congestionamiento en
0
0
0.02
0.01
0.01
0.01
0.03
0.03
minutos

b.

4.

Elabore las grficas de residuos y analcelas por si encuentra alguna violacin grave a los
supuestos del modelo
La Comisin Federal de Comunicaciones (FCC, por sus siglas en ingls) de Estados Unidos especifica
que las emisiones electromagnticas radiadas por dispositivos digitales se deben medir en un sitio
de prueba de campo abierto. A fin de verificar la aceptabilidad de un sitio de prueba es preciso
evaluar la atenuacin del sitio (es decir, la prdida de transmisin desde un dipolo de media onda
hasta la salida de otro cuando ambos dipolos se colocan sobre el plano de tierra). Un estudio
realizado en un sitio de prueba en Fort Collins, Colorado, produjo los siguientes datos de
atenuacin del sitio (en decibeles) y frecuencia de transmisin (en megahertz) para dipolos a una
distancia de 3 metros.
Frecuencia de
transmisin, x,
MHz
Atenuacin del
sitio, y, dBL
Frecuencia de
transmisin, x,
MHz
Atenuacin del
sitio, y, dBL

a.
b.
c.
d.
5.

50

100

200

300

400

500

11.5

15.8

18.2

22.6

26.2

27.1

600

700

800

900

1000

29.5

30.7

31.3

32.6

34.9

Elabore un diagrama de dispersin para los datos. Es evidente una relacin lineal entre x
y y?
Encuentre la lnea de mnimos cuadrados que relaciona la atenuacin del sitio y con la
frecuencia de transmisin x.
Trace la lnea de mnimos cuadrados sobre el diagrama de dispersin para verificar sus
clculos.
Interprete los valores de 0 y 1

[Milton. Seccin 11.1. Ejercicio 7] Se estudia la relacin del consumo de energa elctrica con el
ingreso familiar y se obtienen los datos siguientes sobre el ingreso familiar X (en unidades de
$1,000/ao) y el consumo de energa Y (en 108 Btu/ao):

Consumo de
energa (Y)
Ingreso
familiar (X)

1.8

3.0

4.8

5.0

6.5

7.0

9.0

9.1

20.0

30.5

40.0

55.1

60.3

74.9

88.4

95.2

a.

Realice un diagrama de dispersin de los datos.

b.

Estime la ecuacin de regresin lineal y 0 1 x .

Pgina

6.

Si x = 50 (ingreso familiar de $50,000), estime el consumo promedio de energa de las


familias con ese ingreso. Cul sera su estimacin para una sola familia?
d. Cunto esperara que cambie el consumo si el ingreso familiar aumenta en $2,000 al ao?
e. Obtenga un intervalo de confianza del 98% para el valor de 1.
Se ha utilizado con xito un sistema automatizado para calificar grandes cantidades de programas
para computadora escritos por estudiantes de la McMaster University de Ontario, Canad, llamado
AUTOMARK, el que toma en cuenta tanto la correccin como el estilo de programacin al calificar
las tareas de los estudiantes. A fin de evaluar la efectividad del sistema automatizado, se us
AUTOMARK para calificar las tareas, escritas en FORTRAN77, de un grupo de 33 estudiantes

c.

(Communication of the ACM, febrero de 1986). Estas calificaciones se compararon despus con las
calificaciones asignadas por el profesor. Los resultados se muestran en la tabla.
Calificacin
AUTOMARK, x
Calificacin del
profesor, y
Calificacin
AUTOMARK, x
Calificacin del
profesor, y
Calificacin
AUTOMARK, x
Calificacin del
profesor, y

a.
b.
c.

12.2

10.6

15.1

16.2

16.6

16.6

17.2

17.6

18.2

16.5

17.2

10

11

12

12

12

13

14

14

14

15

15

18.2

15.1

17.2

17.5

18.6

18.8

17.8

18.0

18.2

18.4

18.6

15

16

16

16

16

16

17

17

17

17

17

19.0

19.3

19.5

19.7

18.6

19.0

19.2

19.4

19.6

20.1

19.2

17

17

17

17

18

18

18

18

18

18

19

Obtenga una ecuacin de mnimos cuadrados para el modelo de lnea recta que relaciona
la calificacin del profesor con la calificacin de AUTOMARK x.
Hay pruebas suficientes que indiquen que el modelo resulta til para predecir y? Pruebe
con = 0.10 usando el contraste de hiptesis T.
Calcule un intervalo de prediccin de 95% para la calificacin asignada por el profesor a
una tarea de FORTRAN77 que recibi una calificacin de AUTOMARK de 17.5. Interprete el
intervalo

b.
c.

Pgina

a.

Peso
Temperatura Rendimiento
(X1)
(X2)
(Y)
1.35
90
17.9
1.9
30
16.5
1.7
80
16.4
1.8
40
16.8
1.3
35
18.8
2.05
45
15.5
1.6
50
17.5
1.8
60
16.4
1.85
65
15.9
1.4
30
18.3
Obtenga una ecuacin de mnimos cuadrados para el modelo de regresin lineal que
explique el Rendimiento de combustible del vehculo con base en su Peso y la
Temperatura ambiente promedio.
Hay pruebas suficientes que indiquen que el modelo resulta til para predecir y? Pruebe
con = 0.10 usando el contraste de hiptesis del Anlisis de Varianza.
Calcule un intervalo de prediccin de 95% para el rendimiento observado en un automvil
con un peso de 1.35 ton si la temperatura ambiente es de 40 F. Interprete el intervalo

7. Se investig el efecto del peso del vehculo (en toneladas) y la temperatura ambiente
promedio (en F) sobre el rendimiento del combustible, en una muestra aleatoria de 10
vehculos. Los datos se muestran a continuacin:

8.

[Lind et al (2004). Estadstica para administracin y economa. Ejercicio 14.19, p. 535] El seor Steve
Douglas fue contratado como gerente en capacitacin por una importante empresa financiera.
Como primer proyecto, se le pidi que estudiara la utilidad bruta en la industria qumica. Qu
factores afectan las utilidades en esa industria? Steve seleccion una muestra aleatoria de 16
compaas y obtuvo datos respecto a la cantidad de empleados (EMPLEADOS), el nmero de
dividendos consecutivos pagados en acciones comunes (DIVIDENDOS), el valor total del inventario
al inicio del presente ao (INVENTARIO) y la ganancia bruta (GANANCIA) de cada empresa.
Ganancia
2800
1300
1230
1600
4500
5700
3150
640
3400
6700
3700
6440
1280
4160
3870
980

Empleados
140
65
130
115
390
670
205
40
480
810
120
590
440
280
650
150

Dividendos
12
21
42
80
120
64
43
14
88
98
44
110
38
24
60
24

Inventario
1800
320
820
76
3600
8400
508
870
5500
9875
6500
9130
1200
890
1200
1300

2
9
5
10
3
3
8
7
8
5
a.

2.1
8.4
5.1
14.5
4.4
6.2
12.5
7
17.2
7.1

Energa de
Fractura
4.31
22.11
11.4
24.15
6.21
5.65
9.71
12
14.25
8.63

Elabore una matriz de dispersin. Parece existir una relacin lineal entre las variables?

Pgina

Agrietamiento Permeabilidad

9. [Ejercicios 12.1. 43 y ss.] Se estudi el agrietamiento de la pintura de ltex en estructura


de madera. La preocupacin principal del estudio es investigar el efecto de la
permeabilidad al agua (X1) y la energa de fractura (X2, la energa necesaria para que se
propague una grieta en la pelcula de pintura) en la tasa de agrietamiento de la pintura (Y).
La investigacin arroj los datos siguientes

b.
c.
d.
e.
f.
g.
h.

Estime puntualmente los coeficientes del modelo de regresin lineal mltiple,


considerando todas las variables explicativas e interprtelos en el contexto del problema.
Proporcione una estimacin por intervalo del 90% de confianza para 0. Interprete el
resultado
Proporcione una estimacin por intervalo del 90% de confianza para beta 1. Interprete el
resultado
Calcule el valor de r y r2 e interprete ambos resultados. Corresponden a su apreciacin en
el inciso a)?
Estime puntualmente el valor del agrietamiento si se tiene una permeabilidad de 5.5 y una
energa de fractura de 10.2
Estime con un intervalo de confianza de 95% el nmero medio
Estime con un intervalo de confianza de 95% el nmero observado de operaciones de E/S
(en miles) que se tendra si se procesa un archivo de 444 (miles de) registros

10. [Problema 14.18 p. 534 Lind et al.] Las tiendas de Fran's Convinience Marts estn localizadas en el
rea metropolitana de Erie, Pennsylvania (EUA). A Fran, la duea, le agradara expandirse a otras
comunidades del noroeste de Pennsylvania y el suroeste de Nueva York, tales como Jamestown,
Corry, Meadville y Warren. Como parte de su presentacin al banco local, le gustara entender
mejor los factores que hacen que una tienda particular sea lucrativa. La propietaria debe hacer
todo el trabajo sola, as que no podr analizar todos sus establecimientos. Selecciona una muestra
aleatoria de 15 tiendas y de cada una registra el promedio de las ventas diarias (Y), la superficie
(rea), el nmero de cajones de estacionamiento, y el ingreso econmico medio de familias en esa
regin

b.

Pgina

a.

rea de la
Cajones
Ingresos
Tienda
1840
532
6
44
1746
478
4
51
1812
530
7
45
1806
508
7
46
1792
514
5
44
1825
556
6
46
1811
541
4
49
1803
513
6
52
1830
532
5
46
1827
537
5
46
1764
499
3
48
1825
510
8
47
1763
490
4
48
1846
516
8
45
1815
482
7
43
Obtenga el mejor modelo de regresin lineal mltiple utilizando el mtodo de seleccin de
variables paso a paso.
Realice un anlisis completo de residuos para el modelo obtenido.

Venta Diaria

Referencias

Pgina

1. Lind, Marchal & Mason. Estadistica Para Administracion Y Economia. Alfaomega. Mxico,
2004.
2. Mendenhall, William & Sincich, Terry. Probabilidad y estadstica para ingeniera y
ciencias. Prentice-Hall Hispanoamericana. Mxico, 1995
3. Milton, J. Susan & Arnold, Jesse C. Probabilidad y estadstica con aplicaciones para
ingeniera y ciencias computacionales. McGraw-Hill. Mxico, 2004

Potrebbero piacerti anche