Sei sulla pagina 1di 7

Regresión Lineal Múltiple con variables Dummy

Samuel Martı́nez
March 19, 2019

1 Introducción
En los ejemplos considerados hasta ahora, las variables han sido variables inde-
pendientes cuantitativas como, por ejemplo, población de estudiantes, distancia
recorrida y número de entregas. Sin embargo, en muchas situaciones, se tiene
que trabajar con variables independientes cualitativas como género (masculino o
femenino), modo de pago (efectivo, tarjeta de crédito, cheque), etc. El objetivo
de la clase es mostrar cómo se emplean las variables cualitativas en el análisis
de regresión.

1
2 Ejercicios
1. Johnson Filtration Inc. da servicio de mantenimiento a los sistemas de
filtración en el sur de Florida. Los clientes llaman a Johnson Filtration,
Inc. solicitando un servicio de mantenimiento para sus sistemas de fil-
tración de agua para estimar el tiempo que se requerirá para el servicio y
el costo del mismo, los administradores de Johnson desean poder predecir
este tiempo para cada solicitud de servicio. Por lo tanto, el tiempo, en
horas, requerido para la reparación es la variable dependiente. Se cree
que el tiempo requerido para una reparación está relacionado con dos fac-
tores, meses transcurridos desde el último servicio de mantenimiento y
tipo del problema (mecánico o eléctrico). En la tabla se presentan los
datos correspondientes a una muestra de 10 solicitudes de servicio.

solicitud servicio meses desde último servicio tipo reparación tiempo


1 2 eléctrico 2.90
2 6 mecánico 3.00
3 8 eléctrico 4.80
4 3 mecánico 1.80
5 2 eléctrico 2.90
6 7 eléctrico 4.90
7 9 mecánico 4.20
8 8 mecánico 4.80
9 4 eléctrico 4.40
10 6 eléctrico 4.50

Determine la ecuación de regresión estimada que se puede usar para pre-


decir el tiempo en horas para la reparación.

2. Suponga que ahora conoce el nombre de la persona encargada de realizar


la reparación

Tiempo horas reparación meses último servicio tipo reparación Persona


1 2.90 2 eléctrica Dave Newton
2 3.00 6 mecánica Dave Newton
3 4.80 8 eléctrica Bob Jones
4 1.80 3 mecánica Dave Newton
5 2.90 2 eléctrica Dave Newton
6 4.90 7 eléctrica Bob Jones
7 4.20 9 mecánica Bob Jones
8 4.80 8 mecánica Bob Jones
9 4.40 4 eléctrica Bob Jones
10 4.50 6 eléctrica Dave Newton

Estime el modelo de regresión que predice el tiempo en horas necesario


para realizar la reparación.

2
3. La Liga nacional de futbol americano de Estados Unidos (National Foot-
bal League) evalúa a sus prospectos con una escala que va del 5 al 9.
Estas evaluaciones se interpretan como sigue: 8 – 9 deberá empezar el
año próximo; 7.0 – 7.9 deberá empezar; 6.0 – 6.9 servirán de respaldo al
equipo, y 5.0 – 5.9 pueden formar parte del club y contribuir. En la tabla
siguiente se da posición, peso, tiempo en segundos para correr 40 yardas
y la evaluación dada por la NFL a 25 prospectos (USA Today, 14 de abril
de 2000).

nombre posición peso(libras) tiempo(segundo) evaluación


1 CoseyColeman Guardia 322 5.38 7.40
2 TravisClaridge Guardia 303 5.18 7.00
3 KaulanaNoa Guardia 317 5.34 6.80
4 LeanderJordan Guardia 330 5.46 6.70
5 ChadClifton Guardia 334 5.18 6.30
6 ManulaSavea Guardia 308 5.32 6.10
7 RyanJohanningmeir Guardia 310 5.28 6.00
8 MarkTauscher Guardia 318 5.37 6.00
9 BlaineSaipaia Guardia 321 5.25 6.00
10 RichardMercier Guardia 295 5.34 5.80
11 DamionMcIntosh Guardia 328 5.31 5.30
12 JenoJames Guardia 320 5.64 5.00
13 AlJackson Guardia 304 5.20 5.00
14 ChrisSamuels Tackle 325 4.95 8.50
15 StockarMcDougle Tackle 361 5.50 8.00
16 ChrisMcIngosh Tackle 315 5.39 7.80
17 AdrianKlemm Tackle 307 4.98 7.60
18 ToddWade Tackle 326 5.20 7.30
19 MarvelSmith Tackle 320 5.36 7.10
20 MichaelThompson Tackle 287 5.05 6.80
21 BobbyWilliams Tackle 332 5.26 6.80
22 DarnellAlford Tackle 334 5.55 6.40
23 TerranceBeadles Tackle 312 5.15 6.30
24 TutanReyes Tackle 299 5.35 6.10
25 GregRobinson-Ran Tackle 333 5.59 6.00

(a) Obtenga una ecuación de regresión estimada que muestre la relación


entre la evaluación y posición, peso y tiempo requerido para correr
40 yardas.
(b) Suponga que hay un nuevo prospecto de tackle que pesa 300 libras y
corre 40 yardas en 5.1 segundo, estime la evaluación de este jugador.

3
4. Consumer Reports examinó ampliamente y presentó las evaluaciones de
24 caminadoras. A cada caminadora se le dio una calificación general
que se basaba principalmente en su facilidad de uso, ergonomı́a, gama
de ejercicio y calidad. En general, una mejor calificación corresponde a
un mejor funcionamiento. En la información a continuación se presenta
el precio, la evaluación de la calidad y la puntuación general de las 24
caminadoras (Consumer Reports, febrero de 2006).

Precio Calidad Calificación


1 2900 Excelente 86
2 3500 Muybuena 85
3 2900 Excelente 82
4 3500 Excelente 81
5 2300 Excelente 81
6 2000 Excelente 81
7 3000 Excelente 79
8 1300 Muybuena 78
9 3200 Muybuena 72
10 1600 Muybuena 72
11 1300 Muybuena 69
12 1500 Excelente 83
13 2600 Muybuena 83
14 1600 Muybuena 82
15 1800 Muybuena 80
16 1700 Muybuena 75
17 1600 Muybuena 75
18 1000 Muybuena 74
19 1200 Muybuena 73
20 1600 Muybuena 73
21 1000 Bueno 70
22 1400 Muybuena 70
23 1000 Buena 67
24 600 Buena 66

(a) Con estos datos obtenga una ecuación de regresión estimada que sirva
para estimar la calificación general cuando se conoce el precio.
(b) Estime la calificación general dada a una caminadora cuyo precio es
2000 y que como evaluación de su calidad obtuvo buena. ¿Cuánto
varı́a esta estimación si la evaluación de la calidad es muy buena?
Explique.

4
5. En el mercado actual se ofrece una amplia variedad de vehı́culos utili-
tarios deportivos o SUV (acrónimo en inglés de Sport Utility Vehicle) y
de pickups. Para muchos de los compradores es un factor importante el
valor de reventa del vehı́culo. En la tabla siguiente se presenta el valor de
reventa porcentaje después de dos años y se sugiere el precio de 10 SUV,
de 10 pickups pequeñas y de 10 pickups grandes (Kipkingers New Cars y
Truckers 2000 Buyers Guide).

Tipo vehı́culo precio sugerido valor de reventa (porcentaje)


1 utilitariodeportivo 19495 55
2 utilitariodeportivo 20495 57
3 utilitariodeportivo 26789 67
4 utilitariodeportivo 18965 65
5 utilitariodeportivo 30186 62
6 utilitariodeportivo 25745 57
7 utilitariodeportivo 29895 59
8 utilitariodeportivo 26919 54
9 utilitariodeportivo 22418 55
10 utilitariodeportivo 17148 55
11 pickuppequeña 18847 46
12 pickuppequeña 16870 53
13 pickuppequeña 18510 48
14 pickuppequeña 20225 55
15 pickuppequeña 16938 44
16 pickuppequeña 18820 41
17 pickuppequeña 2350 51
18 pickuppequeña 12110 51
19 pickuppequeña 18228 49
20 pickuppequeña 19318 50
21 pickupgrande 24417 60
22 pickupgrande 24140 64
23 pickupgrande 17460 54
24 pickupgrande 32770 63
25 pickupgrande 23140 59
26 pickupgrande 22875 58
27 pickupgrande 34295 64
28 pickupgrande 2789 68
29 pickupgrande 25605 53
30 pickupgrande 15835 58

Obtenga la ecuación de regresión estimada que sirva para predecir el valor


de reventa conociendo el precio sugerido y el tipo de vehiculo. Pruebe la
significancia de la relación empleando como nivel de significancia 0.05.

5
6. Una agencia automotriz grande desea estimar los efectos que se observan
sobre el tiempo de servicio a los automóviles que llegan al taller a partir
de 3 variables independientes: los kilómetros recorridos desde el último
servicio, el tipo de servicio (normal o express) y el mecánico que realiza la
tarea. En la tabla siguiente se muestran los datos de los que se dispone.
Construya el modelo de regresión lineal múltiple que describa esa relación.

Tiempo de servicio Km recorridos desde último servicio Tipo servicio mecánico


3.0 5 normal Ramón
3.1 9 express Ramón
4.9 11 normal Javier
1.9 6 express Javier
3.0 5 normal Javier
5.0 10 normal Luis
4.3 12 express Luis
4.9 11 express Luis
4.5 7 normal Ramón
4.6 9 normal Javier
4.7 10 express Luis

7. En un estudio sobre el absentismo se recopilaron datos de 12 trabajadores,


con los siguientes resultados:

Trabajador Número de faltas Edad Sexo


1 5 26 H
2 0 31 H
3 1 63 M
4 6 34 H
5 7 46 M
6 11 28 M
7 5 56 H
8 10 42 H
9 3 23 H
10 2 59 M
11 1 32 H
12 6 27 H

Construya una ecuación de regresión lineal múltiple, con el número de


faltas como variable dependiente y esbozar las conclusiones que se pueden
extraer de ese modelo.

6
8. Una agencia de bienes raı́ces que desea determinar si existe relación entre
los precios de departamentos en venta y su superficie y la disponibilidad
de cuarto de servicio, obtuvo los siguientes datos de una muestra de de-
partamentos:

Precio Superficie cuarto de servicio


126.6 120 Sı́
116.1 102.6 No
113.55 87 No
128.85 105.6 Sı́
118.65 115.8 No
105.6 72 Sı́
113.7 93 Sı́
128.85 115.8 Sı́
117.75 95.4 Sı́
118.8 90 Sı́
130.05 114 Sı́
118.95 83.4 Sı́
111.75 92.4 No
125.7 113.4 Sı́
115.2 95.4 No

Construya una ecuación de regresión lineal múltiple, con el precio como


variable dependiente y plantee las conclusiones que se pueden extraer de
ese modelo.

Potrebbero piacerti anche