Sei sulla pagina 1di 9

Práctica de ejercicios

Nombre: Matrícula:
Nombre del curso: Nombre del profesor:
Estadísticas y pronósticos para la
toma de decisiones
Módulo: Actividad:
Módulo 2. Regresión lineal simple y Ejercicio 2. ¿Existe relación entre la
regresión lineal múltiple
cantidad de Kilómetros y los caballos
de fuerza y el peso total?
Fecha: 19 de Junio de 2018
Bibliografía:
Hanke, J. y Wichern, D. (2010). Pronósticos en los negocios (9ª ed.). México: Pearson
Education.
ISBN: 9786074427004 

Desarrollo de la práctica:
Parte 1 
1. Define los siguientes términos:  
a. Análisis de la regresión simple.
 La regresión lineal simple permite estimar y mejorar el modelo lineal lo
que permite predecir el comportamiento de la variable dependiente y
quien a partir de una variable dependiente x.
El análisis de regresión involucra el estudio la relación entre dos
variables
CUANTITATIVAS. En general interesa:
 Investigar si existe una asociación entre las dos variables testeando
la hipótesis de independencia estadística.
 Estudiar la fuerza de la asociación, a través de una medida de
asociación denominada coeficiente de correlación.
 Estudiar la forma de la relación. Usando los datos propondremos un
modelo para la relación y a partir de ella será posible predecir el
valor de una variable a partir de la otra.
Para ello proponemos un MODELO que relaciona una variable
dependiente (Y) con una variable independiente (X).
La decisión sobre qué análisis usar en una situación particular, depende
de la naturaleza del OUTCOME y del tipo de función que se propone para
relacionar el outcome y la variable independiente.
Variables en regresión

Covariables o Outcome o
Variables independientes o Variable dependiente o
Variables regresoras Variable de respuesta
⇓ ⇓
Se usan como predictores o Atributos sobre los cuales queremos
son variables de confusión que medir cambios o hacer predicciones.
Práctica de ejercicios

interesa controlar
b. Estimadores de mínimos cuadrados. 
El método de mínimos cuadrados produce la mejor línea recta. Sin
embargo, puede no haber relación entre estas variables, o quizás esta
relación sea de otro tipo (por ejemplo, cuadrática). Si es así, el modelo
lineal puede que sea inapropiado. Consecuentemente, es importante
evaluar cómo el modelo lineal se ajusta a los datos. Si el ajuste es pobre,
se debería descartar el modelo lineal y buscar otro.
c. Intervalo de confianza. 
se llama intervalo de confianza a un par o varios pares de números entre
los cuales se estima que estará cierto valor desconocido con una
determinada probabilidad de acierto.
d. Coeficiente de regresión. 
Cuantifica la pendiente de una línea de regresión lineal creada con los
datos de una serie de puntos.
e. Coeficiente de correlación. 
El coeficiente de correlación es una medida de la relación lineal entre dos
variables aleatorias cuantitativas.
f. Coeficiente de determinación. 
El coeficiente de determinación es una medida estadística de la bondad
del ajuste o fiabilidad del modelo estimado a los datos. Se representa por
R2 e indica cuál es la proporción de la variación total en la variable
dependiente (Y), que es explicada por el modelo de regresión estimado,
es decir, mide la capacidad explicativa del modelo estimado. 
2. Desarrolla los siguientes ejercicios y da respuesta a las preguntas planteadas. 
a. En una compañía fabricante de helados se sospecha que el almacenar
el helado a temperaturas bajas durante largos periodos tiene un efecto lineal en
la pérdida de peso del producto. En la planta de almacenamiento de la
compañía se obtuvieron los siguientes datos: 

Pérdida de
peso (gr) Y  28  37  36  30  28  36  35 

Tiempo 26  32  35  27  25  31  30 


(semanas) X 
b. Ajusta e interpreta un modelo de regresión lineal simple a los datos. 
Tiempo Pérdida de
(semanas) peso (gr) Y 
X  2 2
XY X Y
26 28 728.00 676.00 784.00
32 37 1,184.00 1,024.00 1,369.00
35 36 1,260.00 1,225.00 1,296.00
27 30 810.00 729.00 900.00
25 28 700.00 625.00 784.00
31 36 1,116.00 961.00 1,296.00
35 35 1,225.00 1,225.00 1,225.00
Suma 273 296 9,093.00 8,419.00 9,850.00
Promedio 54.6 59.2 1,299.00 1,202.71 1,407.14
c. Prueba la significancia de la pendiente β1. 
Práctica de ejercicios

Pendiente -13,533.24 1.087084067


Ordenada 59.35479006 -0.15479006
Y=1.087X-0.155
d. Calcula e interpreta R2.  
R=b1(Sx/Sy)
R=1.087(12.29028523/13.27629466)=1.0063
En el presente caso, el coeficiente de determinación es R2 = (r)2 =
(1.01263969)2 = 1.0063, o, como es más común expresarlo, en porcentaje,
100%, lo cual se interpreta como la variabilidad de Y (Perdida en gramos)
que se explica por la X (Tiempo en semanas).
e. Elabora un intervalo de confianza del 90% para β1. 
IC=1.087±1.860(Se/sqr(7))=1.087±1.860(1.655478473/sqr(7)=
1.087±1.16382441 LIC= -0.07682441 LSC= 2.25082441
f. Pronostica la pérdida cuando el tiempo es de 33 semanas.
F(33)=1.087(33)-0.155=35.72 gramos  
3. Con los conceptos vistos y puestos en práctica, da una respuesta justificada a
cada una de las siguientes cuestiones: 
a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu
especialidad? 
Cuando se nos presenta en una empresa o una industria una situación en
donde estén 2 variables como en el ejercicio anterior. 
b. ¿Qué relación tiene con la correlación? 
En este caso la variable(Gramos) dependerá de la otra variable (tiempo).
c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido? 

d. ¿Qué es el coeficiente de determinación? 


Su principal propósito es predecir futuros resultados o probar una
hipótesis. El coeficiente determina la calidad del modelo para replicar los
resultados, y la proporción de variación de los resultados que puede
explicarse por el modelo.
e. ¿Por qué crees que se llama regresión lineal? 
Por que ayuda a saber si las variables están relacionadas mediante el
diagrama de dispersión y la linea te indica que tan dispersas están.
¿Cuál es la relación de la prueba de hipótesis con el intervalo de confianza en la
regresión
Los intervalos de confianza y las pruebas de hipótesis son dos herramientas
estadísticas relacionadas cuando solicitamos la relación de la hipótesis incluye
los resultados de intervalos de confianza.
Práctica de ejercicios

Parte 2 
Realiza lo siguiente: 
4. En un estudio de variables que afectan la productividad en el negocio de
abarrotes al menudeo, W. S. Good usa el valor agregado por hora de trabajo para
medir la productividad de tiendas de abarrotes al menudeo. Él define el “valor
agregado” como el “excedente [dinero generado por el negocio] disponible para
pagar mano de obra, muebles accesorios y equipo”. Los datos de acuerdo con la
relación del valor agregado por hora de trabajo Y y el tamaño X de la tienda de
abarrotes descrita en el artículo de Good para diez tiendas de abarrotes ficticias se
muestran enseguida. Se establecerá un modelo para relacionar Y con X. 

Datos en relación con el tamaño de tienda y el valor agregado 

Tienda  Valor agregado  Tamaño de la tienda 


por hora de trabajo  (miles de pies cuadrados) 
Y  X 

1  6.08  23.0 

2  5.40  14.0 

3  5.51  27.2 

4  5.09  12.4 

5  4.92  33.9 

6  3.94  9.8 

7  6.11  22.6 

8  5.16  17.5 

9  5.75  27.0 

10  5.60  21.1 


a. Realiza un diagrama de dispersión de los datos para Y contra X. 
Práctica de ejercicios

b. Calcula las rectas de mínimos cuadrados para Y contra X. 


Datos en relación con el tamaño
de tienda y el valor agregado       
Tienda  Valor Tamaño de
agregado  la tienda 
     
por hora (miles de
de pies
trabajo  cuadrados) 
     
Y  X  XY X2 Y2
1  6.08 23.00 139.84 529.00 36.9664
2  5.40 14.00 75.60 196.00 29.16
3  5.51 27.20 149.87 739.84 30.3601
4  5.09 12.40 63.12 153.76 25.9081
5  4.92 33.90 166.79 1149.21 24.2064
6  3.94 9.80 38.61 96.04 15.5236
7  6.11 22.60 138.09 510.76 37.3321
8  5.16 17.50 90.30 306.25 26.6256
9  5.75 27.00 155.25 729.00 33.0625
10  5.60 21.10 118.16 445.21 31.36
Suma 47.48 208.50 1135.62 4855.07 290.50
Promedio 4.75 20.85

Ecuación de regresión estimada


Yo=.29Xo-1.23
Práctica de ejercicios

Si Xo=15
.29(15)-1.23=3.12
Error estándar Se=1.71
Establecimiento de hipótesis:
H0 : β1 = 0 en oposición a Ha : β1≠ 0
Error estándar de Sb1=0.0757
Tcalculada=.29-0/.0757=3.83
c. Obtén una gráfica de residuales contra el valor ajustado de Y, ya sea
por medio de Minitab. Observa la gráfica. ¿Qué patrón parecen seguir los
datos? Éste es un ejemplo de análisis de residuales.

 
 
 
5. En un experimento con conejos se tomaron en cuenta las siguientes variables: 
Y: Proporción del peso final al peso inicial. 
X: Gramos diarios de alimento por kg de peso inicial.  
Proporción de peso Gramos diarios  Proporción de peso Gramos diarios de
final al  de alimento por   final al  alimento por kg de
peso inicial  kg de peso inicial  peso inicial  peso 
inicial 
Y  X  Y 

0.91  10    1.16  33 

0.88  15    0.96  35 

0.90  18    1.08  36 


Práctica de ejercicios

0.79  19    1.13  37 

0.94  20    1.00  39 

0.88  21    1.10  42 

0.95  21    1.11  45 

0.97  24    1.18  54 

0.88  25    1.26  56 

1.01  27    1.29  56 

0.95  28    1.36  59 

0.95  30    1.40  59 

1.05  30    1.32  60 

1.05  31    1.47  64 


a. Realiza un diagrama de dispersión de los datos para Y contra X. 

b. Calcula las rectas de mínimos cuadrados para Y contra X.


Gramos Proporción    
diarios  de peso
final al   
Práctica de ejercicios

de peso    
alimento inicial 
por kg de
peso
inicial 
 
         
X  Y  XY X2 Y2
10.00 0.91 9.10 100.00 0.83
15.00 0.88 13.20 225.00 0.77
18.00 0.90 16.20 324.00 0.81
19.00 0.79 15.01 361.00 0.62
20.00 0.94 18.80 400.00 0.88
21.00 0.88 18.48 441.00 0.77
21.00 0.95 19.95 441.00 0.90
24.00 0.97 23.28 576.00 0.94
25.00 0.88 22.00 625.00 0.77
27.00 1.01 27.27 729.00 1.02
28.00 0.95 26.60 784.00 0.90
30.00 0.95 28.50 900.00 0.90
30.00 1.05 31.50 900.00 1.10
31.00 1.05 32.55 961.00 1.10
33.00 1.16 38.28 1,089.00 1.35
35.00 0.96 33.60 1,225.00 0.92
36.00 1.08 38.88 1,296.00 1.17
37.00 1.13 41.81 1,369.00 1.28
39.00 1.00 39.00 1,521.00 1.00
42.00 1.10 46.20 1,764.00 1.21
45.00 1.11 49.95 2,025.00 1.23
54.00 1.18 63.72 2,916.00 1.39
56.00 1.26 70.56 3,136.00 1.59
56.00 1.29 72.24 3,136.00 1.66
59.00 1.36 80.24 3,481.00 1.85
59.00 1.40 82.60 3,481.00 1.96
60.00 1.32 79.20 3,600.00 1.74
64.00 1.47 94.08 4,096.00 2.16
Suma 994.00 29.93 1,132.80 41,902.00 32.85
Promedio 41.42 1.25

B1=-0.145538269 Bo=7.274793323
Y=7.27-.15X
c. Prueba la hipótesis de que la pendiente es cero. Realiza todas las etapas
de la prueba de hipótesis (α = 0.01). 
Establecimiento de hipótesis: H0 : β1 = 0 en oposición a Ha : β1≠ 0
Sb=0.001299833
Tcalculada=0.145538269-0/0.001299833=111.97
La hipótesis se rechaza
d. Calcula las predicciones Ŷ para los siguientes valores de X0: 0, 5, 15, 25,
30, 35.5, 39, 45, 60, 70, 80, 90. 
Xo Yo
0 7.27
Práctica de ejercicios

5 6.55
15 5.09
25 3.64
30 2.91
35.5 2.11
39 1.60
45 0.73
60 -1.46
70 -2.91
80 -4.37
90 -5.82
6. Calcula el intervalo de confianza de los valores particulares de Y para los
valores dados de X0 del inciso anterior. 
LC:0.15±0.145542318 LIC=0.0044578 LSC=0.295545318

Potrebbero piacerti anche