Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADÍSTICA INDUSTRIAL
ESCUELA PROFESIONAL: Ingeniería Industrial
CURSO: Estadística Industrial
PROBLEMA 1:
Un fabricante de tinas calientes anuncia que con su equipo de calefacción se
puede alcanzar una temperatura de 100 °F en 15 minutos en forma aproximada.
Se selecciona una muestra aleatoria de 42 tinas y se determina el tiempo
necesario para alcanzar una temperatura de 100 °F con cada tina. El tiempo
promedio y la desviación estándar poblacional son de 16.5 y 2.2 min
respectivamente. ¿Evidencian estos datos alguna duda sobre la afirmación de la
compañía? Utilice un nivel de significancia de 5%.
Probabilidad y estadística para ingeniería y ciencia- Devore Jay L. pag 344-
prob.81
SOLUCIÓN
Prueba de hipótesis bilateral
H0: µ=15 (El tiempo en el que su equipo de calefacción alcanza los 100°F es 15)
H1: µ≠15 (El tiempo en el que su equipo de calefacción alcanza los 100°F no es
15)
n=42 tinas (tamaño de la muestra)
𝑥=16.5
σ = 2.2
Debido a que n>30 (muestra grande) se usará la prueba Z
Método clásico
Cálculo del z estadístico:
16.5 − 15
𝑧=
2.2/√42
𝑧 = 4.419
Cálculo del z crítico
𝑧0.475 = 1.96
𝑅𝑒𝑔𝑖𝑜𝑛 𝑅𝑒𝑐ℎ𝑎𝑧𝑜: {𝑧 < −1.96 y z > 1.96}
4.419 ∈ Regio Rechazo Entonces SE RECHAZA H0
Método valor p
Dado
𝑧 = 4.419
𝑝 < 0.5 − 0.49998
𝑝 < 0.00002
𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠: 𝛼 > 𝑝
Entonces SE RECHAZA H0
Método intervalo de confianza
𝟐. 𝟐
𝟏𝟔. 𝟓 ± 𝒁𝟎.𝟎𝟐𝟓 ∗
√𝟒𝟐
𝟐. 𝟐
𝟏𝟔. 𝟓 ± 𝟏. 𝟗𝟔 ∗
√𝟒𝟐
𝟏𝟔. 𝟓 ± 𝟎. 𝟔𝟔𝟓
SOLUCION:
Método clásico
Zcrít= + -1.645
Como el valor de z
es 3.95 y es mayor
que z critico se
Rechaza Ho aun
nivel de confianza
del 90%
Entonces la media
de la población de
auditores varones
es diferente que a
la de mujeres.
Intervalo de confianza :
𝑆12 𝑆22
(𝑥1 − 𝑥2) ± 𝑧 ∗ √ + =
𝑛1 𝑛2
0.8392 0.9662
(4.059 − 3.680) ± 1.645 ∗ √ +
186 172
Ic : ( 0.221 ; 0.536)
Como el valor de cero no pertenece al intervalo Ho se rechaza
MINITAB
Tamaño Viñas
Insecticida
muestral afectadas
A 400 24
B 400 40
Al nivel de significancia 0.05. ¿Puede concluirse que hay diferencia entre las
proporciones de viñas afectadas usando el insecticida A, y usando el
insecticida B?
SOLUCIÓN:
METODO CLASICO
Ho: PA = PB
Ha: PA ≠ PB
Alfa = 0.05
2. Regla de decisión:
ZK
3. Tomamos una decisión:
Insecticida Insecticida
A B
𝐧𝐀 = 𝟒𝟎𝟎 nB = 400
𝐗 𝐀 = 𝟐𝟒 XB = 40
𝑋𝐴 24 𝑋𝐵 40
𝑃𝐴 = = = 0.06 𝑃𝐵 = = = 0.1
𝑛𝐴 400 𝑛𝐵 400
𝑋𝐴 +𝑋𝐵 24 + 40
𝑃𝑐 = = = 0.08
𝑛𝐴 + 𝑛𝐵 400 + 400
𝑃𝐴 − 𝑃𝐵 0.06 − 0.1
𝑍= = = −2.085
1 1
√𝑃𝑐(1 − 𝑃𝑐 ) ( + ) √0.08(1 − 0.08) ( 1 + 1 )
𝑛𝐴 𝑛𝐵 400 400
Entonces ZK = -2.085
ZK ϵ RC → Rechazo HO y acepto la Ha, Por lo tanto la proporción de viñas
afectadas es diferente por el tipo de insecticida
P<α
0.037 < 0.05
Rechazo Ho y acepto la Ha
IC: <-0.0775,-0.0025>
Como el 0 no pertenece al intervalo se rechaza la Ho
MINITAB
Como mediante los tres métodos se rechaza la Ho, entonces decimos que la
proporción de viñas afectadas es diferente por el tipo de insecticida
PROBLEMA 4:
Una compañía de seguros afirma que 90% de sus reclamos son atendidos en un
plazo de 30 dias. Para probar esta aseveración, un grupo de usuarios seleccionó
una muestra aleatoria de 75 reclamaciones hechas a la compañía. Si el grupo
encontró que 55 de estas fueron atendidas en plazo indicado, ¿Es esta evidencia
suficiente para apoyar la apreciación de que menos del 90 de las reclamaciones
se atienden dentro del plazo señalado? Use alfa = 0.01
SOLUCION:
METODO CLASICO
Plantear la hipótesis nula y la hipótesis alternativa
Ho: PA = 90
Ha: PA < 90
Alfa=0.01
Hallamos el Zcritico: Zc=-2.326
Hallo es Z estadístico:
55
𝑃̅= = 0.73
75
𝑃̅ −𝑃 0.73−0.9
𝑧= 𝑃∗𝑄
=> 𝑧= 0.9∗0.1
= −4.81
√ √
𝑛 75
𝑃∗𝑄
Ic: 𝑷 ± 𝒁𝜶 ∗ √ 𝑛
0.73∗0.27
Ic: 𝟎. 𝟕𝟑 ± 𝟐. 𝟑𝟐𝟔 ∗ √ 75
MINITAB
PROBLEMA 1:
“Análisis y propuesta de mejora para una línea de producción de parabrisas
usando herramientas de manufactura esbelta”
La industria automotriz se divide en varios procesos de manufactura, dentro de
los cuales se encuentra la producción de parabrisas para autos, Cuya actividad
no es muy conocida en el país.
La demanda de parabrisas se ha incrementado en los últimos años por lo cual la
empresa busca innovar y desarrollar nuevos productos para cumplir con los
requerimientos del mercado.
La empresa cuenta con una nueva planta, en la cual se han hecho análisis de
los procesos y tiempos de producción.
Se evaluará si los tiempos de producción no son los adecuados y se buscará
implementar herramientas de manufactura esbelta, para mejorar los tiempos de
entrega y los costos de producción.
Uno de los métodos para evaluar esto es hallando el balance del proceso
productivo, para ello se tendrá el tiempo promedio por mes del año 2015 para
elaborar un parabrisas.
El tiempo ideal para producir un parabrisas de acuerdo a la antigua planta de
producción es de 349.2 segundos
2015
Enero 376
Febrero 371
Marzo 376
Abril 371
Mayo 376
Junio 391
Julio 384
Agosto 391
Septiembre 379
Octubre 391
Noviembre 384
Figura 1.1 Centro de valor agregado
Diciembre 376
SOLUCIÓN:
Formulación de la hipótesis:
METODO CLASICO
Como se trata de una muestra pequeña con n= 12 y se asume que los datos
siguen un comportamiento normal, por lo cual se empleará la distribución t d
student.
Gl = 11
Alfa = 0.05
Por lo tanto de la tabla se tiene:
Tcrit = 1.7959
Si el Tdat es mayor que 1.7959 se rechaza la Hipótesis nula.
x (X-Media)^2
376 20.25
371 90.25
376 20.25
371 90.25
376 20.25
391 110.25
384 12.25
391 110.25
379 2.25
391 110.25
384 12.25
376 20.25
∑𝑛
𝑖=1 𝑥𝑖 ∑𝑛
𝑖=1(𝑥𝑖−𝑀𝑒𝑑𝑖𝑎)
2
𝑀𝑒𝑑𝑖𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑉𝑎𝑟(𝑥 ) = 𝐷𝑒𝑠𝑣. 𝐸𝑠𝑡𝑎𝑛𝑑 =
𝑛 𝑛−1
√𝑉𝑎𝑟(𝑥)
n 12
Suma Total 4566
Media 380.5
Muestral
Var(x) 56.2727273
380.5 − 349.2
𝑇𝑑𝑎𝑡 = = 14.45
7.501515
√12
𝟕. 𝟓𝟎𝟏𝟓𝟏𝟓
𝟑𝟖𝟎. 𝟓 ± 𝟏. 𝟕𝟗𝟔 ∗
√𝟏𝟐
IC: <376.611,384.389>
CONCLUSION
Participante 1 2 3 4 5 6 7 8 9 10
N p antes 38 11 34 25 17 38 12 27 32 29
N p desp 45 24 41 39 30 44 30 39 40 41
Solución:
Planteo de hipótesis
Ho: d= 0
Ha: d <>0 La diferencia antes y después es diferente
Valor critico
N= 10; gl =9; alfa = 0.05
Tα/2= 2.262
Se rechaza Ho si el
estadístico de prueba
es mayo que 2.262 o
menor que -2.262
Calculo del Testadistico:
Participante 1 2 3 4 5 6 7 8 9 10
N p antes 38 11 34 25 17 38 12 27 32 29
N p desp 45 24 41 39 30 44 30 39 40 41
diferencia -7 -13 -7 -14 -13 -6 -18 -12 -8 -12
(di-
dprom)^2 16 4 16 9 4 25 49 1 9 1
𝑑𝑖 ∑(𝑑𝑖−𝑑̅)^2
𝑑̅ = ∑ 𝑛 = −11 𝑆𝑑 = √ = 3.8586
𝑛−1
𝑑̅ − 𝐷 −11 − 0
𝑡= = = −9.014
𝑆𝑑 3.8586
√𝑛 √10
Intervalo de confianza:
𝑆𝑑 3.8586
𝑑±𝑡∗ = −11 ± 2.262 ∗
√𝑛 √10
𝐻0 : 𝜇𝑥 = 𝜇𝑦
𝐻1 : 𝜇𝑥 ≠ 𝜇𝑦
𝒕 = −𝟑. 𝟒𝟐
Insertamos los valores en Minitab:
- En la Barra de Menús seleccionamos la viñeta Estadísticas
- Seleccionamos la opción Estadística Básica
- Entramos a la operación T de 2 Muestras
ANOVA
PROBLEMA 4
1. La siguiente información es muestral. Pruebe la hipótesis de que las
medias de tratamiento son iguales. Utilice el nivel de significancia 0.05.
El valor calculado para F es 5.12, que es mayor que el valor crítico 3.89, por
tanto se rechaza la hipótesis nula. Se concluye que las medias poblacionales
no son iguales. Los tratamientos promedio no son iguales en los tres grupos de
evaluación. Por ahora sólo se puede concluir que hay una diferencia entre las
medias de tratamiento.
EJERCICIO
Una compañía de desarrollos inmobiliarios considera la inversión en un centro
comercial en las afueras de Atlanta, Georgia. Se evalúan tres terrenos. El
ingreso de los pobladores de la zona aledaña al centro comercial es de
especial importancia. Se selecciona una muestra aleatoria de cuatro familias
que viven cerca de cada terreno. A continuación se presentan los resultados
muestrales. Al nivel de significancia de 0.05, ¿ puede concluir la compañía que
hay diferencia en los ingresos promedio? Utilice el procedimiento usual de
cinco pasos para prueba de hipótesis.
El valor calculado para F es 14.18, que es mayor que el valor crítico 4.26, por
tanto se rechaza la hipótesis nula. Se concluye que las medias poblacionales
no son iguales. Los ingresos promedio no son iguales en los tres grupos de
evaluación. Por ahora sólo se puede concluir que hay una diferencia entre las
medias de tratamiento.
SEMANA 3: REGRESIÓN LINEAL SIMPLE
PROBLEMA 1.-
Un ciudadano está estudiando compañías que se harán públicas por primera
vez. Tiene interés particular en la relación entre le importe de una oferta y el
precio por acción. Una muestra de 15 empresas que recientemente se hicieron
públicas presento la siguiente información.
Compañía Tamaño(millones de Precio por acción, Y
dólares), X
1 9.0 10.8
2 94.4 11.3
3 27.3 11.2
4 179.2 11.1
5 71.9 11.1
6 97.9 11.2
7 93.5 11.0
8 70.0 10.7
9 160.7 11.3
10 96.5 10.6
11 83.0 10.5
12 23.5 10.3
13 58.7 10.7
14 93.8 11.0
15 34.4 10.8
b) Calcular b0 y b1.
𝑛(∑ 𝑋𝑌) − (∑ 𝑋)(∑ 𝑌) 15(13114,64) − (1193,8)(163,6)
𝑏1 = = = 0.00302
𝑛 (∑ 𝑋 2 ) − (∑ 𝑋)2 15(126252,04) − (1193,8)2
𝑏0 = 𝑦̅ − 𝑏1 ∗ 𝑥̅ = 10.906 − 0.00302 ∗ 79.5867 = 10.665 = 10.7
c) Interpretar b0 y b1
∑(𝑦 − 𝑦′)2
𝑠𝑦.𝑥 = √
𝑛−2
1.04
𝑠𝑦.𝑥 = √ = 0.28
15 − 2
f) Calcular el coeficiente de estimación 𝑟 2 e interprete.
Compañía Tamaño Precio Y’ Desviació Desviació ̅
Y-𝒀 ̅ )^2
(Y-𝒀
(millones por Calculado n (Y-Y’) n (Y-Y’)^2
de acción
dólares), ,Y
X
1 9.0 10.8 10.72718 0.07282 0.00530275 -0.10666667 0.011377
2 94.4 11.3 10.985088 0.314912 0.09916957 0.39333333 0.154711
3 27.3 11.2 10.782446 0.417554 0.17435134 0.29333333 0.086044
4 179.2 11.1 11.241184 -0.141184 0.01993292 0.19333333 0.037377
5 71.9 11.1 10.917138 0.182862 0.03343851 0.19333333 0.037377
6 97.9 11.2 10.995658 0.204342 0.04175565 0.29333333 0.086044
7 93.5 11.0 10.98237 0.01763 0.00031082 0.09333333 0.008711
8 70.0 10.7 10.9114 -0.2114 0.04468996 -0.20666667 0.042711
9 160.7 11.3 11.185314 0.114686 0.01315288 0.39333333 0.154711
10 96.5 10.6 10.99143 -0.39143 0.15321744 -0.30666667 0.094044
11 83.0 10.5 10.95066 -0.45066 0.20309444 -0.40666667 0.165377
12 23.5 10.3 10.77097 -0.47097 0.22181274 -0.60666667 0.368044
13 58.7 10.7 10.877274 -0.177274 0.03142607 -0.20666667 0.042711
14 93.8 11.0 10.983276 0.016724 0.00027969 0.09333333 0.008711
15 34.4 10.8 10.803888 -0.003888 1.5117E-05 -0.10666667 0.011377
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 1 6786.04809 6786.04809 3.6073227 0.07994066
Residuos 13 24455.4292 1881.18687
Total 14 31241.4773
𝑆𝑆𝑅 6786.04809
𝑟2 = = = 0.2172
𝑆𝑆𝑇𝑜𝑡𝑎𝑙 31241.4773
𝑆𝑆𝐸
𝑠=√ = 43.37
𝑛−2
(-0.46248, 0.46852)
Para y
10.7 ± 73.19 ∗ 0.004
(10.4111, 10.9823)
i) Cree un intervalo de predicción.
𝑠𝑦 = 0.009
Analysis of Variance
Source DF SS MS F P
Regression 1 0.28440 0.28440 3.61 0.080
Residual Error 13 1.02493 0.07884
Total 14 1.30933
PROBLEMA 2.
Se quiere estudiar la relación entre la pureza del oxígeno (Y) producido en un proceso
químico de destilación y el nivel de hidrocarburos(X) presentes en el condensador
principal de la unidad de destilación
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
Solución:
a)
X Y X2 Y2 XY
0.99 90.01 0.9801 8101.8001 89.11
1.02 89.05 1.0404 7929.9025 90.83
1.15 91.43 1.3225 8359.4449 105.14
1.29 93.74 1.6641 8787.1876 120.92
1.46 96.73 2.1316 9356.6929 141.23
1.36 94.45 1.8496 8920.8025 128.45
0.87 87.59 0.7569 7672.0081 76.20
1.23 91.77 1.5129 8421.7329 112.88
1.55 99.42 2.4025 9884.3364 154.10
1.4 9365 1.96 8770.3225 131.11
1.19 93.54 1.4161 8749.7316 111.31
1.15 92.52 1.3225 8559.9504 106.40
0.98 90.56 0.9604 8201.1136 88.75
1.01 89.54 1.0201 8017.4116 90.44
1.11 89.85 1.2321 8073.0225 99.73
1.2 90.39 1.44 8170.3521 108.47
1.26 93.25 1.5876 8695.5625 117.50
1.32 93.41 1.7424 8725.4281 123.30
1.43 94.98 2.0449 9021.2004 135.82
0.95 87.33 0.9025 7626.5289 82.96
23.92 1843.21 29.2892 170044.5321 2214.6566
𝒏 ∑ 𝒙𝒚 − ∑ 𝒙 ∑ 𝒚 20(2214.6566) − (23.92)(1843.21)
𝒃= 𝟐 =
𝒏 ∑ 𝒙𝟐 − (∑ 𝒙) 20(29.2892) − 23.922
b = 14.947
∑𝒚 ∑𝒙 1843.21 − 14.947(23.92)
𝒂= −𝒃 =
𝒏 𝒏 20
a = 74.283
(∑ 𝑌)2 1843.212
𝑆𝑆𝑇 = ∑ 𝑌 2 − = 170044.5321 − = 173.377
𝑛 20
(∑ 𝑌)2 1843.212
𝑆𝑆𝑅 = 𝑎 ∑ 𝑌 + 𝑏 ∑ 𝑋𝑌 − = 74.283(1843.21) + 14.947(2214.6566) +
𝑛 20
𝑆𝑆𝑅 = 152.13
Ho: 𝛽1 = 0
Ha: 𝛽1 ≠ 0
2. Determinar el nivel de significancia:
𝛼 = 0.05
3. Identificar el estadístico de prueba:
𝐹
FV GL SC CM F
Regresion 1 152.13 152.13 128.92
Error 18 21.247 1.18
Total 19
FK = 128.92
Fk ϵ RC → Rechazo HO y Acepto la Ha
Interpretación:
El coeficiente de regresión es diferente de 0, por lo tanto la ecuación no es una
constante. Por cada unidad en el nivel de hidrocarburo que se incrementa, la pureza
del oxígeno aumenta en 14.97.
b) Como vamos a hacer un análisis residual, veremos que observación de las 20 que
tenemos, debemos eliminar ya que hace que nuestro estudio y desarrollo del modelo
salga erróneo.
1) Matriz Sombrero:
1 (𝑥𝑖 − 𝑥𝑝𝑟𝑜𝑚)2
ℎ𝑖 = [ + ]
𝑛 ∑ 2 (∑ 𝑥)2
𝑥 − 𝑛
𝑒𝑖
𝑡𝑖 ∗= √1 − ℎ𝑖
𝑆𝑖
3) Estadístico de la distancia de Cook:
𝑆𝑟𝑖 2 ℎ𝑖
𝐷𝑖 =
2(1 − ℎ𝑖)
REGRESIÓN MÚLTIPLE
PROBLEMA 1.
Source DF SS MS F P
Regression 3 915.90 305.30 45.76 0.000
Residual Error 12 80.05 6.67
Total 15 995.95
Source DF Seq SS
Precio (miles de $) 1 406.39
Peso en vacío (lb) 1 242.90
Caballos de fuerza (lb) 1 266.61
Unusual Observations
Velocidad
Precio en ¼ de
(miles milla
Obs de $) (mph) Fit SE Fit Residual St Resid
11 47518 99.000 103.216 1.523 -4.216 -2.02R
𝑋1 = Precio (miles de $)
𝑋2 = Peso en vacío (lb)
𝑋3 = Caballos de fuerza (lb)
Tabla ANOVA
Fuente Gl SS MS F
Regresión 3 915.8989 305.2996 45.7632
Error 16-(3+1)=12 80.0555 6.6713
Total 15 995.9544
2
𝑆𝑆𝑅 915.8989
𝑟𝑦.123 = = = 0.9196
𝑆𝑆𝑇 995.9544
Este coeficiente de determinación múltiple, calculado como 0.9196, puede
interpretarse diciendo que, de la muestra, 91.96% de la variación en la velocidad
para ¼ de milla puede ser explicada por la variación en el peso , por la variación
del precio y por la variación en los caballo de fuerza.
c) Coeficiente r2 ajustado:
𝑛−1 16−1
𝑟 2 𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 = 1 − 𝑛−(𝑘+1)
∗ (1 − 𝑟 2 ) = 1 − 16−(3+1)
∗ (1 − 0.9196) =0.8995
En consecuencia, 90% de la variación en la velocidad por ¼ de milla puede ser
explicada por nuestro modelo de regresión múltiple: ajustado para el número de
variables de predicción y el tamaño de muestra.
d) Matriz de correlación:
Precio Peso en Caballos de Velocidad en ¼
(miles de vacío (lb) fuerza (lb) de milla (mph)
$)
Precio (miles de 1
$)
Peso en vacío 0.1044459 1
(lb) 71
Caballos de 0.4816115 0.665777 1
fuerza (lb) 15
Velocidad en ¼ 0.6387804 0.557862 0.93432631 1
de milla (mph) 81 558 9
𝑆𝑆𝐸 80.0555
𝑠𝑦.123 = √ =√ = 2.5829
𝑛 − (𝑘 + 1) 16 − (3 + 1)
F crítico: 2.179
Tenemos que 2.4206> 2.179 por lo tanto no se rechaza Ho. Y llegamos a la
conclusión de que existe una relación significativa entre la variable X 1 (precio) y
la velocidad, tomando en cuenta las otras variables.
0.000104 ± (2.179)(0.00004315)
0.000104 ± 0.000009402
0.000094598 ≤ 𝛽1 ≤ 0.0001134
PROBLEMA 2
a) Diagramas de dispersión
0,9
0,8
Margen de beneficios
0,7
0,6
0,5
0,4
0,3
6000 6500 7000 7500 8000 8500 9000 9500
Numero de oficinas
Analysis of Variance
Source DF SS MS F P
Regression 2 0,34213 0,17107 35,81 0,000
Residual Error 22 0,10508 0,00478
Total 24 0,44722
Source DF Seq SS
Ingreso por dolar 1 0,21475
Numero de oficinas 1 0,12738
23.6 5 43 0
19.3 2 51 1
33.0 15 60 1
28.6 11 73 0
35.0 14 80 1
32.0 9 76 0
26.8 7 54 1
38.6 22 55 1
21.7 3 90 1
15.7 1 30 0
20.6 5 44 0
41.8 23 84 1
36.7 17 76 0
28.4 12 68 1
23.6 14 25 0
31.8 8 90 1
20.7 4 62 0
22.8 2 80 1
32.8 8 72 0
SOLUCIÓN:
ANÁLISIS DE REGRESIÓN:
La ecuación de regresión es
Sueldo = 9,92 + 0,899 años exp. + 0,154 calf. dir. - 0,67
maestria
Esta ecuación nos indica que por un cambio en una unidad en los años de experiencia, la
variación del sueldo será de 0.899 miles de dólares manteniendo las demás variables
independientes como constantes. De igual modo con la variación en una unidad en la
calificación se producirá una variación en el sueldo de o.154 miles de dólares con las
condiciones anteriores. Por último una variación en el grado de maestría de una unidad
provocará un cambio en -0.67 miles de dólares en el sueldo manteniendo las demás variables
constantes.
Además observamos que con las variables años de experiencia y calificación existe una
relación directa, mientras que con el grado de maestría una relación inversa
La columna “Coef” nos indica los valores de los coeficientes correspondientes a la ecuación.
La segunda columna nos indica la variabilidad de estos coeficientes pues se trata de una
muestra aleatoria. La tercera columna nos muestra la razón “t” con la que podemos verificar
mediante la prueba “t de student”, o también con el valor p, si es que la hipótesis nula de que
los coeficientes sean iguales a cero se rechaza o no se rechaza en una prueba de dos colas
a un nivel de 0.05 de significancia. Analizando con “el valor p” nos dirigimos en análisis a la
variable maestría. Pues su valor es superior al nivel de significancia por lo que no
rechazaríamos la hipótesis nula de que este coeficiente sea “0”. Es una variable que se puede
eliminar del análisis.
S = 2,38967 R-cuad. = 90,8% R-cuad.(ajustado) =
89,1%
GRAFICA:
40
35
Sueldo
30
25
20
15
0 5 10 15 20 25
años exp.
Observamos una relación directa con los datos bien concentrados hacia una recta con
pendiente positiva entre el sueldo y los años de experiencia.
Observamos que no nos permite visualizar fácilmente si relacionamos el sueldo con el grado
de maestría. Sin embargo en la ecuación nos señaló que hay una relación inversa en la
asociación.
ANÁLISIS RESIDUALES:
Observamos que los datos están muy dispersos relacionando el sueldo con la calificación del
director. Sin embargo a rasgo general se visualiza una tendencia positiva en la correlación.
GRAFICA:
Los datos escapan más allá de las 2 desviaciones estándares, pero de modo ligero. Sin
embargo se puede observar que el 95% de los datos al menos está dentro de las 2 desviaciones
por lo que es un ajuste a la recta posiblemente respetable.
PRUEBA DE HIPÓTESIS:
Análisis de varianza
Fuente GL SC CM F P
Regresión 3 903,19 301,06 52,72 0,000
Error residual 16 91,37 5,71
Total 19 994,56
Fuente GL SC Sec.
años exp. 1 748,63
calf. dir. 1 152,84
maestria 1 1,73
El valor f que observamos por la regresión es superior al valor crítico 3.239 por lo que se puede
rechazar la hipótesis nula de que todos los coeficientes son “0”.
Si analizamos el segundo cuadro vemos que es maestría el que cae dentro de la región de no
rechazo, por lo que es posible que este sea el coeficiente que pueda ser eliminado en el
análisis.
JI CUADRADO: INDEPENDENCIA
PROBLEMA 4.
Se realizó una encuesta por parte de una sucursal, situada en Canadá, de una
cadena de que opera a nivel nacional oficinas de corretaje inmobiliario, con el
propósito de conseguir un perfil de las casas de una sola familia en algunas
comunidades vecinas. Se desea saber si existe una alguna relación entre el
estilo arquitectónico y la localización geográfica. Utilizando los archivos de un
Censo canadiense, se selecciona una muestra de 233 casas de una sola
familia y se obtiene un registro de una dirección para cada combinación de
estilo arquitectónico y localización geográfica. La tabla de contingencia de 5x3
se presenta a continuación:
SOLUCIÓN
𝛼 = 0.05
𝑋 2 (0.05,8) = 15.507.
Solución
fo fe` Chi 2
3 2.604 0.060
4 5.968 0.649
15 10.22 2.236
10 10.733 0.050
5 6.912 0.529
3 2.755 0.022
40 39.192 3.546
3) Calculamos el Chi2 crítico:
4) Conclusión:
PRUEBA DE SIGNO
0,
0,
0,
0,
0,0 0,0
0, - 1,9
Interpretación: American Idol y a Dancing with the Stars no tienen el mismo
nivel de preferencia.
Estadística para Administración y Economía 10ª Edición (Anderson – Sweeney – Williams). Página
820. Problema 9
Gráfica de distribución
Normal; Media=0; Desv.Est.=1
0,4
0,3
0,2
0,1
0,05
0,0
1,645
Conclusión: El número mediano de empleados que trabaja de tiempo parcial ha
aumentado.
KRUSKALL WALLIS
PROBLEMA 1
La revista Conde Nast Traveler realiza cada año un estudio para evaluar los 80
principales barcos cruceros del mundo (Conde Nast Traveler, febrero de 2006).
A continuación se dan las evaluaciones dadas a los cruceros de una muestra de las
líneas Holland America, Princess y Royal Caribbean; la evaluación máxima es
100. Use la prueba de Kruskal-Wallis con α= 0.05 para determinar si hay
diferencia significativa en las evaluaciones de los barcos de las tres líneas.
Chi-cuadrada; df=2
0,5
0,4
0,3
0,05
0,0
0 5,991
X
5.
Pasos:
1. 𝐻0 : Son iguales las distribuciones de las tres muestras.
𝐻𝑎 : No son iguales todas las distribuciones de las tres muestras.
2. 𝛼 = 0.05
3. 𝐾𝑟𝑢𝑠𝑘𝑎𝑙 𝑊𝑎𝑙𝑙𝑖𝑠; 𝑋 2
MUESTRA 1 MUESTRA 2 MUESTRA 3
Datos Lugar Datos Lugar Datos Lugar
50 8 48 5 39 1
54 11 49 6.5 41 2
59 14.5 49 6.5 44 3
59 14.5 52 10 47 4
65 16 56 12 51 9
57 13
∑ 𝑹𝟏 64 ∑ 𝑅2 53 ∑ 𝑅3 19
4. Cálculo
12 ∑ 𝑟1 2 ∑ 𝑟2 2 ∑ 𝑟3 2
𝐻= [ + + ] − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑛1 𝑛2 𝑛3
𝑯 = 𝟖. 𝟗𝟖
PROBLEMA 1
Con objeto de determinar su efecto en el rendimiento de la gasolina en millas por
galón en los automóviles de pasajeros, se prueban dos aditivos para gasolina.
Acontinuación aparecen los resultados de esta prueba en 12 automóviles; en cada
automóvil se probaron los dos aditivos. Use α = 0.05 y la prueba de los rangos
con signo de Wilcoxon para determinar si existe una diferencia significativa
entre estos dos aditivos.
Estadística para Administración y Economía 13ª Edición (Anderson – Sweeney – Williams).
Pagina 825. Problema 12
Aditivo Aditivo
Automóvil 1 2 Automóvil 1 2
1 20.12 18.05 7 16.16 17.20
2 23.56 21.77 8 18.55 14.98
3 22.03 22.57 9 21.87 20.03
4 19.15 17.06 10 24.23 21.15
5 21.23 21.22 11 23.21 22.78
6 24.77 23.80 12 25.02 23.70
α =0.05
Gráfica de distribución
0.3
0.2
0.0
-1.960 1.960
Paso 5:
Automóvil Aditivo diferencia Valor lugar Rango
1 2 absoluto con signo
1 20.12 18.05 2.07 2.07 9 9
2 23.56 21.77 1.79 1.79 7 7
3 22.03 22.57 -0.54 0.54 3 -3
4 19.15 17.06 2.09 2.09 10 10
5 21.23 21.22 0.01 0.01 1 1
6 24.77 23.80 0.97 0.97 4 4
7 16.16 17.20 - 1.04 1.04 5 -5
8 18.55 14.98 3.57 3.57 12 12
9 21.87 20.03 1.84 1.84 8 8
10 24.23 21.15 3.08 3.08 11 11
11 23.21 22.78 0.43 0.43 2 2
12 25.02 23.70 1.32 1.32 6 6
T = 9+7-3+10+1+4-5+12+8+11+2+6
T = 62
µT = 0
𝞼T = 25.495
Z= 2.4318
Pasos:
Planteamos nuestra hipótesis:
𝐻0 : 𝐿𝑜𝑠 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜𝑠 𝑚𝑒𝑑𝑖𝑎𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑔𝑜𝑙𝑓𝑖𝑠𝑡𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎𝑠
𝐻1 : 𝐿𝑜𝑠 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜𝑠 𝑚𝑒𝑑𝑖𝑎𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑔𝑜𝑙𝑓𝑖𝑠𝑡𝑎𝑠 𝑠𝑜𝑛 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎𝑠
Nivel de Significancia = 0.05
Número
de Estadística Mediana
Conclusión:
Observamos que el valor 0.139 es mayor que 0.05. No se la hipótesis nula.
Concluimos que los promedios medianos de los golfistas son significativos.
PRUEBA DE MAN WHITNEY WILCOXON
α =0.05
Paso 3: Seleccionar el estadístico MAN WHITNEY-WILCOXON.
TL = 79 TU = n1(n1+n2+1)- TL
TU = 10(10+10+1)-79
TU= 131
Conclusión
2004 623 687 748 638 713 645 726 700 794 662 814 674
2005 752 582 781 805 723 728 674 766 908 737 796 724
α =0.05
Paso 3: Seleccionar el estadístico MAN WHITNEY-WILCOXON.
Gráfica de distribución
0.4
Paso 5:
2004 Rango 2005 Rango
623 2 752 17
687 8 582 1
748 16 781 19
638 3 805 22
713 10 723 11
645 4 728 14
726 13 674 6.5
700 9 766 18
794 20 908 24
662 5 737 15
814 23 796 21
674 6.5 724 12
∑R1 = 119.5
∑R2 = 180.5
µT = 150
𝞼T = 17.32
Z = -1.76
Conclusión
MINITAB
PRUEBA DE COEFICIENTE DE CORRELACIÓN DE SPEARMAN
PROBLEMA 1
Un estudio nacional de Harris Interactive, Evaluó las empresa de alta tecnología
y su reputación. La tabla siguiente muestra cómo se clasifica la reputación de
las 10 empresas de alta tecnóloga y como se la clasifica en el porcentaje de
encuestados que dijeron compartir acciones de la empresa .Se prevé una
correlación positiva, ya que parezca razonable esperara que una empresa con
una reputación más grande, tenga las acciones más cotizadas o las acciones más
grandes.
STOCK
COMPANY REPUTATION PURCHASE
Microsoff 1 3
Intel 2 4
Dell 3 1
Lucent 4 2
Texas Ins. 5 9
Cisco Systems 6 5
Hewlett-Packard 7 10
IBM 8 6
Motorola 9 7
Yahoo 10 8
SOLUCION:
STOCK
COMPANY REPUTATION PURCHASE
Microsoff 1 3 -2 4
Intel 2 4 -2 4
Dell 3 1 2 4
Lucent 4 2 2 4
Texas Ins. 5 9 4 16
Cisco Systems 6 5 1 1
Hewlett-Packard 7 10 -3 9
IBM 8 6 2 4
Motorola 9 7 2 4
Yahoo 10 8 2 4
8 54
1. Formular las hipótesis:
2. Nivel de significancia
3. Estadístico: z
5. Calculando estadístico.
Interpretación: Con un nivel de confianza de 95 % podemos afirmar que la
correlación de rangos en la población es mayor que 0.
PROBLEMA 2
Calificación en el
Ventas Anuales
Representante programa de
(miles US$)
capacitación
Kitchen 319 3
Bond 150 9
Gross 175 6
Arbuckle 460 1
Greene 348 4
Arden 300 10
Crane 280 5
Arthur 200 2
Keene 190 7
Knopf 300 8
SOLUCIÓN
Lugar
Ventas
Calificación en según
Anuales
Representante el programa de ventas en di di2
(miles
capacitación el primer
US$)
año
Kitchen 3 319 3 0 0
Bond 9 150 10 -1 1
Gross 6 175 9 -3 9
Arbuckle 1 460 1 0 0
Greene 4 348 2 2 4
Arden 10 300 4.5 5.5 30.25
Crane 5 280 6 -1 1
Arthur 2 200 7 -5 25
Keene 7 190 8 -1 1
Knopf 8 300 4.5 3.5 12.25
∑ 83.5
1) Formular las hipótesis:
2) Nivel de significancia
3) Estadístico: Z