Sei sulla pagina 1di 86

“Año del Dialogo y la Reconciliación Nacional”

UNIVERSIDAD NACIONAL DE CAJAMARCA


Norte de la Universidad Peruana
Fundada por Ley 14015 el 13 de febrero de 1962

Análisis de Varianza
“ESTADISTICA APLICADA” MANUEL CÓRDOVA
ZAMORA

Facultad:
Ingeniería.
Escuela Académica:
Ingeniería Civil.
Asignatura:
Estadística Aplicada.
Catedrático:
Dr. Miguel Ángel Macetas Hernández.
Alumnos:
JUAREZ TASILLA, Elmer Roberto
ROJAS HONORES, Diego Manuel
ZELADA REVILA, Edson Fernando

Ciudad Universitaria - Julio del 2018


ANÁLISIS DE VARIANZA
1. Tres lotes pilotos de 5 cerdos cada uno escogió un ingeniero para realizar
durante tres meses de prueba de alimentación. El lote 1 recibió el método
de alimentación A, el lote 2 el B y el lote 3 el C. los rendimientos de los
métodos de alimentación medidos como el peso final (en kilogramos) de
los cerdos se resumen en la siguiente tabla de análisis de varianza

a) Describa la variable dependiente y el modelo de este ANOVA.


b) ¿existe evidencia de una diferencia significativa entre los tres tipos de
alimentación? Plantee las hipótesis nula y alternativa, describa la
estadística y la región de rechazo de la hipótesis nula al nivel de
significación α=0.05 y finalmente tome la decisión completando
previamente la tabla ANOVA

SOLUCIÓN

a) La viable dependiente = X es el rendimiento pues esta depende del


método de alimentación que les sea aplicado
b)
 H₀: µ₁=µ₂=µ₃
 H₁: Una µₓ es diferente

Fuente de
SC GL MC 𝐹𝑐𝑎𝑙
Varianzas
Tipos de
377.733 2 188.8665
Alimentación 10.4346133
Error 217.2 12 18.1
Total 594.933 14 206.9665

 Métodos de Alimentación: 3
 N° de Cerdos por métodos: 5
 N° de Cerdos totales: 15

Sabemos que: α=0.05

Al calcular el Ft obtenemos: 𝐹𝑡 = 3.89

Además, Tenemos que: 𝐹𝑐𝑎𝑙 = 10.435

Entonces al saber eso observamos que: 𝐹𝑐𝑎𝑙 > 𝐹𝑡

Por lo tanto, al saber esto decimos que: Se rechaza la hipótesis nula


2. La empresa P&C que maneja 15 merados quiere comparar la efectividad
de tres tipos e publicidad usados para sus mercados. Se asignaron 5 de
estos mercados al azar a cada uno de los tres tipos distintos de publicidad
con el propósito de estudiar el impacto de los carteles en las ventas. Al
cabo de un mes, el monto de las ventas X (en miles de dólares) de cada
uno de los cinco mercados asignados a cada uno de los tipos de
publicidad dieron los siguientes resultados:
3 5
2
𝑋∗∗ = ∑ ∑ 𝑥𝑖𝑗 2 = 96,698
1 1

Ventas totales para cada tipo de publicidad:


𝑥1. = 400, 𝑥2. = 425 y 𝑥3. = 375
Al nivel de significancia de 0.05, ¿proporcionan estos datos suficiente
evidencia para inferir que los promedios de ventas son iguales para los
tres tipos de carteles?
SOLUCIÓN
Planteamos la hipótesis:
𝐻𝑜: µ1 = µ2 = µ3

Hacemos una tabla con los datos dados


MERCADOS TIPOS DE PUBLICIDAD TOTAL MEDIAS DE LOS
BLOQUES
1 2 3
1
2
3
4
5 400-(a+b+c+d) 425-(e+f+g+h) 375-(i+j+k+l)
TOTAL 400 425 375 1200
MEDIAS 80 85 75 80

𝑋∗∗ = 80
𝑋1∗= 80

𝑋2∗ = 85

𝑋3∗ = 75

𝑋∗∗
=
Sacamos el valor de c, el cuál será: C=96000
Sacamos los valores de SCT, SCE Y SCA

2 𝑋𝑖∗ 2
= ∑∑𝑋 =∑ SCE = ECT - SCA

SCT 698 SCA 250 SCE 448

TABLA ANOVA
FUENTE DE SUMA DE GRADOS MEDIAS RAZÓN F
VARIACIÓN CUADRADOS DE CUADRATICAS CALCULADA
LIBERTAD
PUBLICIDAD 250 2 125 3.34821429
ERROR 448 12 37.33333333
TOTAL 698 14

RC = {F (2,12)>3.89}
FCAL= 3.35
P=P [F (3,12)>3.35]
F (3,12) (5%)=3.89>3.35
RPTA: Al ver que cumple que el F de la tabla es mayor que F(cal)
podemos aceptar la hipótesis nula
Por lo tanto 
𝐻𝑜: µ1 = µ2 = µ3

Se cumple
SCA = 250
SCE = 448
SCT = 698
P = P[F>3.35] = 0.07
3. Para comparar el rendimiento de una variedad de uva un Ingeniero diseño
un experimento con tres métodos de cultivo en una de las viñas de San
Antonio en San Martin. Se escogieron tres terrenos de siembra de iguales
características en las que se sembró el mismo número de plantas por
pacerla de la nueva variedad de uva. El lugar B de 6 parcelas no se abonó.
El lugar A de 5 parcelas se abonó con abono ecológico casero y el lugar
C de 7 parcelas se abonó con abono industrial comercial. La primera
cosecha ha dado las siguientes estadísticas e kilogramos de uva.

X: Rendimiento en kilogramos

Modos de Tamaño de Total Medias


Cultivo Muestra
A 5 450 90
B 5 400 80
C 5 500 100
Desviación estándar de X, igual a 10.

a) Al nivel de significación 𝛼 = 0.05 , ¿Se podría inferir que los promedios


de rendimiento por modos de cultivo de la uva son significativamente
diferentes?
b) Si se concluye hay diferencias significativas en los promedios de
rendimiento por modos de cultivo. ¿Cuál modo de cultivo se debería
seguir? Aplique el método de comparaciones múltiples de Benferroni
para pares de medias con nivel de confianza de al menos 95%.
SOLUCIÓN
a)
1) Hipótesis
Ho: 1= 2= 3
H1: Son diferentes
2) De los datos tenemos:

A X^2 B X^2 C X^2


1 90 8100 80 6400 100 10000
2 90 8100 80 6400 100 10000
3 90 8100 80 6400 100 10000
4 90 8100 80 6400 100 10000
5 90 8100 80 6400 100 10000
Total 450 40500 400 32000 500 50000
Número Tamaño
Modos de de de Total Medias Suma de
cultivo Parcelas muestra Cuadrados
A 5 5 450 90 40500
B 6 5 400 80 32000
C 7 5 500 100 50000
total 18 15 1350 270 122500

3) Aplicando las formulas hallamos SCT, SCI y SCE:

Donde:

SCT 1400.00
SCI 1000
SCE 400.00
J 3
J-1 2
N 15
N-J 12

4) Calculo de Medias Cuadráticas:

Donde:

MCI = SCI /( J-1) 500


SCE / (N-
MCE = J) 33.33

5) Estadístico de contraste:

F = 14.999
6) Regla de Decisión

Rechazar Ho, si 𝐹 1 𝛼𝐹 , .. . 5 𝐹2,12 = 3.89

7) Decisión:
Puesto que el estadístico F cae en la zona critica, se rechaza Ho con
un nivel de confianza del 95%. Podemos concluir que las medias del
rendimiento no son iguales.

4. Un fabricante va adquirir una de cuatro marcas de componentes A, B, C


y D, disponibles en experimento de un factor completamente aleatorio con
cinco unidades de cada componente para cada una de las marcas. En
una prueba de laboratorio con simuladores obtuvo las siguientes
estadísticas de vida útil en días: el mercado, para determinado sistema.
El análisis estadístico encargado del estudio, diseño un
X: Vida útil

Marca de Tamaño de Total


Componentes Muestras
A 5 454
B 5 397
C 5 506
D 5 450

Desviación estándar Sx = 8,2671


a) Al nivel de significación 𝛼 = 0.05 , ¿se podrá inferir que la marca de la
componente es un efecto en el rendimiento de las mismas?
b) ¿Qué marca de componente debería adquirir el fabricante? Use el
método de intervalos de pares de medias de Bonferroni con nivel de
confianza global de al menos 95%.
SOLUCIÓN
b)
I. Planteamos:
Ho: = 2= 3
1
H1: Son diferentes

II. De los datos tenemos:

A X^2 B X^2 C X^2 D X^2


90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
90.8 8244.64 79.4 6304.36 101.2 10241.44 90 8100
454 41223.2 397 31521.8 506 51207.2 450 40500
Tamaño
Marca de Suma de
de Total Media
componentes Cuadrados
muestras
A 5 454 90.8 41223.2
B 5 397 79.4 31521.8
C 5 506 101.2 51207.2
D 5 450 90 40500
total 20 1807 361.4 164452.2

III. Aplicando las formulas hallamos SCT, SCI y SCE:

Donde:

SCT 1298.55
SCI 1189.75
SCE 108.80
J 4
J-1 3
N 20
N-J 16

IV. Calculo de Medias Cuadráticas:

Donde:
SCI /( J-
MCI = 1) 396.58
SCE / (N-
MCE = J) 6.80
V. Estadístico de contraste:

F = 58.322
VI. Regla de Decisión

Rechazar Ho, si 𝐹 1 𝛼𝐹 1, .. . 5 𝐹3,1 = 3.252

Donde F = 58.322 > 3.252

VII. Decisión:
Puesto que el estadístico F cae en la zona critica, se rechaza Ho
con un nivel de confianza del 95%. Podemos concluir que las
medias del rendimiento no son iguales.

5. Un investigador médico realizó una evaluación a profesionales que


trabajan en forma dependiente en diferentes áreas para ver si alguna de
estas es más propensa a producir stress. Usó un cuestionario de 20
preguntas de 4 opciones cada una en donde pueden marcar de 1 a 5. Los
puntajes obtenidos de 20(nivel bajo de stress) a 100(nivel elevado de
stress) se resumen en la siguiente tabla:
Tamaño de Media Desviación
las muestras Estándar
Economistas 10 56.5 1.780
Ingenieros 10 45.6 1.897
Docentes 10 60.3 1.947
universitarios

a) ¿Se puede inferir que no existe diferencia significativa entre los


puntajes promedios de stress de los ingenieros y docentes
universitarios? Utilice la probabilidad de error tipo I igual a 0.05.
b) Pruebe la hipótesis que afirma que no existe diferencia
significativa en el stress que ocasiona el trabajo de estas
profesiones. Use nivel de significación a=0.05.
c) Si existiera diferencia significativa entre los promedios, ¿cuál de
estas profesiones produce mayor stress?
SOLUCIÓN
a)
1) Formulación de Hipótesis
𝑯𝟎 : 2 = 3
𝑯𝟏 : 2 ≠ 3

2) Estadígrafo de prueba
∝= 0.05 ˄ 𝐺 𝑎𝑑𝑜 𝑑𝑒 𝐿𝑖𝑏𝑒 𝑡𝑎𝑑 = 0 1 1 = 18
2
𝑥𝑐𝑎𝑙 = 𝐼𝑁𝑉. 𝐻𝐼 𝑈 𝐷. 𝐷 0.05,18
2
𝑥𝑐𝑎𝑙 = 8.869

3) Toma de decisión:

Las varianzas son iguales, entonces se rechaza 𝐻 .


b)
1) Formulación de Hipótesis

𝑯𝟎 : 𝑎𝑖 = 0 𝑖 = 1, ,3
𝑯𝟏 : ∃ 𝑎 𝑖 ≠ 0

2) Análisis de Varianza- tabla ANOVA


Tamaño Media Desviación ∑ 𝑥𝑖 ∑ 𝑥𝑖 2 ∑ 𝑥
de las Estándar
muestras 𝑥̅ 2
Economistas 10 56.5 1.780 565 31954.184 5.601
Ingenieros 10 45.6 1.897 456 20829.586 72.818
Docentes 10 60.3 1.947 603 36398.808 38.028
universitarios
1624 89182.3578 116.447

 ∑ 𝒙𝒊 = 𝑿 ∗ 𝒏

∑ 𝑥1 = 56.5 ∗ 10 = 565

∑ 𝑥2 = 45.6 ∗ 10 = 456

∑ 𝑥3 = 60.3 ∗ 10 = 603

 ∑ 𝑥𝑖 2 = [𝛿 2 + 𝑋 2 ] ∗ 𝒏
∑ 𝑥1 2 = [ 1.780 2
+ 56.5 2 ] ∗ 10 = 31954.184

∑ 𝑥2 2 = [ 1.897 2
+ 45.6 2 ] ∗ 10 = 08 9.586

∑ 𝑥3 2 = [ 1.947 2
+ 60.3 2 ] ∗ 10 = 36398.808

3) Resultados:
16 4
= = 8791 .533
30
= 8918 .578 8791 .533 = 1 59.4667
= 10 ∗ 116.447 = 1164.4667
𝐸 = 1 59.4667 1164.4667 = 95

2
1 59.4667
𝑇 = = 43.4 99
30 1
𝑘=3
= 30
4) Tabla ANOVA:
Fuentes de Suma de Grado de Medias Razón F
Varianzas Cuadrados Libertad Cuadráticas calculada
Tratamiento 1164.467 2 582.233 165.47678
Error 95 27 3.519
Total 1259.467 29

5) Nivel de significancia:
∝= 0.05 ˄ 𝐹𝑜 = 165.4767

𝐹 = 𝐼𝑁𝑉. 𝐹. 𝐷 0.05, , 7
𝑭 = 𝟑. 𝟑𝟓𝟒𝟏
𝑃 𝐹𝑜 > 165.4767 = 𝐷𝐼 . 𝐹. 𝐷 165.4767,3,16
𝑷 𝑭𝒐 > 165.4767 = 𝟕. 𝟎𝟐𝟔𝟔𝟖𝑬 𝟏𝟔

6) Región Critica:
R.C= [F (2,27)>3.35]
7) Toma de decisión: Se rechaza Ho.
c)
⇨ La que produce mayor estrés es la profesión de Docentes
Universitarios.

45.6 < 56.5 < 60.3

2 < 1 < 3
6. El proyecto académico de un ingeniero es el diseño de un experimento a
fin de determinar el rendimiento de 4 variedades de papa sin tener en
cuenta la influencia de la fertilidad de las tierras de cultivo. Las 20 parcelas
de igual fertilidad que le fueron asignadas los dividió en 4 grupos de 5
parcelas cada una. A cada grupo de parcelas le asignó una variedad
distinta de papa escogida al azar, resultando un diseño completamente
aleatorizado. Los rendimientos medidos en kilogramos de las cinco
variedades por parcela se dan en la tabla que sigue:
V1 V2 V3 V4
55 52 53 52
53 58 55 50
60 50 57 51
52 60 51 49
53 52 54 53
a) Defina la variable dependiente, los niveles del factor, el modelo del
diseño y los supuestos del modelo.
b) Compare descriptivamente las medias de los rendimientos utilizando
un método gráfico.
c) Estime el efecto que produce la variedad 3 en el valor medio global del
rendimiento.
d) Al nivel de significación del 5%, ¿se puede inferir que existen
diferencias significativas entre las producciones medias de las 4
variedades de papa?

SOLUCIÓN

1) Formulación de Hipótesis:
𝑯𝟎 : 1 = 2 = 3 = 4 =
𝑯𝟏 : ∃ 1 ≠
2) Análisis de Varianza – Tabla ANOVA:
3) Nivel de Significancia:

∝= 0.05 ˄ Fo = 1.55

F = INV. F. CD 0.05,3,16
𝐅 = 𝟑. 𝟐𝟒
P Fo > 1.55 = DIST. F. CD 1.55,3,16
𝐏 𝐅𝐨 > 𝟏. 𝟓𝟓 = 𝟎. 𝟐𝟒
4) Región Critica:
R.C= [F (3,16)>3.35]
5) Toma de decisión: Se acepta Ho.

7. Para comparar el tiempo empleado en realizar una tarea específica bajo


tres procedimientos, un investigador diseñó un experimento seleccionado
al azar tres muestras independientes de 10 operarios cada una y asignó
al azar un procedimiento a cada muestra. Los tiempos registrados en
segundos se dan en la tabla que sigue:

P1 P2 P3
13.45 22.81 18.92
19.1 20.69 21.32
20.73 24.4 25.93
23.6 26.86 19.07
13.45 22.37 20.98
23.29 19.98 26.4
14.93 20.98 28.04
17.07 24.08 23.44
13.65 18.35 18.47
18.79 17.22 25.42
Además, la desviación estándar de la variable dependiente es igual a
4.0072
a) Describa la variable dependiente, el factor y sus niveles. El modelo del
diseño y sus supuestos. Además, describa si hay indicios de
diferencias significativas entre los tres procedimientos.
b) ¿Existe diferencia significativa entre los promedios de tiempos
empleados por los procedimientos 2 y 3? Utilice el nivel de confianza
0.95.
c) Realice una prueba de hipótesis global de los promedios de los tres
procedimientos, al nivel se significación α = 0.05.
d) ¿Cuál de los procedimientos empleados es óptimo? Aplique el método
de intervalos de pares de medias de Bonferroni con nivel de confianza
al menos 96% y el método de rangos de Duncan con nivel se
significación 0.05.
SOLUCIÓN
a)
- Variable independiente: X = Tiempo, en segundos, para realizar
una tarea específica.
- Variable dependiente o factor: A = Procedimientos
- Niveles o Tratamientos: Son los procedimientos P1, P2 y P3.
- El modelo de este ANOVA está dado por:
𝑋𝑖𝑗 = + 𝛼𝑖 + 𝜀𝑖𝑗 , i = 1,2,3 j = 1, 2, …,10.
- Supuestos:
𝛼𝑖 = 𝑖
b) COMPARACIÓN POR BONFERRONI

Entonces: 𝑢2 = 𝑢3

c)

A = Procedimientos
P1 P2 P3
13.45 22.81 18.92
19.1 20.69 21.32
20.73 24.4 25.93
23.6 26.86 19.07
13.45 22.37 20.98
23.29 19.98 26.4
14.93 20.98 28.04
17.07 24.08 23.44
13.65 18.35 18.47
18.79 17.22 25.42
TOTALES 𝑋𝑖∙ 𝑋∙∙ =623.79
178.06 217.74 227.99
= 30
ni = r 10 10 10
MEDIAS 𝑋 ∙ 𝑋∙∙ =62.379
17.806 21.774 22.799
De los datos se obtiene:
- SCT = 465.66123
- SCA = 139.08566
- SCE = 326.57557
Hipótesis:
- 𝐻 : 𝑢1 = 𝑢2 = 𝑢3
Contra:
- 𝐻1 : ∃ 𝑢𝑖 ≠ 𝑢𝑗

Estadística y región critica:


Fuente de Suma de Grados de Medias Razón F
Variación Cuadrados Libertad Cuadráticas Calculada
Máquinas 139.08566 2 69.54283
5.750
Error 326.57557 27 12.09539148
Total 465.66123 29

- 𝐹 . 5;2;27 = 0.05139

DECISIÓN: Dado que 𝐹𝑐𝑎𝑙 = 5.75 > 0.05139, se debería rechazar 𝐻 con
probabilidad de error tipo I igual a 0.05, por lo tanto, el factor procedimiento
tiene efecto significativo sobre el tiempo necesario para realizar una tarea
específica.
d)
Utilizando el método de intervalos de pares de medias de Bonferroni
con nivel de confianza al menos 96%:

Entonces: 𝑢1 < 𝑢2 = 𝑢3
Utilizando el método de rangos de Duncan con un nivel de
significación 0.05:
- Ordenamos las medias de menor a mayor:
𝑋1 < 𝑋2 < 𝑋3

17.806 < 1.774 < .799


- Se obtienen los rangos estudentizados:
2 = . 5 , 7 = .9345
3 = . 5 3, 7 = 3.09
- Calculamos los rangos mínimos significativos:
𝑀 𝐸 1 .09539
√ =√ = 1.0998
10
𝑅2 = .9345 ∗ 1.0998 = 3. 74
𝑅3 = 3.09 ∗ 1.0998 = 3.3984
- Para p=3
𝑋3 𝑋2 = 1.0 5 < 3. 74
- Para p=2
𝑋3 𝑋1 = 1.774 17.806 = 3.968 son significativamente
diferentes.
Entonces: 𝑢1 < 𝑢2 = 𝑢3

8. La empresa de transporte terrestre CARGA va adquirir una de 4 marcas


de neumáticos que hay en el mercado. El ingeniero de pruebas de la
empresa diseñó un experimento escogiendo al azar seis neumáticos de
cada marca de características similares. En el laboratorio de pruebas, con
una carga específica simulada, observó la duración de cada neumático
hasta que se deteriore. Los datos redondeados en miles de kilómetros se
dan en la tabla que sigue:

N1 N2 N3 N4
55 63 48 59
53 67 50 68
50 55 59 57
60 62 50 66
55 70 47 71
65 75 61 73
Al nivel de significación del 5%
¿Indican estos datos que las marcas de los neumáticos producen efectos
significativos en el rendimiento?
SOLUCIÓN
De los datos se obtiene:
- SCT = 37322.625
- SCA = 36553.125
- SCE = 729.5
Hipótesis:
- 𝐻 : 𝑢1 = 𝑢2 = 𝑢3
Contra:
- 𝐻1 : ∃ 𝑢𝑖 ≠ 𝑢𝑗

Estadística y región critica:


Fuente de Suma de Grados de Medias Razón F
Variación Cuadrados Libertad Cuadráticas Calculada
Marca de
Neumáticos 36553.125 3 12184.375 316.683
Error 769.5 20 38.475
Total 37322.625 23

- 𝐹 . 5;3;2 = 3.10

Decisión: Dado que 𝐹𝑐𝑎𝑙 = 316068 > 3.10, se debería rechazar 𝐻 con
probabilidad de error tipo I igual a 0.05, por lo tanto, el factor procedimiento
tiene efecto significativo sobre el tiempo necesario para realizar una tarea
específica.

9. Un promotor inmobiliario está considerando invertir en su centro comercial


a construirse en el sector medio de una capital del interior del país, Se
evalúan 4 ciudades: Arequipa, Iquitos, Piura y Trujillo, en donde es muy
importante el nivel de los ingresos mensuales de las familias. Con este fin
se diseñó una prueba de hipótesis de medias múltiples, seleccionando
una muestra aleatoria de ingresos familiares en cada una de las cuatro
ciudades. Los ingresos mensuales observados en dólares son los
siguientes:
X:Ingresos mensuales
Arequipa Iquitos Piura Trujillo
610 710 560 500
560 730 610 400
490 660 470 500
550 610 510 500
460 580 500
620 400
650

Además, la desviación estándar de la variable dependiente es igual a 90.3193,


a) Describa el modelo de este diseño de experimento y sus supuestos.
b) Aplique la prueba (a priori) DMS (o LSD) al nivel de significación
0.05, para determinar los pares de medias que son significativamente
diferentes.
c) Al nivel de significación del 5% ¿producen efectos significativos en la
variabilidad de los ingresos los niveles del factor ciudad?. Si su
respuesta es afirmativa use la prueba (a posteriori) de rangos de
Duncan para determinar la ciudad donde se debería construir el
centro comercial.

SOLUCIÓN
a)

grafica de ingresos promedio


700

600

500

400

300

200

100

0
1 2 3 4

La grafica nos muestra que las medias muestrales no difieren mucho


entre si y tampoco están muy alejadas de la media general.
b)
1 1
ES = √𝑀 𝐸 ∗ + 𝑡 = 𝑡1 𝛼, 𝑘
𝑖 𝑗 2

Intervalos de aceptación = 𝑋𝑖 𝑋𝑗 ± 𝑡𝑜 ∗ 𝐸

A continuación, se muestra las siguientes tablas obtenidas al usar las


formulas antes mencionadas:

ES 44.67 X1 552.5
tₒ 2.101 X2 634
ni=4 nj =7 X3 571.4
X4 466.7
Medias muéstrales Diferencia IC al 95%
límite límite
Xi Xj Xi-Xj inferior superior
1 2 -81.5 -175.35 12.35
3 -18.9 -112.75 74.95
4 85.8 -8.05 132.57
2 3 62.6 -31.25 156.45
4 167.3 73.45 261.15
3 4 104.7 10.85 198.55

De donde:

µ1=µ2; µ1=µ3; µ1=µ4; µ2=µ3; µ2>µ4; µ3>µ4

c) Análisis de varianza
Origen de Grados Promedio Valor
Suma de
las de de los F Probabilidad crítico
cuadrados
variaciones libertad cuadrados para F
Entre
79895.04 3 26631.68 5.24 0.009 3.160
grupos
Dentro de
91414.05 18 5078.56
los grupos
Total 171309.09 21

De donde:
SCA=79895.04 SCT=171309.09 Fcal= 5.24
SCE=91414.05 MCE=5078.56
Aplicando Duncan:
α=0.05 k=4 f=18
𝑛
n= 1 =5.266
∑𝑘
𝑖=1𝑛𝑖

𝑀𝐶𝐸 5 78.5
√ =√ =31.0548
𝑛 5.2

r2=2.97 r3=3.12 r4=3.21


R2= (2.97) * (31.0548) =92.2327
R3= (3.12) * (31.0548) =96.8909
R4= (3.21) * (31.0548) =99.6859
Por lo tanto: µ4 =µ1 <µ3 =µ2
10. Un proceso de producción que consiste de 4 líneas está controlado si las
líneas utilizan el mismo tiempo promedio (en segundos) antes que las
unidades producidas caigan a una bandeja. Cada cierto periodo un
Ingeniero realiza el control de los tiempos de producción por línea del
producto, si una línea está fuera de control, pasa a mantenimiento. En un
reciente control de las líneas de producción se escogió una muestra
aleatoria de tiempos de producción (x) por unidad en cada línea,
observándose los datos de la tabla que sigue:
Al nivel de significación del 5%,

Muestras
Muestra Muestra Muestra Muestra
1 2 3 4
15 10 20 16
12 12 18 18
14 14 20 16
14 13 22 15
15 18 21
14 20 18
12 19
17 20
14
Además, Sx=3.199. Se supone homocedasticidad.
a) ¿Cree usted que se debería realizar el mantenimiento a alguna de las
líneas de producción?
b) Si su respuesta en el inciso a) es afirmativa, ¿a cuál de las 4 líneas se
debería realizar el mantenimiento? Aplique de rangos de Duncan.
c) ¿Cree usted que se viola el supuesto de homecedasticidad? Utilice un
paquete de cómputo para resolver este inciso.

SOLUCIÓN
a)
Hₒ=µ1=µ2=µ3=µ4

𝐻1 = ⁆µ𝑖≠µ𝑗

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 6 84 14 1.2
Columna 2 9 130 14.44 10.53
Columna 3 8 158 19.75 1.93
Columna 4 4 65 16.25 1.58
ANÁLISIS DE VARIANZA
Valor
Origen de Grados Promedio
Suma de crítico
las de de los F Probabilidad
cuadrados para
variaciones libertad cuadrados
F
Entre
157.60 3 52.53 11.14 0.00 3.03
grupos
Dentro de
108.47 23 4.72
los grupos

Total 266.07 26

De donde:
SCA=157.60 SCT=266.07
SCE=108.47 MCE= 4.72
Por lo tanto, si se debe realizar mantenimiento de las líneas de
producción.
b) Aplicando Duncan:
α=0.05 k=4 f=23
𝑛
n= 1 =6.128
∑𝑘
𝑖=1 𝑛𝑖

MCE=4.72

𝑀𝐶𝐸 4.72
√ =√ =0.8776
𝑛 .128

Entonces:
µ1=µ2 <µ4<µ3
Por lo tanto, se debe hacer mantenimiento a la línea 3.
c)
Prueba de homocedasticidad: 4.144
Grados de libertad: 3 y 23
Significancia = 0.017
11. El Decano del FACI desea estudiar el número de horas que los alumnos
que los alumnos de los ciclos: 5,6,7 y 8, utilizan los terminales de computo
de la universidad. Una muestra de usos por ciclo ha dado los siguientes
tiempos en hora mensuales:

CICLOS
C5 C6 C7 C8
35 43 28 39
33 47 30 48
30 35 39 37
40 30 46
35 27
42
a) Defina la variable dependiente y estime el efecto que produce el séptimo
ciclo.
b) Describa la regla de decisión para probar globalmente la hipótesis nula de
igualdad de las cuatro medias. ¿Cuál es la decisión estadística? Use
𝛼 = 0.05. ¿Cuánto es la probabilidad P de la prueba?
c) Si es adecuado, determine que ciclos difieren significativamente en el uso
promedio de horas por ciclo de los terminales por computo. Use Duncan
con 𝛼 = 0.05.

SOLUCIÓN
a)
i. LA VARIABLE DEPENDIENTE ES: X= número de horas que
los alumnos utilizan los terminales de computo.
∑𝑘
𝑖=1 𝜇𝑖
ii. = 𝑘
35 + 33 + 30 + 40 + 35 + 4 15
1 = = = 35.83
6 6
43 + 37 + 35 1 5
2 = = = 41.68
3 3
8 + 30 + 39 + 30 + 7 154
3 = = = 30.8
5 5
39 + 48 + 37 + 46 170
4 = = = 4 .5
4 4

35.83 + 41.68 + 30.8 + 4 .5 150.81


= = = 37.70 5
4 4

𝛼𝑖 = 𝑖

𝛼3 = 3 = 30.8 37.70 5
b)
i. Hipótesis:
𝐻: 1= 2= 3= 4=
𝐻 :∃ 𝑖 ≠
ii. Nivel de significancia:
𝛼 = 0.05.
De los datos se obtienen:
𝑋1. = 15 1 = 6
𝑋2. = 1 5 2 = 3
𝑋3∙ = 154 3 = 5
𝑋4. = 170 4 = 4
𝑋.. = 664 = 18

2 2
𝑋.. 664
= = = 4494.
18
2 2 2 2 2 2
.∑ ∑ 𝑋𝑖𝑗 = 35 + 33 + 30 + ⋯ + 37 + 46 = 5 30

2
SCT=∑ ∑(𝑋𝑖𝑗 ) = 5 30 4494. = 735.8

𝑋1. 2 215 2 125 2 154 2 17 2


SCA=∑ ∑ = + + + 4494. = 376.5
𝑛𝑖 3 5 4

SCE= = 735.8 376.5 = 349.3

𝑆𝐶𝐴 38 .3
MCA= 𝐾 = = 1 8.83
1 3

𝑆𝐶𝐸 34 .3
MCE= 𝑛 = = 4.95
𝑘 14

𝑀𝐶𝐴 128.83
FA=𝑀𝐶𝐸 = = 5.1635
24. 5

iii. Estadística y Región Crítica


La estadística es, 𝐹𝐴 = 𝑀 ⁄𝑀 𝐸 ~𝐹 3,14 . La región critica de la
prueba es: 𝑅 : 𝐹𝑎 > 𝐹 . 5,3,14 = 3.344
FUENTE GRADOS
SUMA DE MEDIAS RAZON F
DE DE
CUADRADOS CUADRATICAS CALCULADA
VARIACION LIBERTAD
HORAS 386.5 3 128.83
ERROR 349.3 14 24.95 FA=5.1635
TOTAL 735.8 17
iv. Decisión: Dado que 𝐹𝑐𝑎𝑙 = 5.163 > 3.344, se debe rechazar la
𝐻 , el factor horas influye en el uso de los terminales de
computo.
v. La probabilidad P de la prueba es,
𝑃 = 𝑃[𝐹 3,14 > 5.163] =0.013
c)
I. 𝑋 1. = 35.83 1=6
𝑋 2. = 41.68 2 =3
𝑋 3. = 30.8 3 =5
𝑋 4. = 4 .5 4 =4

𝑋 3. < 𝑋 1. < 𝑋 2. < 𝑋 4.


30.8 < 35.83 < 41.68 < 4 .5

II. 𝑝= 𝛼 𝑝, 𝑓
𝛼 = 0.05
𝑘=4
𝑓 = 14

2 = . 5 ,14 = 3.03
3 = . 5 3,14 = 3.18
4 = . 5 4,14 = 3. 7

III. Rangos mínimos significativos


𝑅𝑝 = 𝑝 √𝑀 𝐸 ⁄
𝑘
Para tamaños diferentes de muestras: = 1
∑𝑘
𝑖=𝑖 𝑛
𝑖
4 4 40
= = =
1 1 1 1 57 57
6+3+5+4 60

𝑀 𝐸 4.95
√ =√ = .434
40⁄57
𝑅2 = 3.03 × .434 = 7.375
𝑅3 = 3.18 × .434 = 7.740
𝑅4 = 3. 7 × .434 = 7.959

IV. Comparaciones múltiples de rangos de Duncan


𝑋 3. < 𝑋 1. < 𝑋 2. < 𝑋 4.
30.8 < 35.83 < 41.68 < 4 .5

𝑋 4. 𝑋 3. = 11.7 > 7.959 Significativa Duncan:


𝑋 4. 𝑋 1. = 6.67 < 7.740 No Significativa 1 = 3𝑦 1 = 2 = 4
𝑋 2. 𝑋 3. = 10.88 > 7.740 Significativa
𝑋 4. 𝑋 2. = 0.8 < 7.375 No Significativa 40
= = 4. 105
𝑋 2. 𝑋 1. = 5.85 < 7.375 No Significativa 57
𝑋 1. 𝑋 3. = 5.03 < 7.375 No Significativa
12. En EGC de la PUCP se va evaluar la efectividad de tres métodos
diferentes de enseñanza de Matemática I: El método grupal (A), el
tradicional (B) y el aprendizaje basado en problemas (ABP). Del semestre
anterior se ha escogido una muestra aleatoria de calificaciones finales
para cada método de enseñanza cuyos resultados se dan en la tabla que
sigue:

METODOS
A B ABP
132 17 10
14 16 11
12 16 15
13 17 10
12 17 14
15 13 13
11 10
14 13
11
14
13
10
a) Al nivel de significancia 𝛼 = 0.05 ¿indican los datos obtenidos que no
existen diferencias significativas entre los tres métodos de
enseñanza?.
b) Realice un ordenamiento de efectividad de los tres métodos aplicando
el método de rangos de Duncan al nivel de 𝛼 = 0.05.

SOLUCIÓN
a)
i. Hipótesis:
𝐻: 1= 2= 3=
𝐻 :∃ 𝑖 ≠
ii. Nivel de significancia:
𝛼 = 0.05.

De los datos se obtienen:


𝑋1. = 104 1 = 8
𝑋2. = 96 2 =6
𝑋3∙ = 144 3 = 1
𝑋.. = 344 = 6
2
𝑋.. 344 2
= = = 4551.3895
6
2 2 2 2 2 2
.∑ ∑ 𝑋𝑖𝑗 = 13 + 14 + 1 + ⋯ + 13 + 10 = 4678

2
SCT=∑ ∑(𝑋𝑖𝑗 ) = 4678 4551.385 = 1 6.615

𝑋1. 2 1 4 2 2 144 2
SCA=∑ ∑ = + + 4551.385 = 64.615
𝑛𝑖 8 12

SCE= = 1 6.615 64.615 = 6

𝑆𝐶𝐴 4. 15
MCA= 𝐾 = = 3 .3075
1 2

𝑆𝐶𝐸 2
MCE= = = .696
𝑛 𝑘 23

𝑀𝐶𝐴 32.3 75
FA=𝑀𝐶𝐸 = = 11.9835
2.

iii. Estadística y Región Crítica


La estadística es, 𝐹𝐴 = 𝑀 ⁄𝑀 𝐸 ~𝐹 , 3 . La región critica de la
prueba es: 𝑅 : 𝐹𝐴 > 𝐹 . 5,2,23 = 3.4
FUENTE DE SUMA DE GRADOS DE MEDIAS RAZON F
VARIACION CUADRADOS LIBERTAD CUADRATICAS CALCULADA
METODOS 64.615 2 32.3075
ERROR 62 23 2.696 FA=11.9835
TOTAL 126.615 25

iv. Decisión: Dado que 𝐹𝑐𝑎𝑙 = 11.98 > 3.4 , se debe rechazar la 𝐻 ,
el factor método influye en la enseñanza de matemática I.
v. La probabilidad P de la prueba es,
𝑃 = 𝑃[𝐹 , 3 > 11.985] = 0.000

b)
1) 𝑋 1. = 13 1 =8
𝑋 2. = 16 2 =6
𝑋 3. = 1 3 =1

𝑋 3. < 𝑋 1. < 𝑋 2.
1 < 13 < 16
2) 𝑝 = 𝛼 𝑝, 𝑓
𝛼 = 0.05
𝑘=3
𝑓= 3

2 = . 5 , 3 = .77
3 = . 5 3, 3 = .9

3) Rangos mínimos significativos


𝑅𝑝 = 𝑝 √𝑀 𝐸 ⁄
𝑘
Para tamaños diferentes de muestras: = 1
∑𝑘
𝑖=𝑖 𝑛𝑖
3 3
= = =8
1 1 1 9
+ +
8 6 1 4

𝑀 𝐸 .696
√ =√ = 0.58
8
𝑅2 = .77 × 0.58 = 1.606
𝑅3 = .9 × 0.58 = 1.693

4) Comparaciones múltiples de rangos de Duncan


𝑋 3. < 𝑋 1. < 𝑋 2.
1 < 13 < 16

𝑋 2. 𝑋 1. = 3 > 1.693 Significativa


𝑋 2. 𝑋 3. = 4 > 1.606 Significativa
𝑋 2. 𝑋 3. = 1 < 1.606 No Significativa
Duncan:
1 = 3 < 2

7
= =8
9
13. Dieciséis empleados nuevos del grupo “BANC” fueron distribuidos
aleatoriamente en 4 grupos distintos de cuatro empleados cada uno. A
cada grupo se le asignó aleatoriamente un tiempo de entrenamiento antes
de realizar cierta tarea. Los resultados de dicha tarea en tiempos
correspondientes se dan en la siguiente tabla:
ENTRENAMIENTO
Grupo 1: 1 Grupo 2: 1.5 Grupo 3: 2 Grupo 4: 2.5
hora hora hora hora
25 14 7 8
19 26 10 7
22 17 9 9
20 15 11 4
86 72 37 28
4 4 4 4

a) Antes de saber los resultados de la prueba global de comparaciones


(ANOVA) realice una prueba de significación, por partes e medias
muéstrales, utilizando intervalos de confianza al 95 % y prueba de
hipótesis con  = 0.05 Asuma los supuestos de este modelo de diseño
de experimentos si fuera necesario.
b) Al nivel de significación 0.001, ¿Se debería rechazar la hipótesis nula
que afirma que no son significativas las diferencias observadas en los
promedios de los cuatro grupos? En caso de rechazar la hipótesis nula,
¿Qué grupo realizará el trabajo en tiempo óptimo? Utilice Duncan con
 = 0.01
SOLUCIÓN

a) Las hipótesis a probar son:

1) Con respecto a tratamientos (Número de Grupo)

 𝑯𝟎=𝝉𝟏=𝝉𝟏=⋯=𝝉𝒃=𝟎 (El Número de Grupo NO influye de


manera significativa en el Tiempo de Entrenamiento)

 𝑯𝟏=𝝉𝒊≠𝟎 (Al menos un Número de Grupo influye de significativa


en la resistencia del material)

2) Con respecto a bloques (Tipo de Entrenamiento)

 𝑯𝟎=𝜷𝟏=𝜷𝟐=⋯=𝜷𝒃=𝟎 (El Tipo de Entrenamiento NO influye de


manera significativa en el Tiempo de Entrenamiento)

 𝑯𝟏=𝜷𝒋≠𝟎 (Al menos un Tipo de Entrenamiento influye de


manera significativa en el Tiempo de Entrenamiento)
3) Resultados:

4) Conclusiones:
 I) Como p valué para el Número de Grupo = 0.690 > 0.05,
Se Acepta H0 y Se concluye que el Número de Grupo NO
influye de manera significativa en el Tiempo de
Entrenamiento.

 II) Como p valué para el Tipo de Entrenamiento= 0.001 <


0.05, Se Rechaza H0 y Se concluye que al menos un Tipo
de Entrenamiento, influye de manera significativa en el
Tiempo de Entrenamiento.
b)

ENTRENAMIENTO
Grupo 1: 1 Grupo 2: 1.5 Grupo 3: 2 Grupo 4: 2.5
hora hora hora hora
25 14 7 8
19 26 10 7
22 17 9 9
20 15 11 4
Totales Xi 86 72 37 28 223
ni=r 4 4 4 4 16
Medias X 21.5 18 9.25 7 13.94
1) ordenamos las medias de menor a mayor
X4 < X3 < X2 < X1

2) se obtienen los valores en la tabla de Duncan


Dato:  = 0.05

rp = r (p,f)

r2 = r0.05(2,12) = 3.08
r3 = r0.05(3,12) = 3.77
r4 = r0.05(4,12) = 4.20
3) Se obtiene los rangos mínimos significativos:

𝑴𝑪𝑬
Rp = rp × √ 𝒏

𝑀 𝐸 6.3964
Dónde: √ =√ = 1.26455
𝑛 4

R2 = r2 × 1.26455= 3.08× 1.26455= 3.8948


R3 = r3 × 1.26455= 3.77× 1.26455= 4.7673
R4 = r4 × 1.26455= 4.20 × 1.26455= 5.3111
4) Se contrastan las diferencias entre pares de medias muestrales
comparando el rango de p medias adyacentes.
 P = 4, rango de las 4 medias adyacentes:

X1 – X4 = 21.5 – 7 = 14.50
 P = 3, rango de las 3 medias adyacentes:

X1 – X3 = 21.5 – 9.25 = 12.25

X2 – X4 = 18 – 7 = 11.00

 P = 2, rango de las 2 medias adyacentes:

X1 – X2 = 21.5 – 18 = 3.50

X2 – X3 = 18 - 9.25 = 8.75

X3 – X4 = 9.25 – 7 = 2.25

5) Comparaciones múltiples de Duncan

X1 – X4 = 14.50 > R4 = 5.3111 SIGNIFICATIVA

X1 – X3 = 12.25 > R3 = 4.7673 SIGNIFICATIVA

X2 – X4 = 11.00 > R3 = 4.7673 SIGNIFICATIVA

X1 – X2 = 3.50 < R2 = 3.8948 NO SIGNIFICATIVA

X2 – X3 = 8.75 > R2 = 3.8948 SIGNIFICATIVA

X3 – X4 = 2.25 < R2 = 3.8948 NO SIGNIFICATIVA


6) Análisis:
X4 X3 X2 X1
7 9.25 18 21.5

µ4 = µ 3 < µ2 = µ1

Por lo tanto, los grupos que realizan el trabajo en tiempos


más óptimos son el grupo 4 y el grupo 3

14. Veinte personas que experimentaban fiebres de 38 grados o más fueron


divididos en grupos de 6 personas cada uno y a cada grupo se le
administró una marca de tableta distinta para aliviar el mal. El número de
horas contadas hasta bajar la fiebre luego de administrar la tableta se da
en la siguiente tabla:
TABLETAS
TABLETA 1 TABLETA 2 TABLETA 3 TABLETA 4
5 11 6 12
3 5 4 10
8 3 7 9
4 3 5 8
2 4 6 7
6 2 2 8

a) Pruebe al nivel de significación  = 0.05, la hipótesis de que el


promedio del número de horas hasta aliviar el mal es el mismo para la
cuatro marcas de tabletas. ¿cuál es la decisión con  = 0.01?
b) Sí rechaza la hipótesis de igual efectividad. ¿Cuál de las cuatro
tabletas es la más eficaz? Use el método de Rangos de Duncan al 5%

SOLUCIÓN
a) Las hipótesis a probar son:

1) Con respecto a tratamientos (Número de Grupo)

 𝑯𝟎=𝝉𝟏=𝝉𝟏=⋯=𝝉𝒃=𝟎 (El Número de Grupo NO influye


de manera significativa en el Número de horas hasta
bajar la fiebre)

 𝑯𝟏=𝝉𝒊≠𝟎 (Al menos un Número de Grupo influye de


significativa en el Número de horas hasta bajar la
fiebre)
2) Con respecto a bloques (Tipo de Tableta)

 𝑯𝟎=𝜷𝟏=𝜷𝟐=⋯=𝜷𝒃=𝟎 (El Tipo de Tableta NO influye


de manera significativa en el Número de horas hasta
bajar la fiebre)


𝑯𝟏=𝜷𝒋≠𝟎 (Al menos un Tipo de Tableta influye de
manera significativa en el Número de horas hasta
bajar la fiebre)
3) RESULTADOS

4) CONCLUSIONES
I) Como p valué para el Número de Grupo = 0.100 >
0.05, Se Acepta H0 y Se concluye que el Número de
Grupo NO influye de manera significativa en el
Número de horas hasta bajar la fiebre.

II) Como p valué para el Tipo de Tableta = 0.005 < 0.05,


Se Rechaza H0 y Se concluye que al menos un Tipo
de Tableta, influye de manera significativa en el
Número de horas hasta bajar la fiebre.
b)

TABLETAS
TABLETA 1 TABLETA 2 TABLETA 3 TABLETA 4
5 11 6 12
3 5 4 10
8 3 7 9
4 3 5 8
2 4 6 7
6 2 2 8
Totales
28 28 30 54 140
Xi
ni=r 6 6 6 6 24
Medias
4.67 4.67 5 9 5.83
X

1) Ordenamos las medias de menor a mayor


X1 ≤ X2 < X3 < X4

2) Se obtienen los valores en la tabla de Duncan


Dato:  = 0.05

rp = r (p,f)

r2 = r0.05(2,20) = 2.95
r3 = r0.05(3,20) = 3.58
r4 = r0.05(4,20) = 3.96
3) Se obtiene los rangos mínimos significativos:

𝑴𝑪𝑬
Rp = rp × √ 𝒏

𝑀 𝐸 .3 7
Dónde: √ =√ = 1.24967
𝑛

R2 = r2 × 1.24967= 2.95× 1.24967= 3.6865


R3 = r3 × 1.24967= 3.58× 1.24967= 4.4738
R4 = r4 × 1.24967= 3.96 × 1.24967= 4.9487
4) Se contrastan las diferencias entre pares de medias
muestrales comparando el rango de p medias
adyacentes.

 P = 4, rango de las 4 medias adyacentes:


X4 – X1 = 9 – 4.67 = 4.33

 P = 3, rango de las 3 medias adyacentes:


X4 – X2 = 9 – 4.67= 4.33
X3 – X1 = 5 – 4.67 = 0.33

 P = 2, rango de las 2 medias adyacentes:


X4 – X3 = 9 – 5 = 4
X3 – X2= 5 - 4.67= 0.33
X2 – X1 = 4.67– 4.67 = 0

5) Comparaciones múltiples de Duncan

X4 – X1 = 4.33 < R4 = 4.9487 NO SIGNIFICATIVA

X4 – X2 = 4.33 < R3 = 4.4738 NO SIGNIFICATIVA

X3 – X1 = 0.33 < R3 = 4.4738 NO SIGNIFICATIVA

X4 – X3 = 4 < R4 = 4.9487 NO SIGNIFICATIVA

X3 – X2= 0.33 < R3 = 4.4738 NO SIGNIFICATIVA

X2 – X1 = 0 < R2 = 3.6865 NO SIGNIFICATIVA

6) Análisis
X2 X3 X4 X1
4.67 4.67 5 9

µ4 = µ 3 = µ2 < µ1

Por lo tanto, la tableta más eficaz seria la tableta 1


15. la estructura financiera de una firma se refiere a la forma en que se dividen
los activos de la empresa por debe y haber, y el apalancamiento financiero
se refiere al porcentaje de activos financiados por deuda. En un estudio
financiero se firma que el apalancamiento financiero puede utilizarse para
aumentar la tasa de rendimiento sobre la inversión, es decir que, los
accionistas pueden recibir rendimientos más altos con la misma cantidad
de inversión gracias a su uso. Los siguientes datos muestran las tasas de
rendimiento utilizando 3 diferentes niveles de apalancamiento financiero

𝑋: 𝑡𝑎𝑠𝑎𝑠 𝑑𝑒 𝑒𝑚𝑑𝑖𝑚𝑖𝑒𝓃𝑡𝑜
Niveles de rendimiento
Control Bajo Medio Alto
4.6 2 7 7.9
2 7.4 4.5 6.8
6.8 1.8 11.6 5.8
4.2 3.2 6 9.2
1.6 4 6.8 11
a) ¿Existen diferencias reales entre las medias de los cuatro niveles
de rendimiento al nivel de significación 1%, y al 5%?
b) ¿Son las tasas medias de rendimiento en los niveles de
apalancamiento financiero bajo, medio y alto más altas que la de
nivel de control?

SOLUCIÓN

a) Gráfica de las medias muestrales.

Interval Plot of rendimiento vs Niveles de rendimiento


99% CI for the Mean
12

10

8
rendimiento

0
A B C M
Niveles de rendimiento
The pooled standard deviation was used to calculate the intervals.

La variable dependiente es: 𝑿: 𝒕𝒂𝒔𝒂𝒔 𝒅𝒆 𝒓𝒆𝒎𝒅𝒊𝒎𝒊𝒆𝓷𝒕𝒐

Asociada a la variable dependiente o factor 𝑅 = nivel de rendimiento,


cuyos tratamientos son: control (C), Bajo (B), Medio (M) y Alto (A)

Sea 𝑖 las medias de los niveles de rendimiento


1. 𝐻𝑜 ∶ 1 = 2 = 3 = 4
𝐻1 ∶ No todas las 𝑖 son iguales
2.

2 2
𝑋.. 114.
= = = 65 .08
𝓃 0
2 2 2 2
∑ ∑ 𝑥𝑖𝑗 = 4.6 + + ⋯ + 11 = 813.8
2
= ∑ ∑ 𝑥𝑖𝑗 = 813.8 65 .08 = 161.74
2 2 2 2
𝑋𝑖. 19. + 18.4 + 35.9 + 40.7
= ∑ = = 78.4
5
𝐸= = 161.74 78.4 = 83.3

Grados
Fuente de Suma de Medias Razón F P-
de
Variación Cuadrados Cuadráticas Calculada Value
Libertad
Nivel de
rendimiento 78.42 3 26.14 5.02 0.0012
Error 83.32 16 5.2
Total 161.74 19

𝑀𝐶𝐴
La estadística de la prueba es: 𝐹𝐴 = 𝑀𝐶𝐸 ∼ 𝐹 3,16

𝑅 = { 𝐹 3,16 > 3.01 }


Dado que 𝑃[𝐹 > 5.0 ] = 0.01 > 𝛼 = 0.01, se acepta la 𝐻𝑜, y se
concluye que las medias de los cuatro niveles de rendimiento son iguales.
Interval Plot of rendimiento vs Niveles de rendimiento
95% CI for the Mean

10

7
rendimiento

1
A B C M
Niveles de rendimiento
The pooled standard deviation was used to calculate the intervals.

b)
𝐻𝑜 ∶ 1 = 2 = 3 = 4
𝐻1 ∶ No todas las 𝑖 son iguales

𝑋.. 2 114. 2
= = = 65 .08
𝓃 0
2 2 2 2
∑ ∑ 𝑥𝑖𝑗 = 4.6 + + ⋯ + 11 = 813.8

2
= ∑ ∑ 𝑥𝑖𝑗 = 813.8 65 .08 = 161.74

2 2 2 2
𝑋𝑖. 19. + 18.4 + 35.9 + 40.7
= ∑ = = 78.4
5
𝐸= = 161.74 78.4 = 83.3

Dado que 𝑃[𝐹 > 5.0 ] = 0.01 < 𝛼 = 0.05, se rechaza la 𝐻𝑜, y se
concluye que no todas las medias de los cuatro niveles de rendimiento
son iguales.
16. La importadora “Drogasa” quiere compara la eficiencia de tres medicinas
para el tratamiento de la rinitis alérgica en adultos mayores de 50 años.
Para esto diseño un experimento seleccionando 3 pacientes mayores de
50 años que sufren la enfermedad. A cada paciente escogido se le
suministro las tres medicinas A, V y C en periodos distintos del ataque de
la enfermedad registrándose el número de días que tardaron en
recuperarse. Los datos se registraron en el siguiente diseño de un factor
(medicina) aleatorizado por bloques (pacientes).

Paciente 1 Paciente 2 Paciente 3


B 18 C 15 A 16
A 23 B 25 C 16
C 17 A 28 B 22

a) Al nivel de significación 0.05 ¿es válido concluir que no existen


diferencias significativas en los tiempos promedios de días de
recuperación de los pacientes?
b) ¿Fue correcto incluir a los pacientes como una fuente de variación
en el diseño del experimento?
SOLUCIÓN

a) La variable dependiente es:


𝑿: 𝒕𝒊𝒆𝒎𝒑𝒐𝒔 𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐𝒔 𝒅𝒆 𝒅í𝒂𝒔 𝒅𝒆 𝒓𝒆𝒄𝒖𝒑𝒆𝒓𝒂𝒄𝒊ó𝒏 𝒅𝒆 𝒍𝒐𝒔 𝒑𝒂𝒄𝒊𝒆𝒏𝒕𝒆𝒔

El factor 𝑃 es pacientes
Los bloques ℬ son los tipos de medicinas
El modelo de este diseño de experimento es:

𝑋𝑖𝑗 = + 𝛼𝑖 + 𝛽𝑗 + 𝜀𝑖𝑗
Cálculos de los datos
𝑋.. 2 180 2
= = = 3600
∗𝑘 3∗3
2 2
= 𝓃 1 𝑥 = 8 4.6368 = 17
𝑘
2 2 2
1 2
67 + 65 + 48
= ∑ 𝑋𝑖. = 3600 = 7 .667
3
𝑖=1
𝑟 2 2 2
1 2
58 + 68 + 54
ℬ = ∑ 𝑋.𝑗 = 3600 = 34.667
𝑘 3
𝑖=1

𝐸= + ℬ = 64.667
Las sumas de cuadrados, los grados de libertad, los cuadrados
medios y las F calculadas se resumen minitab

Sea 𝑖 tiempos promedios de días de recuperación de los


pacientes
- Hipótesis
𝐻𝑜 ∶ 1 = 2 = 3 = 4
𝐻1 ∶ No todas las 𝑖 son iguales

- Región de rechazo
Se rechazara Ho con un nivel de significancia 𝛼 = 0.05, si 𝐹𝐴 >
𝐹 . 5,2,4
- Decisión
Dado que 𝐹𝐴 = . 5 < 𝐹 . 5,2,4 = 6.94, se debe aceptar la Ho y
concluir con probabilidad de error tipo I, 𝛼 = 0.05, los tiempos
promedios de recuperación de los pacientes son iguales; es
decir: 1 = 2 = 3 = 4
b)
- Hipótesis
𝐻𝑜 ∶ 𝛽1 = 𝛽 = 𝛽3 = 𝛽4
𝐻1 ∶ No todas las 𝛽𝑖 son iguales

- Región de rechazo
Se rechazara Ho con un nivel de significancia 𝛼 = 0.05,
si 𝐹Β > 𝐹 . 5,2,4

- Decisión
Dado que 𝐹Β = 1.07 < 𝐹 . 5,2,4 = 6.94, se debe aceptar la
Ho y concluir con probabilidad de error tipo I, 𝛼 = 0.05,
que fue correcto incluir a los pacientes como una fuente
de variación en el diseño del experimentos los tiempos
promedios de recuperación de los pacientes son iguales.
17.
18.
19. La empresa agroindustrial ARROZSA, estudia el efecto de 4 clases de
fertilizantes A, B, C y D en el rendimiento de la producción de arroz. Para
esto, diseño un experimento dividiendo el terreno del cultivo en tres
bloques 1, 2,3 con cuatro parcelas homogéneas de cada uno, asignado
aleatoriamente los fertilizantes de cada uno de los bloques para conseguir
aso un diseño de bloques completamente aleatorizado. El rendimiento,
medido en kilogramos por parcela, se da en la siguiente tabla:
1 2 3
C D B
39.9 43.4 42.7
A B D
40.1 42.9 42.9
B A C
41.1 42.2 41.4
D C A
42.1 42.3 41.9

a) Describa la variable dependiente y el modelo de este diseño de


experimento.
b) ¿proporcionan estos datos suficiente evidencia de alguna
diferencia significativa en la medida de los rendimientos de los
fertilizantes? ¿si es, así ¿cuál de los fertilizantes es el mejor?
c) Si un analista opina que fue innecesario dividir los terrenos en
bloque considerarlos como fuente de variabilidad de la producción.
Solo bastaba con comparado con el efecto de los fertilizantes sobre
la producción aplicando un diseño o factor completamente
aleatorio. estaría de acuerdo usted con el analista.
SOLUCIÓN
a) La variable dependiente es: X= efecto de fertilizantes A, B, C, D
Asociada a variable dependiente o factor a= terreno del cultivo en tres
bloques 1, 2,3 con cuatro parcelas homogéneas de cada uno.
El modelo de este ANOVA está dado por: Xij=µ+∝i+𝜀 ij i=1, 2, 3,4
Donde, 𝛼 i= µi -µ es el efecto de los fertilizantes
b) Tabla ANOVA los datos se obtienen:

Tipos
Total Xi n=r Medias 𝑋𝑖
Fertilizantes 1 2 3
A 40.1 42.2 41.9 124.2 3 41.4
42.333333
B 41.4 42.9 42.7 127 3 3
C 39.9 42.3 41.4 123.6 3 41.2
D 42.1 43.4 42.9 128.4 3 42.8
TOTAL DE 167.73333
164.5 172.8 171.9 503.2 12
BLOQUE X 3

Cálculos:
2
X. . 5032
= = = 1100.85333
n 1
ΣΣx 2 ij = 1113.76
SCT = ΣΣx^ ij C = 1 .90666667
2
Σ Xi.
SCA = C = 5.
r
SCB = Σx. J ^ /k C = 516.571666
SCE = SCT SCB + SCA = 0.534666667
varianza = 1.173333333
Otra forma de obtener SCT
SCT = n 1 Sx^ = 1 .90666667
La suma de los cuadrados de libertad, los cuadrados medios y las F calculadas
se resumen.
Grados
Suma de Medias
Fuente de de Razón F calculada
cuadrados cuadráticas
variación libertad
A=fertilizante 5.2 3 1.73333333 FA =19.4513716
Bloques 7.172 2 3.586 FB = 40.2418953
Error 0.53466667 6 0.08911111
Total 12.9066667 11

a) Se quiere contrastar la hipótesis nula:


Ho: αi = 0, para todo i=1, 2, 3,4
H1: una de las αi no es nulo
b) La región de rechazo: Se rechazará Ho el nivel de significación
α=0.05, si FA>F0.95, 3,6
Decisión: Dado que Fa=19.451, P [F (3.6)>19.451]=0.002
c) Se tiene, además: FB= 40.241 con un nivel de significación = 0.00. Se
establece que el diseño por bloques es el adecuado.

20. El gerente de ventas del grupo “Mercados” realizó un estudio estadístico


para comparar volumen de ventas dirás de sus cuatro mercados. Para
esto diseño un experimento considerando solo las ventas de los días
jueves, viernes, sábado y domingo de días de semana como una posible
fuente de variabilidad en el monto de las ventas. Los mercados 1, 2,
3,4fueron asignados al azar a los 4 jueves, 4 viernes, a los 4 sábados y
los 4 domingos consiguiendo así un diseño aleatorio por bloque. Las
ventas dirías EN MILES DE SOLES SE DAN en la tabla que siguen
Días
Jueves viernes sábado Domingo
42(3) 55(1) 61(2) 40(4)
50(1) 52(3) 44(4) 60(2)
35(4) 59(2) 46(3) 52(1)
62(2) 38(4) 54(1) 50(3)

A un nivel de significación α=0.05


a) ¿muestras estos datos que existe muestras significativas en los
volúmenes de las ventas promedios delas 4 sucursales? SI ES ASI ¿Cuál
sucursal vende más?
b) ¿ha sido adecuado considerar a los días como una fuente de variabilidad
en monto de las ventas en las 4 sucursales?
c) Si los días no considerados no afectan a la variabilidad en el monto de las
ventas en las sucursales, rediseñe el experimento sin considerar como
fue la variabilidad alas días. Con este modelo, ¿cuál de las sucursales
vende más? ¿use la prueba del rango de Duncan?
SOLUCIÓN
Tabla ANOVA

Datos Días Medias


Total. n=r
MERCADOS Jueves viernes sábado Domingo Xi.
A 126 55 122 160 463 4 115.75
B 50 156 176 120 502 4 125.5
C 140 118 138 52 448 4 112
D 124 152 54 150 480 4 120
TOTAL DE 440 481 490 482 1893 16 473.25
BLOQUE X.j
Media
bloque X.j 44 48.1 49

Cálculos.
2
X. .
C= = 3889664 . 6853637
n
𝛴𝛴𝑥 2 𝑖𝑗 = 50765
= 𝛴𝛴𝑥 2 𝑖𝑗 = 1080.01
𝛴 𝑋𝑖. ^ / 958.48
𝐵 = 1/𝐾 𝛴𝑥. 𝐽 ^ = 41.50
𝐸= 𝐵+ = 80.03
Otra forma de obtener SCT: = 1 𝑥^ = 1080.01
Las sumas de cuadrados los grados de libertad los cuadrados medios y las F
calculadas se resuman:

Fuente de Suma de Grados de medias Razón F


variación cuadrados libertad cuadráticas calculada
A=fertilizante 958.48 3 95.848183 35.9298375
bloques 41.50 9 4.61117071 1.72855248
error 80.02946 15 2.66764867
total 1080.01183 27

c) Se quiere contrastar la hipótesis nula:


Ho: αi = 0, para todo i=1, 2, 3,4, j=1,2
H1: una de las αi no es nulo
La región de rechazo: Se rechazará Ho el nivel de significación
α=0.05, si Fa > F0.95, 3,047
Decisión: Dado que Fa=19.451, P [F (3.6)>19.451]=0.002
Además: Fb= 31.56 con un nivel de significación = 0.00. con 5%
µ4<µ3<µ2<µ1.
21. El decano de estudios generales ciencias de la PUCP quiere saber si son
los niveles de evaluación de cursos y/o el conocimiento de los alumnos
que producen la variabilidad en las notas finales que obtienen. Para esto,
se diseñó un experimento de dos factores sin réplicas, escogiendo 4
alumnos al azar del tercer nivel que cursaron las materias: matemática
(M), estadística (E), física (F) y lengua (L), observando las calificaciones
siguientes:
CURSOS
Alumno M E F L
1 14 13 14 16
2 13 18 15 19
3 11 16 13 18
4 12 15 112 16

A) ¿podemos concluir que los cursos presentan la misma dificultad? Si no es


así, ¿Cuál de estos cursos es más difícil? Use Bonferroni con nivel de
confianza al menos del 95% y Duncan 5%.
B) ¿son los alumnos un factor de variabilidad significativo de las notas finales
obtenidas? Utilice el método de la probabilidad P.

SOLUCIÓN
Análisis de varianza de dos factores con una sola muestra por grupo

RESUMEN Cuenta Suma Promedio Varianza


1 4 57 14.25 1.583
2 4 65 16.25 7.583
3 4 58 14.5 9.667
4 4 55 13.75 4.250

M 4 50 12.5 1.667
E 4 62 15.5 4.333
F 4 54 13.5 1.667
L 4 69 17.25 2.250
ANÁLISIS DE VARIANZA
Origen de Grados Promedio Valor
Suma de
las de de los F Probabilidad crítico
cuadrados
variaciones libertad cuadrados para F
Filas 14.188 3.000 4.729 2.735 0.106 3.863
Columnas 53.688 3.000 17.896 10.349 0.003 3.863
Error 15.563 9.000 1.729
Total 83.438 15.000

Tenemos sacando la tabla de cuadrados:

SCA 53.688
SCB 14.188
SCE 15.563
SCT 83.438

a)

𝐻 : 𝑎𝑖 = 0
Tenemos un rango de1-4
Según la tabla 𝐹𝐴 = 10,349 con grados de libertad 3,9,
Tenemos P [F (3,9)>10,349]=0.003
Como la probabilidad es menor que 0.05 entonces se rechaza.
 UTILIZAMOS EL METODO DE BONFERRINI
Calculamos los siguientes datos necesarios:
n= 6
a= 0.013

1-(a)/2 = 0.994

n-k = 12.000
2.934
error= 2.228
Tabla de diferencias de medias
𝑥𝑖 𝑥𝑗 𝑥 𝑖-𝑥𝑗 L.inf L.sup
12.5 15.5 -3 -5.228 -0.772 xe-xm
15.5 13.5 2 -0.228 4.228 xe-xf
13.5 17.25 -3.75 -5.978 -1.522 xf-xl
17.25 12.5 4.75 2.522 6.978 ul-xm
Del cuadro calculamos que:
𝑢1 < 𝑢4 , 𝑢2 = 𝑢3 , 𝑢2 = 𝑢4 , 𝑢3 < 𝑢4 , Duncan, subconjunto homogéneo
𝑢1 con 𝑢3 , 𝑢3 con 𝑢2 y 𝑢2 con 𝑢4
b)

Tenemos una hipótesis 𝐻 : 𝑏𝑗 = 0

El rango de trabajo es de 1-4


Según la tabla 𝐹𝑏 = .735 con grados de libertad 3,9,
Tenemos P [F (3,9)>2.735]=0.106 entonces no se rechaza.
22. Cuatro operarios del grupo “construye” realizan la misma tarea de
construir paredes de ladrillo en tiempos iguales. El grupo quiere
determinar si hay alguna diferencia significativa en el metraje promedio
debido a la habilidad de los operarios y/o debido al horario. Para esto
diseñaron un análisis de varianza de dos factores sin replicas, registrando
los siguientes datos en metros cuadrado de pared construida por cada
operario en tres horas cualesquiera:
Operarios
Horas 𝑜1 𝑜2 𝑜3 𝑜4
10-11 am 3.0 3.5 3.2 3.3
2-3 pm 1.8 2.1 2.0 1.9
4-5 pm 2.4 2.5 2.4 2.4

a) Plantea la hipótesis nula y alternativa para determinar si existen


diferencias significativas en el metraje construido debido a los operarios.
b) Plantee la hipótesis nula y alternativa para determinar si existen
diferencias significativas en el metraje construido debido a los horarios.
c) Si existen diferencia en alguno de los dos factores, ¿Qué pares de niveles
de este, producen las diferencias? Utilice el método de Duncan.
Use un nivel de significancia =0.01 en todas las pruebas
SOLUCIÓN
Cálculo del análisis de datos
RESUMEN Cuenta Suma Promedio Varianza
10-11 am 4.0000 13.0000 3.2500 0.0433
2-3 pm 4.0000 7.8000 1.9500 0.0167
4-5 pm 4.0000 9.7000 2.4250 0.0025
3.0000 7.2000 2.4000 0.3600
3.0000 8.1000 2.7000 0.5200

3.0000 7.6000 2.5333 0.3733


3.0000 7.6000 2.5333 0.5033

ANÁLISIS DE VARIANZA
Origen de Suma de Grados Promedio de Probabilidad Valor crítico
las cuadrados de los F para F
variaciones libertad cuadrados
Filas 3.46166667 2 1.73083333 201 3.1803E-06 5.14325285
Columnas 0.13583333 3 0.04527778 5.25806452 0.04074402 4.75706266
Error 0.05166667 6 0.00861111

Total 3.64916667 11

Resumen del cuadro

SCA 0.136
SCB 3.462
SCE 0.052
SCT 3.649

a) Operarios(A),
Tenemos como hipótesis,𝐻 : 𝑖 donde i va de 1-4
De la tabla se ha calculado 𝐹𝐴 = 5. 58, y con grados de libertad 3,6
También calculamos P [F>5.258]=0.04, por lo cual se acepta 𝐻
b) Horas (B),
Tenemos 𝐻 : 𝑏𝑗 y tiene un rango 1, 2,3
Según la tabla tenemos 𝐹𝐴 = 10, con grado de libertad 2,6
Calculamos P [F>210]=0.000 por lo cual se rechaza 𝐻 .
c) Duncan por horas:
𝑢2 < 𝑢3 < 𝑢3
23. La firma confecciones quiere saber si las perdidas en porcentajes de
producción defectuosa producida, dependen de las líneas de producción
y/o de los tipos de materia prima de sus proveedores. Para esto, el
ingeniero a cargo del control, diseño un experimento de dos factores sin
replicas asignando a cada una de las 5 líneas de producción L 1, L2, L3, L4
y L5 una de las 4 materias primas: M1, M2, M3, M4 por día. Los porcentajes
de producción defectuosa por día se dan en la tabla que sigue:

Líneas de producción
Materias
primas L1 L2 L3 L4 L5
M1 2.3 2.5 3.0 3.2 4
M2 2.8 2.7 3.5 3.8 4.2
M3 3.2 3.0 3.7 3.9 4.3
M4 3.6 3.8 4.0 4.3 4.5

a) Defina la variable dependiente y el modelo de ANOVA.


b) ¿Son significativamente diferentes los promedios de porcentajes de
producción defectuosa debido a las líneas de producción? Si es así ¿cuál
es la línea de mayor producción defectuosa? Use el método de rangos de
Duncan.
c) ¿Son significativamente diferente los promedios de porcentajes de
producción defectuosa debido a las materias primas? Si es así, ¿Cuál es
la materia prima optima? Use Duncan.

En todas las pruebas use el nivel de significación 𝛼 = 0.05


SOLUCIÓN
a)

ANÁLISIS DE VARIANZA
Origen de Grados Promedio
las Suma de de de los Valor crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Filas SCB=2.8255 3 0.942 31.22 5.978E-06 3.490
Columnas SCA=4.718 4 1.180 39.10 8.606E-07 3.259
Error SCE=0.362 12 0.030
Total SCT=7.9055 19
b)

1. H0: 𝛼𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4,5
2. se calculan las medias y se proceden a ordenar de menor a mayor.

Líneas de
producción Promedio
L1 2.98
L2 3
L3 3.55
L4 3.8
L5 4.25

3.
𝛼 = 0.05 , k=5, f= 12
R2=r0.05 (2, 12) =3.08
R3=r0.05 (3, 12) =3.23
R4=r0.05 (4, 12) =3.33
R5=r0.05 (5, 12) =3.36
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 0.030
√ =√
4

𝑀 𝐸
√ = 0.0866

Las muestras adyacentes se tienen:


𝑅2 = 3.08 ∗ 0.0866 = 0. 68
𝑅3 = 3. 3 0.0866 = 0. 80
𝑅4 = 3.33 ∗ 0.0866 = 0. 88
𝑅5 = 3.36 ∗ 0.0866 = 0. 91
Se realiza una comparación entre las medias y los rangos mínimos:
medias comparación de rangos de Duncan
5y4 0.45 > 0.29 significativa
5y 3 0.7 > 0.29 significativa
5y 2 1.25 > 0.29 significativa
5y1 1.28 > 0.29 significativa
4y3 0.25 < 0.29 no significativa
4y2 0.8 > 0.29 significativa
4y1 0.83 > 0.29 significativa
3y2 0.55 > 0.28 significativa
3y1 0.58 > 0.28 significativa
2y1 0.02 < 0.268 no significativa

Podemos afirmar que:


𝐹𝐴 = 39.1
𝑃[𝐹 > 39.1] = 0

1 = 2 < 3 = 4 < 5

c) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor.

materias
primas Promedio
M1 3
M2 3.4
M3 3.62
M4 4.04

3.
𝛼 = 0.05 , k=4, f= 12
R2=r0.05 (2, 12) =3.08
R3=r0.05 (3, 12) =3.23
R4=r0.05 (4, 12) =3.33
R5=r0.05 (5, 12) =3.36
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 0.030
√ =√
5

𝑀 𝐸
√ = 0.077

Las muestras adyacentes se tienen:


𝑅2 = 3.08 ∗ 0.077 = 0. 37
𝑅3 = 3. 3 ∗ 0.077 = 0. 49
𝑅4 = 3.33 ∗ 0.077 = 0. 56
Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


4y3 0.42 > 0.26 significativa
4y2 0.64 < 0.26 significativa
4y1 1.04 > 0.26 significativa
no
3y2
0.22 > 0.25 significativa
3y1 0.62 > 0.25 significativa
2y1 0.40 > 0.237 significativa
Podemos afirmar que:
𝐹𝐴 = 31.
𝑃[𝐹 > 31. ]=0

1 < 2 = 3 < 4

24. Para evaluar 4 sistemas de administración de archivos de diseño un


experimento con 4 operadores de procesamiento de palabras a quienes
se les observo el tiempo X necesario, en minutos, para aprender a usar
cada uno de los siguientes sistemas de administración de archivos. Los
tiempos observados se dan en la tabla que sigue:

sistemas de administración de archivo


operadores A1 A2 A3 A4
B1 390 402 392 385
B2 380 403 394 385
B3 377 411 399 380
B4 370 404 400 384
Además, Sx= 11.5181
¿Existen alguna diferencia significativa en la media del tiempo,
a) ¿Debido a los sistemas de administración de archivos?
b) ¿Debido a los operadores?
c) ¿Cuál de los sistemas es el más adecuado? Use el método de rangos de
Duncan.

En todas las pruebas use el nivel de significación 𝛼 = 0.05


SOLUCIÓN
Realizamos el cuadro ANOVA:

ANÁLISIS DE VARIANZA
Origen de Grados Promedio Valor
las Suma de de de los crítico
variaciones cuadrados libertad cuadrados F Probabilidad para F
Filas SCB= 18.5 3 6.167 0.185 0.904 3.863
SCA=
Columnas 1671.5 3 557.167 16.715 0.001 3.863
Error SCE= 300 9 33.333
Total SCT= 1990 15

A) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor:

Sistemas de
administración Promedio
de archivos
A1 379.25
A2 383.5
A3 396.25
A4 405

3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 33.333
√ =√
3

𝑀 𝐸
√ = 3.33

Las muestras adyacentes se tienen:


𝑅2 = 3. 0 ∗ 3.33 = 10.66
𝑅3 = 3.34 ∗ 3.33 = 11. 1
𝑅4 = 3.41 ∗ 3.33 = 11.36
Se realiza una comparación entre las medias y los rangos mínimos:

Medias Comparación de rangos de Duncan


no
4y3
8.75 < 11.36 significativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36 significativa

Podemos afirmar que:


𝐹𝐴 = 16.715
𝑃[𝐹 > 16.715] = 0.001

1 = 4 < 3 = 2
A) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias:

Sistemas de
administración Promedio
de archivos
A1 379.25
A2 405
A3 396.25
A4 383.5

3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 33.333
√ =√
3

𝑀 𝐸
√ = 3.33

Las muestras adyacentes se tienen:


𝑅2 = 3. 0 ∗ 3.33 = 10.66
𝑅3 = 3.34 ∗ 3.33 = 11. 1
𝑅4 = 3.41 ∗ 3.33 = 11.36
Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


no
4y3
8.75 < 11.36 significativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36 significativa
Podemos afirmar que:
𝐹𝐴 = 16.715
𝑃[𝐹 > 16.715] = 0.001

1 = 4 < 3 = 2

a) 1. H0: 𝛼𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias y se proceden a ordenar de menor a mayor:

Sistemas de
administración Promedio
de archivos
A1 379.25
A2 383.5
A3 396.25
A4 405

3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 33.333
√ =√
3

𝑀 𝐸
√ = 3.33

Las muestras adyacentes se tienen:


𝑅2 = 3. 0 ∗ 3.33 = 10.66
𝑅3 = 3.34 ∗ 3.33 = 11. 1
𝑅4 = 3.41 ∗ 3.33 = 11.36
Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


no
4y3
8.75 < 11.36 significativa
4y2 21.50 > 11.36 significativa
4y1 25.75 > 11.36 significativa
3y2 12.75 > 11.12 significativa
3y1 17.00 > 11.12 significativa
no
2y1
4.25 < 10.36 significativa

Podemos afirmar que:


𝐹𝐴 = 16.715
𝑃[𝐹 > 16.715] = 0.001

1 = 4 < 3 = 2

b) 1. H0: 𝛽𝑖 = 0 , 𝑝𝑎 𝑎 𝑖 = 1, ,3,4
2. se calculan las medias:

Operadores ´Promedio

O1 389.5
O2 390.5
O3 391.75
O4 392.25

3. 𝛼 = 0.05 , k=4, f= 9
R2=r0.05 (2, 9) =3.20
R3=r0.05 (3, 9) =3.34
R4=r0.05 (4, 9) = 3.41
Se calculan los rangos mínimos significativos:

𝑀 𝐸
𝑅𝑝 = 𝑝 ∗ √

𝑀 𝐸 33.333
√ =√
3

𝑀 𝐸
√ = 3.33

Las muestras adyacentes se tienen:


𝑅2 = 3. 0 ∗ 3.33 = 10.66
𝑅3 = 3.34 ∗ 3.33 = 11. 1
𝑅4 = 3.41 ∗ 3.33 = 11.36
Se realiza una comparación entre las medias y los rangos mínimos:

medias comparación de rangos de Duncan


no
4y3
0.50 < 11.36 significativa
no
4y2
1.75 < 11.36 significativa
no
4y1
2.75 < 11.36 significativa
no
3y2
1.25 < 11.12 significativa
no
3y1
2.25 < 11.12 significativa
no
2y1
1.00 < 10.36 significativa

Podemos afirmar que:


𝐹𝐴 = 0.185
𝑃[𝐹 > 0.185] = 0.904

1 = 2 = 3 = 4

c) El más adecuado sería el sistema A4.


25. La empresa de “Torneados metálicos” diseño un experimento de dos
factores con tres replicas para determinar si existen diferencias
significativas en la cantidad de piezas producidas debido a las máquinas
y debido a los operarios. Se emplearon dos operarios y cada uno de ellos
utilizo cada una de las tres máquinas para procesar el producto en tres
periodos iguales de tiempo.
Los valores promedios de las cantidades de piezas producidas para cada
combinación de los niveles de los factores se dan en la tabla que sigue:

MAQUINAS
OPERARIOS
M1 M2 M3
O1 102.33 130.00 114.33
O2 114.00 142.67 126.67

Y la tabla ANOVA resultante es:


Fuente de Sumas de Grados de Medias Estadísticas
variabilidad cuadrados Libertad cuadráticas F
Maquinas 2392.33
Operario 672.22
Interacción 0.778
Error
Total 3190.000

a) Realice una grafica lineal de medias y analice descriptivamente la


existencia podría o no de interacción entre los dos factores considerados.
b) ¿Es significativa la interacción entre los factores considerados? ¿Qué
puede decir de los efectos de las máquinas y de los operarios?
c) ¿Qué maquina y operario tienen mayor rendimiento? Utilice el método de
rangos de Duncan donde sea posible aplicar.
Aplique el nivel de significación α=5% en todas las pruebas.
SOLUCIÓN
a) Gráfica lineal de medias para la interacción entre los dos factores
considerados.

Interacción de Medias
160
140
120
100
80
60
40
20
0
M1 M2 M3
MAQUINAS

O1 O2

Según la gráfica nos podemos dar cuenta de que descriptivamente no


existe ningún tipo de interacción entre los operarios y sus máquinas
correspondientes.
b)
Antes de realizar el proceso para elaborar la tabla ANOVA, describiremos
los siguientes datos:
𝑦. . = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑡𝑜𝑡𝑎𝑙
𝑦𝑖. = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑓𝑖𝑙𝑎
𝑦̂. 𝑗 = 𝑝 𝑜𝑚𝑒𝑑𝑖𝑜 𝑜𝑙𝑢𝑚 𝑎
𝑗 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑢 𝑎 𝑜𝑙𝑢𝑚 𝑎
𝑖 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑢 𝑎 𝑓𝑖𝑙𝑎
𝑖𝑗 = #𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒 𝑎𝑑𝑎 𝑒𝑙𝑑𝑎
𝑎 = #𝑓𝑖𝑙𝑎𝑠
𝑏 = # 𝑜𝑙𝑢𝑚 𝑎𝑠
𝑁 = #𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
Previo a pasar al desarrollo realizaremos la prueba de hipótesis
H0= No hay interacción entre los operarios con sus respectivas
máquinas.
H1= Existe interacción entre los operarios con sus respectivas
máquinas.
N= 18
n= 3
n i= 9
n j= 6
y..= 121,667

Donde:
N= # de datos * # de réplicas
n= # de réplicas
ni= # de réplicas * # de filas
nj=# de réplicas * # de columnas

Ahora teniendo en cuenta la tabla de valores de las cantidades producidas


por los dos factores, procedemos a sacar los promedios:
_Para los operarios:
Promedio de O1 𝑦̂1. = 115,553
Promedio de O2 𝑦̂ . = 127,78

_Para las máquinas:


Promedio de M1 𝑦.
̂1 = 108,165
Promedio de M2 𝑦.
̂ = 136,335
Promedio de M3 𝑦.
̂3 = 120,5

La tabla ANOVA cuenta con todas las sumas de cuadrados menos con la
del ERROR, entonces:
+ 𝐵+ 𝐸+ 𝐵=
𝐸 = 1 4.67
La tabla ANOVA quedaría de la siguiente manera:
Fuente de Sumas de Grados de Medias Estadísticas
variabilidad cuadrados Libertad cuadráticas F
Maquinas 2392,33 2 1196,165 115,1340
Operario 672,22 1 672,22 64,7029
Interacción 0,778 2 0,389 0,0374
Error 124,67 12 10,3893
Total 3190 17

Para realizar el contraste de hipótesis, para ello recurrimos a la tabla de


distribución F:
Fcritico = F 𝑔𝑙𝑓𝑎𝑐𝑡𝑜𝑟 , 𝑔𝑙𝑒𝑟𝑟𝑜𝑟 , 𝛼
Máquinas 3.89
Operario 4.75
Interacción 3.89

Como: Fmáquinas>Fcrítico, rechazamos la H0


Como: Foperario>Fcrítico, rechazamos la H0
Como: Finteracción<Fcrítico, aceptamos la H0

Después de haber realizado el contraste de la hipótesis concluimos en


que no existe interacción entre observadores y máquinas, a un nivel de
significancia del 5%
c)
Primero ordenamos de forma creciente las medias
𝑋1 < 𝑋3 < 𝑋2
108.165 < 1 0.5 < 136.335
Con la tabla Duncan obtenemos:

𝑝 = 𝛼 𝑝, 𝑓
2 = , 5 ,1 3,08

3 = , 5 3,1 3,23
Los rangos mínimos y significativos:

𝑀 𝐸
𝑅𝑝 = 𝛼 ∗√
6

R2= 4,0529
R3= 4,2503

Contrastamos las diferencias entre pares de medias muéstrales comparando el


rango de medias adyacentes con el valor critico de mínimo significación.
Para p=3 𝑋2 𝑋1 = 28,17 > 𝑅3 = 4, 503 𝑠𝑖𝑔 𝑖𝑓𝑖 𝑎𝑡𝑖𝑣𝑎

Para p=2 𝑋2 𝑋3 = 15,835 > 𝑅2 = 4,0,5 9 𝑠𝑖𝑔 𝑖𝑓𝑖 𝑎𝑡𝑖𝑣𝑎


𝑋3 𝑋1 = 12,335 > 𝑅2 = 4,0,5 9 𝑠𝑖𝑔 𝑖𝑓𝑖 𝑎𝑡𝑖𝑣𝑎

Entonces concluimos en que:


1 < 3 < 2

Completamos la información con el siguiente cuadro:

Rendimiento de las Máquinas


160
140
120
100
80
60
40
20
0
1 2 3

PROMEDIO M1
26. Para seleccionar la mejor semilla de maíz y el mejor fertilizante la empresa
“AGROSA” diseñó un experimento de dos factores con cuatro réplicas en
terrenos de igual fertilidad. El terreno se dividió en 24 pares iguales. Cada
combinación de tipo de semilla y tipo de fertilizante se asignaron a cuatro
pares iguales. Los rendimientos obtenidos en kilogramos se dan en la
tabla siguiente:

Semilla de Maíz
Fertilizante
A1 A2 A3
B1 35 33 38 37 33 3
30 5 35 36 3 34
B2 31 30 40 39 36 35
3 9 43 4 40 38

a) Realice una gráfica de medias y el análisis descriptivo de interacción.


b) ¿es significativa la interacción observada entre los tipos de maíz y tipos
de fertilizante? Utilice el método de la probabilidad P.
c) ¿Se debería seguir analizando el efecto de los dos factores?

SOLUCIÓN
a) gráfica de medias y el análisis descriptivo de interacción

INTERACCION ENTRE MAIZ Y FERTILIZANTE


180
160
140
120
100
80
60
40
20
0
A1 A2 A3
Fertilizante Semilla de Maíz

Series1 Series2 Series3 Series4

De la gráfica observamos claramente que si existe interacción entre


ambos factores
b)
Primero realizamos la prueba de hipótesis:
H0= No hay interacción entre los cultivos de fertilizante y maíz.
H1= Existe interacción entre los cultivos de fertilizante y maíz.
Proponemos un cuadro estadístico descriptivo para facilitarnos el manejo
de los datos:
FACTOR B FACTOR A TOTAL MEDIA N

A1 B1 150 37,5 4
B2 122 30,5 4
Total 272 34 8
A2 B1 146 36,5 4
B2 164 41 4
Total 310 38,75 8
A3 B1 131 32,75 4
B2 149 37,25 4
Total 280 35 8
TOTAL B1 427 35,5833 12
B2 435 38,5833 12
Total 862 37,0833 24

Cuya desviación estándar va a ser igual a: 3,90001858


Con los datos obtenidos, comenzamos a realizar los cálculos para la tabla
ANOVA:
 Primero para el SST:
2
= 𝑁 1 × 𝑥 349,833333

2
𝑋∙∙∙
= 30960,1667
𝑎𝑏

 Luego empezamos con las sumas de cuadrados para los factores:


𝑘
1 2 100,3333
= ∑ 𝑋𝑖∙∙
×
𝑖=1
𝑟 2,6667
1 2
𝐵= ∑ 𝑋∙𝑗∙
𝑘×
𝑖=1

 Lo mismo hacemos con la Interacción:

2 3 2
𝑋𝑖𝑗∙ 176,3333
𝐵 = ∑∑ + + 𝐵 =
𝑖=1 𝑗=1

 Para el error tenemos que la SSE es igual a:


+ 𝐵+ 𝐵 = 𝐸 70,5

Con los datos anteriores ya podemos completar la tabla ANOVA para su


respectivo análisis:

Fuente de Sumas de Grados de Medias Estadísticas


variabilidad cuadrados Libertad cuadráticas F
S. MAIZ 100,3333 2 50,1667 12,8085
FERTILIZANTE 2,6667 1 2,6667 0,6809
INTERACCION 176,3333 2 88,1667 22,5106
ERROR 70,5 18 3,9167
TOTAL 349,8333 23

Para realizar el contraste de hipótesis, para ello recurrimos a la tabla de


distribución F:
Fcritico = F 𝑔𝑙𝑓𝑎𝑐𝑡𝑜𝑟 , 𝑔𝑙𝑒𝑟𝑟𝑜𝑟 , 𝛼
FS. Maíz 3.55
Ffertilizante 4.41
Finteracción 3.55
Ahora ya podemos realizar el contraste de hipótesis:
S. MAIZ Como: Fmaiz>Fcrítico, entonces: Rechazamos Ho
FERTILIZANTE Como: Ffertilizante<Fcrítico, entonces: Aceptamos Ho
INTERACCION Como: Fmaiz>Fcrítico, entonces: Rechazamos Ho
c)
Ya no sería necesario realizar un análisis de rango para la comprobación
del contraste de hipótesis, ya que tanto gráfica como analíticamente se ha
comprobado la validez de la hipótesis.
27. El grupo de mercados ¨P&C¨ quiere saber el efecto que la publicidad y la
promoción pueden ejercer sobre la venta de uno de sus productos de
consumo popular. Las ventas en miles de dólares durante un mes, de 16
mercados escogidos al azar en un experimento diseñado en dos factores
con cuatro replicas se dan en la tabla que sigue:
publicidad
Promoción Con propaganda Sin propaganda
Con 110.5 105.4 80.5 78.6
descuento 90.7 95.8 60.8 65.8
Sin 50.4 45.8 35.8 40.1
descuento 40.6 44.9 20.7 25.7

a) Realice una gráfica de medidas y el análisis de interacción.


b) ¿es significativa la interacción observada?
c) Si no existe interacción entre promoción y publicidad, pruebe si
existe efecto de los factores en forma independiente. Si existe
efecto alguno de los factores sobre las ventas, haga un análisis
de los mejores modos de venta.

SOLUCIÓN
a) Grafico:

120
Gráfica de medidas
100 con propaganda sin propaganda

80

60

40

20

0
0 1 2 3 4 5 6
El grafico podemos observar que no existe una intersección entre
las líneas por lo tanto concluimos no hay indicios de interacción

b) De la siguiente tabla obtenemos los datos

= 1 17 .4 9
= 1938. 01
𝐸 = 8080 3
𝐵 = 99 0.801
Interacción entre promoción y publicidad:

𝐻 : 𝛼, 𝛽 , = 0
𝐻𝑎 : ∃ 𝛼, 𝛽 , ≠ 0

Efecto alguno de los factores sobre las ventas:

𝐹𝐴∗𝐵 = 3.047

Análisis de los mejores modos de venta.

𝐻 : 𝛼1 = 0
𝐹𝑎 = 8.777
𝐹𝑏 = 136.905
28. Con el fin de estudiar los efectos de tipo de carga y de las empresas que
las transportan sobre el tiempo de reparto terrestre de cargas, la
distribuidora ¨DOCASA¨ diseño un modelo de análisis de varianza de dos
vías con réplicas. Cada una de las tres empresas terrestres: 𝐵1, , 𝐵2 𝑌 𝐵3
transporto una misma distancia cada uno de los tipos de carga 1, =
𝐿𝑖𝑞𝑢𝑖𝑑𝑜 , 2 = 𝑜𝑙𝑖𝑑𝑜 , repitiéndose el experimento tres veces. Se
registraron los siguientes tiempos en minutos.
Tipo de carga
1 2
140 130
𝐵1 145 128
135 132
135 125
TRANSPORTE 𝐵2 136 126
134 124
90 83
𝐵3 92 82
88 84

Asumiendo que los factores en estudio son de efectos fijos.


a) Realice una gráfica de medidas y el análisis descriptivo de la
interacción.
b) ¿Es significativa la interacción observada entre tipo de carga y de
transporte?
c) ¿son significativos los efectos de los tipos de carga? Si es así,
¿Cuál de los dos tipos de carga llega primero?
d) ¿son todos significativos los efectos de las empresas? Si fuera así
determine la empresa de transporte que utiliza el menor tiempo
promedio
SOLUCIÓN

a) Grafico:

Gráfica de medidas
tipo de carga A1 tipo de carga A2

160

140

120

100

80

60

40

20

0
0 1 2 3 4 5 6 7 8

El grafico podemos observar que no existe una intersección entre


las líneas por lo tanto concluimos no hay indicios de interacción

b) De la siguiente tabla obtenemos los datos

= 8984.5
= 364.5
𝐸=7
𝐵=9
Interacción entre promoción y publicidad:

𝐻 : 𝛼, 𝛽 , = 0
𝐻𝑎 : ∃ 𝛼, 𝛽 , ≠ 0

Efecto alguno de los factores sobre las ventas:

𝐹𝐴∗𝐵 = 0.75

Análisis de los mejores modos de venta.

𝐻 : 𝛼1 = 0
𝐹𝑎 = 60.75
𝐹𝑏 = 711.58

29. La empresa "BATERIAS" estudia el diseño de una batería que no sea


sensible a la temperatura ambiente. Para esto aprueba 3 materias
distintas A1, A2, A3, bajo tres niveles de temperatura ambiente B1=Baja,
B2=Media, B3=Alta, aplicando un diseño de experimento de clasificación
de dos factores con 6 réplicas. La duración de las baterías, en niveles de
horas, se da en la tabla adjunta:

MATERIALES USADO EN LAS BATERIAS


NIVELES DE T°
A1 A2 A3
1.1 0.9 1.2 1.3 1.1 0.9
B1 1.2 1.3 1.1 1.3 1.2 1.4
0.7 1 0.9 1.2 1.7 1.3
1.4 1.3 1.5 1.6 1.7 1.6
B2 1.5 1.2 1.4 1.3 1.2 1.5
1.3 1.4 1.3 1.5 1.7 1.4
0.9 1.2 1.1 0.9 0.7 1
B3 1.1 1 1.2 1.3 1.2 0.9
1.2 1.1 1 1.2 0.9 1.1

a) Defina la variable dependiente y el modelo de este diseño de


experimento
b) Realice el análisis descriptivo de la interacción.
c) ¿Es significativa la interacción muestral observada entre los factores:
Materiales y Temperaturas
d) ¿Son significativos los efectos debido a los materiales utilizados en las
baterías?
SOLUCIÓN
a)
La variable dependiente es X=Diseño de una batería que no sea sensible a la
temperatura ambiente
El modelo del ANOVA de dos factores con replicas es:

𝑋𝑖𝑗𝑘 = 𝑢 + 𝛼𝑖 + 𝛽𝑗 + 𝛼𝛽 𝑖𝑗 + ԑ𝑖𝑗𝑘

Donde i=1,2,3, j=1,2,3, k=1,2,3,4,5,6


b)
FACTOR FACTOR
A B TOTAL MEDIA DESV.ESTAND. N
B1 6.2 1.0333 0.21602469 6
A1 B2 8.1 1.35 0.104880885 6
B3 6.5 1.0833 0.116904519 6
TOTAL 20.8 3.4667 0.437810094 18
B1 7 1.1667 0.150554531 6
A2 B2 8.6 1.4333 0.121106014 6
B3 6.7 1.1167 0.147196014 6
TOTAL 22.3 3.7167 0.418856559 18
B1 7.6 1.2667 0.27325202 6
A3 B2 9.1 1.5167 0.194079022 6
B3 5.8 0.9667 0.175119007 6
TOTAL 22.5 3.75 0.642450049 18
B1 20.8 3.4667 0.639831241 6
TOTAL B2 25.8 4.3 0.420065921 6
B3 19 3.1667 0.439219541 6
TOTAL 65.6 10.933 1.499116703 18

 SCA=0.096

 SCB=1.379

 SCI=0.226

 SCE=1.367

 SCT=3.068

 G. L=2,2,4,45,53
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Materiales 1.379259259 2 0.68962963 22.70731707 1.52023E-07 3.204317292
Niveles de temperatura 0.095925926 2 0.047962963 1.579268293 0.21733653 3.204317292
Interacción 0.226296296 4 0.056574074 1.862804878 0.133552632 2.578739184
Dentro del grupo 1.366666667 45 0.03037037

Total 3.068148148 53

c)
Interacción:
𝐻𝑜 𝛼𝛽 𝑖𝑗 = 0 ; 𝑖 = 1, ,3 𝑗 = 1, ,3
𝐻𝑖: 𝑒𝑥𝑖𝑠𝑡𝑒 𝛼𝛽 𝑖𝑗 ≠ 0 ; 𝑖 = 1, ,3 𝑗 = 1, ,3
𝐹𝐴∗𝐵 = 1.863 ; 𝐼𝐺𝑁𝐼𝐹𝐼 𝑁 𝐼 = 0.134
No hay interacción muestral entre los factores: Materiales y temperatura.
d)
MATERIALES (A):
𝐻𝑜: 𝛼 = 0 𝑜𝑙𝑢𝑚 𝑎𝑠 ; 𝐹𝐴 = 1.579
𝐼𝐺𝑁𝐼𝐹𝐼 𝑁 𝐼 = 0. 17
Se acepta Ho
30. Con el fin de estudiar los efectos de tipo de carga y los efectos que puedan
ocasionar las empresas que la transportan sobre el tiempo de reparto
terrestre de cargas se diseñó un modelo de análisis de varianza con los
tipo de cargas A1=Liquido ,A2= sólido y tres empresas de transporte
terrestre B1,B2,B3,.Cada empresa transporto una misma distancia cada
tipo de carga repitiéndose el experimento tres veces .Se registraron los
tiempos en minutos y se procesaron obteniendo las siguientes
estadísticas:
NÚMERO DE
TIPO DE CARGA TRANSPORTE DATOS MEDIAS
A1 B1 3 140
A1 B2 3 135
A1 B3 3 90
A2 B1 3 130
A2 B2 3 125
A2 B3 3 83
Desviación estándar de la variable dependiente= 22.9891279

a) Defina el modelo estadístico de este problema de ANOVA


b) ¿Existe interacción significativa entre los factores considerados? ¿Qué
puede decir de los efectos de tipos de carga y de las empresas de
transporte?

SOLUCIÓN
a) Tabla ANOVA

F.DE SUMAS MEDIAS ESTADISTICA


VARIABILIDAD CUADRADOS G.L CUADRATICAS F
TIPO DE
CARGA 364.5 1 364.5 60.75
TRANSPORTE 8539 2 4269.5 711.5833333
INTERACCION 9 2 4.5 0.75
ERROR 72 12 6
TOTAL 8984.5 17

b)
HIPOTESIS
Se contrasta la hipótesis nula

𝐻𝑜: 𝛼𝛽 𝑖𝑗 = 0 No existe interacción; para i=1,2 ; j=1,2,3


𝐻𝑜: 𝛼𝛽 𝑖𝑗 ≠ 0 para algún i≠ j (si existe interacción)

Estadística y región critica:


F=MCAB/MCE= 0.75
RC= {F (2,12)>3.89}

Decisión:
Dado que 𝐹𝐴∗𝐵 =0.75<3.89 no deberíamos rechazar Ho al nivel de significación
α=0.05. Esto es la interacción observada no es significativa.
Por tanto, no existe interacción entre los factores CARGAS y EMPRESAS DE
TRANSPORTE TERRESTRE.
31. Para producir una prenda la firma de confecciones “JEANS” dispone de 4
máquina de marcas distintas ( 𝑖 que se supone producen con igual
velocidad, de 3 fuentes distintas de materia prima 𝐵𝑖 que se supone de
igual calidad.

Materia Máquinas
Prima
A1 A2 A3 A4

6 4 5 3
B1 5 3 5 4

2 3 1 2
B2 1 2 2 2

5 3 3 4
B3 4 4 4 3

Para determinar si el porcentaje de producción defectuosa es la misma para las


máquinas y para las materias primas, se realizó un experimento que consistió en
operar cada marca de máquina con cada tipo de material durante 2 días
resultando. Los porcentajes de unidades defectuosas producidas se dan en la
tabla adjunta.
a) Defina la variable dependiente y el modelo de este diseño de experimento.
b) ¿Existe efecto de interacción significativa entre máquinas y materias
primas?
c) Si no existe interacción entre máquinas y materias primas, ¿es la calidad
del producto igual debido a las máquinas? ¿Es la calidad del producto
igual debido a las materias primas?
d) ¿Cuál de estas materias primas es la óptima? Aplique el método de
comparaciones de Duncan. Aplique el nivel de significación α=5% en
todas las pruebas.

SOLUCIÓN

a) La producción de la máquina es la variable dependiente X, pues


depende de la materia prima, el modelo a usar en este experimento es
el modelo de clasificación a dos factores con repetición.
Factor A Factor B Total Media Desviación Estándar N
A1 B1 11 5.5 0.707 2
B2 3 1.5 0.707 2
B3 9 4.5 0.707 2
Total 23 3.833 1.941 6
A4
A2 B1 7 3.5 0.707 2
3 B2 5 2.5 0.707 2
4 B3 7 3.5 0.707 2
Total 19 3.167 0.753 6
2 A3 B1 10 5 0.000 2
2 B2 3 1.5 0.707 2

4 B3 7 3.5 0.707 2
Total 20 3.333 1.491 6
3
A4 B1 7 3.5 0.707 2
B2 4 2 0.000 2
B3 7 3.5 0.707 2
Total 18 3 0.894 6

Total B1 35 4.375 1.061 8


B2 15 1.875 0.641 8
B3 30 3.75 0.707 8
80 3.333 1.341 24

Realizamos los cálculos:


2 2
= 𝑎𝑏 1 𝑋 ⇾ = 80 1 * 1.341 = 41.333
2
𝑋 80 2
= = = 66.67
𝑎𝑏 ∗3∗4
1
= ∑𝑎𝑖=1 𝑋𝑖.. = .333
𝑏
1
𝐵= ∑𝑏𝑖=1 𝑋. 𝑗. = 27.083
𝑎

𝑎 𝑏
1 2
𝐵= ∑ ∑(𝑋𝑖𝑗. ) 𝐵 = 6.917
𝑖=1 𝑖=1

𝐸= + 𝐵+ 𝐵 = 5.00
Fuente de Grados de Medias
variabilidad Suma de cuadrados libertad Cuadráticas F calculada
A =Máquina 2.333 3 0.778 1.867
B= Materia Prima 27.083 2 13.542 32.5
AXB Interacción 6.917 6 1.153 2.767
Error 5.00 12 0.417
Total 41.333 23

Contraste de Interacción:
Hipótesis:
Se contrasta la hipótesis nula:
𝐻𝑂 : 𝛼𝛽 𝑖𝑗 =0

Contra:
𝐻1 : 𝛼𝛽 𝑖𝑗 ≠ 0 𝑝𝑎 𝑎 𝑎𝑙𝑔ú 𝑖 ≠ 𝑗 𝑠𝑖 𝑒𝑥𝑖𝑠𝑡𝑒 𝑖 𝑡𝑒 𝑎 𝑖ó

Estadística y región crítica:


𝑀 𝐵
𝐹= ~ 𝐹 6, 1
𝑀 𝐸
𝐹 = .767
𝑅. = {𝐹 . 5 6,1 > 3.00}
Dado que 𝐹𝐴.𝐵 = .767 < 3.00 debemos aceptar la hipótesis nula al nivel de
significación α=0.05. La interacción observada no es significativa. Por lo tanto,
no existe interacción entre los factores máquina y materia prima.
Hacemos comparaciones múltiples por el método de Duncan
Ordenamos las medias de menor a mayor
𝑋4<𝑋2<𝑋3 < 𝑋1
18 < 19 < 20 < 23
Obtenemos los rangos Estudentizados:
- α = 0.05
- 𝑓=1
- 𝑘=4

2 = . 5 ,1 = 3.08 3 = . 5 3, 1 = 3. 3
4 = . 5 4, 1 = 3.31

Calculamos los rangos mínimos significativos

𝑀𝐶𝐸
𝑅𝑝 = 𝑝 ∗ √ 𝑛

𝑅2 = 3.08 ∗ 0.457 = 1.406


𝑅3 = 3. 3 ∗ 0.45 = 1.476
𝑅4 = 3.31 ∗ 0.457 = 1.513

El rango de las 4 medias adyacentes es 𝑋1 𝑋4 = 5 dado que 1.513 < 5


concluimos que 𝑋1 y 𝑋4 son significativamente diferentes.
Para 𝑝 = 3 los rangos de 3 medias adyacentes es 𝑋1 𝑋2 = 4 y 𝑋3 𝑋4 = al
comparar estos dos rangos con 𝑅3 se concluye que 𝑋1 𝑦 ̅𝑋2 son
significativamente diferentes
Para 𝑝 = los rangos de 2 medias adyacentes 𝑋1 𝑋3 = 3 , 𝑋3 𝑋2 = 1,
𝑋2 𝑋4 = 1. Al comparar estos tres rangos con 𝑅2 concluimos que 𝑋1 𝑦 ̅𝑋3
Al nivel de significación global de 0.05, podemos afirmar que:

2 < 3 = 1 = 4

La materia prima adecuada es la B2.


32. El analista estadístico del grupo “Estudios del mercado” quiere
comprobar si la región geográfica y/o los ingresos familiares influyen en
las puntuaciones obtenidas en una prueba de razonamiento. Para esto,
diseñó un experimento de dos factores con réplicas eligiendo al azar de
cada una de 4 regiones, 6 jefes de familia con ingresos bajos, 6 con
ingresos medios y 6 con ingresos altos. Los puntajes obtenidos en la
prueba de razonamiento por las 72 personas se dan en la tabla que sigue:

Región Ingresos
Geográfica Alto Medio Bajo
10 15 16 17 14 12
Norte 16 14 18 15 13 11
14 12 16 12 09 12
13 12 15 18 13 10
Sur 17 16 17 16 15 11
15 11 15 13 12 09
14 16 17 17 11 12
Centro 14 10 19 11 15 08
17 13 17 18 16 13
15 14 18 12 12 13
Oriente 14 13 17 20 15 08
16 11 16 15 14 11

a) Analice, descriptivamente, si existe o no, indicios de interacción entre


ingresos y regiones.
b) Defina la variable dependiente y el modelo de este diseño de experimento.
c) Pruebe si es o no significativa la interacción muestral entre los factores
región e ingresos.
d) Si rechaza la hipótesis que afirma la existencia de interacción entre los
factores región e ingresos, ¿produce algún efecto en la variabilidad de la
prueba de razonamiento los niveles de ingresos familiares?, ¿y los niveles
de las regiones?. Si su respuesta es afirmativa, ¿cuál de los niveles
produce el mínimo efecto?. Aplique el método de rangos de Duncan.
Tome las decisiones estadísticas con probabilidad de error tipo I igual a
0.05 en todos los casos.
SOLUCIÓN

a) Los ingresos son la variable dependiente X, el modelo a usar en este


experimento es el modelo de clasificación a dos factores con
repetición.
b)

Desviación
Factor A Factor B Total Media Estándar N
A1 B1 81 13.50 2.168 6
B2 84 14.00 2.366 6
B3 84 14.00 2.449 6
B4 83 13.83 1.722 6
Total 332 13.83 2.057 24
A2 B1 94 15.67 2.066 6
B2 94 15.67 1.751 6
B3 99 16.50 2.811 6
B4 98 16.33 2.733 6
Total 385 16.04 2.255 24
A3 B1 71 11.83 1.722 6
B2 70 11.67 2.160 6
B3 75 12.50 2.881 6
B4 73 12.17 2.483 6
Total 289 12.04 2.216 24

Total B1 246 13.67 2.473 18


B2 248 13.78 2.602 18
B3 258 14.33 3.068 18
B4 254 14.11 2.826 18
Total 1006 13.97 2.706 72

Realizamos los cálculos:


2 2
= 𝑎𝑏 1 𝑋 ⇾ = 7 1 * .706 = 519.94
2 2
𝑋 1006
= = = 14056.06
𝑎𝑏 7
1
= ∑𝑎𝑖=1 𝑋𝑖.. = 19 .694
𝑏
1
𝐵 = 𝑎 ∑𝑏𝑖=1 𝑋. 𝑗. = 5.06
𝑎 𝑏
1 2
𝐵= ∑ ∑(𝑋𝑖𝑗. ) 𝐵 = 1.861
𝑖=1 𝑖=1

𝐸= + 𝐵+ 𝐵 = 320.333

Fuente de Suma de Grados de Medias


Variabilidad cuadrados libertad Cuadráticas F calculada
A=Ingresos 192.694 2 96.347 18.046
B= Región
Geográfica 5.056 3 1.685 0.316
AXB Interacción 1.861 6 0.310 0.058
Error 320.333 60 5.339
Total 519.944 71

Contraste de Interacción:
Hipótesis:
Se contrasta la hipótesis nula:
𝐻𝑂 : 𝛼𝛽 𝑖𝑗 =0

Contra:
𝐻1 : 𝛼𝛽 𝑖𝑗 ≠ 0 𝑝𝑎 𝑎 𝑎𝑙𝑔ú 𝑖 ≠ 𝑗 𝑠𝑖 𝑒𝑥𝑖𝑠𝑡𝑒 𝑖 𝑡𝑒 𝑎 𝑖ó

Estadística y región crítica:


𝑀 𝐵
𝐹= ~ 𝐹 6, 60
𝑀 𝐸
𝐹 = 0.058
𝑅. = {𝐹 . 5 6,60 > . 5}
Dado que 𝐹𝐴.𝐵 = 0.058 < 2.25, debemos aceptar la hipótesis nula al nivel de
significación α=0.05. La interacción observada no es significativa. Por lo tanto,
no existe interacción entre los factores ingresos y región geográfica.
Hacemos el método de comparaciones múltiples por el método de Duncan.
Región Subconjuntos Homogéneos
Geográfica n 1 2
18 12.04
18 13.83
18 16.04
Significación 1.00 0.814

Podemos afirmar que el ingreso A1 produce el mínimo efecto


33. La industria P&C que utiliza para su producción tres máquinas de marcas
distintas 1, 2 y 3 y dos fuentes de materia prima A y B quiere saber si el
número de unidades defectuosas resultantes es la misma para las tres
máquinas y para las dos materias primas. P ara esto, el ingeniero a cargo
del control llevo a cabo un experimento de la producción observando el
número de unidades defectuosas, con cada una de las máquinas y con
cada tipo de materia prima durante dos días y entre los resultados
presentó el siguiente resumen descriptivo.

Materia Máquinas Número De Datos Media de unidades


Prima defectuosas
A 1 4 9.1
A 2 4 11.3
A 3 4 7.4
B 1 4 7.1
B 2 4 9.0
B 3 4 5.9

Desviación estándar de la variable dependiente= 1.8075

Tabla ANOVA
Fuente De Suma De Grados De Medias Estadística
Variabilidad Cuadrados Libertad Cuadráticas F
Materia prima 22.427
Maquinas 49.480
Interacción
Error 2.580
total

a. Defina el modelo estadístico de este problema de ANOVA. Haga un


gráfico de líneas de los factores máquina y materia prima e indique si,
en forma descriptiva, se podría suponer o no interacción entre los dos
factores considerados.
b. ¿Es significativa la interacción entre los dos factores considerados?
¿Qué puede decir de los efectos de las materias primas y las máquinas
en la producción defectuosa? Use el nivel de significación a=0.05
c. ¿Qué maquina produce menos unidades defectuosas? Con
probabilidad de error tipo I, igual a 0.05
SOLUCIÓN

 Es un modelo de clasificación doble con replica

Fuente De Suma De Grados De Medias Estadística


Variabilidad Cuadrados Libertad Cuadráticas F
Materia prima 22.427 1 22.43 156.47
Maquinas 49.48 2 24.74 172.60
Interacción 0.653 2 0.3265 2.28
Error 2.58 18 0.14
total 75.14 23 47.64

Se aprecia en el gráfico y los resultados que no hay interacción

Hipótesis
Se contrasta la hipótesis nula
HO: (ab)y =0 (no existe interacción), para i=1,2,3, j=1,2,3
Contra:
H1: (ab)y ≠0 para algún i≠j(si existe interacción)
Estadística y región crítica

F=MCAB/MCE ~ F(2.28); RC={(F0.95(2.28)< 3.76}

Decisión:

Dado que FA*B=3.6<3.76, no rechazamos la hipótesis nula al nivel de


significación del 0.05 entonces se dice que no hay interacción.

Análisis De Varianza De Dos Factores Con Varias Muestras Por


Grupo

RESUMEN 1 2 3 Total
A
Cuenta 4 4 4 12
Suma 36.4 45.2 29.6 111.2
Promedio 9.1 11.3 7.4 9.27
Varianza 0.54 2.22 0.82 3.76

B
Cuenta 4 4 4 12
Suma 28.4 36 23.6 88
Promedio 7.1 9 5.9 7.33
Varianza 0.98 0.69 1.85 2.74

Total
Cuenta 8 8 8
Suma 64.8 81.2 53.2
Promedio 8.1 10.15 6.65
Varianza 1.79 2.76 1.79

ANÁLISIS DE VARIANZA
O. De las S.
variaciones Cuadrados Gl P.cuadrados F Probabilidad Valor F
Muestra 22.43 1.00 22.43 18.95 0.00 4.41
Columnas 49.5 2.0 24.7 20.9 0.0 3.6
Interacción 0.7 2.0 0.3 0.3 0.8 3.6
Dentro del grupo 21.3 18.00 1.18

Total 93.86 23
De la tabla N° 2 se obtiene que:
µ3< µ1< µ2
Entonces la máquina que produce menos defectos es la maquina
número 3.
34. La empresa R&G realiza una investigación para determinar si el
rendimiento de sus empleados está influenciado por el nivel capacitación
y el turno de trabajo. Para realizar este estudio, se diseñó un experimento
de dos factores: el factor A: capacitación del personal con tres niveles,
A1= Buena, A2= Regular, A3= Ninguna, y el factor B: turno de trabajo con
tres niveles, B1= Mañana, B2=Tarde, B3= Noche. En cada combinación
de los niveles de capacitación y de turno, se midieron el rendimiento de
cuatro trabajadores. En la medición de los rendimientos se utilizó un
procedimiento cuyos resultados son tiempos en minutos, indicando que a
menor tiempo mayor rendimiento. Los tiempos de rendimiento observados
se dan en la tabla:

A=Capacitación
B=Turnos
A1 A2 A3
4 5 8 6 6 7
B1
5 6 5 6 7 6
6 7 7 5 8 7
B2
4 6 6 8 7 6
6 5 6 7 8 6
B3
5 6 6 6 7 7

a) Realice una gráfica de líneas de las medias muéstrales, ¿indica la


gráfica presencia de interacción los dos factores considerados?
b) Al nivel de significancia de 0.05, ¿existe interacción entre el factor de
capacitación y el factor turno de trabajo?
SOLUCIÓN
a) La variable dependiente es X= Rendimiento de los empleados.
Los factores que posiblemente influyen en el rendimiento son:
A: capacitación del personal: A1= Buena, A2= Regular, A3= Ninguna
B: turno de trabajo: B1= Mañana, B2=Tarde, B3= Noche
El modelo del ANOVA de dos factores con replica es:

Xijk = µ + ai + bj + (ab)y + Eijk

Donde i=1, 2,3, j=1, 2,3, k=1, 2, 3, 4

Estadísticas descriptivas:

Análisis de varianza de dos factores con varias muestras por grupo


RESUMEN A1 A2 A3 Total
B1
Cuenta 2.00 2.00 2.00 2.00 2.00 2.00 12.00
Suma 9.00 11.00 13.00 12.00 13.00 13.00 71.00
Promedio 4.50 5.50 6.50 6.00 6.50 6.50 5.92
Varianza 0.50 0.50 4.50 0.00 0.50 0.50 1.17

B2
Cuenta 2.00 2.00 2.00 2.00 2.00 2.00 12.00
Suma 10.00 13.00 13.00 13.00 15.00 13.00 77.00
Promedio 5.00 6.50 6.50 6.50 7.50 6.50 6.42
Varianza 2.00 0.50 0.50 4.50 0.50 0.50 1.36

B3
Cuenta 2 2 2 2 2 2 12
Suma 11 11 12 13 15 13 75
Promedio 5.5 5.5 6 6.5 7.5 6.5 6.25
Varianza 0.5 0.5 0 0.5 0.5 0.5 0.75

Total
Cuenta 6.00 6.00 6.00 6.00 6.00 6.00
Suma 30.00 35.00 38.00 38.00 43.00 39.00
Promedio 5.00 5.83 6.33 6.33 7.17 6.50
Varianza 0.80 0.57 1.07 1.07 0.57 0.30
ANALISIS DESCRIPTIVO DE LA INTERACCÍON
25

20

15

10

0
1 2 3

Series1 Series2 Series3

Indica que el rendimiento de los que no reciben capacitación es más bajo


de los que reciben una regular capacitación.

Potrebbero piacerti anche