Sei sulla pagina 1di 20

uia Ing.

en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

III. ANALISIS DE VARIANZA DE UNA VA o DIRECCIN (ANOVA 1 VIA)


El anlisis de la varianza de un criterio (ANOVA) es una metodologa para analizar la variacin entre muestras y la variacin al interior de las mismas mediante la determinacin de varianzas. Es llamado de un criterio porque analiza un variable independiente o Factor ej: Velocidad. Como tal, es un mtodo estadstico til para comparar dos o ms medias poblacionales. El ANOVA de un criterio nos permite poner a prueba hiptesis tales como:

H 0 1 2 3 .... k

H 1 : Al menos dos medias poblacionales son diferentes.


Los supuestos en que se basa la prueba t de dos muestras que utiliza muestras independientes son: 1. Ambas poblaciones son normales. 2. Las varianzas poblacionales son iguales, esto es, 1 El estadstico tiene una distribucin muestral resultando:
2 2 2 .

Fc
Donde

2 sb 2 sw

Fc = F calculado o F estadstico s b2 = promedio entre grupos


2 sw = promedio dentro de los grupos

El valor crtico para la prueba F es:

F (k 1, k (n 1))
Donde el nmero de grados de libertad para el numerador es k-1 y para el denominador es k(n1), siendo el nivel de significancia. k = nmero de muestras. Por ejemplo: 1. Cuatro catalizadores que pueden afectar la concentracin de un componente en una mezcla lquida de tres componentes estn siendo investigado. Se obtienen las siguientes concentraciones: Catalizador B 56.3 54.5 57 55.3

A 58.2 57.2 58.4 55.8

C 50.1 54.2 55.4

D 52.9 49.9 50 51.7

Pgina 1

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

54.9

Pgina 2

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

Ho mu1=mu2=mu3=mu4 alfa(1/2) 0.025 Catalizadores A 1 2 3 4 5 sumatoria promedio g.promedio n c r gl SCT gl SCTR gl SCE SCT SCTR SCE CMT CMTR CME Fc Ft(0.025,3,12) B 58.2 57.2 58.4 55.8 54.9 284.5 56.9 54.4875 Prom 56.3 50.1 58.2 54.5 54.2 57.2 57 55.4 58.4 55.3 55.8 54.9 56.3 223.1 159.7 204.5 54.5 55.775 53.2333 51.13 57 55.3 50.1 54.2 55.4 52.9 49.9 50 51.7 C D 52.9 49.9 50 51.7 SC 13.8384 7.3984 15.3664 1.7424 0.1764 3.3124 0.0004 6.3504 0.6724 19.1844 0.0784 0.8464 2.4964 20.9764 20.0704 7.7284 # SCR renglones 29.1128 5 6.63578 4 4.71504 3 45.2122 4 85.6758 SCTR

16 4 5 15 3 12 120.2384 85.6758373 34.5625627 8.01589333 28.5586124 2.88021356 9.91544963 4.47 4.474185

SCT

120.238

9.915 es mayor que 4.47, por lo tanto cae en la zona de rechazo, se rechaza Ho.Los catalizadores tienen efectos diferentes

Tabla de Anlisis de varianza Suma de cuadrados Entre muestras 85.67584 Dentro de muestras Varianza total Valor P 0.00143578 34.56256 120.2384

Grados de libertad 3 12 15

Cuadrado medio 28.5586 2.88021

Valor F 9.915

Como el valor P es menor que alfa(1/2) por lo que se confirma que Ho se rechaza. Prueba de Tukey T 4.11529534 q(0.01,4,12) 4.2 Diferencia minima significativa DMS 2.339 F(0.05,1,12) 4.75

x1-x2

1.125 menor que T

menor que 1.125 DMS

Pgina 3

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

x1-x3 x1-x4 x2-x3 x2-x4 x3-x4

3.66666667 menor que T 5.775 mayor que T 2.54166667 menor que T 4.65 mayor que T 2.10833333 menor que T

mayor que 3.667 DMS mayor que 5.775 DMS mayor que 2.542 DMS mayor que 4.65 DMS menor que 2.108 DMS

Basandonos en la diferencia minima significativa que es mas precisa, concluimos que solamente A es igual con B y C es igual con D. La maxima concentracion se obtiene con el catalizador A Residuales 1.3 0.3 1.5 -1.1 -2 0.52 -1.28 1.22 -0.48 -3.13 0.97 2.17 1.77 -1.23 -1.13 0.57 Utilizando los paquetes de Excel y Minitab se tiene: Ejemplo 1: Tres tipos distintos de motores de gasolina fueron probados para determinar cunto tiempo son tiles antes de necesitar una reparacin; si los tiempos de vida de los motores de cada tipo se distribuyen normalmente y tienen la misma varianza, haga una prueba usando 0.05 para determinar si difieren las medias de vida til antes de requerir una reparacin. En la tabla aparecen los tiempos de vida til, en decenas de miles de millas para cada tipo de motor.

A 6 2 4 1 7

B 8 7 7 2 6

C 3 2 5 4 1

Mediante Minitab determinamos si las muestras provienen de una poblacin Normal. Seleccione en el menu para cada muestra:

Pgina 4

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

Stat > Basic statistics > Normalita test Variable Columnas de datos Test for normality Seleccionar Ryan Joiner OK >=0.05 .
Probability Plot of A
Normal
99

Hay normalidad si P value es

95 90 80

Mean StDev N RJ P-Value

4 2.550 5 0.982 >0.100

Percent

70 60 50 40 30 20 10 5

-2

4 A

10

Probability Plot of B
Normal
99 Mean StDev N RJ P-Value 6 2.345 5 0.909 >0.100

95 90 80

Percent

70 60 50 40 30 20 10 5

6 B

10

12

Pgina 5

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

Probability Plot of C
Normal
99 Mean StDev N RJ P-Value 3 1.581 5 0.998 >0.100

95 90 80

Percent

70 60 50 40 30 20 10 5

-1

3 C

Analizando las grficas nos damos cuenta de que las muestras provienen de poblaciones normales.

Si denotamos por

1, 2 y 3 las medias poblacionales de los tiempos de vida til para los tipos

A, B y C, respectivamente, entonces podemos escribir las hiptesis estadsticas como:

H 0 : 1 2 3
H1: Al menos dos medias poblacionales no son iguales.

Procedimiento en Excel:
En el men herramientas seleccione la opcin Anlisis de datos, en funciones para anlisis seleccione Anlisis de varianza de un factor. En Rango de entrada seleccionar la matriz de datos.

Pgina 6

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

Alfa = 0.05 En Rango de salida indicar la celda donde se inciar la presentacin de resultados.
Anlisis de varianza de un factor RESUMEN Grupos Columna 1 Columna 2 Columna 3

Cuenta 5 5 5

Suma 20 30 15

Promedio 4 6 3

Varianza 6.5 5.5 2.5

ANLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos Total

Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crtico para F 23.33333333 2 11.66666667 2.413793103 0.13150932 3.885290312 58 12 4.833333333 81.33333333 14

En la tabla observamos que el estadstico de prueba Fc es menor al valor crtico para F 2.41<3.88, por lo cual no rechazamos al Hiptesis nula H0. No tenemos evidencia estadstica para afirmar que los tiempos de vida til de los motores, antes de requerir una reparacin son diferentes.

Pgina 7

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

ANOVA en Minitab.
Utilice Seleccionar:

0.05 para calcular si difiere el rendimiento de los motores.

Stat > ANOVA > One Way (Unstacked) Response in separate columns A, B, C Seleccionar ! Store Residuals ! Store Fits Graphs Seleccionar Normal plot of residuals Comparisons Seleccionar Tukeys Family error rate OK

Confidence level 95%

Resultados: La grfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el modelo:

Normal Probability Plot of the Residuals


(responses are A, B, C)
99

95 90 80

Percent

70 60 50 40 30 20 10 5

-5.0

-2.5

0.0 Residual

2.5

5.0

One-way ANOVA: A, B, C
Source Factor Error Total DF 2 12 14 SS 23.33 58.00 81.33 MS 11.67 4.83 F 2.41 P 0.132

Como este valor P es mayor a 0.05 se rechaza la hiptesis nula y A, B y C no tienen efecto en la respuesta.
S = 2.198 R-Sq = 28.69% R-Sq(adj) = 16.80%

Level A

N 5

Mean 4.000

StDev 2.550

Individual 95% CIs For Mean Based on Pooled StDev ------+---------+---------+---------+--(----------*----------)

Pgina 8

uia Ing. en Alimentos CEP: Ejercicios de ANOVA


B C 5 5 6.000 3.000 2.345 1.581

P. Reyes / 15/11/2013

(----------*----------) (----------*----------) ------+---------+---------+---------+--2.0 4.0 6.0 8.0

Pooled StDev = 2.198

Los intervalos de confianza de los tres niveles A, B, C del factor se pueden traslapar por tanto sus efectos no son diferentes.
Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons Individual confidence level = 97.94% A subtracted from: B C Lower -1.707 -4.707 Center 2.000 -1.000 Upper 5.707 2.707 ---------+---------+---------+---------+ (----------*---------) (---------*----------) ---------+---------+---------+---------+ -3.5 0.0 3.5 7.0

B subtracted from: C Lower -6.707 Center -3.000 Upper 0.707 ---------+---------+---------+---------+ (---------*----------) ---------+---------+---------+---------+ -3.5 0.0 3.5 7.0

Como el cero pertenece al intervalo de confianza de las diferencias entre A y B; A y C y entre B y C no hay diferencia entre el efecto entre estos niveles.
A continuacin se muestran los residuos y los valores estimados para la respuesta Y por el modelo:

RESI1 2 -2 0 -3 3

RESI2 2 1 1 -4 0

RESI3 0 -1 2 1 -2

FITS1 4 4 4 4 4

FITS2 6 6 6 6 6

FITS3 3 3 3 3 3

Donde cada residuo es Eij = Yij observado Yij estimado Yij estimado es el promedio en cada columna.

Ejemplo: La tabla adjunta contiene el nmero de palabras escritas por minuto por cuatro secretarias de la universidad en cinco ocasiones diferentes usando la misma mquina.
A 82 79 75 68 65 B 55 67 84 77 71 C 69 72 78 83 74 D 87 61 82 61 72

Pgina 9

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

La grfica de residuos los muestra apegados a la recta, indicando que el modelo es vlido:
Normal Probability Plot of the Residuals
(responses are A, B, C, D)
99

95 90 80

Percent

70 60 50 40 30 20 10 5

-20

-10

0 Residual

10

20

One-way ANOVA: A, B, C, D
Source Factor Error Total DF 3 16 19 SS 52.2 1367.6 1419.8 MS 17.4 85.5 F 0.20 P 0.892

Como el valor P de 0.892 es mayor a alfa de 0.05 no hay efecto en la respuesta cambiando los niveles del factor A, B, C y D.
S = 9.245 R-Sq = 3.68% R-Sq(adj) = 0.00% Individual 95% CIs For Mean Based on Pooled StDev -------+---------+---------+---------+-(--------------*--------------) (--------------*--------------) (-------------*--------------) (--------------*--------------) -------+---------+---------+---------+-66.0 72.0 78.0 84.0

Level A B C D

N 5 5 5 5

Mean 73.800 70.800 75.200 72.600

StDev 7.190 10.918 5.450 11.887

Pooled StDev = 9.245

Se pueden traslapar los intervalos de confianza de los niveles del factor, por tanto no hay diferencia significativa en sus efectos.
Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons Individual confidence level = 98.87% A subtracted from: B C D Lower -19.745 -15.345 -17.945 Center -3.000 1.400 -1.200 Upper 13.745 18.145 15.545 --------+---------+---------+---------+(-------------*------------) (-------------*-------------) (-------------*-------------) --------+---------+---------+---------+-12 0 12 24

Pgina 10

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

B subtracted from: C D Lower -12.345 -14.945 Center 4.400 1.800 Upper 21.145 18.545 --------+---------+---------+---------+(-------------*-------------) (------------*-------------) --------+---------+---------+---------+-12 0 12 24

C subtracted from: D Lower -19.345 Center -2.600 Upper 14.145 --------+---------+---------+---------+(-------------*-------------) --------+---------+---------+---------+-12 0 12 24

En la prueba de Tukey como el cero pertenece a los intervalos de confianza de todas las diferencias entre niveles A, B, C y D, no hay diferencia entre sus efectos en la respuesta. Los residuos y valores estimados Fits se muestran a continuacin: RESI1 8.2 5.2 1.2 -5.8 -8.8 RESI2 -15.8 -3.8 13.2 6.2 0.2 RESI3 -6.2 -3.2 2.8 7.8 -1.2
1

RESI4 14.4 -11.6 9.4 -11.6 -0.6

FITS1 73.8 73.8 73.8 73.8 73.8

FITS2 70.8 70.8 70.8 70.8 70.8

FITS3 75.2 75.2 75.2 75.2 75.2

FITS4 72.6 72.6 72.6 72.6 72.6

Prueba de Tukey-Snedecor

Cuando la hiptesis nula Ho es rechazada, estamos interesados en identificar el grupo o grupos particulares que inducen a la diferencia estadsticamente significativa. Los pasos para realizar la prueba son los siguientes: 1. Se ubican las medias de los tratamientos, primero la de mayor valor y por ltimo la de menor, as como la diferencia entre ellas. 2. Se calcula el error estndar de la media :

Sx

2 Sw n

3. Determinamos el valor Q en la tabla de valores crticos Tukey-Snedecor del apndice, mediante el nmero de tratamientos k y los grados de libertad dentro de grupos. 4. Se calcula D, utilizando: D QSx 5. Se compara el valor D con la diferencia de los pares de medias de los tratamientos. La presencia de pares mayores que D significa que dichos tratamientos difieren significativamente del nivel .

Estadstica para las ciencias sociales y del comportamiento. Haroldo Elorza. Segunda Edicin. Oxford University Press.

Pgina 11

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

Problemas de ANOVA de 1 va / Diseo de experimentos de 1 factor: Clculo manual, Excel y Minitab


Problema 1
Para determinar si existe diferencia significativa en el nivel de Matemticas de 4 grupos de estudiantes de Ingeniera se realiz un examen aleatorio a 6 individuos por grupo. Determine cuales son los grupos en los cuales existen diferencias a un 95% de nivel de confianza.

A
75 93 78 71 63 76

B
78 91 97 82 85 77

C
55 66 49 64 70 68

D
64 72 68 77 56 95

Xij
A) Mtodo Manual a) Establecimiento de las hiptesis:
H 0 1 2 3 .... k
Cada Mu representa el promedio de calificacin por cada grupo

H 1 : Al menos dos medias poblacionales son diferentes.

b) Suma de cuadrados total

SCT
i 1

( Xij X )
j 1

r = No. de renglones

c = No. de Columnas

c) Suma de cuadrados de los tratamientos


SCTR r j ( X j X ) 2
j 1 r

Xj es el promedio de cada columna y rj = 6

d) Suma de cuadrados del error

SCE = SCT - SCTR


e) Grados de libertad Gl SCT = N 1 N = nmero de datos totales Gl SCTR = C 1 C = No. de columnas Gl SCE = Gl SCT Gl SCTR f) Cuadrados medios

Pgina 12

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

MSTR = SCTR / Gl SCTR MSE = SCE / Gl SCE g) Estadstico Fc Fc = MSTR / MSE h) Estadstico de alfa el cual define la regin de rechazo Falfa = Distr.f.inv (Alfa, Gl SCTR, Gl SCE) i) Observar si Fc cae en la zona de rechazo lo que indicara que todas las medias poblacionales no son iguales. j) Determinar el valor P de la prueba y compararlo con alfa para decidir si se rechaza Ho P = Distr.f(Fc, Gl MSTR, GL MSE)

B) En Excel (Anlisis de datos - ANOVA de un factor) C) Con Minitab (Stat > ANOVA > One Way (unstacked) ) Qu grupo tiene el mayor nivel y cual el menor nivel? Problema 2 Las calificaciones en el examen a 18 empleados de tres unidades de negocio Se muestran a continuacin: Probar si no hay diferencia entre las unidades a un 5% de nivel de significancia.
A 85 75 82 76 71 85 B 71 75 73 74 69 82 C 59 64 62 69 75 67

Qu unida de negocio tiene la ms alta calificacin? Problema 3 Excel y Minitab Probar si hay diferencia en los tiempos de servicio de 4 unidades de negocio para el mismo servicio a un nivel de significancia del 10%.
A 5.4 7.8 5.3 7.4 8.4 B 8.7 7.4 9.4 10.1 9.2 C 11.1 10.3 9.7 10.3 9.2 D 9.9 12.8 12.1 10.8 11.3

Pgina 13

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

7.3

9.8

8.8

11.5

Problema 4 Excel y Minitab Cuatro catalizadores que pueden afectar la concentracin de un componente en una mezcla lquida de tres componentes estn siendo investigados. Se obtienen las siguientes concentraciones:
Catalizador B 56.3 54.5 57 55.3

A 58.2 57.2 58.4 55.8 54.9

C 50.1 54.2 55.4

D 52.9 49.9 50 51.7

Qu conclusiones se obtienen a un 10% de nivel de signficancia? Qu catalizador da la mayor concentracin?

Problema 5 Excel y Minitab La resistencia a la tensin observada en funcin del peso porcentual del algodn en una fibra sinttica es: Peso porcentual del algodn
15 7 7 15 11 9 20 12 17 12 18 18 25 14 18 18 19 19 30 19 25 22 19 23 35 7 10 11 15 11

Probar si hay diferencia en la resistencia al usar peso porcentuales diferentes a un 5% de significancia o 95% de confianza. Qu peso proporciona la mayor resistencia? a) En Excel los datos se introducen como estn en la tabla (Anlisis de Datos). b) Para Minitab los datos se deben arreglar como sigue: Otra opcin (Response y Factor):
%Algodon Resistencia 15 7 15 7 15 15 15 11 15 9

Pgina 14

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

20 20 20 20 20 25 25 25 25 25 30 30 30 30 30 35 35 35 35 35

12 17 12 18 18 14 18 18 19 19 19 25 22 19 23 7 10 11 15 11

Problemas de ANOVA de 2 vas / Diseo de experimentos de 1 factor y una variable de bloqueo:


Problema 6 Excel y Minitab Una empresa de taxis intenta crear un sistema de rutas que minimice el tiempo que se pasa manejando a ciertas localidades. El tiempo que toma viajar en cada ruta por los taxis se muestra a continuacin:

Taxista 1 2 3 4 5

1 12 18 10 13 18

Factor - Ruta 2 3 15 17 18 18 11 15 12 12 14 12

4 13 17 9 15 15

Probar a un nivel del 5% identificar si hay rutas ms rpidas y si afecta el taxista.

a) En Excel los datos se introducen como estn en la tabla (Anlisis de Datos ANOVA de dos factores con una muestra por grupo). b) Para Minitab los datos se deben arreglar como sigue: (Stat > ANOVA > Two ways Response Row factor Column factor) Arreglo de datos
Taxi_Renglon Ruta_Columna Tiempo_Resp 1 1 12

Pgina 15

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4

18 10 13 18 15 18 11 12 14 17 18 15 12 12 13 17 9 15 15

Problema 7 Excel y Minitab


Se prueba si el tiempo en aprender diferentes sistemas es el mismo. Probar a un 5% con 5 alumnos. Sistema B C 16 24 17 22 13 19 12 18 22 17

Alumno

1 2 3 4 5

A 16 19 14 13 18

Reng 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

Col A A A A A B B B B B C C C C C

Tiempo 16 19 14 13 18 16 17 13 12 17 24 22 19 18 22

Problema 8 Excel y Minitab Se quiere probar si los tiempos de verificacin de autos probados en Analizador computarizado y en probadores electrnicos son iguales, para lo cual se usan tres tamaos de autos. Probar a un 5% de significancia.

Pgina 16

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

Compacto Mediano Grande

Analizador Computarizado Electrnico 50 42 55 44 63 46

Reng C M G C M G

Col Tiempo Com 50 Com 55 Com 63 Ele 42 Ele 44 Ele 46

Herramienta para Anlisis de Datos:


ANOVA: Anlisis de varianza de dos factores con varias muestras por grupo

Problema ejemplo:
Suponga que usted tenga un restaurante y haya creado una nueva receta de salsa para las enchiladas. Por alguna razn parece ser que a sus clientes varones les gusta ms la salsa anterior que la nueva. Pero tambin parece ser que a sus clientes femeninas prefieren la nueva salsa que la anterior. Usted decide realizar una prueba con un grupo de 10 mujeres y 10 varones dndole a probar las dos salsas, basndose en una escala de 100 puntos para el sabor de las dos salsas. Existe alguna relacin significativa desde el punto de vista de los clientes varones y clientes femeninas y cmo ven la nueva y la anterior salsa para las enchiladas? Encuesta: Resultado sobre el sabor de la nueva salsa Hombres Mujeres 85 69 74 65 96 63 Opinin 62 70 de la 80 72 salsa de 78 59 la 90 64 receta 79 70 anterior 85 68 80 73 68 85 64 75 62 97 Opinin 69 80 de la 73 88 salsa de 61 81 la 64 91 receta 72 83 nueva 70 84 71 82

Observaciones
Esta funcin permite realizar un anlisis de varianza de dos factores con varias muestras por grupo. En general, el anlisis de varianza es un procedimiento estadstico que se utiliza para determinar si las medias de dos o ms muestras han sido extradas de poblaciones con la misma media. La funcin de ANOVA: dos factores con varias muestras por grupo le pide que provee la siguiente informacin. Input Range: Rango de entrada. Escriba la referencia correspondiente al rango de datos de la hoja de clculo que desee analizar. El rango de entrada deber contener dos

Pgina 17

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

o ms rangos adyacentes organizados en columnas (como se ve arriba) o filas. Si el rango de entrada contiene ttulos de fila o de columna, deber seleccionar la casilla de verificacin Output Range: Rango de salida. Escriba la referencia correspondiente a la celda superior izquierda del rango en el cual desea que aparezcan los resultados. Para utilizar las herramientas de anlisis, seleccione Data Analysis del men de Tools. Dentro de la caja de herramienta de anlisis, escoja "ANOVA: Two-factor With Replication." En seguida, registre el Rango de entrada y el Rango de salida, refirindose a la direccin de las celdas requeridas. Cuando utilize una herramienta de analisis, Excel crea una tabla de resultados. Si usted incluye ttulos en el rango de entrada, Excel los utiliza para los datos de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar abajo.

Anova: Dos factores con varias muestras por grupo Resumen Hombres Mujeres Receta Anterior Cuenta 10 10 Suma 809 673 Promedio 80.9 67.3 Varianza 84.77 19.57 Receta Nueva Cuenta 10 10 Suma 674 846 Promedio 67.4 84.6 Varianza 18.71 38.04 Total Cuenta 20 20 Suma 1483 1519 Promedio 74.15 75.95 Varianza 96.98 106.1

Total 20 1482 74.1 98.09 20 1520 76 104.7

ANOVA Origen de Variaciones Muestra Columnas Interaccin Dentro Total

Suma de Cuadrados 36.1 32.4 2372 1450 3890

Grados Libertad 1 1 1 36 39

Promedio Cuadrados 36.1 32.4 2372 40.27

F 0.896 0.805 58.89

Prob. 0.35 0.376 4E-09

Valor Crtico 4.11 4.11 4.11

El resultado del ANOVA (Anlisis de varianza) indica el valor estadstico de la "F." En este caso el valor de la "F" de la muestra (receta anterior y receta nueva) es 0.896. Para saber si estos resultados son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" necesita ser al menos 4.11 (o sea, el valor crtico de la F). Entonces, como el valor de nuestra "F" es de 0.896 y es no es mayor que el valor crtico de la F, no podemos decir que existe alguna diferencia significativa. Sin embargo, a la vez necesitamos interpretar qu significa el valor de F que est relacionado al efecto de una interaccin. Siempre un efecto de interacin sobrepasa el efecto principal. En este caso tenemos un gran efecto de interaccin (el valor de la "F"=58.89). En otras palabras, s existe una diferencia significativa entre la opinin de los hombres y de las mujeresa relacionada a la receta anterior y a la nueva. La probabilidad demuestra a qu nivel los resultados son estadsticamente significativos.

Pgina 18

uia Ing. en Alimentos CEP: Ejercicios de ANOVA

P. Reyes / 15/11/2013

Problema para el estudiante:


Imagine que la compaa Tortillas Familiares, S.A. necesite distribuir tortillas recin hechas diariamente y que sea importante reportar el nmero mnimo de paquetes sobrantes diariamente. La compaa Tortillas Familiares ha checado el nmero de paquetes sobrantes en las tiendas en cuatro diferentes localidades (Chihuahua, Monclova, Saltillo, y Monterrey). Basndose en estos nmeros, la compaa cambi algunos de sus procedimientos de distribucin. Despus checaron otra vez para ver si hubo menos paquetes sobrantes. Existe alguna diferencia significativa en el nmero de paquetes sobrantes en relacin con los cambios de distribucin? Estos cambios se aplican para todas las localidades? Nmero de paquetes sobrantes de tortillas (En 10 tiendas por ciudad) Chihuahua Monclova Saltillo Monterrey Pre-Modificacin 20 36 45 27 45 33 21 22 15 34 15 20 20 21 33 20 15 14 10 25 15 20 40 35 30 21 20 30 12 10 14 21 39 30 31 20 19 32 15 9 25 37 44 25 46 34 25 25 17 33 14 21 22 20 34 21 14 13 9 26 26 36 45 21 48 32 24 26 18 32 25 33 44 20 47 34 20 24 15 29

Pos-Modificacin

Anova: Dos factores con varias muestras por grupo Resumen Chihuahua Monclova Saltillo Pr-Modificacin Cuenta 10 10 10 Suma 298 233 311 Promedio 29.8 23.3 31.1 Varianza 109.96 100.67 86.98 Ps-Modificacin Cuenta 10 10 10 Suma 193 230 194 Promedio 19.3 23.0 19.4 Varianza 41.79 91.11 52.93 Total Cuenta 20 20 20 Suma 491 463 505

Monterrey 10 308 30.8 97.33 10 291 29.1 109.87 20 599

Total 40 1150 28.75 101.62 40 908 22.7 84.52

Pgina 19

uia Ing. en Alimentos CEP: Ejercicios de ANOVA Promedio Varianza 24.55 100.89 23.15 90.87 25.25 102.30

P. Reyes / 15/11/2013

29.95 99.10

ANOVA Origen de Variaciones Muestra Columnas Interaccin Dentro Total

Suma de Cuadrados 732.05 521.75 518.55 6219.6 7991.95

Grados Libertad 1 3 3 72

Promedio Cuadrados 732.05 173.91 172.85 86.38

F 8.474 2.013 2.001

Prob. 0.0047 0.1196 0.1214

Valor Crtico 3.973 2.731 2.731

Ntese: El valor de F signficativo para las muestras (i.e., pre- y pos-modificacin nos indica que hay una diferencia significativa en el cambio en el nmero de paquetes sobrantes. El valor de F no significativo para las columnas (i.e., las cuatro ciudades) nos indica que los cambios tenan el mismo efecto en todas las ciudades, no hubo diferencia entre las ciudades. El valor de F no significativo para la interaccin nos indica que no hay un efecto de interaccin entre las variables (eso es bueno, pues una interaccin muchas veces neiga la validez de los otros valores de F.)

Pgina 20

Potrebbero piacerti anche