Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
El número de grados de libertad (gl) puede separarse de forma similar y se corresponde con la
forma en que la distribución Chi-cuadrado describe la suma de cuadrados asociada.
glTotal = glError + glFactores
Nota: Por grados de libertad "degrees of freedom" entendemos el número efectivo de observaciones que contribuyen a la
suma de cuadrados en un ANOVA, es decir, el número total de observaciones menos el número de datos que sean
combinación lineal de otros.
El problema más sencillo de ANOVA se conoce como el análisis de varianza de un solo factor o
diseño completamente al azar, éste se utiliza para comparar dos o más tratamientos, dado que
sólo consideran dos fuentes de variabilidad, los tratamientos y el error aleatorio.
Los datos generados para un diseño completamente al azar para comparar dichas
poblaciones se pueden escribir tal y como se muestra en la tabla 1.
𝑌𝑖𝑗=𝜇+𝜏𝑖+𝜀𝑖𝑗 (1)
donde:
𝜀𝑖𝑗=𝑦𝑖𝑗−𝜇𝑖 (3)
𝜇𝑖=𝜏𝑖+𝜇 (4)
𝜇𝑖=𝜀𝑖𝑗+𝑦𝑖𝑗 (5)
𝜏𝑖+𝜇=𝜀𝑖𝑗+𝑦𝑖𝑗 (6)
Despejando a 𝑦𝑖𝑗 tenemos:
𝑦𝑖𝑗=𝜇+𝜏𝑖+𝜀𝑖𝑗 (7)
Sabe que la media de 𝑦𝑖𝑗 difiere de la media de la población, entonces la ecuación (7) se
transforma en:
𝑦𝑖𝑗−𝜇=𝜏𝑖+𝜀𝑖𝑗 (8)
(𝑦𝑖𝑗−𝜇)=(𝜇𝑖−𝜇)+(𝑦𝑖𝑗−𝜇𝑖) …….(9)
En la ecuación (9) podemos ver que la desviación de una observación con relación a la
gran media (desviación total) se descompone en el efecto de los tratamientos
(desviación entre tratamientos) o desviación de cada tratamiento en relación a la gran
media y en el error residual (desviación dentro de cada tratamiento) o desviación de
cada observación con relación a su propio tratamiento.
se sabe que
entonces
por lo tanto
la suma de cuadrados de la ecuación (12) nos queda como
donde:
En las ecuaciones anteriores se puede ver que las sumas de cuadrado son los
numeradores de las varianzas respectivas, que el ANOVA se llama cuadrados medios. A
partir de las sumatorias de cuadrados, es posible obtener dos estimadores insesgados
de la varianza poblacional 𝜎2. Se puede demostrar que cuando las medias de los
tratamientos son iguales (𝐻0:𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) tanto la suma de cuadrados de los
tratamientos como la suma de cuadrados del error divididas entre sus respectivos
grados de libertad proporcionan estimadores insesgados e independientes de 𝜎2.
Dentro de los tratamientos, se tiene que:
proporciona un estimador insesgado de la varianza de su grupo y bajo el supuesto de
que las varianzas de los tratamientos son todas iguales, se pueden ponderar las
varianzas de los 𝑘 tratamientos para obtener:
que es la varianza dentro de los tratamientos o varianzas del error o cuadrados medios
del error.
de donde
Que es una variable de F de Fisher y será la unidad o casi la unidad. Por el contrario si
(𝐻0:𝑓𝑎𝑙𝑠𝑎); es decir, si los efectos de los tratamientos no son nulos, esto tenderá a ser
significativamente menor que la unidad. Así se rechazará (𝐻0) si
es mayor que la F de tablas ( F teórica) 𝐹1−𝛼,𝑔𝑙 𝑇𝑟𝑡,𝑔𝑙 𝑒𝑟𝑜𝑟 donde 𝑔𝑙𝑇𝑟𝑡=𝑘−1 y 𝑔𝑙𝑒𝑟𝑜𝑟=𝑁−𝑘.
Todo esto se puede sintetizar en una tabla llamada tabla de ANOVA (tabla 2).
Tabla 2. Tabla de ANOVA para un diseño completamente al azar
Vamos a ver un ejemplo, suponga que en una empresa dedica a la elaboración y venta
de alimentos, un ingeniero a observado que en las frituras, las rosquillas absorben
grasa en diversas cantidades, y está interesado en saber si la cantidad absorbida
depende del tipo de grasa que se utiliza. Para esto, desarrolló un experimento en el
cual se prepararon 24 bolsas de 250 gramos y se cocieron con cuatro diferentes tipos
de aceites (aceite de cártamo (A), aceite de girasol (B), aceite de semilla de maíz (C) y
aceite de soya (D)). Los datos obtenidos de grasa absorbida en miligramos se muestran
en la tabla 3.
El ingeniero se pregunta si estos datos aportan suficiente evidencia para indicar una
diferencia entre los diferentes tipos de aceites. En análisis de la varianza se desarrolla
como sigue:
o bien
𝐻0: 𝜏𝐴= 𝜏𝐵= 𝜏𝐶= 𝜏𝐷=0
Tabla 3. Gramos de grasa absorbida
Ahora vamos a obtener los totales y las medias de acuerdo a lo planteado en la tabla 1.
𝑆𝐶𝑒𝑟𝑜𝑟=𝑆𝐶𝑇𝑜𝑡−𝑆𝐶𝑇𝑟𝑡 =3,550.96−2,480.12=1,070.83
Ahora determinaremos los grados de libertad para las sumatorias de cuadrados y esto
se obtienen de la siguiente manera:
Es una práctica común utilizar la muestra de residuos para comprobar los supuestos del
modelo, ya que si los supuestos se cumplen, los residuos o también conocidos como
residuales se pueden ver como una muestra aleatoria de una distribución normal con
media cero y varianza constante. Los residuos, 𝑒𝑖𝑗, se definen como la diferencia entre
la respuesta observada 𝑦𝑖𝑗, y la respuesta predicha por el modelo (𝑦𝑖 ), lo cual permite
hacer un diagnóstico más directo de la calidad del modelo, ya que su magnitud señala
qué tan bien describe a los datos el modelo. Para comprobar cada supuesto existen
pruebas analíticas y gráficas. Por sencillez, muchas veces se prefieren las pruebas
gráficas. Éstas tienen el inconveniente de que son exactas, pero aun así, en la mayoría
de las situaciones prácticas proporcionan le evidencia suficiente contra o a favor de los
supuestos.
El uso de las pruebas gráficas requiere una fuerte evidencia visual para concluir que el
supuesto en cuestión no se cumple, ya que se requiere que la evidencia en contra de un
supuesto esté soportada por más de dos puntos.
Cuando son uno o dos los puntos que se salen del comportamiento esperado de las
gráficas se puede tratar de un problema de puntos aberrantes, no de una violación del
supuesto en cuestión. En este caso debe de investigarse la obtención de dichas
mediciones atípicas ya que ese tipo de puntos pueden afectar sensiblemente los
resultados del análisis.
Ventajas
a. Permite gran flexibilidad, es decir puede usarse cualquier número de
tratamientos y repeticiones, además se puede variar el número de repeticiones de un
tratamiento a otro.
b. El análisis estadístico es sencillo, aún si el número de repeticiones no es el
mismo para cada tratamiento.
c. El análisis estadístico es fácil aun cuando los datos de algunas de las unidades
experimentales o algunos tratamientos completos se hayan perdido o se rechacen por
alguna causa.
d. Es el diseño que se basa en más grados de libertad para la estimación de los
cuadrados medios.
Desventajas
Para usar este diseño se necesitan unidades experimentales muy homogéneas, porque
de otra manera la variación entre ellas pasa a formar parte del error experimental.
Grupo
1 2 3 4 5
180 172 163 158 147
173 158 170 146 152
175 167 158 160 143
182 160 162 171 155
181 175 170 155 160
La tabla de anova es:
Fuente de variación GL SS MS F
Tratamiento 4 2010,64 502,66 11,24
Error 20 894,4 44,72
Total 24 2905,04
Como F0,05 (4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y concluimos que los
resultados de los tratamientos son diferentes.
El primer subíndice indica el nivel del primer factor, el segundo el nivel del segundo
factor y el tercero la observación dentro de la muestra. Los factores pueden ser ambos
de efectos fijos (se habla entonces de modelo I), de efectos aleatorios (modelo II) o
uno de efectos fijos y el otro de efectos aleatorios (modelo mixto). El modelo
matemático de este análisis es:
Modelo I
Modelo II
Modelo mixto
donde m es la media global, ai o Ai el efecto del nivel i del 1º factor, bj o Bj el efecto del
nivel j del 2º factor y eijk las desviaciones aleatorias alrededor de las medias, que
también se asume que están normalmente distribuidas, son independientes y tienen
media 0 y varianza s2.
A los términos (ab) ij, (AB)ij, (aB)ij, se les denomina interacción entre ambos factores y
representan el hecho de que el efecto de un determinado nivel de un factor sea
diferente para cada nivel del otro factor.
Para entender mejor este concepto de interacción veamos un ejemplo sencillo sobre un
ANOVA de dos factores, cada uno con dos niveles: supóngase un estudio para analizar
el efecto de un somnífero teniendo en cuenta el sexo de los sujetos. Se eligen al azar
dos grupos de hombres y otros dos de mujeres. A un grupo de hombres y otro de
mujeres se les suministra un placebo y a los otros grupos el somnífero. Se mide el
efecto por el tiempo que los sujetos tardan en dormirse desde el suministro de la
píldora.
Se trata de un ANOVA de dos factores (sexo y fármaco) fijos, cada uno con dos niveles
(hombre y mujer para el sexo y somnífero y placebo para el fármaco). Los dos tipos de
resultados posibles se esquematizan en la figura
A B
En la figura A se observa que las mujeres tardan más en dormirse, tanto en el grupo
tratado como en el grupo placebo (hay un efecto del sexo) y que los tratados con
placebo tardan más en dormirse que los tratados con somnífero en ambos sexos (hay
un efecto del tratamiento). Ambos efectos son fácilmente observables.
Sin embargo en la figura B es difícil cuantificar el efecto del somnífero pues es distinto
en ambos sexos y, simétricamente, es difícil cuantificar el efecto del sexo pues es
distinto en ambos grupos de tratamiento. En este caso, se dice que existe interacción.
Podría, incluso, darse el caso de que se invirtieran los efectos de un factor para los
distintos niveles del otro, es decir, que las mujeres se durmieran antes con el somnífero
y los hombres antes con el placebo.
La interacción indica, por tanto, que los efectos de ambos factores no son aditivos:
cuando se dan juntos, su efecto no es la suma de los efectos que tienen cuando están
por separado, por lo que, si en un determinado estudio se encuentra interacción entre
dos factores, no tiene sentido estimar los efectos de los factores por separado. A la
interacción positiva, es decir, cuando el efecto de los factores actuando juntos es
mayor que la suma de efectos actuando por separado, en Biología se le denomina
sinergia o potenciación y a la interacción negativa inhibición. En el ejemplo de la figura
B, se diría que el ser mujer inhibe el efecto del somnífero, o que el ser hombre lo
potencia (según el sexo que se tome como referencia).
Para plantear los contrastes de hipótesis hay que calcular los valores esperados de los
distintos cuadrados medios.
Del mismo modo que se hizo en el ANOVA de una vía, para plantear los contrastes de
hipótesis habrá que calcular los valores esperados de los distintos cuadrados medios.
Los resultados son:
Modelo I
MS Valor esperado
MSA
MSB
MSAB
MSE
Modelo II
MS Valor esperado
MSA
MSB
MSAB
MSE
En un modelo II, como no se está interesado en estimar los efectos de los factores sino
sólo la existencia de la componente añadida, sí tiene sentido contrastar la existencia de
la misma para cada factor incluso aunque exista interacción.
Ejemplo
El resultado del análisis es: no existe componente añadida por la interacción, tampoco
por el 1º factor y sí existe componente añadida por el 2º.
23,54 con 112 grados de libertad y hubiera resultado significativo también el 1º factor.
MS Valor esperado
MSA
MSB
MSAB
MSE
Ejemplo
Placebo Somnífero
30 35
50 32
45 30 Hombre
47 25
38 30
50 42
35 30
46 15 Mujer
25 18
32 23
Se trata de un ANOVA de dos factores fijos. Llamamos primer factor a la droga que
tiene dos niveles: placebo y somnífero. El segundo factor es el sexo también con 2
niveles: hombres y mujeres. El tamaño de las muestras es n=5.
Fuente de variación GL SS MS
Somnífero 1 696,2 696,2
Sexo 1 105,8 105,8
Interacción 1 0,2 0,2
Error 16 1197,6 74,85
Total 19 1999,8
La estimación del efecto del somnífero será la diferencia entre las medias de los que lo
toman y los que tomaron placebo, sin tener en cuenta el sexo, una vez que se ha visto
que no tiene efecto.
y la tabla de medias
Por tanto la estimación del efecto del somnifero es 39,8 - 28,0=11,8 min
Otro concepto importante en ANOVA: Cuando tenemos dos o más factores estos
pueden estar, entre sí, dos a dos, cruzados o anidados. Dos factores están cruzados
cuando todos los niveles de un factor se cruzan, se combinan, con todos los niveles del
otro factor.
Dos factores están anidados (uno dentro de otro) cuando los niveles de uno se
combinan, jerárquicamente, entre los niveles del otro. Supongamos, por ejemplo, que
queremos ver la influencia que tienen, en los resultados de calidad de un producto, la
máquina y el operario. Y tenemos cuatro tipos de máquinas y dos operarios. El primer
operario trabaja en las máquinas 1 y 2, el segundo en la 3 y la 4. Tenemos, pues, dos
factores: máquina (con cuatro niveles) y operario (con dos niveles). Y están anidados.
No están cruzados. Dos máquinas las usa un operario y las otras dos máquinas las usa el
otro operario.
En el ANOVA de dos o más factores cruzados, podemos valorar algo muy importante: la
interacción entre factores. Interacción entre factores significa que la variable
estudiada, la variable dependiente, se comporta, ante niveles de un factor,
dependiendo de cuáles sean los niveles del otro factor. O sea, que la variable estudiada
tiene un valor que es función de la combinación que se dé de niveles.
ANOVA de un factor
El procedimiento ANOVA de un factor, produce un análisis de varianza para una
variable dependiente cuantitativa por una variable de factor único (independiente).
El análisis de varianza se usa para probar la hipótesis de que varias medias son iguales.
Esta técnica es una extensión de la prueba t de dos muestras.
Además de determinar que existen diferencias entre las medias, es posible que desee
saber qué medios difieren. Existen dos tipos de pruebas para comparar medias:
Contrastes a priori y pruebas post hoc. Los contrastes son pruebas configuradas antes
de ejecutar el experimento, y las pruebas post hoc se ejecutan después de que se haya
realizado el experimento.
Ejemplo. Las donas absorben la grasa en varias cantidades cuando se cocinan. Se
establece un experimento que involucra tres tipos de grasa: aceite de maní, aceite de
maíz y manteca de cerdo. El aceite de maní y el aceite de maíz son grasas insaturadas, y
la manteca de cerdo es una grasa saturada.
Además de determinar si la cantidad de grasa absorbida depende del tipo de grasa
utilizada, puede establecer un contraste a priori para determinar si la cantidad de
absorción de grasa difiere para las grasas saturadas y no saturadas.
Puede usar el procedimiento ANOVA de una vía para probar la hipótesis de que los
medios de dos o más grupos no son significativamente diferentes.
La estadística de Levene rechaza la hipótesis nula de que las variaciones de grupo son
iguales. ANOVA es robusto a esta violación cuando los grupos son de igual o casi igual
tamaño; sin embargo, puede elegir transformar los datos o realizar una prueba no
paramétrica que no requiera esta suposición:
► Seleccione el estilo como la variable para la cual se deben producir las pruebas post
hoc.
► Seleccione el estilo de gender *style como el término para el cual deben mostrarse
los medios.
► Seleccione Estadísticas descriptivas, Pruebas de homogeneidad, Estimaciones del
tamaño del efecto y “Spread vs. level plot” en el grupo Display.
► Haga clic en Continuar.
► Haga clic en Aceptar en el cuadro de diálogo GLM Univariate
Parece que hay un efecto de estilo de compras; en promedio, los clientes "quincenales"
gastan $ 378.52, mientras que los clientes "semanales" gastan $ 404.55, y los clientes "a
menudo" gastan $ 406.76.
También parece haber un efecto de género; en promedio, los hombres en la muestra
gastan $ 430.30 en comparación con $ 365.66 para las mujeres
Por último, puede haber un efecto de interacción entre el género y el estilo de compra ,
porque las diferencias medias en la cantidad gastada por el estilo de compra varían entre
los géneros
Por ejemplo, los clientes masculinos "quincenales" tienden a gastar más que los clientes
masculinos "a menudo", pero esta tendencia se invierte para las clientas "quincenales" y
"a menudo" femeninas
La columna N en la tabla muestra que hay tamaños de celda desiguales. La mayoría de
los clientes prefieren comprar semanalmente
Las desviaciones estándar parecen ser relativamente homogéneas, aunque debe verificar
la prueba de Levene y las gráficas de distribución en función del nivel para estar seguro.
La tabla siguiente prueba la hipótesis nula de que la varianza del término de error es
constante en las celdas definidas por la combinación de niveles de factor
Dado que el valor de significación de la prueba, 0.330, es mayor que 0.10, no hay razón
para creer que se haya violado el supuesto de varianzas iguales. Por lo tanto, las
pequeñas diferencias en las desviaciones estándar de grupo observadas en la tabla de
estadísticas descriptivas se deben a la variación aleatoria.
Este gráfico proporciona una prueba visual del supuesto de varianzas iguales, con el
beneficio adicional de ayudarlo a evaluar si las violaciones del supuesto se deben a una
relación entre las medias de las celdas y las desviaciones estándar.
No hay un patrón aparente en esta gráfica, por lo que no hay ninguna indicación de tal
relación aquí
Las pruebas de los efectos entre sujetos le ayudan a determinar la importancia de un
factor. Sin embargo, no indican cómo difieren los niveles de un factor. Las pruebas post
hoc muestran las diferencias en las medias pronosticadas por el modelo para cada par de
niveles de factores
En la siguiente tabla tenemos:
La primera columna (en rojo) muestra las diferentes pruebas post hoc.
Las siguientes dos columnas (en verde) muestran el par de niveles de factor que se están
probando
Cuando el valor significativo de la diferencia en la cantidad gastada para un par de
niveles de factor es menor que 0.05, se imprime un asterisco (*) por la diferencia.
En este caso, no parece haber diferencias significativas en los hábitos de gasto de los
clientes "quincenales", "semanales" o "a menudo"
El T2 de Tamhane es generalmente más apropiado que el HSD de Tukey cuando hay
tamaños de celdas desiguales, pero los resultados en este caso son en gran medida los
mismos.
En la tabla anterior los intervalos de confianza para el T2 de Tamhane son solo un poco
más amplios que los del HSD de Tukey.
Dado que los resultados de estas dos pruebas no son muy diferentes, es bueno que se
revisen los resultados de los subconjuntos homogéneos, que están disponibles para la
HSD de Tukey pero no para la T2 de Tamhane .
La tabla de subconjuntos homogéneos toma los resultados de las pruebas post hoc y los
muestra en una forma más fácil de interpretar
Alternativamente, los niveles de factor de Género podrían mostrarse a lo largo del eje
horizontal, con líneas separadas producidas para cada nivel de estilo de Compras .
Si no hubiera efecto de interacción, las líneas en la tabla serían paralelas. En cambio,
puede ver que la diferencia en el gasto entre clientes "semanales" y "a menudo" es
mayor para las clientas, ya que la línea para los clientes masculinos es decreciente y la
de las clientas aumenta.
Este es un fuerte efecto de interacción y es poco probable que se deba al azar, pero debe
verificar las pruebas de los efectos entre sujetos para confirmar su importancia.
A continuación la tabla del análisis de varianza.
Cada término en el modelo, más el modelo en su totalidad, se prueban para determinar
su capacidad para explicar la variación en la variable dependiente.
El valor de significación para cada término, excepto ESTILO , es menor que 0.05. Por
lo tanto cada término , excepto ESTILO, es estadísticamente significativo.
El estadístico parcial de eta cuadrado informa el significado "práctico" de cada término,
basado en la relación de la variación (suma de cuadrados) contabilizada por el término,
a la suma de la variación explicada por el término y la variación dejada al error
Los valores más grandes de eta cuadrado parcial indican una mayor cantidad de
variación representada por el término modelo, hasta un máximo de 1. Aquí los términos
individuales, aunque estadísticamente significativos, no tienen un gran efecto sobre el
valor de la cantidad gastada
En este ejemplo, las pruebas post hoc no revelaron una diferencia en el gasto entre los
clientes que compraban cada dos semanas y los que compraban con mayor frecuencia.
Sin embargo, las medias marginales estimadas y las gráficas de perfil revelaron una
interacción entre los dos factores, lo que sugiere que los clientes masculinos que
compran una vez a la semana son más rentables que los que compran con más
frecuencia, mientras que el patrón se invierte para las clientas. La importancia de este
efecto de interacción fue confirmada por los resultados de la tabla ANOVA
ANALISIS DE VARIANZA CON EXCEL
Tres tipos distintos de motores de gasolina fueron probados para determinar cuánto tiempo son
útiles antes de necesitar una reparación; si los tiempos de vida de los motores de cada tipo se
distribuyen normalmente y tienen la misma varianza, haga una prueba usando 0.05 para
determinar si difieren las medias de vida útil antes de requerir una reparación. En la tabla
aparecen los tiempos de vida útil, en decenas de miles de millas para cada tipo de motor.
A B C
6 8 3
2 7 2
4 7 5
1 2 4
7 6 1
Procedimiento:
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 20 4 6.5
Columna 2 5 30 6 5.5
Columna 3 5 15 3 2.5
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Entre grupos 23.33333333 2 11.66666667 2.413793103 0.13150932 3.885290312
Dentro de los grupos 58 12 4.833333333
Total 81.33333333 14
ANALISIS DE VARIANZA DE DOS VÍAS CON UNA SOLA MUESTRA POR GRUPO
Rollo
Agente
Químico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69
Procedimiento:
ANÁLISIS DE VARIANZA
Grados F
Fuente de Suma de de Cuadrados Fc Probabilidad tablas
variación Cuadrados libertad medios Valor P
Filas 12.95 3 4.32 2.38 0.12 3.49
Columnas 157 4 39.25 21.61 2.06E-05 3.26
Error 21.8 12 1.82
Total 191.75 19
Total 231 24
Sin embargo observamos que el rollo si tiene influenza significativa en la respuesta (P<0.05).
ANALISIS DE VARIANZA DE DOS VÍAS CON VARIAS MUESTRAS POR GRUPO
Catalizador 1 2 3
A 86.8 82.4 86.7 83.5 93.4 85.2 94.8 83.1 77.9 89.6 89.9 83.7
B 71.9 72.1 80 77.4 74.5 87.1 71.9 84.1 87.5 82.7 78.3 90.1
C 65.5 72.4 76.6 66.7 66.7 77.1 76.7 86.1 72.7 77.8 83.5 78.8
D 63.9 70.4 77.2 81.2 73.7 81.6 84.2 84.9 79.8 75.7 80.5 72.9
Para resolver este ejercicio, la tabla debe ser copiada en Excel de forma que los
tratamientos queden en las filas. Esto puede hacerse fácilmente copiando los datos de
la tabla directamente y luego transponiendo los valores:
Excel muestra primero los resultados de las sumas para cada uno de los catalizadores y
después muestra los totales. El resultado del análisis de varianza se muestra al final. Este es
en realidad el resultado que nos interesa.
Análisis de varianza de dos factores con varias muestras por grupo
RESUMEN A B C D Total
1
Cuenta 4 4 4 4 16
Suma 339,4 301,4 281,2 292,7 1214,7
Promedio 84,85 75,35 70,3 73,175 75,91875
Varianza 5,01666667 16,0966667 26,7 58,1091667 52,9682917
2
Cuenta 4 4 4 4 16
Suma 356,5 317,6 306,6 324,4 1305,1
Promedio 89,125 79,4 76,65 81,1 81,56875
Varianza 34,0625 53,88 62,8366667 26,3533333 58,4169583
3
Cuenta 4 4 4 4 16
Suma 341,1 338,6 312,8 308,9 1301,4
Promedio 85,275 84,65 78,2 77,225 81,3375
Varianza 32,3225 27,3166667 19,62 12,7958333 32,6065
Total
Cuenta 12 12 12 12
Suma 1037 957,6 900,6 926
Promedio 86,4166667 79,8 75,05 77,1666667
Varianza 23,5069697 42,3472727 42,5136364 37,9460606
ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Muestra 327,1404167 2 163,5702083 5,232711738 0,010118283 3,259446306
Columnas 877,5633333 3 292,5211111 9,357930563 0,000103987 2,866265557
Interacción 156,9829167 6 26,16381944 0,836996703 0,549602958 2,363750958
Dentro del grupo 1125,33 36 31,25916667
Total 2487,016667 47
Lo primero que hay que observar es el valor p de la interacción el cual en este caso es de
0.5496. Este valor es el resultado de la hipótesis de que las interacciones de los factores son
todas 0. Esto significa básicamente que la producción puede depender del tipo de catalizador y
del tipo de reactivo pero no de la interacción entre ellos. Los modelos que cumplen con este
supuesto son llamados generalmente modelos aditivos. En este caso, el valor p indica que la
hipótesis de las interacciones igual a 0 no puede rechazarse. Por lo que concluimos que este es
un modelo aditivo.
Los otros dos valores p se refieren a la significancia de los catalizadores y los reactivos
respectivamente. Debido a que estos valores son pequeños, se concluye que ambos factores
influyen significativamente en la media de la producción obtenida. Hay que tomar en cuenta
que estos valores solo se consideran válidos en el caso de que el modelo sea aditivo por lo que
es muy importante revisar primero el valor p de la interacción