desventajas. El anlisis de varianza (ANOVA) es un mtodo de prueba de igualdad de tres o ms medias poblacionales, por medio del anlisis de las varianzas muestrales. El anlisis de variancia es una tcnica que se puede utilizar para decidir si las medias de dos o ms poblaciones son iguales. La prueba se basa en una muestra nica, obtenida a partir de cada poblacin. El anlisis de variancia puede servir para determinar si las diferencias entre las medias muestrales revelan las verdaderas diferencias entre los valores medios de cada una de las poblaciones, o si las diferencias entre los valores medios de la muestra son ms indicativas de una variabilidad de muestreo. Cuando es necesario hacer comparaciones entre tres o ms medias muestrales para determinar si provienen de poblaciones iguales utilizamos la tcnica de anlisis de variancia. Esta tcnica se realiza utilizando la distribucin de probabilidad. El anlisis de la variancia tiene amplia aplicacin en el anlisis de datos derivados de experimentos. Esta tcnica se utiliza para cumplir dos objetivos: 1) Estimar y probar hiptesis respecto a las variancias de las poblaciones. 2) Estimar y probar hiptesis respecto a las medias de las poblaciones. 3) Existen muchas aplicaciones de las tcnicas de Anlisis de la Variancia que son importantes para el mundo de los negocios. Cuando el valor promedio de alguna variable se compara con tres o ms poblaciones, las conclusiones que resultan de un estudio de Variancia pueden ser muy tiles para el administrador. Con frecuencia se modifican las variables de produccin para determinar que combinacin lleva al proceso de manufactura ptimo. 4.2. Lgica bsica del anlisis de varianza 4.2.1. Estimacin de la varianza poblacional a partir de la variacin dentro de cada muestra. El mtodo dentro de estimacin de la varianza produce una estimacin vlida sin importar si la hiptesis nula de las medias poblacionales iguales es cierta. Esto se debe a que la variabilidad de los valores de la muestra se determina comparando cada elemento en los datos con la media muestral. Cada valor de la muestra obtenido de la poblacin A se compara con la media muestral A; cada elemento obtenido de la poblacin B se compara con la media muestral B, y as sucesivamente 4.2.2. Estimacin de la varianza poblacional a partir de la variacin entre las medias muestrales. El segundo mtodo para estimar la varianza comn de la poblacin produce una estimacin vlida slo si la hiptesis nula es cierta. Para entender el mtodo entre recuerde el teorema del lmite central. Este importante teorema en estadstica establece que la distribucin de las medias muestrales tiende a una distribucin normal conforme crece el tamao de la muestra, con una media y una desviacin estndar n. Si el error estndar de la media es n, entonces la varianza de la distribucin es igual al error estndar al cuadrado. Esta varianza es una medida de las diferencias entre todas las medias muestrales que puedan obtenerse de la distribucin y la media de la poblacin. La raz cuadrada de esta varianza es el error estndar de la media, es decir, la diferencia estndar entre una media muestral y la media poblacional. En ANOVA, para estimar la varianza de la distribucin muestral de medias, se debe estimar primero la mdia poblacional. La media de todos los valores muestrales proporciona esa estimacin. Despus, se determina la diferencia entre la media de cada grupo y esta media poblacional estimada, y estas diferencias se elevan al cuadrado y se suman. 4.2.3. Comparacin de las estimaciones de la varianza. Una vez que se ha usado el mtodo dentro y entre, para estimar la varianza desconocida de las poblaciones, se forma un cociente con estas dos estimaciones. Si la hiptesis nula es cierta, tanto el numerador como el denominador de la ecuacin son estimaciones vlidas de la varianza comn de las poblaciones que se estudian. Este cociente se ajusta a la distribucin F. Si la hiptesis nula es falsa el numerador de la ecuacin en realidad es una estimacin inflada de 2; el denominador sigue siendo una estimacin vlida. Bajo estas condiciones, el valor F ser muy grande, y se puede concluir que la hiptesis nula es falsa. La figura que mostramos a continuacin presenta la distribucin muestral para la prueba ANOVA junto con las regiones de aceptacin y rechazo. La siguiente figura ilustra el paso final de la prueba de hiptesis ANOVA. Si la hiptesis nula de medias poblacionales iguales es cierta, el estadstico F calculado se obtuvo de esta distribucin; esto parece razonable siempre que el valor F no sea demasiado grande. De los datos muestrales resulta un valor F muy grande, se concluye que medias poblacionales diferentes son las causas de que el numerador en el clculo de F est inflado, y la hiptesis nula se rechaza. En la figura siguiente se puede observar que alfa, la probabilidad de un error tipo I se indica en la cola superior. Si la hiptesis nula es en realidad cierta existe alguna posibilidad de que equivocadamente se declare falsa. La probabilidad de que esto ocurra es alfa, es decir, el nivel de significancia de la prueba.
4.3. Supuestos del anlisis de varianza. Las poblaciones tienen distribuciones que son aproximadamente normales. (Este requisito no es demasiado estricto, ya que el mtodo funciona bien, a menos que la poblacin tenga una distribucin muy diferente de la normal. Si una poblacin tiene una distribucin muy diferente a la normal, utilice la prueba de Kruskal-Wallis. Las poblaciones tienen la misma varianza s2(o desviacin estndar s). (Este requisito no es demasiado estricto, ya que el mtodo funciona bien, a menos que las varianzas poblacionales difieran en grandes cantidades. El estadstico de la Universidad de Wisconsin, George E. P. Box demostr que, siempre y cuando los tamaos muestrales sean iguales [o casi iguales], las varianzas llegan a diferir de tal forma que la ms grande es nueve veces el tamao de la ms pequea, en tanto que los resultados del ANOVA seguirn siendo esencialmente confiables). Las muestras son aleatorias simples (es decir, muestras del mismo tamao que tienen la misma probabilidad de ser elegidas). Las muestras son independientes entre s. (Las muestras no estn aparejadas ni asociadas de ninguna forma). Las diferentes muestras provienen de poblaciones que se categorizaron de una sola forma. (De ah el nombre del mtodo: anlisis de varianza de un factor). Tenga cuidado al interpretar los resultados: Cuando concluimos que hay suficiente evidencia para rechazar la aseveracin de medias poblacionales iguales, no podemos concluir a partir del ANOVA que cualquier media en particular es distinta de las dems. (Existen otras pruebas que permiten identificar las medias especficas, que son diferentes. Dichas pruebas se conocen como procedimientos de comparacin mltiple. La comparacin de intervalos de confianza, la prueba de Scheff, la prueba de Tukey extendida y la prueba de Bonferroni son procedimientos de comparacin mltiple comunes).