Sei sulla pagina 1di 5

4.1. Qu es el anlisis de varianza?

Definicin, aplicacin, usos, ventajas,


desventajas.
El anlisis de varianza (ANOVA) es un mtodo de prueba de igualdad de tres o
ms medias poblacionales, por medio del anlisis de las varianzas muestrales.
El anlisis de variancia es una tcnica que se puede utilizar para decidir si las
medias de dos o ms poblaciones son iguales. La prueba se basa en una muestra
nica, obtenida a partir de cada poblacin. El anlisis de variancia puede servir
para determinar si las diferencias entre las medias muestrales revelan las
verdaderas diferencias entre los valores medios de cada una de las poblaciones, o
si las diferencias entre los valores medios de la muestra son ms indicativas de
una variabilidad de muestreo.
Cuando es necesario hacer comparaciones entre tres o ms medias muestrales
para determinar si provienen de poblaciones iguales utilizamos la tcnica de
anlisis de variancia. Esta tcnica se realiza utilizando la distribucin de
probabilidad.
El anlisis de la variancia tiene amplia aplicacin en el anlisis de datos derivados
de experimentos. Esta tcnica se utiliza para cumplir dos objetivos:
1) Estimar y probar hiptesis respecto a las variancias de las poblaciones.
2) Estimar y probar hiptesis respecto a las medias de las poblaciones.
3) Existen muchas aplicaciones de las tcnicas de Anlisis de la Variancia que son
importantes para el mundo de los negocios. Cuando el valor promedio de alguna
variable se compara con tres o ms poblaciones, las conclusiones que resultan de
un estudio de Variancia pueden ser muy tiles para el administrador. Con
frecuencia se modifican las variables de produccin para determinar que
combinacin lleva al proceso de manufactura ptimo.
4.2. Lgica bsica del anlisis de varianza
4.2.1. Estimacin de la varianza poblacional a partir de la variacin dentro de
cada muestra.
El mtodo dentro de estimacin de la varianza produce una estimacin vlida sin
importar si la hiptesis nula de las medias poblacionales iguales es cierta. Esto se
debe a que la variabilidad de los valores de la muestra se determina comparando
cada elemento en los datos con la media muestral. Cada valor de la muestra
obtenido de la poblacin A se compara con la media muestral A; cada elemento
obtenido de la poblacin B se compara con la media muestral B, y as
sucesivamente
4.2.2. Estimacin de la varianza poblacional a partir de la variacin entre las
medias muestrales.
El segundo mtodo para estimar la varianza comn de la poblacin produce una
estimacin vlida slo si la hiptesis nula es cierta. Para entender el mtodo entre
recuerde el teorema del lmite central. Este importante teorema en estadstica
establece que la distribucin de las medias muestrales tiende a una distribucin
normal conforme crece el tamao de la muestra, con una media y una desviacin
estndar n. Si el error estndar de la media es n, entonces la varianza de la
distribucin es igual al error estndar al cuadrado. Esta varianza es una medida de
las diferencias entre todas las medias muestrales que puedan obtenerse de la
distribucin y la media de la poblacin. La raz cuadrada de esta varianza es el
error estndar de la media, es decir, la diferencia estndar entre una media
muestral y la media poblacional.
En ANOVA, para estimar la varianza de la distribucin muestral de medias, se
debe estimar primero la mdia poblacional. La media de todos los valores
muestrales proporciona esa estimacin. Despus, se determina la diferencia entre
la media de cada grupo y esta media poblacional estimada, y estas diferencias se
elevan al cuadrado y se suman.
4.2.3. Comparacin de las estimaciones de la varianza.
Una vez que se ha usado el mtodo dentro y entre, para estimar la varianza
desconocida de las poblaciones, se forma un cociente con estas dos
estimaciones.
Si la hiptesis nula es cierta, tanto el numerador como el denominador de la
ecuacin son estimaciones vlidas de la varianza comn de las poblaciones que
se estudian. Este cociente se ajusta a la distribucin F. Si la hiptesis nula es falsa
el numerador de la ecuacin en realidad es una estimacin inflada de 2; el
denominador sigue siendo una estimacin vlida. Bajo estas condiciones, el valor
F ser muy grande, y se puede concluir que la hiptesis nula es falsa. La figura
que mostramos a continuacin presenta la distribucin muestral para la prueba
ANOVA junto con las regiones de aceptacin y rechazo.
La siguiente figura ilustra el paso final de la prueba de hiptesis ANOVA. Si la
hiptesis nula de medias poblacionales iguales es cierta, el estadstico F calculado
se obtuvo de esta distribucin; esto parece razonable siempre que el valor F no
sea demasiado grande. De los datos muestrales resulta un valor F muy grande, se
concluye que medias poblacionales diferentes son las causas de que el
numerador en el clculo de F est inflado, y la hiptesis nula se rechaza. En la
figura siguiente se puede observar que alfa, la probabilidad de un error tipo I se
indica en la cola superior. Si la hiptesis nula es en realidad cierta existe alguna
posibilidad de que equivocadamente se declare falsa. La probabilidad de que esto
ocurra es alfa, es decir, el nivel de significancia de la prueba.

4.3. Supuestos del anlisis de varianza.
Las poblaciones tienen distribuciones que son aproximadamente normales.
(Este requisito no es demasiado estricto, ya que el mtodo funciona bien, a
menos que la poblacin tenga una distribucin muy diferente de la normal.
Si una poblacin tiene una distribucin muy diferente a la normal, utilice la
prueba de Kruskal-Wallis.
Las poblaciones tienen la misma varianza s2(o desviacin estndar s).
(Este requisito no es demasiado estricto, ya que el mtodo funciona bien, a
menos que las varianzas poblacionales difieran en grandes cantidades. El
estadstico de la Universidad de Wisconsin, George E. P. Box demostr
que, siempre y cuando los tamaos muestrales sean iguales [o casi
iguales], las varianzas llegan a diferir de tal forma que la ms grande es
nueve veces el tamao de la ms pequea, en tanto que los resultados del
ANOVA seguirn siendo esencialmente confiables).
Las muestras son aleatorias simples (es decir, muestras del mismo tamao
que tienen la misma probabilidad de ser elegidas).
Las muestras son independientes entre s. (Las muestras no estn
aparejadas ni asociadas de ninguna forma).
Las diferentes muestras provienen de poblaciones que se categorizaron de
una sola forma. (De ah el nombre del mtodo: anlisis de varianza de un
factor).
Tenga cuidado al interpretar los resultados: Cuando concluimos que hay suficiente
evidencia para rechazar la aseveracin de medias poblacionales iguales, no
podemos concluir a partir del ANOVA que cualquier media en particular es distinta
de las dems. (Existen otras pruebas que permiten identificar las medias
especficas, que son diferentes. Dichas pruebas se conocen como procedimientos
de comparacin mltiple. La comparacin de intervalos de confianza, la prueba de
Scheff, la prueba de Tukey extendida y la prueba de Bonferroni son
procedimientos de comparacin mltiple comunes).

Potrebbero piacerti anche