Sei sulla pagina 1di 51

Análisis de la Varianza (ANOVA)

La observación y la experimentación son la base en que se apoya la investigación para


el estudio de fenómenos, presentes en la naturaleza. Mediante la observación se
describe el fenómeno con todas las circunstancias que lo rodean, pero no se puede
atribuir sus efectos a una causa específica. Con la ayuda de la experimentación se
estudian dichos fenómenos en forma controlada, aislando aquellos factores que
pudieran enmascarar el efecto que ocasiona la causa de interés sobre dicho fenómeno.

En el estudio experimental de un fenómeno se plantea una hipótesis, para cuya prueba


se diseña un procedimiento de ejecución, que se denomina diseño del experimento.
Esta hipótesis, al ser probada requiere generalizarla por lo que es necesario asociarle
una medida de probabilidad. Los diseños experimentales, cuya metodología es
ampliamente usada en la investigación se realizan a fin de comparar los efectos de las
diferentes variables experimentales independientes conocidas con el nombre de
factores sobre una variable dependiente conocida como variable de respuesta.

Un diseño experimental debe adecuarse al material experimental con que se cuenta y a


las preguntas que desea contestar el investigador. Sus resultados se resumen en un
cuadro de Análisis de Varianza y en una Tabla de Comparación de Medias de
Tratamientos, que indican las diferencias entre dichas medidas.

El análisis de varianza proporciona la variación de la variable de interés, en fuentes


explicables por algunos factores y la variación debida a fuentes para las cuales el
investigador no tiene control, no puede medir y no le es posible explicar o atribuir a
algún factor en particular; variaciones que conforman el llamado error experimental.
Por ejemplo: si se realiza un experimento en el cual se estudian 4 tipos de dietas para
cerdos de engorde y se mida la ganancia de peso, la variación de dicha ganancia puede
descomponerse en la fuente de variación atribuible a las diferentes dietas y a las
fuentes desconocidas o error experimental.

El análisis de la varianza (ANOVA) es una colección de modelos estadísticos y sus


procedimientos asociados (como la "variación" entre los grupos) utilizados para
analizar las diferencias entre los medios del grupo. ANOVA fue desarrollado por el
estadístico y biólogo evolutivo Ronald Fisher. En la configuración de ANOVA, la
varianza observada en una variable particular se divide en componentes atribuibles a
diferentes fuentes de variación. En su forma más simple, ANOVA proporciona una
prueba estadística de si los medios de varios grupos son iguales o no, y por lo tanto
generaliza la prueba t para más de dos grupos. Los ANOVA son útiles para comparar
(probar) tres o más medias (grupos o variables) para la significación estadística. Es
conceptualmente similar a múltiples pruebas t de dos muestras, pero es más
conservador (produce menos errores de tipo I) y, por lo tanto, es adecuado para una
amplia gama de problemas prácticos.
En resumen, el ANOVA sirve para comparar si los valores de un conjunto de datos
numéricos son significativamente distintos a los valores de otro o más conjuntos de
datos. El método para comparar estos valores está basado en la varianza global
observada en los grupos de datos numéricos a comparar. Típicamente, el ANOVA se
utiliza para asociar una probabilidad a la conclusión de que la media de un grupo de
puntuaciones es distinta de la media de otro grupo de puntuaciones.

El ANOVA parte de algunos supuestos que han de cumplirse:

 La variable dependiente debe medirse al menos a nivel de intervalo.


 Independencia de las observaciones.
 La distribución de la variable dependiente debe ser normal.
 Homocedasticidad: homogeneidad de las varianzas.

Existen tres tipos de modelos:

 El modelo de efectos fijos asume que el experimentador ha considerado para el factor


todos los posibles valores que éste puede tomar. Ejemplo: Si el género del individuo es
un factor, y el experimentador ha incluido tantos individuos masculinos como
femeninos, el género es un factor fijo en el experimento.
 Los modelos de efectos aleatorios asumen que en un factor se ha considerado tan sólo
una muestra de los posibles valores que éste puede tomar. Ejemplo: Si el método de
enseñanza es analizado como un factor que puede influir sobre el nivel de aprendizaje y
se ha considerado en el experimento sólo tres de los muchos más métodos posibles, el
método de enseñanza es un factor aleatorio en el experimento.
 Los modelos mixtos describen situaciones donde están presentes ambos tipos de
factores: fijos y aleatorios.

La técnica fundamental consiste en la separación de la suma de cuadrados (SS, 'sum of


squares') en componentes relativos a los factores contemplados en el modelo.
SSTotal = SSError + SSFactores

El número de grados de libertad (gl) puede separarse de forma similar y se corresponde con la
forma en que la distribución Chi-cuadrado describe la suma de cuadrados asociada.
glTotal = glError + glFactores

Nota: Por grados de libertad "degrees of freedom" entendemos el número efectivo de observaciones que contribuyen a la
suma de cuadrados en un ANOVA, es decir, el número total de observaciones menos el número de datos que sean
combinación lineal de otros.

El problema más sencillo de ANOVA se conoce como el análisis de varianza de un solo factor o
diseño completamente al azar, éste se utiliza para comparar dos o más tratamientos, dado que
sólo consideran dos fuentes de variabilidad, los tratamientos y el error aleatorio.

En este todas las corridas experimentales se deben de realizar en un orden aleatorio.


De esta manera, si durante el estudio se hacen 𝑁 pruebas, éstas se corren al azar, de
manera que los posibles efectos ambientales y temporales se vayan repartiendo
equitativamente entre los tratamientos.

Vamos a suponer que se tienen 𝑘 poblaciones o tratamientos, independientes y con


medias desconocidas 𝜇1,2,...,𝜇𝑘, así como varianzas también desconocidas, pero que se
supone que son iguales 𝜎12=𝜎22= ...=𝜎𝑘2=𝜎2. Las poblaciones pueden ser 𝑘 métodos
de producción, 𝑘 tratamientos, 𝑘 grupos, etc., y sus medias se refieren o son medidas
en términos de la variable de respuesta.

Si se decide hacer un experimento completamente al azar para comparar las


poblaciones, que cumpla las condiciones antes mencionadas, entonces se tiene que
hacer mediante la hipótesis de igualdad de medias:

𝐻0: 𝜇1= 𝜇2= ...= 𝜇𝑘=𝜇


𝐻1: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖≠𝑗

Los datos generados para un diseño completamente al azar para comparar dichas
poblaciones se pueden escribir tal y como se muestra en la tabla 1.

El número de tratamientos 𝑘 es determinado por el investigador y depende del


problema en particular de que se trata. El número de observaciones en cada
tratamiento debe escogerse con base a la variabilidad que se espera observar en los
datos, así como en la diferencia mínima que el experimentador considera que es
importante detectar. Por lo general se recomiendan entre 5 y 30 mediciones en cada
tratamiento. En caso de que los tratamientos tengan efecto, las observaciones 𝑦𝑖𝑗 de la
tabla 1 se puede escribir como el modelo estadístico lineal dado por:

𝑌𝑖𝑗=𝜇+𝜏𝑖+𝜀𝑖𝑗 (1)
donde:

𝜇 – Es el parámetro de escala común a todos los tratamientos, llamado media global


𝜏𝑖 – Es un parámetro que mide el efecto del tratamiento 𝑖
𝜀𝑖𝑗 – es el error atribuido a la medición 𝑦𝑖𝑗

Tabla 1. Diseño completamente al azar


Este modelo implica que actuarían a lo más dos fuentes de variabilidad: los
tratamientos y el error aleatorio. La media global de la variable de respuesta no se
considera una fuente de variabilidad por ser una constante en todos los tratamientos,
que es un punto de referencia con el cual se comparan las respuestas medias de los
tratamientos, tal como lo muestra la figura 1.

Figura 1. Representación de los efectos de los tratamientos en un diseño


completamente al azar.

Entonces las hipótesis también se pueden escribir como:

𝐻0: 𝜏1= 𝜏2=...= 𝜏𝑘=0


𝐻1: 𝜏𝑖 ≠ 0 para algún 𝑖

Si la respuesta media de un tratamiento particular 𝜇𝑖, es muy diferente de la media


global 𝜇, es un síntoma de que existe un efecto de dicho tratamiento, ya que 𝜏𝑖=𝜇𝑖−𝜇.
La diferencia que deben tener las medias entre sí para concluir que hay un efecto, es
decir que los tratamientos sean diferentes, no lo dice el análisis de la varianza.

El modelo estadístico de la ecuación (1) describe dos situaciones diferentes con


respecto a los efectos de los tratamientos. La primera, los 𝑘 tratamientos pueden ser
elegidos explícitamente por el investigador; en este caso se quieren probar las
hipótesis acerca de las medias de los tratamientos y las conclusiones se aplican
únicamente a los niveles del factor considerados en el análisis. Las conclusiones no
pueden extenderse a tratamientos similares que no fueron considerados
expresamente. También si se quisiera estimar los parámetros del modelo (𝜇, 𝜏 , 𝜎2). A
éste se le llama modelo con efectos fijos. De manera alternativa, los 𝑘 tratamientos
podrían ser una muestra aleatoria de una población más grande de tratamientos. En
esta situación se desearía poder extender las conclusiones (las cuales se basan en la
muestra de los tratamientos) a la totalidad de los tratamientos de la población, que se
haya considerado en el análisis o no. Aquí las 𝜏𝑖 son variables aleatorias, y el
conocimiento de las 𝜏𝑖 particulares que se investigaron es relativamente inútil. Más
bien, se prueban las hipótesis acerca de la variabilidad de las 𝜏𝑖 y se intenta estimar su
variabilidad. A éste se le llama modelo con efectos aleatorios o modelo de los
componentes de la varianza.

Análisis del estadístico del modelo con efectos fijos

El análisis de varianza es la técnica central en el análisis de datos experimentales, la idea


es separar la variación total en partes con las que contribuye cada fuente de variación
en el experimento, en el diseño completamente al azar se separa la variabilidad debida
a los tratamientos y debida al erros.

Cuando la primera predomina claramente sobre la segunda, es cuando se concluye que


los tratamientos tienen efecto también se puede decir que las medias son diferentes.
Cuando los tratamientos no dominan y contribuyen igual o menor que el error, por los
que se concluye que las medias son iguales y que no hay diferencias significativas entre
los tratamientos, esto lo podemos ver en la figura 2.

De la figura 1 se puede observar claramente que:


𝜏𝑖=𝜇𝑖−𝜇 (2)

En la figura 3 podemos observar el error residual de cada una de las observaciones y


este se puede escribir de la forma:

𝜀𝑖𝑗=𝑦𝑖𝑗−𝜇𝑖 (3)

Pero la ecuación (2) y (3) se pueden escribir como

𝜇𝑖=𝜏𝑖+𝜇 (4)
𝜇𝑖=𝜀𝑖𝑗+𝑦𝑖𝑗 (5)

Igualando la ecuación (4) y (5) se tiene:

𝜏𝑖+𝜇=𝜀𝑖𝑗+𝑦𝑖𝑗 (6)
Despejando a 𝑦𝑖𝑗 tenemos:

𝑦𝑖𝑗=𝜇+𝜏𝑖+𝜀𝑖𝑗 (7)

Sabe que la media de 𝑦𝑖𝑗 difiere de la media de la población, entonces la ecuación (7) se
transforma en:

𝑦𝑖𝑗−𝜇=𝜏𝑖+𝜀𝑖𝑗 (8)

Sustituyendo las ecuaciones (2) y (3) en la ecuación (8) obtendremos:

(𝑦𝑖𝑗−𝜇)=(𝜇𝑖−𝜇)+(𝑦𝑖𝑗−𝜇𝑖) …….(9)

En la ecuación (9) podemos ver que la desviación de una observación con relación a la
gran media (desviación total) se descompone en el efecto de los tratamientos
(desviación entre tratamientos) o desviación de cada tratamiento en relación a la gran
media y en el error residual (desviación dentro de cada tratamiento) o desviación de
cada observación con relación a su propio tratamiento.

Si tomamos los datos de la tabla 1 observamos que la identidad correspondiente a


nuestro modelo para muestras es:

Si elevamos al cuadrado los términos de ambos miembros de la igualdad de la ecuación


(10), obtenemos las distintas sumas de cuadrados:
obteniendo las sumatorias la ecuación (11) se puede escribir como:

el último término de la ecuación (12) se puede escribir como:

tomando el último término tenemos que:

se sabe que

entonces

por lo tanto
la suma de cuadrados de la ecuación (12) nos queda como

donde:

Es posible obtener eficientes fórmulas para las sumas de cuadrados, expandiendo y


simplificando las expresiones anteriores. Esto produce

La suma de cuadrados del error se obtiene mediante sustracción como

En las ecuaciones anteriores se puede ver que las sumas de cuadrado son los
numeradores de las varianzas respectivas, que el ANOVA se llama cuadrados medios. A
partir de las sumatorias de cuadrados, es posible obtener dos estimadores insesgados
de la varianza poblacional 𝜎2. Se puede demostrar que cuando las medias de los
tratamientos son iguales (𝐻0:𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) tanto la suma de cuadrados de los
tratamientos como la suma de cuadrados del error divididas entre sus respectivos
grados de libertad proporcionan estimadores insesgados e independientes de 𝜎2.
Dentro de los tratamientos, se tiene que:
proporciona un estimador insesgado de la varianza de su grupo y bajo el supuesto de
que las varianzas de los tratamientos son todas iguales, se pueden ponderar las
varianzas de los 𝑘 tratamientos para obtener:

que es la varianza dentro de los tratamientos o varianzas del error o cuadrados medios
del error.

El segundo estimador de 𝜎2 se obtiene de la varianza de medias conocida (Teorema del


Limite Central) 𝜎𝑥̅2=𝜎2/𝑛, que al despejar 𝜎2 se tiene 𝜎2=𝑛𝜎𝑥̅2. Pero, un estimador
insesgado de 𝜎𝑥̅2 calculado a partir de las 𝑘 muestras:

de donde

Se puede ver que el numerador de esta expresión es la suma de cuadrados entre


tratamientos. Esta suma de cuadrados dividida entre los correspondientes grados de
libertad, es llamada la varianza entre tratamientos o cuadrados medios entre
tratamientos.
Si la hipótesis nula es cierta, se esperará que estos dos estimadores de 𝜎2 sean
aproximadamente iguales y el cociente:

Que es una variable de F de Fisher y será la unidad o casi la unidad. Por el contrario si
(𝐻0:𝑓𝑎𝑙𝑠𝑎); es decir, si los efectos de los tratamientos no son nulos, esto tenderá a ser
significativamente menor que la unidad. Así se rechazará (𝐻0) si

es mayor que la F de tablas ( F teórica) 𝐹1−𝛼,𝑔𝑙 𝑇𝑟𝑡,𝑔𝑙 𝑒𝑟𝑜𝑟 donde 𝑔𝑙𝑇𝑟𝑡=𝑘−1 y 𝑔𝑙𝑒𝑟𝑜𝑟=𝑁−𝑘.
Todo esto se puede sintetizar en una tabla llamada tabla de ANOVA (tabla 2).
Tabla 2. Tabla de ANOVA para un diseño completamente al azar

Vamos a ver un ejemplo, suponga que en una empresa dedica a la elaboración y venta
de alimentos, un ingeniero a observado que en las frituras, las rosquillas absorben
grasa en diversas cantidades, y está interesado en saber si la cantidad absorbida
depende del tipo de grasa que se utiliza. Para esto, desarrolló un experimento en el
cual se prepararon 24 bolsas de 250 gramos y se cocieron con cuatro diferentes tipos
de aceites (aceite de cártamo (A), aceite de girasol (B), aceite de semilla de maíz (C) y
aceite de soya (D)). Los datos obtenidos de grasa absorbida en miligramos se muestran
en la tabla 3.
El ingeniero se pregunta si estos datos aportan suficiente evidencia para indicar una
diferencia entre los diferentes tipos de aceites. En análisis de la varianza se desarrolla
como sigue:

Primero se deben plantear las hipótesis, para este ejemplo se tiene:

𝐻0: 𝜇𝐴= 𝜇𝐵= 𝜇𝐶=𝜇𝐷

𝐻1: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖≠𝑗

o bien
𝐻0: 𝜏𝐴= 𝜏𝐵= 𝜏𝐶= 𝜏𝐷=0
Tabla 3. Gramos de grasa absorbida

Ahora vamos a obtener los totales y las medias de acuerdo a lo planteado en la tabla 1.

Para hacer más sencillos los cálculos, tenemos:

Sustituyendo estos valores en la ecuación (13):

Para calcular la sumatoria de cuadrados de los tratamientos primero realizaremos:

Sustituyendo en la ecuación (14)


Para obtener la sumatoria de cuadrados del error solo sustituimos los dos resultados
anteriores en la ecuación (16):

𝑆𝐶𝑒𝑟𝑜𝑟=𝑆𝐶𝑇𝑜𝑡−𝑆𝐶𝑇𝑟𝑡 =3,550.96−2,480.12=1,070.83

Ahora determinaremos los grados de libertad para las sumatorias de cuadrados y esto
se obtienen de la siguiente manera:

En seguida calcularemos los cuadrados medios del erro y de los tratamientos,


dividiendo sus respectivas sumas cuadradas entre sus respectivos grados de libertad:

Por último calcularemos el valor de 𝐹𝑐𝑎𝑙𝑐

Con los datos obtenidos elaboraremos la tabla de análisis de la varianza:

Con un nivel de significancia 𝛼=5% y, 20 grados de libertad, se encuentra el valor en la


tabla, siendo para este caso 𝐹𝑡𝑎𝑏𝑙𝑎𝑠=2.87.

Como 𝐹𝑐𝑎𝑙𝑐=15.44>𝐹𝑡𝑎𝑏𝑙𝑎𝑠=2.87, se rechaza la hipótesis nula 𝐻0, como lo podemos ver


en la siguiente figura. Por lo que sí existe suficiente evidencia estadística al nivel del 5%
de que hay una diferencia significativa entre los diferentes tipos de grasa que absorben
las rosquillas.
Zona de aceptación y de rechazo de la hipótesis nula.

Verificación de los supuestos del modelo

Las suposiciones en el análisis de varianza son fundamentalmente:

• Normalidad de las distribuciones


• Igualdad de Varianzas
• Independencia

Debido a estos supuestos la validez de los resultados obtenidos en cualquier análisis de


la varianza quedará sujeta a que se cumplan dichos supuestos. Esto es, la respuesta (𝑦)
se debe de distribuir normalmente, con la misma varianza en cada tratamiento y las
mediciones deben ser independientes.

Es una práctica común utilizar la muestra de residuos para comprobar los supuestos del
modelo, ya que si los supuestos se cumplen, los residuos o también conocidos como
residuales se pueden ver como una muestra aleatoria de una distribución normal con
media cero y varianza constante. Los residuos, 𝑒𝑖𝑗, se definen como la diferencia entre
la respuesta observada 𝑦𝑖𝑗, y la respuesta predicha por el modelo (𝑦𝑖 ), lo cual permite
hacer un diagnóstico más directo de la calidad del modelo, ya que su magnitud señala
qué tan bien describe a los datos el modelo. Para comprobar cada supuesto existen
pruebas analíticas y gráficas. Por sencillez, muchas veces se prefieren las pruebas
gráficas. Éstas tienen el inconveniente de que son exactas, pero aun así, en la mayoría
de las situaciones prácticas proporcionan le evidencia suficiente contra o a favor de los
supuestos.

El uso de las pruebas gráficas requiere una fuerte evidencia visual para concluir que el
supuesto en cuestión no se cumple, ya que se requiere que la evidencia en contra de un
supuesto esté soportada por más de dos puntos.
Cuando son uno o dos los puntos que se salen del comportamiento esperado de las
gráficas se puede tratar de un problema de puntos aberrantes, no de una violación del
supuesto en cuestión. En este caso debe de investigarse la obtención de dichas
mediciones atípicas ya que ese tipo de puntos pueden afectar sensiblemente los
resultados del análisis.

Ventajas y desventajas al utilizar un Diseño completamente aleatorizado

Ventajas
a. Permite gran flexibilidad, es decir puede usarse cualquier número de
tratamientos y repeticiones, además se puede variar el número de repeticiones de un
tratamiento a otro.
b. El análisis estadístico es sencillo, aún si el número de repeticiones no es el
mismo para cada tratamiento.
c. El análisis estadístico es fácil aun cuando los datos de algunas de las unidades
experimentales o algunos tratamientos completos se hayan perdido o se rechacen por
alguna causa.
d. Es el diseño que se basa en más grados de libertad para la estimación de los
cuadrados medios.
Desventajas
Para usar este diseño se necesitan unidades experimentales muy homogéneas, porque
de otra manera la variación entre ellas pasa a formar parte del error experimental.

Análisis de la varianza de dos factores

Es un diseño de ANOVA que permite estudiar simultáneamente los efectos de dos


fuentes de variación.

Se tiene el siguiente ejemplo:

Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión


arterial, comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25
hipertensos y se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le
suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al
tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada y al quinto el
mismo fármaco a otra dosis. Las presiones arteriales sistólicas de los 25 sujetos al
finalizar los tratamientos son:

Grupo
1 2 3 4 5
180 172 163 158 147
173 158 170 146 152
175 167 158 160 143
182 160 162 171 155
181 175 170 155 160
La tabla de anova es:

Fuente de variación GL SS MS F
Tratamiento 4 2010,64 502,66 11,24
Error 20 894,4 44,72
Total 24 2905,04

Como F0,05 (4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y concluimos que los
resultados de los tratamientos son diferentes.

Como vemos, en él se estudiaban diversos tratamientos para la hipertensión arterial.


Se podría plantear que, quizás, la evolución de la misma fuera diferente para los
hombres y las mujeres, en cuyo caso, y si el número de hombres y mujeres en cada
muestra no fuera el mismo, podría ocurrir que una parte del efecto atribuido a los
tratamientos fuera debido al sexo.

En cualquier caso, el investigador puede estar interesado en estudiar si hay, o no,


diferencia en la evolución según el sexo. En un ANOVA de dos vías se clasifica a los
individuos de acuerdo a dos factores (o vías) para estudiar simultáneamente sus
efectos. En este ejemplo se harían cinco grupos de tratamiento para los hombres y
otros cinco para las mujeres, en total diez grupos; en general, si el primer factor tiene a
niveles y el segundo tiene b, se tendrán ab muestras o unidades experimentales, cada
una con n individuos o repeticiones.

Una observación individual se representa como:

El primer subíndice indica el nivel del primer factor, el segundo el nivel del segundo
factor y el tercero la observación dentro de la muestra. Los factores pueden ser ambos
de efectos fijos (se habla entonces de modelo I), de efectos aleatorios (modelo II) o
uno de efectos fijos y el otro de efectos aleatorios (modelo mixto). El modelo
matemático de este análisis es:

Modelo I

Modelo II

Modelo mixto

donde m es la media global, ai o Ai el efecto del nivel i del 1º factor, bj o Bj el efecto del
nivel j del 2º factor y eijk las desviaciones aleatorias alrededor de las medias, que
también se asume que están normalmente distribuidas, son independientes y tienen
media 0 y varianza s2.

A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo


añade la de aditividad de los efectos de los factores.

A los términos (ab) ij, (AB)ij, (aB)ij, se les denomina interacción entre ambos factores y
representan el hecho de que el efecto de un determinado nivel de un factor sea
diferente para cada nivel del otro factor.

Para entender mejor este concepto de interacción veamos un ejemplo sencillo sobre un
ANOVA de dos factores, cada uno con dos niveles: supóngase un estudio para analizar
el efecto de un somnífero teniendo en cuenta el sexo de los sujetos. Se eligen al azar
dos grupos de hombres y otros dos de mujeres. A un grupo de hombres y otro de
mujeres se les suministra un placebo y a los otros grupos el somnífero. Se mide el
efecto por el tiempo que los sujetos tardan en dormirse desde el suministro de la
píldora.

Se trata de un ANOVA de dos factores (sexo y fármaco) fijos, cada uno con dos niveles
(hombre y mujer para el sexo y somnífero y placebo para el fármaco). Los dos tipos de
resultados posibles se esquematizan en la figura

A B

En la figura A se observa que las mujeres tardan más en dormirse, tanto en el grupo
tratado como en el grupo placebo (hay un efecto del sexo) y que los tratados con
placebo tardan más en dormirse que los tratados con somnífero en ambos sexos (hay
un efecto del tratamiento). Ambos efectos son fácilmente observables.

Sin embargo en la figura B es difícil cuantificar el efecto del somnífero pues es distinto
en ambos sexos y, simétricamente, es difícil cuantificar el efecto del sexo pues es
distinto en ambos grupos de tratamiento. En este caso, se dice que existe interacción.
Podría, incluso, darse el caso de que se invirtieran los efectos de un factor para los
distintos niveles del otro, es decir, que las mujeres se durmieran antes con el somnífero
y los hombres antes con el placebo.

La interacción indica, por tanto, que los efectos de ambos factores no son aditivos:
cuando se dan juntos, su efecto no es la suma de los efectos que tienen cuando están
por separado, por lo que, si en un determinado estudio se encuentra interacción entre
dos factores, no tiene sentido estimar los efectos de los factores por separado. A la
interacción positiva, es decir, cuando el efecto de los factores actuando juntos es
mayor que la suma de efectos actuando por separado, en Biología se le denomina
sinergia o potenciación y a la interacción negativa inhibición. En el ejemplo de la figura
B, se diría que el ser mujer inhibe el efecto del somnífero, o que el ser hombre lo
potencia (según el sexo que se tome como referencia).

Identidad de la suma de cuadrados

La suma de cuadrados total en un anova de 2 vías, es:

(donde para representar las medias se ha usado la convención habitual de poner un


punto (.) en el lugar del subíndice con respecto al que se ha sumado) que dividida por
sus grados de libertad, abn - 1, estima la varianza s2 en el supuesto de que las ab
muestras provengan de una única población.

Se puede demostrar que

que es la llamada identidad de la suma de cuadrados en un ANOVA de dos factores. Los


sucesivos sumandos reciben respectivamente el nombre de suma de cuadrados del 1º
factor (tiene a-1 grados de libertad y recoge la variabilidad de los datos debida
exclusivamente al 1º factor), del 2º factor (con b-1 grados de libertad y recoge la
variabilidad de los datos debida exclusivamente al 2º factor), de la interacción (con (a-
1)(b- 1) grados de libertad, recoge la variabilidad debida a la interacción) y del error (con
ab(n - 1) grados de libertad, recoge la variabilidad de los datos alrededor de las medias
de cada muestra).

Los resultados de un análisis de la varianza de dos factores se suelen representar en


una tabla como la siguiente:
Fuente de variación GL SS MS
1º factor a-1 SSA SSA/(a - 1)
2º factor b-1 SSB SSB/(b - 1)
Interacción (a - 1)(b - 1) SSAB SSAB/[(a - 1)(b - 1)]
Error ab(n - 1) SSE SSE/[ab(n - 1)]
Total abn - 1 SST

Los grados de libertad también son aditivos.

En ocasiones se añade una primera línea llamada de tratamiento o de subgrupos cuyos


grados de libertad y suma de cuadrados son las sumas de los del primer, segundo
factor y la interacción, que corresponderían a la suma de cuadrados y grados de
libertad del tratamiento de un análisis de una vía en que las ab muestras se
considerarán como muestras de una clasificación única.

Para plantear los contrastes de hipótesis hay que calcular los valores esperados de los
distintos cuadrados medios.

Contrates de hipótesis en un análisis de la varianza de dos factores

Del mismo modo que se hizo en el ANOVA de una vía, para plantear los contrastes de
hipótesis habrá que calcular los valores esperados de los distintos cuadrados medios.
Los resultados son:

Modelo I

MS Valor esperado

MSA

MSB

MSAB

MSE

Por lo tanto, los estadísticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen como


una F con los grados de libertad correspondientes y permiten contrastar,
respectivamente, las hipótesis:

i) no existe interacción ( MSAB/MSE)


ii) no existe efecto del primer factor, es decir, diferencias entre niveles del primer
factor (MSA/MSE)

iii) no existe efecto del segundo factor ( MSB/MSE)

Si se rechaza la primera hipótesis de no interacción, no tiene sentido contrastar las


siguientes. En este caso lo que está indicado es realizar un análisis de una vía entre las
ab combinaciones de tratamientos para encontrar la mejor combinación de los mismos.

Modelo II

MS Valor esperado
MSA
MSB
MSAB
MSE

donde son, respectivamente las componentes añadidas por el primer


factor, por el segundo y por la interacción, que tienen la misma forma que los del
modelo I, sin más que cambiar ai y bj por Ai y Bj, respectivamente.

La interacción se contrasta, como en el modelo I, con MSAB/MSE, si se rechaza la


hipótesis nula se contrastarían cada uno de los factores con MSA/MSAB y MSB/MSAB.

En un modelo II, como no se está interesado en estimar los efectos de los factores sino
sólo la existencia de la componente añadida, sí tiene sentido contrastar la existencia de
la misma para cada factor incluso aunque exista interacción.

Aquí el problema se plantea cuando no se puede rechazar la hipótesis nula y se


concluye que no existe interacción: entonces tanto MSE como MSAB estiman s2,
entonces ¿cuál se elige para contrastar la componente añadida de los factores?.

En principio, parece razonable escoger su media (la media de varios estimadores


centrados es también un estimador centrado y más eficiente), sin embargo si se elige
MSAB se independiza el contraste para los factores de un posible error tipo II en el
contraste para la interacción. Hay autores que por ello opinan que es mejor usar MSAB,
pero otros proponen promediar si se puede asegurar baja la probabilidad para el error
tipo II. La media de los cuadrados medios se calcula dividiendo la suma de las sumas de
cuadrados por la suma de los grados de libertad.

Ejemplo

A partir de la siguiente tabla de un ANOVA de 2 factores modelo II, realizar los


contrastes adecuados.

Fuente de variación G.L. SS MS


1º factor 4 315,8 78,95
2º factor 3 823,5 274,5
Interacción 12 328,9 27,41
Error 100 2308,0 23,08
Total 119 3776,2

Se empezaría contrastando la existencia de interacción: f = 27,41/23,08 = 1,188 como


F0,05 (12,100) = 1,849 no se puede, al nivel de significación del 95%, rechazar la hipótesis
nula y se concluye que no existe interacción.

Si usamos MSAB para contrastar los factores:

1º factor: f = 78,95/27,41 = 2,880 como F0,05(4,12) = 3,26 no se rechaza la hipótesis nula


y se concluye la no existencia de componente añadida por este factor.

2º factor: f = 274,5/27,41 = 10,015 como F 0,05(3,12) = 3,49 se rechaza la hipótesis nula y


se acepta la existencia de componente añadida por este factor.

El resultado del análisis es: no existe componente añadida por la interacción, tampoco
por el 1º factor y sí existe componente añadida por el 2º.

La estimación de esta componente es: como a partir de los grados de libertad de la


tabla podemos calcular a = 5, b = 4 y n = 6 resulta que la estimación de es 274,5 -
27,41 = 247,09; por lo tanto que representa un 35,7% de
componente añadida por el segundo factor.

Si se hubiera optado por promediar, los cuadrados medios promediados son


(328,9+2308,0)/(12+100)=

23,54 con 112 grados de libertad y hubiera resultado significativo también el 1º factor.

La salida de un paquete estadístico, p.ej. el Statgraphics, para un ANOVA de 2 factores


modelo II:
Modelo mixto

Supóngase el primer factor de efectos fijos y el segundo de efectos aleatorios, lo que


no supone ninguna perdida de generalidad, ya que el orden de los factores es
arbitrario.

MS Valor esperado

MSA

MSB
MSAB
MSE

Se contrastan la interacción y el factor aleatorio con el término de error, si la


interacción fuera significativa no tiene sentido contrastar el efecto fijo y si no lo fuera,
el efecto fijo se contrasta con el término de interacción o con el promedio de
interacción y error.

Ejemplo

Se quiere probar la eficacia de un somnífero estudiando posibles diferencias de la


misma por el sexo de los sujetos. Se eligen al azar dos grupos de insomnes varones y
otros dos de mujeres y tanto para los hombres como para las mujeres se suministra a
un grupo el somnífero y a otro un placebo y se mide, en minutos, el tiempo que tardan
en dormirse.
Los resultados son:

Placebo Somnífero
30 35
50 32
45 30 Hombre
47 25
38 30
50 42
35 30
46 15 Mujer
25 18
32 23

Se trata de un ANOVA de dos factores fijos. Llamamos primer factor a la droga que
tiene dos niveles: placebo y somnífero. El segundo factor es el sexo también con 2
niveles: hombres y mujeres. El tamaño de las muestras es n=5.

La tabla de anova es:

Fuente de variación GL SS MS
Somnífero 1 696,2 696,2
Sexo 1 105,8 105,8
Interacción 1 0,2 0,2
Error 16 1197,6 74,85
Total 19 1999,8

Se empieza contrastando la interacción: f = 0,2/74,85 = 0,0026 que como es menor que


F 0,05 (1,16)=4,49 no se rechaza la hipótesis nula de que no existe interacción.

A continuación se contrastan los factores: para el somnífero f = 696,2/74,85 = 9,3 que


es mayor que 4,49 por lo tanto existe efecto del somnífero y para el sexo f =
105,8/74,85 = 1,41 que como es menor que 4,49 no existe diferencias entre los sexos.

La estimación del efecto del somnífero será la diferencia entre las medias de los que lo
toman y los que tomaron placebo, sin tener en cuenta el sexo, una vez que se ha visto
que no tiene efecto.

Para analizarlo con un paquete estadístico, p.e. el Statgraphics, se necesita crear un


archivo con tres variables
y el resultado, pidiendo la tabla de ANOVA

y la tabla de medias
Por tanto la estimación del efecto del somnifero es 39,8 - 28,0=11,8 min

Algunas notas de interés:

El nombre de Análisis de la varianza, sin embargo, no es muy afortunado. En el ANOVA


se comparan siempre las medias de varias poblaciones y se hace a través de un
contraste de hipótesis donde se analiza la varianza, es cierto; pero no sólo eso, porque
también se analizan las diferencias de medias que hay entre las muestras, y también,
por supuesto, como siempre en Estadística, se analiza el tamaño de muestra.

Las técnicas de comparación siempre analizan estos tres elementos: dispersión,


diferencias de medias y tamaño muestral. Por lo tanto, ANOVA es, en realidad, una
metonimia: se habla del todo a partir de una parte. Porque, en realidad, la técnica que
vamos a ver en este tema, se debería denominar: Análisis de la varianza, de la diferencia
de medias y del tamaño muestral.

Otro concepto importante en ANOVA: Cuando tenemos dos o más factores estos
pueden estar, entre sí, dos a dos, cruzados o anidados. Dos factores están cruzados
cuando todos los niveles de un factor se cruzan, se combinan, con todos los niveles del
otro factor.

Dos factores están anidados (uno dentro de otro) cuando los niveles de uno se
combinan, jerárquicamente, entre los niveles del otro. Supongamos, por ejemplo, que
queremos ver la influencia que tienen, en los resultados de calidad de un producto, la
máquina y el operario. Y tenemos cuatro tipos de máquinas y dos operarios. El primer
operario trabaja en las máquinas 1 y 2, el segundo en la 3 y la 4. Tenemos, pues, dos
factores: máquina (con cuatro niveles) y operario (con dos niveles). Y están anidados.
No están cruzados. Dos máquinas las usa un operario y las otras dos máquinas las usa el
otro operario.
En el ANOVA de dos o más factores cruzados, podemos valorar algo muy importante: la
interacción entre factores. Interacción entre factores significa que la variable
estudiada, la variable dependiente, se comporta, ante niveles de un factor,
dependiendo de cuáles sean los niveles del otro factor. O sea, que la variable estudiada
tiene un valor que es función de la combinación que se dé de niveles.

Existen diversas técnicas de ANOVA, entre las cuales podemos citar:

 ANOVA de un factor a efectos fijos.


 ANOVA de un factor a efectos aleatorios.
 ANOVA de dos factores a efectos fijos.
 ANOVA de dos factores a efectos aleatorios.
 ANOVA de dos factores a efectos mixtos (uno fijo y uno aleatorio).
 ANOVA de dos factores anidados a efectos fijos.
 ANOVA de dos factores anidados a efectos aleatorios.
 ANOVA de dos factores anidados a efectos mixtos.
 ANOVA de un factor fijo con bloques aleatorizados.
 ANOVA de cuadrados latinos.

En todas estas técnicas el objetivo básico será contrastar la hipótesis de igualdad o


diferencia entre los distintos niveles en cada factor. Y si hay más de un factor y están
cruzados contrastar la existencia de interacción entre esos factores. La importancia de
diferenciar entre modelos diferentes es porque, como puede verse en cada uno de
ellos, el cálculo de los p-valores para evaluar la significación es diferente según sean
factores fijos o aleatorios, cruzado y anidado.
ANOVA NO PARAMÉTRICO
Test de Kruskal-Wallis
Ejemplos con SPSS

ANOVA de un factor
El procedimiento ANOVA de un factor, produce un análisis de varianza para una
variable dependiente cuantitativa por una variable de factor único (independiente).
El análisis de varianza se usa para probar la hipótesis de que varias medias son iguales.
Esta técnica es una extensión de la prueba t de dos muestras.
Además de determinar que existen diferencias entre las medias, es posible que desee
saber qué medios difieren. Existen dos tipos de pruebas para comparar medias:
Contrastes a priori y pruebas post hoc. Los contrastes son pruebas configuradas antes
de ejecutar el experimento, y las pruebas post hoc se ejecutan después de que se haya
realizado el experimento.
Ejemplo. Las donas absorben la grasa en varias cantidades cuando se cocinan. Se
establece un experimento que involucra tres tipos de grasa: aceite de maní, aceite de
maíz y manteca de cerdo. El aceite de maní y el aceite de maíz son grasas insaturadas, y
la manteca de cerdo es una grasa saturada.
Además de determinar si la cantidad de grasa absorbida depende del tipo de grasa
utilizada, puede establecer un contraste a priori para determinar si la cantidad de
absorción de grasa difiere para las grasas saturadas y no saturadas.

Análisis de varianza de una sola vía (o un factor)

Puede usar el procedimiento ANOVA de una vía para probar la hipótesis de que los
medios de dos o más grupos no son significativamente diferentes.

El ANOVA de una vía también ofrece:

Estadísticas a nivel de grupo para la variable dependiente.


Una prueba de igualdad de varianza.
Un gráfico para el promedio de los grupos o categorías.
Pruebas de rango, comparaciones múltiples por pares y contrastes, para describir
la naturaleza de las diferencias grupales.

Un primer paso importante en el análisis de la varianza es establecer la validez de los


supuestos. Un supuesto de ANOVA es que las variaciones de los grupos son
equivalentes. El siguiente ejemplo ilustra cómo esa prueba es realizada.
Un gerente de ventas desea determinar la cantidad óptima de días de capacitación
necesarios para los nuevos empleados. Tiene puntajes de desempeño para tres grupos:
empleados con uno, dos o tres días de capacitación. Los datos están en el expediente
salesperformance.sav
Este es un archivo de datos hipotéticos que se refiere a la evaluación de dos nuevos cursos de capacitación en ventas.
Sesenta empleados, divididos en tres grupos, todos reciben capacitación estándar. Además, el grupo 2 recibe
formación técnica; Grupo 3, un tutorial práctico. Cada empleado fue evaluado al final del curso de capacitación, y su
puntaje fue registrado. Cada caso en el archivo de datos representa un aprendiz por separado y registra el grupo al que
fueron asignados y la calificación que recibieron en el examen.
Antes de ejecutar el análisis de varianza, se realiza una gráfica para los promedios y los
errores estándar.

El rendimiento promedio aumenta claramente con días de entrenamiento adicionales,


pero la variación en el rendimiento disminuye al mismo tiempo. ANOVA asume la
igualdad de variación entre los grupos; ese supuesto puede no ser válido para estos
datos.
Para probar el supuesto de igualdad de varianza, elija en los menús:
Analizar
Comparar medios
ANOVA unidireccional ...

Seleccione Descriptivos y Homogeneidad de la prueba de varianza.


► Haga clic en Continuar.
► Haga clic en Aceptar en el cuadro de diálogo ANOVA unidireccional.
La desviación estándar y el error estándar confirman que a medida que aumentan los
días de entrenamiento, la variación en el rendimiento disminuye

La estadística de Levene rechaza la hipótesis nula de que las variaciones de grupo son
iguales. ANOVA es robusto a esta violación cuando los grupos son de igual o casi igual
tamaño; sin embargo, puede elegir transformar los datos o realizar una prueba no
paramétrica que no requiera esta suposición:

GLM Univariate Analysis (Análisis univariado GLM)


El procedimiento “GLM Univariate” proporciona un análisis de varianza para una
variable dependiente por uno o más factores y/o variables. Las variables factores
dividen la población en grupos. Usando este procedimiento del modelo lineal general,
puede probar hipótesis nulas sobre los efectos de otras variables en los medios de varias
agrupaciones de una sola variable dependiente. Puede investigar las interacciones entre
los factores, así como los efectos de factores individuales, algunos de los cuales pueden
ser aleatorios.
Se pueden probar modelos tanto balanceados como no balanceados (Un diseño
balanceado tiene un número de observaciones que es igual para todas las combinaciones
posibles de los niveles de los factores. Un diseño no balanceado tiene un número
desigual de observaciones).
Un diseño se equilibra si cada celda del modelo contiene el mismo número de casos.
Además de probar hipótesis, el procedimiento GLM Univariate produce estimaciones de
parámetros.
Los contrastes a priori comúnmente utilizados están disponibles para realizar pruebas
de hipótesis. Además, después de que una prueba de F general haya demostrado
importancia, puede usar pruebas post hoc para evaluar las diferencias entre los medios
específicos. Las medias marginales estimadas proporcionan estimaciones de los valores
medios pronosticados para las celdas en el modelo, y las gráficas de perfil (gráficas de
interacción) de estos medios le permiten visualizar fácilmente algunas de las relaciones.
El procedimiento GLM Univariate le permite modelar el valor de una variable de escala
dependiente en función de su relación con los predictores categóricos y de escala.
El procedimiento GLM Univariate se basa en el procedimiento del Modelo Lineal
General, en el que se supone que los factores y las covariables tienen una relación lineal
con la variable dependiente.
Los predictores categóricos deben seleccionarse como factores en el modelo. Cada nivel
de un factor puede tener un efecto lineal diferente en el valor de la variable dependiente.
• Los factores de efectos fijos generalmente se consideran variables cuyos valores
de interés están representados en el archivo de datos.
• Los factores de efectos aleatorios son variables cuyos valores en el archivo de
datos pueden considerarse una muestra aleatoria de una población mayor de
valores. Son útiles para explicar el exceso de variabilidad en la variable
dependiente.
Por ejemplo, una cadena de tiendas de comestibles está interesada en los efectos de
cinco tipos diferentes de cupones en el gasto del cliente. En varias tiendas, estos
cupones se entregan a los clientes que frecuentan esa ubicación; Un cupón seleccionado
al azar para cada cliente.
El tipo de cupón es un efecto fijo porque la compañía está interesada en esos cupones en
particular. La ubicación de la tienda es un efecto aleatorio porque las ubicaciones
utilizadas son una muestra de la mayor población de interés, y si bien es probable que
haya una variación entre las tiendas en el gasto de los clientes, la empresa no está
interesada directamente en esa variación en el contexto de este problema
Los predictores de escala deben seleccionarse como covariables en el modelo. Dentro
de las combinaciones de niveles de factor (o celdas), se asume que los valores de las
covariables están correlacionados linealmente con los valores de las variables
dependientes.
De manera predeterminada, el procedimiento GLM Univariate produce un modelo con
todas las interacciones factoriales, lo que significa que cada combinación de niveles de
factor puede tener un efecto lineal diferente en la variable dependiente. Además, puede
especificar las interacciones factor-covariable, si cree que la relación lineal entre una
covariable y la variable dependiente cambia para los diferentes niveles de un factor.
A los fines de probar hipótesis sobre estimaciones de parámetros, GLM Univariate
asume:
• Los valores de los errores son independientes entre sí y las variables en el
modelo. Bueno estudiar diseño generalmente evita violación de esto suposición.
• La variabilidad de los errores es constante a través de las células. Esto puede ser
particularmente importante cuando hay tamaños de células desiguales; es decir,
diferentes números de observaciones a través de combinaciones de nivel de
factor.
• Los errores tienen una distribución normal con una media de 0.
Uso de GLM Univariate para realizar un análisis de varianza de dos factores
Una cadena de tiendas de comestibles encuestó a un grupo de clientes con respecto a sus
hábitos de compra. Dados los resultados de la encuesta y cuánto gastó cada cliente en el
mes anterior, la tienda desea ver si la frecuencia con la que los clientes compran está
relacionada con la cantidad que gastan en un mes, controlando el género del cliente.
Esta información se recopila en grocery_1month.sav. Se utilizara el procedimiento GLM
Univariate para realizar un ANOVA de dos factores (o de dos vías) en las cantidades
gastadas.
Este archivo de datos hipotéticos contiene las compras semanales "acumuladas" donde cada caso corresponde a un
cliente separado. La cantidad gastada registrada es la suma de las cantidades gastadas durante las cuatro semanas del
estudio.

Para ejecutar un análisis univariado GLM , desde los menús elija:


Analizar
Modelo lineal general
Univariante ...

► Seleccione la cantidad gastada como la variable dependiente.


► Seleccione el género y el estilo de compra como los factores fijos.
► Hacer clic Gráficos
► Seleccione el estilo como la variable del eje horizontal.
► Seleccione el género como la variable de líneas separadas.
► Haga clic en Agregar.
► Haga clic en Continuar.
► Haga clic en Post Hoc en el cuadro de diálogo GLM Univariate.

► Seleccione el estilo como la variable para la cual se deben producir las pruebas post
hoc.

► Seleccione Tukey en el grupo Supuesto por desviaciones iguales.


► Seleccione el T2 de Tamhane en el grupo Varianzas iguales no asumidas.
► Haga clic en Continuar.
► Haga clic en Opciones en el cuadro de diálogo GLM Univariate

► Seleccione el estilo de gender *style como el término para el cual deben mostrarse
los medios.
► Seleccione Estadísticas descriptivas, Pruebas de homogeneidad, Estimaciones del
tamaño del efecto y “Spread vs. level plot” en el grupo Display.
► Haga clic en Continuar.
► Haga clic en Aceptar en el cuadro de diálogo GLM Univariate

Estas selecciones producen un análisis de varianza de dos factores donde se solicitan


pruebas post hoc para determinar cómo difieren los tres estilos de compra.
La siguiente tabla muestra estadísticas descriptivas para cada combinación de factores
en el modelo:

Parece que hay un efecto de estilo de compras; en promedio, los clientes "quincenales"
gastan $ 378.52, mientras que los clientes "semanales" gastan $ 404.55, y los clientes "a
menudo" gastan $ 406.76.
También parece haber un efecto de género; en promedio, los hombres en la muestra
gastan $ 430.30 en comparación con $ 365.66 para las mujeres
Por último, puede haber un efecto de interacción entre el género y el estilo de compra ,
porque las diferencias medias en la cantidad gastada por el estilo de compra varían entre
los géneros
Por ejemplo, los clientes masculinos "quincenales" tienden a gastar más que los clientes
masculinos "a menudo", pero esta tendencia se invierte para las clientas "quincenales" y
"a menudo" femeninas
La columna N en la tabla muestra que hay tamaños de celda desiguales. La mayoría de
los clientes prefieren comprar semanalmente
Las desviaciones estándar parecen ser relativamente homogéneas, aunque debe verificar
la prueba de Levene y las gráficas de distribución en función del nivel para estar seguro.

La tabla siguiente prueba la hipótesis nula de que la varianza del término de error es
constante en las celdas definidas por la combinación de niveles de factor

Dado que el valor de significación de la prueba, 0.330, es mayor que 0.10, no hay razón
para creer que se haya violado el supuesto de varianzas iguales. Por lo tanto, las
pequeñas diferencias en las desviaciones estándar de grupo observadas en la tabla de
estadísticas descriptivas se deben a la variación aleatoria.

El gráfico de distribución en función del nivel es un diagrama de dispersión de las


medias de las celdas y las desviaciones estándar de la tabla de estadísticas descriptivas

Este gráfico proporciona una prueba visual del supuesto de varianzas iguales, con el
beneficio adicional de ayudarlo a evaluar si las violaciones del supuesto se deben a una
relación entre las medias de las celdas y las desviaciones estándar.
No hay un patrón aparente en esta gráfica, por lo que no hay ninguna indicación de tal
relación aquí
Las pruebas de los efectos entre sujetos le ayudan a determinar la importancia de un
factor. Sin embargo, no indican cómo difieren los niveles de un factor. Las pruebas post
hoc muestran las diferencias en las medias pronosticadas por el modelo para cada par de
niveles de factores
En la siguiente tabla tenemos:
La primera columna (en rojo) muestra las diferentes pruebas post hoc.
Las siguientes dos columnas (en verde) muestran el par de niveles de factor que se están
probando
Cuando el valor significativo de la diferencia en la cantidad gastada para un par de
niveles de factor es menor que 0.05, se imprime un asterisco (*) por la diferencia.
En este caso, no parece haber diferencias significativas en los hábitos de gasto de los
clientes "quincenales", "semanales" o "a menudo"
El T2 de Tamhane es generalmente más apropiado que el HSD de Tukey cuando hay
tamaños de celdas desiguales, pero los resultados en este caso son en gran medida los
mismos.
En la tabla anterior los intervalos de confianza para el T2 de Tamhane son solo un poco
más amplios que los del HSD de Tukey.
Dado que los resultados de estas dos pruebas no son muy diferentes, es bueno que se
revisen los resultados de los subconjuntos homogéneos, que están disponibles para la
HSD de Tukey pero no para la T2 de Tamhane .
La tabla de subconjuntos homogéneos toma los resultados de las pruebas post hoc y los
muestra en una forma más fácil de interpretar

En las columnas de subconjunto, los niveles de factor que no tienen efectos


significativamente diferentes se muestran en la misma columna.
En este ejemplo, el primer subconjunto contiene los clientes "quincenales", "semanales"
y "a menudo"
Estos son todos los clientes, por lo que no hay otros subconjuntos.
Las pruebas post hoc sugieren que los esfuerzos para atraer a los clientes a comprar con
más frecuencia de lo habitual se desperdician porque no gastarán mucho más.
Sin embargo, los resultados de las pruebas post hoc no tienen en cuenta los niveles de
otros factores, por lo que se ignora la posibilidad de un efecto de interacción con el
género visto en la tabla de estadísticas descriptivas. Vea los medios marginales
estimados para ver cómo esto podría cambiar sus conclusiones.
Esta tabla muestra las medias marginales estimadas por el modelo y los errores estándar
de la cantidad gastada en las combinaciones de factores de género y estilo de compra.
Esta tabla es útil para explorar el posible efecto de interacción entre estos dos factores.
En este ejemplo, se espera que un cliente masculino que realiza compras semanalmente
gaste alrededor de $ 440.96, mientras que uno que hace compras con mayor frecuencia
debe gastar $ 407.77.
Se espera que una cliente que realiza compras semanalmente gaste $ 361.72, mientras
que una que haga compras con mayor frecuencia gastará $ 405.72. Por lo tanto, existe
una diferencia entre clientes "semanales" y "a menudo", según el género del cliente.

Este hecho sugiere un efecto de interacción entre el género y el estilo de compra . Si no


hubiera interacción, usted esperaría que la diferencia entre los estilos de compra
permanezca constante para los clientes masculinos y femeninos. La interacción se puede
ver más fácilmente en las parcelas de perfil.
El gráfico de perfil es una representación visual de la tabla de medios marginales.
Los niveles de factor del estilo de compra se muestran a lo largo del eje horizontal
Líneas separadas son
realizadas para cada
grupo.

Alternativamente, los niveles de factor de Género podrían mostrarse a lo largo del eje
horizontal, con líneas separadas producidas para cada nivel de estilo de Compras .
Si no hubiera efecto de interacción, las líneas en la tabla serían paralelas. En cambio,
puede ver que la diferencia en el gasto entre clientes "semanales" y "a menudo" es
mayor para las clientas, ya que la línea para los clientes masculinos es decreciente y la
de las clientas aumenta.
Este es un fuerte efecto de interacción y es poco probable que se deba al azar, pero debe
verificar las pruebas de los efectos entre sujetos para confirmar su importancia.
A continuación la tabla del análisis de varianza.
Cada término en el modelo, más el modelo en su totalidad, se prueban para determinar
su capacidad para explicar la variación en la variable dependiente.

El valor de significación para cada término, excepto ESTILO , es menor que 0.05. Por
lo tanto cada término , excepto ESTILO, es estadísticamente significativo.
El estadístico parcial de eta cuadrado informa el significado "práctico" de cada término,
basado en la relación de la variación (suma de cuadrados) contabilizada por el término,
a la suma de la variación explicada por el término y la variación dejada al error
Los valores más grandes de eta cuadrado parcial indican una mayor cantidad de
variación representada por el término modelo, hasta un máximo de 1. Aquí los términos
individuales, aunque estadísticamente significativos, no tienen un gran efecto sobre el
valor de la cantidad gastada
En este ejemplo, las pruebas post hoc no revelaron una diferencia en el gasto entre los
clientes que compraban cada dos semanas y los que compraban con mayor frecuencia.
Sin embargo, las medias marginales estimadas y las gráficas de perfil revelaron una
interacción entre los dos factores, lo que sugiere que los clientes masculinos que
compran una vez a la semana son más rentables que los que compran con más
frecuencia, mientras que el patrón se invierte para las clientas. La importancia de este
efecto de interacción fue confirmada por los resultados de la tabla ANOVA
ANALISIS DE VARIANZA CON EXCEL

ANALISIS DE VARIANZA DE UNA VÍA

Tres tipos distintos de motores de gasolina fueron probados para determinar cuánto tiempo son
útiles antes de necesitar una reparación; si los tiempos de vida de los motores de cada tipo se
distribuyen normalmente y tienen la misma varianza, haga una prueba usando 0.05 para
determinar si difieren las medias de vida útil antes de requerir una reparación. En la tabla
aparecen los tiempos de vida útil, en decenas de miles de millas para cada tipo de motor.

A B C
6 8 3
2 7 2
4 7 5
1 2 4
7 6 1
Procedimiento:

 En el menú herramientas seleccione la opción Análisis de datos, en funciones para


análisis seleccione Análisis de varianza de un factor.
 En Rango de entrada seleccionar la matriz de datos.
 Alfa = 0.05
 En Rango de salida indicar la celda donde se inciará la presentación de resultados.

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 20 4 6.5
Columna 2 5 30 6 5.5
Columna 3 5 15 3 2.5

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Entre grupos 23.33333333 2 11.66666667 2.413793103 0.13150932 3.885290312
Dentro de los grupos 58 12 4.833333333

Total 81.33333333 14

En la tabla observamos que el estadístico de prueba Fc es menor al valor crítico para F


2.41<3.88, por lo cual no rechazamos al Hipótesis nula H 0. No tenemos evidencia estadística
para afirmar que los tiempos de vida útil de los motores, antes de requerir una reparación son
diferentes.

ANALISIS DE VARIANZA DE DOS VÍAS CON UNA SOLA MUESTRA POR GRUPO

Un químico quiere probar el efecto de 4 agentes químicos sobre la resistencia de un tipo


particular de tela. Debido a que podría haber variabilidad de un rollo de tela a otro, el químico
decide usar un diseño de bloques aleatorizados, con los rollos de tela considerados como
bloques. Selecciona 5 rollos y aplica los 4 agentes químicos de manera aleatoria a cada rollo. A
continuación se presentan las resistencias a la tención resultantes. Analizar los datos de este
experimento (utilizar α=0.05) y sacar las conclusiones apropiadas.

Rollo
Agente
Químico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69

Procedimiento:

 En el menú herramientas seleccione la opción análisis de datos, en funciones para


análisis seleccione análisis de varianza de dos factores con una sola muestra por
grupo.
 En Rango de entrada seleccionar la matriz de datos.
 Alfa = 0.05
 En Rango de salida indicar la celda donde se iniciará la presentación de resultados.
Análisis de varianza de dos factores con una sola muestra por grupo

RESUMEN Cuenta Suma Promedio Varianza


Fila 1 5 353 70.6 9.3
Fila 2 5 357 71.4 9.3
Fila 3 5 362 72.4 19.3
Fila 4 5 363 72.6 6.8

Columna 1 4 294 73.5 1


Columna 2 4 274 68.5 3
Columna 3 4 302 75.5 3
Columna 4 4 291 72.75 2.92
Columna 5 4 274 68.5 1.67

ANÁLISIS DE VARIANZA
Grados F
Fuente de Suma de de Cuadrados Fc Probabilidad tablas
variación Cuadrados libertad medios Valor P
Filas 12.95 3 4.32 2.38 0.12 3.49
Columnas 157 4 39.25 21.61 2.06E-05 3.26
Error 21.8 12 1.82

Total 191.75 19
Total 231 24

En la tabla observamos que el estadístico de prueba Fc es menor al valor crítico para F


2.38<3.49, por lo cual no rechazamos al Hipótesis nula H 0. No tenemos evidencia estadística
para afirmar que el agente químico tenga influencia en la respuesta.

Sin embargo observamos que el rollo si tiene influenza significativa en la respuesta (P<0.05).
ANALISIS DE VARIANZA DE DOS VÍAS CON VARIAS MUESTRAS POR GRUPO

Un ingeniero químico está estudiando los efectos de varios reactivos y catalizadores en


la producción de cierto proceso la cual se expresa como un porcentaje de un máxi mo
teórico. Se hicieron cuatro operaciones del proceso para cada combinación de tres
reactivos y cuatro catalizadores. Los resultados se presentan en la siguiente tabla. Con
un nivel de confianza del 95%, indique si hay evidencia para decir que los factores y su
interacción influyen significativamente en la media de producción del proceso .

Catalizador 1 2 3
A 86.8 82.4 86.7 83.5 93.4 85.2 94.8 83.1 77.9 89.6 89.9 83.7
B 71.9 72.1 80 77.4 74.5 87.1 71.9 84.1 87.5 82.7 78.3 90.1
C 65.5 72.4 76.6 66.7 66.7 77.1 76.7 86.1 72.7 77.8 83.5 78.8
D 63.9 70.4 77.2 81.2 73.7 81.6 84.2 84.9 79.8 75.7 80.5 72.9

Para resolver este ejercicio, la tabla debe ser copiada en Excel de forma que los
tratamientos queden en las filas. Esto puede hacerse fácilmente copiando los datos de
la tabla directamente y luego transponiendo los valores:
Excel muestra primero los resultados de las sumas para cada uno de los catalizadores y
después muestra los totales. El resultado del análisis de varianza se muestra al final. Este es
en realidad el resultado que nos interesa.
Análisis de varianza de dos factores con varias muestras por grupo

RESUMEN A B C D Total
1
Cuenta 4 4 4 4 16
Suma 339,4 301,4 281,2 292,7 1214,7
Promedio 84,85 75,35 70,3 73,175 75,91875
Varianza 5,01666667 16,0966667 26,7 58,1091667 52,9682917

2
Cuenta 4 4 4 4 16
Suma 356,5 317,6 306,6 324,4 1305,1
Promedio 89,125 79,4 76,65 81,1 81,56875
Varianza 34,0625 53,88 62,8366667 26,3533333 58,4169583

3
Cuenta 4 4 4 4 16
Suma 341,1 338,6 312,8 308,9 1301,4
Promedio 85,275 84,65 78,2 77,225 81,3375
Varianza 32,3225 27,3166667 19,62 12,7958333 32,6065

Total
Cuenta 12 12 12 12
Suma 1037 957,6 900,6 926
Promedio 86,4166667 79,8 75,05 77,1666667
Varianza 23,5069697 42,3472727 42,5136364 37,9460606

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F
Muestra 327,1404167 2 163,5702083 5,232711738 0,010118283 3,259446306
Columnas 877,5633333 3 292,5211111 9,357930563 0,000103987 2,866265557
Interacción 156,9829167 6 26,16381944 0,836996703 0,549602958 2,363750958
Dentro del grupo 1125,33 36 31,25916667

Total 2487,016667 47

Lo primero que hay que observar es el valor p de la interacción el cual en este caso es de
0.5496. Este valor es el resultado de la hipótesis de que las interacciones de los factores son
todas 0. Esto significa básicamente que la producción puede depender del tipo de catalizador y
del tipo de reactivo pero no de la interacción entre ellos. Los modelos que cumplen con este
supuesto son llamados generalmente modelos aditivos. En este caso, el valor p indica que la
hipótesis de las interacciones igual a 0 no puede rechazarse. Por lo que concluimos que este es
un modelo aditivo.
Los otros dos valores p se refieren a la significancia de los catalizadores y los reactivos
respectivamente. Debido a que estos valores son pequeños, se concluye que ambos factores
influyen significativamente en la media de la producción obtenida. Hay que tomar en cuenta
que estos valores solo se consideran válidos en el caso de que el modelo sea aditivo por lo que
es muy importante revisar primero el valor p de la interacción

Potrebbero piacerti anche