Sei sulla pagina 1di 43

EXPERIMENTOS CON UN

SOLO FACTOR: ANLISIS


DE VARIANZA
Temas
Anlisis de varianza (Ejemplo aplicado)
Anlisis del modelo con efectos fijos
Descomposicin de la suma de cuadrados total
Anlisis estadstico
Estimacin de los parmetros del modelo.
Datos no balanceados.
Introduccin
El Anlisis de la Varianza es, probablemente, la herramienta de
inferencia estadstica ms utilizada en las investigaciones
cientfico-tcnicas.

Esta compuesto por unidades llamadas tratamientos, los


cuales consisten en un conjunto de acciones que se aplican a
las unidades experimentales con la finalidad de observar
como responden a stas.

El procedimiento usual es asignar aleatoriamente los


tratamientos a las unidades experimentales.

Se llama variable aleatoria observada o respuesta a la


medida u observacin que se obtiene de cada una de las
unidades experimentales.
Ejemplos
Los tratamientos consisten en sembrar tres variedades de
trigo en las parcelas experimentales y observar la
respuesta: rendimiento de la parcela. Se dice en este
caso que el factor tratamiento (variedad) tiene 3 niveles.

Se llama repeticin a cada realizacin de un tratamiento

Ejemplo: si se asignan 10 parcelas a cada cultivar, se


tendrn 10 repeticiones para cada tratamiento.
cmo surge una ANOVA?
Las tcnicas iniciales de anlisis de varianza fueron
desarrolladas por el estadstico y genetista R.A Fisher,
en los aos 1920 y 1930. Debido a que se basa en la
distribucin F de Fisher como parte de contraste de
hipotesis, a menudo se le lama anlisis de varianza
de Fisher
Para que hacer una ANOVA?
Su verdadero objetivo (la mayora de veces) no es la
variabilidad, sino otros contrastes como la igualdad de
medias el ajuste en un problema de regresin.

El objetivo del ANOVA de efectos fijos es contrastar la


hiptesis de que los efectos de tratamientos son nulos
versus que al menos uno no lo es. En trminos
estadsticos:
H0: 1=...=a= 0
H1: Al menos un tratamiento tiene efecto no nulo.
En que consiste la ANOVA?
Consiste en descomponer la variabilidad de una
poblacin (representada por una varianza) en diversos
sumandos segn los factores que intervengan en la
creacin de esa variabildiad.

Normalmente el modelo se indica en terminos de


variables dependientes, independientes.

Hay algunos factores que no se incluyen, pero se deben


controlar.
Comparacin de medias
Modelo de una anova de una va
Descomposicin de la varianza (ANOVA)
Generalidades de la ANOVA de efectos
fijos
Sirve para comparar las medias de mas de 2 grupos

La variable dependiente es cuantitativa.

La variable independiente (Factor de estudio) es cualitativa


categrica.

No es necesario que todos los grupos sean del mismo tamao.

Cuanto mayor es el tamao de los grupos, es menos


importante garantizar la normalidad la homocedasticidad
Caractersticas y supuestos
Permite comparar 3 o ms medias para ver si son
iguales, controlando el error.
Existen 3 supuestos:
1. Independencia de las observaciones y de los errores.
2. Normalidad de los datos
3. Homogeneidad de varianzas (Homocedsticidad):
Igualdad de las varianzas de los grupos. Ejemplo:
Prueba de Hartley (F)
Independencia de observaciones
Un ejemplo de un grfico en el que no se observan
patrones sospechosos en la distribucin de residuos es el
siguiente:
Supuesto de Normalidad
un Q-Q plot de residuos obtenidos a partir de un modelo
con errores normales homocedsticos
Prueba de homogeneidad de varianzas
(Hartley)
Homogeneidad de varianzas (Levene).
Descomposicin de la varianza
Varianza Total
La variacin total tiene en cuenta la varicin en todas las
unidades, tomando como referencia la gran media
media total.
k n
SST = (Xij - X.. )2 =(X11 - X.. )2 + (X12 - X.. )2 +... + (Xnk - X.. )2
j=1 i=1

Este valor se conoce como la suma de cuadrados


totales.
Cada dato es reconocido con dos sub-indices, el primero
indica el grupo y se denota con la letra i y la segunda
es la unidad dentro del grupo y se denota con la letra j.
Concepto grfico
Varianza entre grupos
La varianza entre grupos compara la media de cada
grupo con respecto a la gran media.
k n
SSentre = (X. j - X.. )2 =(X.1 - X.. )2 + (X.2 - X.. )2 +... + (X.k - X.. )2
j=1 i=1

Es la varianza que mide la diferencia entre grupos


Habitualmente el nmero de grupos se denota con la letra
k.
Se debe multiplicar por el valor de repeticiones.
Concepto grfico
Varianza Intra-grupos
Considera la variacin que hay dentro de cada grupo.
k n
SSint ra = (Xij - X. j )2 =(X11 - X.1 )2 + (X12 - X.1 )2 +... + (Xnk - X.k )2
j=1 i=1

Los datos de la varianza se reunen en una tabla llamada:


Tabla de anlisis de varianza, que reune los valores de
sumatoria de cuadrados y los llamados grados de libertad
(gl )
Concepto grfico
Cuadrados medios entre o dentro de los
tratamientos
Sean 2E y 2D las varianzas estimadas por el CME y el
CMD respectivamente

CMD=SSintra/(n-k)
CME=Ssentre/(k-1)

La prueba consiste en calcular el estadstico F utilizando


los estimadores de 2E y 2D de la siguiente forma:
La particin de la suma de cuadrados y la
tabla del ANAVA
Tabla ANOVA (Resumen)

CM
Otra forma de presentar el ANOVA
Ejemplo
Ejemplo
Ejemplo
Pasos para el anlisis de varianza
Pasos para el anlisis de varianza
Ejemplo
Ejercicio (Tabla de resultados)
Ejercicio (Cuadro de resumen de ANOVA)
Anova
Pruebas a posteriori
Si se rechaza Ho del ANAVA, la pregunta que sigue es:
cul o cules de las medias poblacionales en estudio son
las diferentes?

Compararlas por pares con una prueba T no es un


procedimiento adecuado, por lo que se deben hacer
pruebas de comparaciones mltiples.

Existen diferentes tipos de procedimientos entre los que


se destacan a prueba de Tukey, la de Scheff, la de
Duncan, la de Dunnet y la de Fisher, entre otras.
La prueba de Tukey
El estadstico de Tukey es el siguiente:

donde qa,gld; es el cuantil (1-) que se obtiene de la


(1-)
distribucin de Rangos Studentizados (Tabla) para a
tratamientos y los grados de libertad dentro. n es el nmero de
repeticiones con base en las que se calculan las medias
muestrales. Si el tamao de muestra no fuera el mismo para
cada tratamiento, deber reemplazarse n por la media
armnica de los {ni}, esto es:

Si el valor absoluto de la diferencia entre un par de medias


supera a DMSt, se dice que esta diferencia es
estadsticamente significativa (a es el nmero de medias, gld
son los grados de libertad dentro).
La prueba de Fisher
La prueba de Fisher es similar en su procedimiento a la
prueba de Tukey, pero el estadstico de la prueba es
diferente. En vez de usar los cuantiles de la distribucin
de rangos estudentizados utiliza los cuantiles de una t
con los grados de libertad del cuadrado medio dentro de
tratamientos y es particular para cada comparacin de
medias ya que depende del nmero de repeticiones por
tratamiento

Potrebbero piacerti anche