Filminas ANOVA 1

CURSO
ANALISIS ESTADISTICO DE
DATOS E INTERPRETACION DE
RESULTADOS
1
Análisis Estadístico en Estudios
Comparativos
• Pruebas t
•Análisis de Varianza
• DCA y Técnicas No-paramétricas
•Estructura de Parcelas, Tratamientos y Aleatorización
•DBCA y Estructura Factorial de Tratamientos
• DCL y DPD
2
¿Qué es un estudio observacional?
Sobre un proceso existente se observan (registra información) una o más
variables aleatorias.
Finalidad: explorar, describir, confirmar hipótesis.
¿Qué es un experimento?
“Prueba o serie de pruebas en las cuales se inducen cambios deliberados
en las variables de entrada de un proceso o sistema de manera que sea
posible observar e identificar las causas de los cambios en la respuesta
de salida” (Montgomery 1991).
“Es una reproducción restringida de la realidad con el fin de observar los

efectos de su manipulación planificada” (Casanoves y Di Rienzo, 1999).
Finalidad de estudios basados en experimentos: Confirmar hipótesis,

modelar , predecir
3
Experimentos Comparativos
consisten en la aplicación de tratamientos a un

conjunto de unidades experimentales
para valorar y comparar las respuestas obtenidas

desde diferentes tratamientos
cuando es deseable incrementar la precisión de

las inferencias realizadas y/o ampliar el espacio de
inferencia
4
Estudios Planificados
5
Estudios Planificados
6
Ejemplo:
Antecedentes: Se observó que los renovales de

algarrobo parecían tener una mayor tasa de
sobrevida cuando estaban debajo de plantas de
Jarilla.
Objetivos:
a) Determinar si efectivamente la Jarilla actúa
como planta madrina en el caso del algarrobo.
b) En caso afirmativo establecer el mecanismo de

protección involucrado.
7
Vocabulario asociado a Proyectos de Investigación
que generan Datos
•Unidad Experimental
•Unidad Observacional
•Factor, niveles de los factores
•Tipo de Factores: cualitativos y cuantitativos
•Tratamientos
•Repetición. Pseudo-réplicas
•Submuestras
•Contraste o comparación
•Precisión
8
Preguntas asociadas a Proyectos de Investigación
que generan Datos
 ¿Cuántos tratamientos se desean estudiar?
 ¿Cuántas veces necesita observar la respuesta?
 ¿Es necesario observar la evolución de la respuesta en el tiempo?
 ¿Cuáles son las unidades experimentales?
 ¿Cuáles son las unidades de observación?
 ¿Son las unidades experimentales homogéneas?
 ¿Son las unidades experimentales suficientes para realizar todos
los tratamientos?
 ¿Cómo se asignan los tratamientos a las unidades experimentales?
 El objetivo del experimento, ¿es la comparación y/o la estimación?
 ¿Los tratamientos tienen alguna estructura?
 ¿Puede el diseño resultante ser analizado y/o las comparaciones
deseadas llevadas a cabo?.
9
Comparación de dos medias (prueba t)
La prueba t de Student proporciona el método para comparar las

medias de dos muestras independientes o dependientes
(apareadas).
Muestras aleatorias independientes: los tratamientos se asignan
a diferentes unidades experimentales al azar
Hipótesis para las 2 Hipótesis para las 
H0 :12  22 H0 : 1  2
H1 :12   22 H1: 1  2
Tipos de errores en pruebas de hipótesis:
• Error Tipo I : rechazar H0 cuando es verdadera (   )
• Error Tipo II: aceptar H0 cuando es falsa (   )
10
Ejemplo prueba de t para dos muestras
independientes
Se tienen datos de dos procedencias de pino hondureño, las que
van a compararse sobre la base de su producción en volumen.
Los volúmenes (m3) de 11 árboles de cada procedencia son:
Procedencia 1: 11, 5, 9, 8, 10, 11, 10, 8, 11, 8, 8
Procedencia 2: 9, 6, 9, 9, 13, 8, 6, 5, 6, 10, 7
Prueba T para muestras Independientes

Clasific Variable Grupo(1) Grupo(2) n(1) n(2)
Procedencia Volumen {1.00} {2.00} 11 11
media(1) media(2) p(Var.Hom.) T p prueba

9.00 8.00 0.4775 1.12 0.2768 Bilateral
11
Comparación de dos medias (prueba t)
Muestras dependientes: los tratamientos se aplican a pares de
unidades experimentales gemelas o parecidas; aleatorizando
dentro de los pares
Hipótesis
H0 : 1  2  0 H1: 1  2  0
Ejemplo:
Un técnico desea evaluar el comportamiento de dos tipos de picos aspersores de riego. Para esto
Selecciona 10 campos aleatoriamente, y en cada uno de ellos pone a prueba los 2 picos. Se conoce
que el tipo de agua influye sobre la calidad de la aspersión, ya que las sales disueltas en ella suelen
tapar los picos. Por este motivo, la variable a evaluar es el caudal entregado por los picos luego de
1 mes de funcionamiento. Los datos obtenidos en litros por hora son los siguientes:
Productor 1 2 3 4 5 6 7 8 9 10
Pico A 9 7 9 10 11 5 8 4 11 7
Pico B 5 4 4 6 10 6 7 3 10 7
Prueba T (muestras apareadas)

Obs(1) Obs(2) N media(dif) DE(dif) T Bilateral
Pico A Pico B 10 1.90 1.97 3.05 0.0138
12
Análisis de Varianza (ANAVA)
La técnica de análisis de la varianza presupone un modelo
para la variable respuesta. Permite descomponer la
variación total de las observaciones en la variación entre
tratamientos y la variación dentro de tratamientos
(entre unidades experimentales que reciben el mismo
tratamiento).
Se denomina modelo lineal de ANAVA (a una vía de
clasificación) para la observación Yij a:
Yij = + i + ij , con i=1,...,a y j=1,..,n
donde:
Yij es la j-ésima observación del i-ésimo tratamiento
 es la media general de las observaciones
i es el efecto del i-ésimo tratamiento
ij es una variable aleatoria normal independientemente distribuida con
esperanza 0 y varianza 2 i,j.
13
El objetivo del ANAVA de efectos fijos es
contrastar la hipótesis de que los efectos de
tratamientos son nulos versus que al menos
uno no lo es. En términos estadísticos:
H0: 1=...=a= 0
H1: Al menos un tratamiento tiene efecto no nulo.
Otra forma de enunciar estas hipótesis es

que las medias de los tratamientos que se
comparan son idénticas vs. que no lo son.
14
Formato de una Tabla de ANAVA
Fuente de Suma de Cuadrados Grados Cuadrado F

Variación de Medio Obs
Libertad
Entre SCE gle=a -1 CME CME

Tratamientos CMD
Dentro
(Error SCD=SCT-SCE gld=N-a CMD
Experimental)
Total SCT glt=N- 1
15
Ejemplo
El porcentaje de humedad relativa (HR) es determinante para el ataque de
hongos en semillas. Para evaluar la susceptibilidad de las semillas de una
forrajera al ataque de un hongo se realizó un ensayo en cámaras de cría con
tres porcentajes de HR: 70%, 80% y 90%. Cinco observaciones fueron
tomadas para cada porcentaje de HR, registrándose el número de semillas
atacadas en un grupo de 100 semillas
Porcentaje Observaciones Totales de Tratamiento yi

de HR (Número de semillas atacadas)
70 7 6 9 5 9 36
80 12 15 17 18 20 82
90 14 16 18 21 15 84
y = 202
16
Análisis de Varianza para un ensayo sobre el
efecto de hongos en la semilla de una forrajera
según tratamientos de humedad relativa.
Fuente de Suma de Grados de Cuadrados F

Variación Cuadrados Libertad Medios
Entre 294.93 2 147.46 21.9

Tratamientos
Dentro 80.8 12 6.73
(Error Experimental)
Total 375.73 14
17
Interpretación de Resultados
Si  = 0.05, luego el punto crítico que

delimita la zona de aceptación y rechazo
de H0 es F(2,12; 0.95) = 3.88.
Como F= 21.91> Fcrítica se concluye, con un nivel de

significación del 5%, que se rechaza la hipótesis
nula de igualdad de medias de número de semillas
atacadas para los 3 porcentajes de HR, por lo
tanto al menos una de las HR produce un grado de
ataque de hongos diferente de los restantes.
18
Pruebas de Comparaciones Múltiples
Si se rechaza la hipótesis nula del ANAVA, la

pregunta que sigue es ¿cuál o cuáles de las
medias poblacionales en estudio son las
diferentes?
Existe una gama muy amplia de alternativas para

llevar adelante este tipo de pruebas, entre las
que se destacan la de Tukey (Tukey, 1949), la de
Scheffé (Scheffé, 1953), la de Duncan (Duncan,
1955), la de Dunnet (Dunnet, 1964), y la de
Fisher (Fisher, 1966), entre otras
19
Prueba de Tukey para el ejemplo en cuestión
1 2 3
1 - 9.2 9.6
2 - 0.4
3 -
La DMS de la prueba de Tukey para el ejemplo es 4.37.

Luego, se debe controlar qué diferencias entre medias muestrales
son mayores que 4.37 para concluir que las esperanzas que estiman
difieren entre sí con un nivel de significación del 5%. Revisando la
matriz de diferencias de medias se concluye que :
1  2 , 1  3 y 2 = 3
20
Valores críticos de distintos PCM
en función del número de tratamientos
2.2
2
Valores críticos
1.8
1.6
1.4
1.2
1
0 2 4 6 8 10
Número de tratamientos
DUNCAN SNK REGWQ

TUKEY LSD (U)
21
Verificación de Supuestos del Análisis
Los errores se suponen normales con esperanza cero,
varianza común e independientes. Los predictores de los
errores son los residuos.
Se llama residuo de la observación j-ésima

correspondiente al i-ésimo nivel del factor
tratamiento al predictor de ij, que se denota por
eij y se obtiene como la diferencia entre el valor
observado y el valor predicho por el modelo
22
Normalidad
Seleccionando los residuos como variable de análisis, una de
las técnicas más usadas es construir un Q-Q plot normal.
Mediante esta técnica se obtiene un diagrama de dispersión
en el que, si los residuales son normales y no hay otros
defectos del modelo, entonces se alinean sobre una recta a
45°.
3.60
3.40
3.20
Q-Q plot (normal)
3.00
obtenido a partir 2.80
de un modelo con 2.60
errores normales 2.40
2.20
2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6
23
Homogeneidad de varianzas
Cuando los errores son homocedásticos, haciendo un gráfico de
dispersión de residuos vs. valores predichos por el modelo se
debe observar una nube de puntos sin patrón alguno. Un patrón
típico que indica falta de homogeneidad en las varianzas, se
muestra en la siguiente figura, ya que a medida que crecen los
valores predichos por el modelo, aumentan las dispersiones de
los residuos respectivos.
residuales
Gráfico de residuos en
función de predichos en
un ejemplo con falta de 0
homogeneidad de
varianzas
predichos
24
Prueba de hipótesis sobre los
supuestos
• Prueba de Shapiro-Wilks
H0: Los errores tienen distribución normal
• Prueba de Levene
H0: Los errores tienen varianza homogénea
25
Versión No-Paramétrica del ANAVA
El ANAVA propuesto por Kruskal y Wallis permite

comparar las esperanzas de 2 o más distribuciones
sin necesidad de realizar el supuesto de que los
términos de error se distribuyen normalmente.
El estadístico de la prueba (H) se basa en

la suma de los rangos asignados a las
observaciones dentro de cada tratamiento.
La interpretación se realiza de igual
manera que el ANAVA paramétrico
26
Versión No-Paramétrica del ANAVA
Ejemplo:
En un experimento se prueba si el número de insectos por planta es diferente en 3
variedades de chile dulce. Para cada variedad se cuenta el número de insectos en
15 plantas. Los datos obtenidos son los siguientes:
Planta 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Variedad 1 5 7 8 2 2 8 3 6 8 9 2 5 4 7 10
Variedad 2 21 8 2 23 7 9 3 24 7 2 1 12 7 8 9
Variedad 3 0 3 0 4 2 3 4 1 2 6 5 3 7 0 4
Prueba de Kruskal Wallis

Variable variedad N Medias D.E. Medianas H p
Insectos 1.00 15 5.73 2.69 6.00 11.54 0.0029
Insectos 2.00 15 9.53 7.47 8.00
Insectos 3.00 15 2.93 2.15 3.00
Trat. Ranks
3.00 14.00 A
1.00 25.13 B
2.00 29.87 B
Letras distintas indican diferencias significativas(p<= 0.05)
27
Para modelar es importante identificar
DOS tipos de estructuras
Estructura de parcelas
Aleatorización
Estructura de tratamientos
28
Estructura de Tratamientos
Experimento unifactorial:
Los tratamientos consisten en aplicar distintos niveles de un

mismos factor. Ejemplo: Factor densidad de siembra y las distintas
densidades son sus niveles.
Experimento con estructura factorial de tratamientos:
Cada tratamiento surge de la combinación de los niveles de 2 o

más factores. Ejemplo: Factores variedad y fecha de siembra , con tres
variedades de una especie y dos fechas de siembra. Hay un total de seis
tratamientos, ya que el factor variedad se encuentra a tres niveles y el factor fecha
a dos.
29
Estructura de Tratamientos
La estructura de tratamientos de un
problema particular consiste en el
conjunto de tratamientos o poblaciones
que el experimentador ha seleccionado
para estudiar y/o comparar.
30
Experimento con Dos Factores
Con Dos niveles cada uno
Posible arreglo para un

A2B1 A1B1 experimento bifactorial
sin repeticiones,
conducido bajo un diseño
A1B2 A2B2
completamente
aleatorizado.
31
Modelo para un Experimento Factorial
sin Repeticiones
Yij= + i + j + ij con i=1,2 j=1,2
ij es el término de error independiente

que se supone es una variable aleatoria
normal, con esperanza cero y varianza
común 2
Cuando los experimentos factoriales no tienen repeticiones, se
debe suponer que los factores no interactúan, para poder
estimar el error experimental.
32
Formato Tabla de ANAVA
Experimento Bifactorial sin Repeticiones
F.V. Suma de Cuadrados Grados de Cuadrado F

Libertad Medio
Factor A SCA a-1 CMA CMA
CMD
Factor B SCB b-1 CMB CMB

CMD
Error SCD=SCT-SCA-SCB (a-1)(b-1) CMD
Total SCT a.b-1
33
Ejemplo
Datos de un ensayo comparativo del efecto de distintos
potenciales agua del substrato sobre el porcentaje de
germinación en Atriplex Cordobensis.
Mpa 0 -0.5 -1.0 -1.5
ClNa 85 78 54 14
PEG 83 76 43 9
34
Cuadro de análisis de la varianza del experimento
bifactorial para evaluar el efecto de distintos potenciales
agua del substrato sobre el porcentaje de germinación en
Atriplex cordobensis.
Fuente de Suma de G. de Cuadrado F obs. F tabla
Variación Cuadrados Libertad Medio
Osmolito 50.0 1 50.0 5.6 10.128
Potencial 6118.5 3 2172.8 241.0 9.276

Agua
Error 27.0 3 9.0
Total 6195.5 7
35
Modelos con Interacción
La inclusión de términos de interacción en el

modelo conlleva la necesidad de tener
repeticiones para cada tratamiento.
Modelo lineal para un experimento bifactorial

con interacciones
Yijk=  + i+ j + ij + ijk con i=1,2 j=1,2 k=1,..,nij
36
Formato Tabla de ANAVA
Bifactorial con Repeticiones
Fuente de Suma de Cuadrados Grados de Libertad Cuadrado F
Variación Medio
Factor A SCA a-1 CMA CMA
CMD
Factor B SCB b-1 CMB CMB

CMD
Interacción AB SCAB (a-1)(b-1) CMAB CMAB

CMD
Error SCD=SCT-SCA-SCB- glt-gla-glb-glab CMD

SCAB
Total SCT glt= n-1
37
Ejemplo
Concentración proteica (% del peso seco) en hojas de
Atriplex cordobensis cosechadas en invierno y verano de
plantas masculinas y femeninas.
Femeninas Masculinas
Invierno Verano Invierno Verano
24 17 17 24
28 18 18 25
26 16 16 23
38
Tabla de ANAVA
Fuente de Suma de Grados de Cuadrado

Variación Cuadrados Libertad Medio F obs. F
tabla
Factor Sexo 3 1 3.00 1.71 5.32
Factor Epoca 3 1 3.00 1.71 5.32

de cosecha
Interacción 192 1 192.00 109.7 5.32

Epoca-Sexo
Error 14 8 1.75
Total 212 11
39
Gráfico para estudiar interacción
30
masculinas
contenido de proteínas
femeninas
Media  error estándar
25 de la concentración de
proteínas en hojas de
Atriplex cordobensis por
efecto del sexo y la época
20
de cosecha.
femeninas masculinas
15
Verano Invierno
40
Gráfico para estudiar interacción
60
55
50
Media  error
Fibras Insolubles
masculinas
estándar de la
45 concentración de
fibras insolubles en
40
hojas de Atriplex
35 femeninas cordobensis por
efecto del sexo y la
30 época de cosecha.
25
Verano Invierno
41
Ventaja de la Estructura
Factorial de Tratamientos
Ejemplo: Comparar el efecto de tres tipos de ruptura de
dormición y el efecto de tres temperaturas de cámara de
germinación bajo un DCA con tres repeticiones.
Fuente Gl Fuente GL
Temperatura 2 Tipo de Ruptura 2
Error 6 Error 6
Total 8 Total 8
Número total de UE 18
42
Ventaja de la Estructura
Factorial de Tratamientos
Fuente Gl
Temperatura (A) 2
Tipo de Ruptura (B) 2
A*B 4
Error 9
Total 17
Número total de UE 18
43
Estructura de Parcelas
Unidades Experimentales Homogéneas.

Sin estructura
Diseño Completamente al Azar
Unidades Experimentales Heterogéneas .

Variabilidad sistemática natural o Inducida
Diseño en Bloques
44
Principio del Diseño en Bloques
El agrupamiento del material experimental debe

ser tal que, las unidades experimentales dentro de
un bloque sean tan homogéneas como sea posible y
que las diferencias entre unidades experimentales
sea explicada, en mayor proporción, por las
diferencias entre bloques
Homogeneidad dentro de bloques

Heterogeneidad entre bloques
45
Diseño en Bloques Completos al Azar
Todos los tratamientos en un bloque ??
Bloques Completos
Aleatorización por Bloque ???
Bloques al Azar
46
Comentarios
El DBCA es una estrategia experimental para disminuir el
efecto de variaciones sistemáticas entre unidades
experimentales sobre la comparación de medias de tratamiento
Tales variaciones son generalmenre reconocidas a priori de

realizar el experimento. Un bloque es un grupo de unidades
experimentales homogéneas. También se pueden reconocer a
posteriori
El DBCA representa una restricción a la aleatorización, los

tratamientos son aleatorizados por bloques.
La técnica de ANAVA es usada para el análisis de datos

experimentales obtenidos bajo un diseño en bloques para probar
la hipótesis nula de igualdad de medias de tratamientos.
47
Modelo para la Respuesta de un Experimento Diseñado en Bloques
Yij =  + i + j + ij , con i=1,...,a; j=1,...,b

•  corresponde a la media general,
• i el efecto del i-ésimo tratamiento (Fijo o Aleatorio)
• j el efecto del j-ésimo bloque (Fijo o Aleatorio)
• ij es el error aleatorio asociado con la unidad experimental en
el bloque j que recibe el tratamiento i, comúnmente los
términos de error se asumen normalmente distribuídos con
esperanza cero y varianza común 2.
48
Estructura típica de una tabla de datos para un
ensayo unifactorial con diseño en bloques completos
aleatorizados.
Trat bloque bloque ... bloque Total
1 2 b
1 y11 y12 ... y1b y1
2 y21 y22 ... y2b y2
: : : ::: :
a ya1 ya2 ... yab ya
Total y1 y2 yb y
49
ANAVA - DBCA
Partición de la Suma de Cuadrados Total en
Sumas de Cuadrados Entre Tratamientos, Entre
Bloques y Suma de Cuadrados del Error
Obtención del estadístco F para probar la Hipótesis de

igualdad de medias de tratamiento (Hipótesis de interés)
Supuestos del análisis: Normalidad, Independencia,

Homogeneidad de Varianzas, Aditividad Bloque-Tratamiento
Prueba validez de los supuestos a través de los residuos eij
50
Formato Tabla ANAVA -DBCA
Fuente de Suma de Cuadrados Grados de Cuadrado F
Variación Libertad Medio
Bloques SCB glb=b-1 CMB CMB
CMD
Entre SCE gle=a-1 CMT CMT
Tratamientos CMD
Dentro SCD=SCT-SCE-SCB gld=(a-1)(b-1) CMD

(Error
Experimental)
Total SCT glt=ab-1
51
Ejemplo DBCA
Se realizó un experimento en un diseño de bloques completos al azar para
evaluar el rendimiento en kg/parcela de maíz en suelos infectados con
Diplodia spp, en tratamiento con varios fungicidas. Los datos se presentan
a continuación:
Tratamiento
Bloque A B C D E
1 8 16 14 10 8 Tratamientos
2 8 19 16 11 7 A= control sin tratamiento
3 9 24 14 12 1 B y C= fungicidas mercúricos
4 7 22 13 8 1 D y E= fungicidas no mercúricos
I II III IV
C A D B
A E E D
Esquema del diseño
B C B E
de tratamientos
D B A C
E D C A
52
Ejemplo DBCA
Resultados del análisis de los datos

Análisis de la varianza
Variable N R² R² Aj CV
DensidadSem 20 0.88 0.81 23.01
Cuadro de Análisis de la Varianza (SC tipo III)

F.V. SC gl CM F p-valor
Modelo 614.20 7 87.74 12.75 0.0001
Bloque 12.40 3 4.13 0.60 0.6269
Trat 601.80 4 150.45 21.86 <0.0001
Error 82.60 12 6.88
Total 696.80 19
Test:Duncan Alfa:=0.05
Error: 6.8833 gl: 12
Trat Medias n
B 20.25 4 A
C 14.25 4 B
D 10.25 4 B C
A 8.00 4 C D
E 4.25 4 D
53
Comparación de Medias
Pruebas exactas (contrastes ortogonales)
Ortogonal = independiente y aditivo (balanceado)
• Comparación de grupos de tratamientos
• Descomposición de la SC de tratamientos
SC Total
SC Trat SC1
Particionada SC2
SC Trat
SC4 SC Trat = SC1 + SC2 + .. +SCt-1
SC3
SC EE SC EE
54
Contrastes ortogonales
Ejemplo
Tratamientos
A= control sin tratamiento
B y C= fungicidas mercúricos
D y E= fungicidas no mercúricos
Los 4 grados de libertad de los tratamientos se pueden descomponer en 4 hipótesis

con un grado de libertad cada hipótesis
Coeficientes
A B C D E
B  C  D  E
1. H 0 :  A  4 -1 -1 -1 -1
4
B  C  D   E
2. H 0 :  0 1 1 -1 -1
2 2
3. H 0 : B  C 0 1 -1 0 0
4. H 0 : D  E 0 0 0 1 -1
55
Ejemplo Contrastes Ortogonales
Modelo 614.20 7 87.74 12.75 0.0001
Bloque 12.40 3 4.13 0.60 0.6269
Trat 601.80 4 150.45 21.86 <0.0001
Error 82.60 12 6.88
Total 696.80 19
Contrastes
Trat SC gl CM F p-valor
Contraste1 57.80 1 57.80 8.40 0.0134
Contraste2 400.00 1 400.00 58.11 <0.0001
Contraste3 72.00 1 72.00 10.46 0.0072
Contraste4 72.00 1 72.00 10.46 0.0072
Total 601.80 4 150.45 21.86 <0.0001
trat Medias
B 20.25
C 14.25
D 10.25
A 8.00
E 4.25
56
ANAVA Parcelas Divididas
DISEÑO DE EXPERIMENTOS CON DOS TAMAÑOS DE PARCELA
o La naturaleza de los tratamientos justifica el uso de diferentes

tamaños de parcela
o Para modelar respuestas en el tiempo (esfericidad)
o El experimento está en marcha y se quieren agregar nuevos subtratamientos
o Estimar con diferente precisión los experimentos
o Diferentes tamaños de parcela
o Mayor precisión a nivel de subparcela que en parcela
o Por lo general, el interés se centra más en la parcela pequeña
o Dos pasos de aleatorización:
o Para parcelas grandes
o Para subparcelas (parcelas pequeñas)
o Es posible generalizar para mayor subdivisión de parcelas: parcelas subdivididas
57
Modelo matemático DCA:
Yijk    Ai  k (i)  B j  ( AB)ij ijk
Donde:
Yijk = Variable de respuesta en la parcela grande i, parcela pequeña j
y repetición k
µ = La media general
Ai = El efecto principal de la parcela grande i
 k (i) = El error para la parcela grande
Bj = El efecto principal de la parcela pequeña j
(AB)ij = La interacción de la parcela grande i con la parcela pequeña j
ijk = El error para la parcela pequeña
58
Modelo matemático DBCA:
Yijk    Ri  Aj ij  Bk  ( AB) jk ijk
Donde:
Yijk = Variable de respuesta en la parcela grande i, parcela pequeña j

y bloque k
µ = La media general
Ri = El efecto del bloque k
Aj = El efecto principal de la parcela grande i
 ij = El error para la parcela grande
Bk = El efecto principal de la parcela pequeña j
(AB)jk = La interacción de la parcela grande i con la parcela pequeña j
ijk = El error para la parcela pequeña
59
Croquis experimental
Bloques=2 Factor A=3 niveles Factor B=3 niveles
Bloque I Bloque II
a2 a1 a3 a3 a1 a2
b2 b2 b3 b1 b1 b2
b3 b1 b1 b3 b2 b1
b1 b3 b2 b2 b3 b3
60
Ejemplo
Se realizó un experimento en DBCA para comparar dos niveles de irrigación (alta y
moderada) y cuatro variedades de caña de azúcar. La parcela grande corresponde a la
irrigación y la parcela pequeña a las variedades. Los datos de rendimiento en ton/ha son
los siguientes:
VARIEDAD
Irrigación 1 2 3 4
Alta 123.2 132.3 123.2 128.8
BLOQUE I
Moderada 118.2 123.2 115.2 116.3
Alta 128.2 138.3 128.2 125.8
BLOQUE II
Moderada 119.2 120.2 117.2 121.3
Alta 118.2 122.3 121.2 124.8
BLOQUE III
Moderada 111.2 117.2 113.2 113.3
Alta 128.2 123.3 128.2 132.8
BLOQUE IV
moderada 113.2 122.2 114.2 116.3
61
Rend 32 0.85 0.75 2.70

F.V. SC gl CM F p-valor (Error)
Modelo 1127.31 13 86.72 8.00 <0.0001
Bloque 214.59 3 71.53 11.86 0.0359 (Blo*Irri)
Irrigacion 754.66 1 754.66 125.13 0.0015 (Blo*Irri)
Bloque*Irrigacion 18.09 3 6.03 0.56 0.6504
Variedad 129.92 3 43.31 4.00 0.0241
Irrigacion*Variedad 10.03 3 3.34 0.31 0.8188
Error 195.06 18 10.84
Total 1322.37 31
Error: 6.0312 gl: 3
Irrigacion Medias n
Alta 126.69 16 A
Moderada 116.98 16 B
Error: 10.8368 gl: 18
Variedad Medias n
2.00 124.88 8 A
4.00 122.43 8 A B
3.00 120.08 8 B
1.00 119.95 8 B
62
ANAVA Diseño Cuadrado Latino
En el diseño de bloques completos al azar, se busca aislar una fuente de
variación extraña reconocible, que puede generar ruido en la comparación
de los efectos de los tratamientos a través del bloqueo. Si el bloqueo
funciona, el CME se reduce, dando una prueba más sensible que la
obtenida en un DCA.
No obstante, hay situaciones en las que se pueden presentar dos fuentes
de variación extrañas reconocibles, por lo que habría que bloquear en dos
sentidos. Si el bloqueo en los dos sentidos funciona, el CME se reduce,
dando una prueba más sensible que en un DBCA
Ventaja:
 Controla la variabilidad extraña a tratamientos en doble sentido
Desventajas:
 Menos grados de libertad en error experimental que DCA y DBCA
 Número de repeticiones = número de tratamientos o múltiplo
 Los tratamientos deben aparecer sólo una vez en hilera / columna
63
Modelo matemático
Yij(k )    Hi  C j T(k )  eij
Donde:
Yij = Valor de la variable de respuesta en la hilera i, columna j y tratamiento k
 = Promedio general
Hi = Efecto de la hilera i
Cj = Efecto de la columna j
T(k ) = Efecto del tratamiento k
eij = Error experimental
Columnas
1 2 3
1 A B C
Hileras 2 B C A
3 C A B
Croquis experimental
64
Ejemplo:
Se realizó un experimento para comparar los rendimientos en
kg/parcela de 5 variedades de maíz.En el campo donde se realizó el
Experimento, los gradientes de fertilidad se presentan en dos
sentidos: paralalamente y en ángulo recto a los surcos.
Los datos obtenidos son los siguientes:
Columnas
Filas 1 2 3 4 5
1 C (32) A (23) B (24) E (34) D (28)
2 A (28) C (36) D (33) B (32) E (38)
3 E (40) D (37) A (31) C (39) B (26)
4 D (39) B (31) E (43) A (33) C (41)
5 B (32) E (45) C (43) D (40) A (35)
65
Resultado del análisis de los datos:
Rend 25 0.96 0.93 4.67
Cuadro de Análisis de la Varianza (SC tipo I)

Modelo 835.12 12 69.59 26.84 <0.0001
Fila 347.84 4 86.96 33.53 <0.0001
Columna 11.04 4 2.76 1.06 0.4159
Trat 476.24 4 119.06 45.91 <0.0001
Error 31.12 12 2.59
Total 866.24 24
Error: 2.5933 gl: 12
Trat Medias n
E 40.00 5 A
C 38.20 5 A
D 35.40 5 B
A 30.00 5 C
B 29.00 5 C
66
MAS DE UN CUADRADO LATINO POR EXPERIMENTO
Los cuadrados latinos pequeños proporcionan pocos grados

de libertad para estimar el error experimental, y así debe
lograrse una disminución sustancial en el error para compensar
el poco número de gl. Sin embargo, puede utilizarse más de
un cuadrado latino en el mismo experimento; por ejemplo,
dos cuadrados latinos 4 X 4 darán 15 gl para el error si los
tratamientos responden de manera análoga en ambos cuadrados.
67
Modelo matemático
Yijk (l)    Qi  F (Q) j(i)  C(Q)k (i) T(l)  eijk
Donde:
Yijk = Valor de la variable de respuesta en el cuadrado i, hilera j, columna k y
tratamiento l
 = Media general
Qi = Efecto del Cuadrado i
F (Q) j(i) = Fila j dentro de Cuadrado i
C (Q)k (i)
= Hilera k dentro de Cuadrado i
T(l ) = Efecto del Tratamiento l
eijk = Error experimental
68
Ejemplo
Un experimento con seis novillas de un año en una vaquería se efectúo en dos
cuadrados latinos. Los tratamientos fueron tres raciones seleccionadas en base a
la localidad y características físicas diversas y se alimentaron ad libitum. Cada
animal recibió las tres raciones sucesivamente, con una semana para cada una.
La variable observada fue libras de materia seca consumida por 100 lbs de peso
corporal. Los datos se presentan a continuación:
Cuadrado 1 2
Novilla 1 2 3 4 5 6
Semana
1 2.7(1) 2.6(2) 1.9(3) 3.3(1) 2.3(2) 0.1(3)
2 2.1(2) 0.2(3) 2.3(1) 1.7(3) 2.8(1) 1.8(2)
3 1.9(3) 2.1(1) 2.4(2) 2.1(2) 1.7(3) 2.7(1)
69
Ejemplo
materia_seca 18 1.00 0.56 26.19
Cuadro de Análisis de la Varianza (SC tipo I)

Modelo 9.39 11 0.85 2.99 0.0950
Cuadrado 0.01 1 0.01 0.02 0.8990
Cuadrado>Semana 1.30 4 0.32 1.14 0.4219
Cuadrado>Novilla 1.92 4 0.48 1.69 0.2698
Trat 6.16 2 3.08 10.81 0.0103
Error 1.71 6 0.29
Total 11.10 17
Error: 0.2852 gl: 6
Trat Medias n
1.00 2.65 6 A
2.00 2.22 6 A
3.00 1.25 6 B
70
TÉCNICAS COMBINADAS DE ANÁLISIS
ANÁLISIS DE COVARIANZA = ANAVA + Regresión
Modelo matemático:
Yij   Ti    X ij  X..   ij

 
donde:
Yij = Valor de la variable de respuesta correspondiente al tratamiento i en la repetición j
 = Promedio general
Ti = Efecto del tratamiento i
X ij = Valor de la variable X de la parcela de tratamiento i y la repetición j
X.. = Media general de la covariable
 = Coeficiente de regresión lineal
ij = Error experimental
 Permite estimar un error más puro de Y sin la perturbación de X

 Las medias ajustadas miden los efectos esperados de tratamientos,
si no influyera X
 Aumenta la precisión
 Brinda información sobre relación X y Y
71
ANÁLISIS DE COVARIANZA
Supuestos:
 Los valores x (covariable) se miden sin error e independientes

de los tratamientos
 Homogeneidad de las regresiones  dentro de los grupos
i
 La regresión es lineal e independiente de los tratamientos. Los
tratamientos no influyen en la covariable X
 Los residuos se distribuyen normalmente e independientemente con
media 0 y varianza común. Esto implica que las regresiones
poblacionales tienen la misma pendiente
 Existe correlación entre la variable dependiente y la covariable.
si no hay correlación, el análisis de covarianza no tendría ventajas
sobre el ANAVA
72
Ejemplo:
Se hizo una prueba del efecto de tres tratamientos al suelo sobre el crecimiento
en altura de arbolitos de dos años. Los tratamientos se asignaron al azar a las tres
parcelas dentro de cada uno de los 10 bloques. Cada parcela incluía 50 arbolitos.
La media del crecimiento de 5 años fue el criterio para evaluar los tratamientos.
Las alturas iniciales y los crecimientos de cinco años, todos ellos medidos en pies,
fueron:
Tratamientos
A B C
Bloque Alt. Ini Crecim Alt. Ini Crecim Alt. Ini Crecim
1 3.6 8.9 3.1 10.7 4.7 12.4
2 4.7 10.1 4.9 14.2 2.6 7.0
3 2.6 6.3 0.8 5.9 1.5 7.4
4 5.3 14.0 4.6 12.6 4.3 10.1
5 3.1 9.6 3.9 12.5 3.3 6.8
6 1.8 6.4 1.7 9.6 3.6 8.3
7 5.8 12.3 5.5 12.8 5.8 11.9
8 3.8 10.8 2.6 8.0 2.0 7.5
9 2.4 8.0 1.1 7.5 1.6 5.2
10 5.3 12.6 4.4 8.4 4.8 10.7
Existen razones para creer que, en el caso de árboles jóvenes, el crecimiento
está afectado por la altura inicial.
73
Resultados del análisis de covarianza:
Crecimiento 30 0.81 0.68 15.09

F.V. SC gl CM F p-valor Coef
Modelo 157.32 12 13.11 6.22 0.0004
Bloque 8.66 9 0.96 0.46 0.8839
Tratamiento 16.61 2 8.31 3.94 0.0392
AltInicial 34.59 1 34.59 16.42 0.0008 1.81
Error 35.80 17 2.11
Total 193.12 29
Error: 2.1060 gl: 17
Tratamiento Medias n
B 10.67 10 A
A 9.30 10 A B
C 8.89 10 B
74
Resultados del análisis de varianza:
Crecimiento 30 0.64 0.41 20.56

Modelo 122.73 11 11.16 2.85 0.0235
Bloque 110.43 9 12.27 3.14 0.0186
Tratamiento 12.30 2 6.15 1.57 0.2346
Error 70.39 18 3.91
Total 193.12 29
Tratamiento Medias n
B 10.22 10
A 9.90 10
C 8.73 10
75

Filminas ANOVA 1

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Filminas ANOVA 1

Caricato da

Copyright:

Formati disponibili

CURSO

Finalidad: explorar, describir, confirmar hipótesis.

“Es una reproducción restringida de la realidad con el fin de observar los

Finalidad de estudios basados en experimentos: Confirmar hipótesis,

consisten en la aplicación de tratamientos a un

para valorar y comparar las respuestas obtenidas

cuando es deseable incrementar la precisión de

Antecedentes: Se observó que los renovales de

b) En caso afirmativo establecer el mecanismo de

La prueba t de Student proporciona el método para comparar las

Prueba T para muestras Independientes

media(1) media(2) p(Var.Hom.) T p prueba

Prueba T (muestras apareadas)

Otra forma de enunciar estas hipótesis es

Fuente de Suma de Cuadrados Grados Cuadrado F

Entre SCE gle=a -1 CME CME

Total SCT glt=N- 1

Porcentaje Observaciones Totales de Tratamiento yi

Fuente de Suma de Grados de Cuadrados F

Entre 294.93 2 147.46 21.9

Si  = 0.05, luego el punto crítico que

Como F= 21.91> Fcrítica se concluye, con un nivel de

Si se rechaza la hipótesis nula del ANAVA, la

Existe una gama muy amplia de alternativas para

La DMS de la prueba de Tukey para el ejemplo es 4.37.

DUNCAN SNK REGWQ

Se llama residuo de la observación j-ésima

El ANAVA propuesto por Kruskal y Wallis permite

El estadístico de la prueba (H) se basa en

Prueba de Kruskal Wallis

Los tratamientos consisten en aplicar distintos niveles de un

Experimento con estructura factorial de tratamientos:

Cada tratamiento surge de la combinación de los niveles de 2 o

Posible arreglo para un

Yij= + i + j + ij con i=1,2 j=1,2

ij es el término de error independiente

F.V. Suma de Cuadrados Grados de Cuadrado F

Factor B SCB b-1 CMB CMB

Error SCD=SCT-SCA-SCB (a-1)(b-1) CMD

Total SCT a.b-1

Mpa 0 -0.5 -1.0 -1.5

Osmolito 50.0 1 50.0 5.6 10.128

Potencial 6118.5 3 2172.8 241.0 9.276

Error 27.0 3 9.0

La inclusión de términos de interacción en el

Modelo lineal para un experimento bifactorial

Yijk=  + i+ j + ij + ijk con i=1,2 j=1,2 k=1,..,nij

Factor B SCB b-1 CMB CMB

Interacción AB SCAB (a-1)(b-1) CMAB CMAB

Error SCD=SCT-SCA-SCB- glt-gla-glb-glab CMD

Total SCT glt= n-1

Fuente de Suma de Grados de Cuadrado

Factor Epoca 3 1 3.00 1.71 5.32

Interacción 192 1 192.00 109.7 5.32

Temperatura 2 Tipo de Ruptura 2

Unidades Experimentales Homogéneas.

Unidades Experimentales Heterogéneas .

El agrupamiento del material experimental debe

Homogeneidad dentro de bloques

Todos los tratamientos en un bloque ??

Aleatorización por Bloque ???

Tales variaciones son generalmenre reconocidas a priori de

El DBCA representa una restricción a la aleatorización, los