Sei sulla pagina 1di 75

CURSO

ANALISIS ESTADISTICO DE
DATOS E INTERPRETACION DE
RESULTADOS

1
Análisis Estadístico en Estudios
Comparativos
• Pruebas t
•Análisis de Varianza
• DCA y Técnicas No-paramétricas
•Estructura de Parcelas, Tratamientos y Aleatorización
•DBCA y Estructura Factorial de Tratamientos
• DCL y DPD

2
¿Qué es un estudio observacional?
Sobre un proceso existente se observan (registra información) una o más
variables aleatorias.

Finalidad: explorar, describir, confirmar hipótesis.

¿Qué es un experimento?
“Prueba o serie de pruebas en las cuales se inducen cambios deliberados
en las variables de entrada de un proceso o sistema de manera que sea
posible observar e identificar las causas de los cambios en la respuesta
de salida” (Montgomery 1991).

“Es una reproducción restringida de la realidad con el fin de observar los


efectos de su manipulación planificada” (Casanoves y Di Rienzo, 1999).

Finalidad de estudios basados en experimentos: Confirmar hipótesis,


modelar , predecir

3
Experimentos Comparativos

consisten en la aplicación de tratamientos a un


conjunto de unidades experimentales

para valorar y comparar las respuestas obtenidas


desde diferentes tratamientos

cuando es deseable incrementar la precisión de


las inferencias realizadas y/o ampliar el espacio de
inferencia

4
Estudios Planificados

5
Estudios Planificados

6
Ejemplo:

Antecedentes: Se observó que los renovales de


algarrobo parecían tener una mayor tasa de
sobrevida cuando estaban debajo de plantas de
Jarilla.

Objetivos:
a) Determinar si efectivamente la Jarilla actúa
como planta madrina en el caso del algarrobo.

b) En caso afirmativo establecer el mecanismo de


protección involucrado.

7
Vocabulario asociado a Proyectos de Investigación
que generan Datos

•Unidad Experimental
•Unidad Observacional
•Factor, niveles de los factores
•Tipo de Factores: cualitativos y cuantitativos
•Tratamientos
•Repetición. Pseudo-réplicas
•Submuestras
•Contraste o comparación
•Precisión

8
Preguntas asociadas a Proyectos de Investigación
que generan Datos
 ¿Cuántos tratamientos se desean estudiar?
 ¿Cuántas veces necesita observar la respuesta?
 ¿Es necesario observar la evolución de la respuesta en el tiempo?
 ¿Cuáles son las unidades experimentales?
 ¿Cuáles son las unidades de observación?
 ¿Son las unidades experimentales homogéneas?
 ¿Son las unidades experimentales suficientes para realizar todos
los tratamientos?
 ¿Cómo se asignan los tratamientos a las unidades experimentales?
 El objetivo del experimento, ¿es la comparación y/o la estimación?
 ¿Los tratamientos tienen alguna estructura?
 ¿Puede el diseño resultante ser analizado y/o las comparaciones
deseadas llevadas a cabo?.

9
Comparación de dos medias (prueba t)

La prueba t de Student proporciona el método para comparar las


medias de dos muestras independientes o dependientes
(apareadas).
Muestras aleatorias independientes: los tratamientos se asignan
a diferentes unidades experimentales al azar
Hipótesis para las 2 Hipótesis para las 
H0 :12  22 H0 : 1  2
H1 :12   22 H1: 1  2
Tipos de errores en pruebas de hipótesis:
• Error Tipo I : rechazar H0 cuando es verdadera (   )
• Error Tipo II: aceptar H0 cuando es falsa (   )
10
Ejemplo prueba de t para dos muestras
independientes
Se tienen datos de dos procedencias de pino hondureño, las que
van a compararse sobre la base de su producción en volumen.
Los volúmenes (m3) de 11 árboles de cada procedencia son:
Procedencia 1: 11, 5, 9, 8, 10, 11, 10, 8, 11, 8, 8
Procedencia 2: 9, 6, 9, 9, 13, 8, 6, 5, 6, 10, 7

Prueba T para muestras Independientes


Clasific Variable Grupo(1) Grupo(2) n(1) n(2)
Procedencia Volumen {1.00} {2.00} 11 11

media(1) media(2) p(Var.Hom.) T p prueba


9.00 8.00 0.4775 1.12 0.2768 Bilateral

11
Comparación de dos medias (prueba t)
Muestras dependientes: los tratamientos se aplican a pares de
unidades experimentales gemelas o parecidas; aleatorizando
dentro de los pares
Hipótesis
H0 : 1  2  0 H1: 1  2  0
Ejemplo:
Un técnico desea evaluar el comportamiento de dos tipos de picos aspersores de riego. Para esto
Selecciona 10 campos aleatoriamente, y en cada uno de ellos pone a prueba los 2 picos. Se conoce
que el tipo de agua influye sobre la calidad de la aspersión, ya que las sales disueltas en ella suelen
tapar los picos. Por este motivo, la variable a evaluar es el caudal entregado por los picos luego de
1 mes de funcionamiento. Los datos obtenidos en litros por hora son los siguientes:
Productor 1 2 3 4 5 6 7 8 9 10
Pico A 9 7 9 10 11 5 8 4 11 7
Pico B 5 4 4 6 10 6 7 3 10 7

Prueba T (muestras apareadas)


Obs(1) Obs(2) N media(dif) DE(dif) T Bilateral
Pico A Pico B 10 1.90 1.97 3.05 0.0138

12
Análisis de Varianza (ANAVA)
La técnica de análisis de la varianza presupone un modelo
para la variable respuesta. Permite descomponer la
variación total de las observaciones en la variación entre
tratamientos y la variación dentro de tratamientos
(entre unidades experimentales que reciben el mismo
tratamiento).
Se denomina modelo lineal de ANAVA (a una vía de
clasificación) para la observación Yij a:
Yij = + i + ij , con i=1,...,a y j=1,..,n
donde:
Yij es la j-ésima observación del i-ésimo tratamiento
 es la media general de las observaciones
i es el efecto del i-ésimo tratamiento
ij es una variable aleatoria normal independientemente distribuida con
esperanza 0 y varianza 2 i,j.

13
El objetivo del ANAVA de efectos fijos es
contrastar la hipótesis de que los efectos de
tratamientos son nulos versus que al menos
uno no lo es. En términos estadísticos:

H0: 1=...=a= 0
H1: Al menos un tratamiento tiene efecto no nulo.

Otra forma de enunciar estas hipótesis es


que las medias de los tratamientos que se
comparan son idénticas vs. que no lo son.

14
Formato de una Tabla de ANAVA

Fuente de Suma de Cuadrados Grados Cuadrado F


Variación de Medio Obs
Libertad

Entre SCE gle=a -1 CME CME


Tratamientos CMD

Dentro
(Error SCD=SCT-SCE gld=N-a CMD
Experimental)

Total SCT glt=N- 1

15
Ejemplo
El porcentaje de humedad relativa (HR) es determinante para el ataque de
hongos en semillas. Para evaluar la susceptibilidad de las semillas de una
forrajera al ataque de un hongo se realizó un ensayo en cámaras de cría con
tres porcentajes de HR: 70%, 80% y 90%. Cinco observaciones fueron
tomadas para cada porcentaje de HR, registrándose el número de semillas
atacadas en un grupo de 100 semillas

Porcentaje Observaciones Totales de Tratamiento yi


de HR (Número de semillas atacadas)

70 7 6 9 5 9 36

80 12 15 17 18 20 82

90 14 16 18 21 15 84

y = 202

16
Análisis de Varianza para un ensayo sobre el
efecto de hongos en la semilla de una forrajera
según tratamientos de humedad relativa.

Fuente de Suma de Grados de Cuadrados F


Variación Cuadrados Libertad Medios

Entre 294.93 2 147.46 21.9


Tratamientos
Dentro 80.8 12 6.73
(Error Experimental)

Total 375.73 14

17
Interpretación de Resultados

Si  = 0.05, luego el punto crítico que


delimita la zona de aceptación y rechazo
de H0 es F(2,12; 0.95) = 3.88.

Como F= 21.91> Fcrítica se concluye, con un nivel de


significación del 5%, que se rechaza la hipótesis
nula de igualdad de medias de número de semillas
atacadas para los 3 porcentajes de HR, por lo
tanto al menos una de las HR produce un grado de
ataque de hongos diferente de los restantes.

18
Pruebas de Comparaciones Múltiples

Si se rechaza la hipótesis nula del ANAVA, la


pregunta que sigue es ¿cuál o cuáles de las
medias poblacionales en estudio son las
diferentes?

Existe una gama muy amplia de alternativas para


llevar adelante este tipo de pruebas, entre las
que se destacan la de Tukey (Tukey, 1949), la de
Scheffé (Scheffé, 1953), la de Duncan (Duncan,
1955), la de Dunnet (Dunnet, 1964), y la de
Fisher (Fisher, 1966), entre otras

19
Prueba de Tukey para el ejemplo en cuestión
1 2 3
1 - 9.2 9.6
2 - 0.4
3 -

La DMS de la prueba de Tukey para el ejemplo es 4.37.


Luego, se debe controlar qué diferencias entre medias muestrales
son mayores que 4.37 para concluir que las esperanzas que estiman
difieren entre sí con un nivel de significación del 5%. Revisando la
matriz de diferencias de medias se concluye que :
1  2 , 1  3 y 2 = 3

20
Valores críticos de distintos PCM
en función del número de tratamientos
2.2

2
Valores críticos

1.8

1.6

1.4

1.2

1
0 2 4 6 8 10
Número de tratamientos

DUNCAN SNK REGWQ


TUKEY LSD (U)

21
Verificación de Supuestos del Análisis
Los errores se suponen normales con esperanza cero,
varianza común e independientes. Los predictores de los
errores son los residuos.

Se llama residuo de la observación j-ésima


correspondiente al i-ésimo nivel del factor
tratamiento al predictor de ij, que se denota por
eij y se obtiene como la diferencia entre el valor
observado y el valor predicho por el modelo

22
Normalidad
Seleccionando los residuos como variable de análisis, una de
las técnicas más usadas es construir un Q-Q plot normal.
Mediante esta técnica se obtiene un diagrama de dispersión
en el que, si los residuales son normales y no hay otros
defectos del modelo, entonces se alinean sobre una recta a
45°.
3.60
3.40
3.20
Q-Q plot (normal)
3.00
obtenido a partir 2.80
de un modelo con 2.60
errores normales 2.40
2.20
2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6

23
Homogeneidad de varianzas
Cuando los errores son homocedásticos, haciendo un gráfico de
dispersión de residuos vs. valores predichos por el modelo se
debe observar una nube de puntos sin patrón alguno. Un patrón
típico que indica falta de homogeneidad en las varianzas, se
muestra en la siguiente figura, ya que a medida que crecen los
valores predichos por el modelo, aumentan las dispersiones de
los residuos respectivos.

residuales
Gráfico de residuos en
función de predichos en
un ejemplo con falta de 0
homogeneidad de
varianzas

predichos

24
Prueba de hipótesis sobre los
supuestos
• Prueba de Shapiro-Wilks
H0: Los errores tienen distribución normal

• Prueba de Levene
H0: Los errores tienen varianza homogénea

25
Versión No-Paramétrica del ANAVA

El ANAVA propuesto por Kruskal y Wallis permite


comparar las esperanzas de 2 o más distribuciones
sin necesidad de realizar el supuesto de que los
términos de error se distribuyen normalmente.

El estadístico de la prueba (H) se basa en


la suma de los rangos asignados a las
observaciones dentro de cada tratamiento.
La interpretación se realiza de igual
manera que el ANAVA paramétrico
26
Versión No-Paramétrica del ANAVA
Ejemplo:
En un experimento se prueba si el número de insectos por planta es diferente en 3
variedades de chile dulce. Para cada variedad se cuenta el número de insectos en
15 plantas. Los datos obtenidos son los siguientes:
Planta 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Variedad 1 5 7 8 2 2 8 3 6 8 9 2 5 4 7 10
Variedad 2 21 8 2 23 7 9 3 24 7 2 1 12 7 8 9
Variedad 3 0 3 0 4 2 3 4 1 2 6 5 3 7 0 4

Prueba de Kruskal Wallis


Variable variedad N Medias D.E. Medianas H p
Insectos 1.00 15 5.73 2.69 6.00 11.54 0.0029
Insectos 2.00 15 9.53 7.47 8.00
Insectos 3.00 15 2.93 2.15 3.00

Trat. Ranks
3.00 14.00 A
1.00 25.13 B
2.00 29.87 B
Letras distintas indican diferencias significativas(p<= 0.05)

27
Para modelar es importante identificar
DOS tipos de estructuras

Estructura de parcelas

Aleatorización

Estructura de tratamientos

28
Estructura de Tratamientos
Experimento unifactorial:

Los tratamientos consisten en aplicar distintos niveles de un


mismos factor. Ejemplo: Factor densidad de siembra y las distintas
densidades son sus niveles.

Experimento con estructura factorial de tratamientos:

Cada tratamiento surge de la combinación de los niveles de 2 o


más factores. Ejemplo: Factores variedad y fecha de siembra , con tres
variedades de una especie y dos fechas de siembra. Hay un total de seis
tratamientos, ya que el factor variedad se encuentra a tres niveles y el factor fecha
a dos.

29
Estructura de Tratamientos

La estructura de tratamientos de un
problema particular consiste en el
conjunto de tratamientos o poblaciones
que el experimentador ha seleccionado
para estudiar y/o comparar.

30
Experimento con Dos Factores
Con Dos niveles cada uno

Posible arreglo para un


A2B1 A1B1 experimento bifactorial
sin repeticiones,
conducido bajo un diseño
A1B2 A2B2
completamente
aleatorizado.

31
Modelo para un Experimento Factorial
sin Repeticiones

Yij= + i + j + ij con i=1,2 j=1,2

ij es el término de error independiente


que se supone es una variable aleatoria
normal, con esperanza cero y varianza
común 2
Cuando los experimentos factoriales no tienen repeticiones, se
debe suponer que los factores no interactúan, para poder
estimar el error experimental.

32
Formato Tabla de ANAVA
Experimento Bifactorial sin Repeticiones

F.V. Suma de Cuadrados Grados de Cuadrado F


Libertad Medio
Factor A SCA a-1 CMA CMA
CMD

Factor B SCB b-1 CMB CMB


CMD

Error SCD=SCT-SCA-SCB (a-1)(b-1) CMD

Total SCT a.b-1

33
Ejemplo
Datos de un ensayo comparativo del efecto de distintos
potenciales agua del substrato sobre el porcentaje de
germinación en Atriplex Cordobensis.

Mpa 0 -0.5 -1.0 -1.5

ClNa 85 78 54 14

PEG 83 76 43 9

34
Cuadro de análisis de la varianza del experimento
bifactorial para evaluar el efecto de distintos potenciales
agua del substrato sobre el porcentaje de germinación en
Atriplex cordobensis.
Fuente de Suma de G. de Cuadrado F obs. F tabla
Variación Cuadrados Libertad Medio

Osmolito 50.0 1 50.0 5.6 10.128

Potencial 6118.5 3 2172.8 241.0 9.276


Agua

Error 27.0 3 9.0

Total 6195.5 7

35
Modelos con Interacción

La inclusión de términos de interacción en el


modelo conlleva la necesidad de tener
repeticiones para cada tratamiento.

Modelo lineal para un experimento bifactorial


con interacciones

Yijk=  + i+ j + ij + ijk con i=1,2 j=1,2 k=1,..,nij

36
Formato Tabla de ANAVA
Bifactorial con Repeticiones
Fuente de Suma de Cuadrados Grados de Libertad Cuadrado F
Variación Medio
Factor A SCA a-1 CMA CMA
CMD

Factor B SCB b-1 CMB CMB


CMD

Interacción AB SCAB (a-1)(b-1) CMAB CMAB


CMD

Error SCD=SCT-SCA-SCB- glt-gla-glb-glab CMD


SCAB

Total SCT glt= n-1

37
Ejemplo
Concentración proteica (% del peso seco) en hojas de
Atriplex cordobensis cosechadas en invierno y verano de
plantas masculinas y femeninas.

Femeninas Masculinas
Invierno Verano Invierno Verano
24 17 17 24
28 18 18 25
26 16 16 23

38
Tabla de ANAVA

Fuente de Suma de Grados de Cuadrado


Variación Cuadrados Libertad Medio F obs. F
tabla
Factor Sexo 3 1 3.00 1.71 5.32

Factor Epoca 3 1 3.00 1.71 5.32


de cosecha

Interacción 192 1 192.00 109.7 5.32


Epoca-Sexo

Error 14 8 1.75

Total 212 11

39
Gráfico para estudiar interacción
30

masculinas
contenido de proteínas

femeninas
Media  error estándar
25 de la concentración de
proteínas en hojas de
Atriplex cordobensis por
efecto del sexo y la época
20
de cosecha.

femeninas masculinas
15
Verano Invierno

40
Gráfico para estudiar interacción
60

55

50
Media  error
Fibras Insolubles

masculinas
estándar de la
45 concentración de
fibras insolubles en
40
hojas de Atriplex
35 femeninas cordobensis por
efecto del sexo y la
30 época de cosecha.
25
Verano Invierno

41
Ventaja de la Estructura
Factorial de Tratamientos
Ejemplo: Comparar el efecto de tres tipos de ruptura de
dormición y el efecto de tres temperaturas de cámara de
germinación bajo un DCA con tres repeticiones.

Fuente Gl Fuente GL

Temperatura 2 Tipo de Ruptura 2

Error 6 Error 6
Total 8 Total 8

Número total de UE 18

42
Ventaja de la Estructura
Factorial de Tratamientos

Fuente Gl
Temperatura (A) 2
Tipo de Ruptura (B) 2
A*B 4
Error 9
Total 17

Número total de UE 18

43
Estructura de Parcelas

Unidades Experimentales Homogéneas.


Sin estructura
Diseño Completamente al Azar

Unidades Experimentales Heterogéneas .


Variabilidad sistemática natural o Inducida

Diseño en Bloques

44
Principio del Diseño en Bloques

El agrupamiento del material experimental debe


ser tal que, las unidades experimentales dentro de
un bloque sean tan homogéneas como sea posible y
que las diferencias entre unidades experimentales
sea explicada, en mayor proporción, por las
diferencias entre bloques

Homogeneidad dentro de bloques


Heterogeneidad entre bloques

45
Diseño en Bloques Completos al Azar

Todos los tratamientos en un bloque ??

Bloques Completos

Aleatorización por Bloque ???

Bloques al Azar

46
Comentarios
El DBCA es una estrategia experimental para disminuir el
efecto de variaciones sistemáticas entre unidades
experimentales sobre la comparación de medias de tratamiento

Tales variaciones son generalmenre reconocidas a priori de


realizar el experimento. Un bloque es un grupo de unidades
experimentales homogéneas. También se pueden reconocer a
posteriori

El DBCA representa una restricción a la aleatorización, los


tratamientos son aleatorizados por bloques.

La técnica de ANAVA es usada para el análisis de datos


experimentales obtenidos bajo un diseño en bloques para probar
la hipótesis nula de igualdad de medias de tratamientos.

47
Modelo para la Respuesta de un Experimento Diseñado en Bloques

Yij =  + i + j + ij , con i=1,...,a; j=1,...,b


•  corresponde a la media general,
• i el efecto del i-ésimo tratamiento (Fijo o Aleatorio)
• j el efecto del j-ésimo bloque (Fijo o Aleatorio)
• ij es el error aleatorio asociado con la unidad experimental en
el bloque j que recibe el tratamiento i, comúnmente los
términos de error se asumen normalmente distribuídos con
esperanza cero y varianza común 2.

48
Estructura típica de una tabla de datos para un
ensayo unifactorial con diseño en bloques completos
aleatorizados.
Trat bloque bloque ... bloque Total
1 2 b

1 y11 y12 ... y1b y1

2 y21 y22 ... y2b y2

: : : ::: :

a ya1 ya2 ... yab ya

Total y1 y2 yb y

49
ANAVA - DBCA
Partición de la Suma de Cuadrados Total en
Sumas de Cuadrados Entre Tratamientos, Entre
Bloques y Suma de Cuadrados del Error

Obtención del estadístco F para probar la Hipótesis de


igualdad de medias de tratamiento (Hipótesis de interés)

Supuestos del análisis: Normalidad, Independencia,


Homogeneidad de Varianzas, Aditividad Bloque-Tratamiento

Prueba validez de los supuestos a través de los residuos eij

50
Formato Tabla ANAVA -DBCA
Fuente de Suma de Cuadrados Grados de Cuadrado F
Variación Libertad Medio
Bloques SCB glb=b-1 CMB CMB
CMD
Entre SCE gle=a-1 CMT CMT
Tratamientos CMD

Dentro SCD=SCT-SCE-SCB gld=(a-1)(b-1) CMD


(Error
Experimental)

Total SCT glt=ab-1

51
Ejemplo DBCA
Se realizó un experimento en un diseño de bloques completos al azar para
evaluar el rendimiento en kg/parcela de maíz en suelos infectados con
Diplodia spp, en tratamiento con varios fungicidas. Los datos se presentan
a continuación:
Tratamiento
Bloque A B C D E
1 8 16 14 10 8 Tratamientos
2 8 19 16 11 7 A= control sin tratamiento
3 9 24 14 12 1 B y C= fungicidas mercúricos
4 7 22 13 8 1 D y E= fungicidas no mercúricos

I II III IV
C A D B
A E E D
Esquema del diseño
B C B E
de tratamientos
D B A C
E D C A

52
Ejemplo DBCA

Resultados del análisis de los datos


Análisis de la varianza

Variable N R² R² Aj CV
DensidadSem 20 0.88 0.81 23.01

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor
Modelo 614.20 7 87.74 12.75 0.0001
Bloque 12.40 3 4.13 0.60 0.6269
Trat 601.80 4 150.45 21.86 <0.0001
Error 82.60 12 6.88
Total 696.80 19

Test:Duncan Alfa:=0.05
Error: 6.8833 gl: 12
Trat Medias n
B 20.25 4 A
C 14.25 4 B
D 10.25 4 B C
A 8.00 4 C D
E 4.25 4 D
Letras distintas indican diferencias significativas(p<= 0.05)

53
Comparación de Medias
Pruebas exactas (contrastes ortogonales)
Ortogonal = independiente y aditivo (balanceado)
• Comparación de grupos de tratamientos
• Descomposición de la SC de tratamientos
SC Total
SC Trat SC1
Particionada SC2
SC Trat
SC4 SC Trat = SC1 + SC2 + .. +SCt-1
SC3
SC EE SC EE

54
Contrastes ortogonales
Ejemplo
Tratamientos
A= control sin tratamiento
B y C= fungicidas mercúricos
D y E= fungicidas no mercúricos

Los 4 grados de libertad de los tratamientos se pueden descomponer en 4 hipótesis


con un grado de libertad cada hipótesis

Coeficientes
A B C D E
B  C  D  E
1. H 0 :  A  4 -1 -1 -1 -1
4
B  C  D   E
2. H 0 :  0 1 1 -1 -1
2 2
3. H 0 : B  C 0 1 -1 0 0

4. H 0 : D  E 0 0 0 1 -1

55
Ejemplo Contrastes Ortogonales
Resultados del análisis de los datos
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 614.20 7 87.74 12.75 0.0001
Bloque 12.40 3 4.13 0.60 0.6269
Trat 601.80 4 150.45 21.86 <0.0001
Error 82.60 12 6.88
Total 696.80 19

Contrastes
Trat SC gl CM F p-valor
Contraste1 57.80 1 57.80 8.40 0.0134
Contraste2 400.00 1 400.00 58.11 <0.0001
Contraste3 72.00 1 72.00 10.46 0.0072
Contraste4 72.00 1 72.00 10.46 0.0072
Total 601.80 4 150.45 21.86 <0.0001
trat Medias
B 20.25
C 14.25
D 10.25
A 8.00
E 4.25

56
ANAVA Parcelas Divididas
DISEÑO DE EXPERIMENTOS CON DOS TAMAÑOS DE PARCELA

o La naturaleza de los tratamientos justifica el uso de diferentes


tamaños de parcela
o Para modelar respuestas en el tiempo (esfericidad)
o El experimento está en marcha y se quieren agregar nuevos subtratamientos
o Estimar con diferente precisión los experimentos
o Diferentes tamaños de parcela
o Mayor precisión a nivel de subparcela que en parcela
o Por lo general, el interés se centra más en la parcela pequeña
o Dos pasos de aleatorización:
o Para parcelas grandes
o Para subparcelas (parcelas pequeñas)
o Es posible generalizar para mayor subdivisión de parcelas: parcelas subdivididas

57
ANAVA Parcelas Divididas
Modelo matemático DCA:
Yijk    Ai  k (i)  B j  ( AB)ij ijk

Donde:
Yijk = Variable de respuesta en la parcela grande i, parcela pequeña j
y repetición k
µ = La media general
Ai = El efecto principal de la parcela grande i
 k (i) = El error para la parcela grande
Bj = El efecto principal de la parcela pequeña j
(AB)ij = La interacción de la parcela grande i con la parcela pequeña j
ijk = El error para la parcela pequeña

58
ANAVA Parcelas Divididas
Modelo matemático DBCA:
Yijk    Ri  Aj ij  Bk  ( AB) jk ijk

Donde:

Yijk = Variable de respuesta en la parcela grande i, parcela pequeña j


y bloque k
µ = La media general
Ri = El efecto del bloque k
Aj = El efecto principal de la parcela grande i
 ij = El error para la parcela grande
Bk = El efecto principal de la parcela pequeña j
(AB)jk = La interacción de la parcela grande i con la parcela pequeña j
ijk = El error para la parcela pequeña

59
ANAVA Parcelas Divididas
Croquis experimental
Bloques=2 Factor A=3 niveles Factor B=3 niveles

Bloque I Bloque II
a2 a1 a3 a3 a1 a2
b2 b2 b3 b1 b1 b2

b3 b1 b1 b3 b2 b1

b1 b3 b2 b2 b3 b3

60
ANAVA Parcelas Divididas
Ejemplo
Se realizó un experimento en DBCA para comparar dos niveles de irrigación (alta y
moderada) y cuatro variedades de caña de azúcar. La parcela grande corresponde a la
irrigación y la parcela pequeña a las variedades. Los datos de rendimiento en ton/ha son
los siguientes:

VARIEDAD
Irrigación 1 2 3 4
Alta 123.2 132.3 123.2 128.8
BLOQUE I
Moderada 118.2 123.2 115.2 116.3
Alta 128.2 138.3 128.2 125.8
BLOQUE II
Moderada 119.2 120.2 117.2 121.3
Alta 118.2 122.3 121.2 124.8
BLOQUE III
Moderada 111.2 117.2 113.2 113.3
Alta 128.2 123.3 128.2 132.8
BLOQUE IV
moderada 113.2 122.2 114.2 116.3

61
Resultados del análisis de los datos

Variable N R² R² Aj CV
Rend 32 0.85 0.75 2.70

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor (Error)
Modelo 1127.31 13 86.72 8.00 <0.0001
Bloque 214.59 3 71.53 11.86 0.0359 (Blo*Irri)
Irrigacion 754.66 1 754.66 125.13 0.0015 (Blo*Irri)
Bloque*Irrigacion 18.09 3 6.03 0.56 0.6504
Variedad 129.92 3 43.31 4.00 0.0241
Irrigacion*Variedad 10.03 3 3.34 0.31 0.8188
Error 195.06 18 10.84
Total 1322.37 31

Test:Duncan Alfa:=0.05
Error: 6.0312 gl: 3
Irrigacion Medias n
Alta 126.69 16 A
Moderada 116.98 16 B
Error: 10.8368 gl: 18
Variedad Medias n
2.00 124.88 8 A
4.00 122.43 8 A B
3.00 120.08 8 B
1.00 119.95 8 B
Letras distintas indican diferencias significativas(p<= 0.05)

62
ANAVA Diseño Cuadrado Latino
En el diseño de bloques completos al azar, se busca aislar una fuente de
variación extraña reconocible, que puede generar ruido en la comparación
de los efectos de los tratamientos a través del bloqueo. Si el bloqueo
funciona, el CME se reduce, dando una prueba más sensible que la
obtenida en un DCA.
No obstante, hay situaciones en las que se pueden presentar dos fuentes
de variación extrañas reconocibles, por lo que habría que bloquear en dos
sentidos. Si el bloqueo en los dos sentidos funciona, el CME se reduce,
dando una prueba más sensible que en un DBCA

Ventaja:
 Controla la variabilidad extraña a tratamientos en doble sentido
Desventajas:
 Menos grados de libertad en error experimental que DCA y DBCA
 Número de repeticiones = número de tratamientos o múltiplo
 Los tratamientos deben aparecer sólo una vez en hilera / columna

63
ANAVA Diseño Cuadrado Latino
Modelo matemático
Yij(k )    Hi  C j T(k )  eij
Donde:
Yij = Valor de la variable de respuesta en la hilera i, columna j y tratamiento k
 = Promedio general
Hi = Efecto de la hilera i
Cj = Efecto de la columna j
T(k ) = Efecto del tratamiento k
eij = Error experimental
Columnas
1 2 3
1 A B C
Hileras 2 B C A
3 C A B

Croquis experimental

64
ANAVA Diseño Cuadrado Latino
Ejemplo:
Se realizó un experimento para comparar los rendimientos en
kg/parcela de 5 variedades de maíz.En el campo donde se realizó el
Experimento, los gradientes de fertilidad se presentan en dos
sentidos: paralalamente y en ángulo recto a los surcos.
Los datos obtenidos son los siguientes:

Columnas
Filas 1 2 3 4 5
1 C (32) A (23) B (24) E (34) D (28)
2 A (28) C (36) D (33) B (32) E (38)
3 E (40) D (37) A (31) C (39) B (26)
4 D (39) B (31) E (43) A (33) C (41)
5 B (32) E (45) C (43) D (40) A (35)

65
ANAVA Diseño Cuadrado Latino
Resultado del análisis de los datos:
Variable N R² R² Aj CV
Rend 25 0.96 0.93 4.67

Cuadro de Análisis de la Varianza (SC tipo I)


F.V. SC gl CM F p-valor
Modelo 835.12 12 69.59 26.84 <0.0001
Fila 347.84 4 86.96 33.53 <0.0001
Columna 11.04 4 2.76 1.06 0.4159
Trat 476.24 4 119.06 45.91 <0.0001
Error 31.12 12 2.59
Total 866.24 24

Test:Duncan Alfa:=0.05
Error: 2.5933 gl: 12
Trat Medias n
E 40.00 5 A
C 38.20 5 A
D 35.40 5 B
A 30.00 5 C
B 29.00 5 C
Letras distintas indican diferencias significativas(p<= 0.05)

66
ANAVA Diseño Cuadrado Latino

MAS DE UN CUADRADO LATINO POR EXPERIMENTO

Los cuadrados latinos pequeños proporcionan pocos grados


de libertad para estimar el error experimental, y así debe
lograrse una disminución sustancial en el error para compensar
el poco número de gl. Sin embargo, puede utilizarse más de
un cuadrado latino en el mismo experimento; por ejemplo,
dos cuadrados latinos 4 X 4 darán 15 gl para el error si los
tratamientos responden de manera análoga en ambos cuadrados.

67
MAS DE UN CUADRADO LATINO POR EXPERIMENTO

Modelo matemático
Yijk (l)    Qi  F (Q) j(i)  C(Q)k (i) T(l)  eijk
Donde:
Yijk = Valor de la variable de respuesta en el cuadrado i, hilera j, columna k y
tratamiento l
 = Media general
Qi = Efecto del Cuadrado i
F (Q) j(i) = Fila j dentro de Cuadrado i
C (Q)k (i)
= Hilera k dentro de Cuadrado i
T(l ) = Efecto del Tratamiento l
eijk = Error experimental

68
MAS DE UN CUADRADO LATINO POR EXPERIMENTO

Ejemplo
Un experimento con seis novillas de un año en una vaquería se efectúo en dos
cuadrados latinos. Los tratamientos fueron tres raciones seleccionadas en base a
la localidad y características físicas diversas y se alimentaron ad libitum. Cada
animal recibió las tres raciones sucesivamente, con una semana para cada una.
La variable observada fue libras de materia seca consumida por 100 lbs de peso
corporal. Los datos se presentan a continuación:

Cuadrado 1 2
Novilla 1 2 3 4 5 6
Semana
1 2.7(1) 2.6(2) 1.9(3) 3.3(1) 2.3(2) 0.1(3)
2 2.1(2) 0.2(3) 2.3(1) 1.7(3) 2.8(1) 1.8(2)
3 1.9(3) 2.1(1) 2.4(2) 2.1(2) 1.7(3) 2.7(1)

69
MAS DE UN CUADRADO LATINO POR EXPERIMENTO

Ejemplo
Variable N R² R² Aj CV
materia_seca 18 1.00 0.56 26.19

Cuadro de Análisis de la Varianza (SC tipo I)


F.V. SC gl CM F p-valor
Modelo 9.39 11 0.85 2.99 0.0950
Cuadrado 0.01 1 0.01 0.02 0.8990
Cuadrado>Semana 1.30 4 0.32 1.14 0.4219
Cuadrado>Novilla 1.92 4 0.48 1.69 0.2698
Trat 6.16 2 3.08 10.81 0.0103
Error 1.71 6 0.29
Total 11.10 17

Test:Duncan Alfa:=0.05
Error: 0.2852 gl: 6
Trat Medias n
1.00 2.65 6 A
2.00 2.22 6 A
3.00 1.25 6 B
Letras distintas indican diferencias significativas(p<= 0.05)

70
TÉCNICAS COMBINADAS DE ANÁLISIS
ANÁLISIS DE COVARIANZA = ANAVA + Regresión
Modelo matemático:

Yij   Ti    X ij  X..   ij


 
donde:
Yij = Valor de la variable de respuesta correspondiente al tratamiento i en la repetición j
 = Promedio general
Ti = Efecto del tratamiento i
X ij = Valor de la variable X de la parcela de tratamiento i y la repetición j
X.. = Media general de la covariable
 = Coeficiente de regresión lineal
ij = Error experimental

 Permite estimar un error más puro de Y sin la perturbación de X


 Las medias ajustadas miden los efectos esperados de tratamientos,
si no influyera X
 Aumenta la precisión
 Brinda información sobre relación X y Y
71
ANÁLISIS DE COVARIANZA

Supuestos:

 Los valores x (covariable) se miden sin error e independientes


de los tratamientos
 Homogeneidad de las regresiones  dentro de los grupos
i
 La regresión es lineal e independiente de los tratamientos. Los
tratamientos no influyen en la covariable X
 Los residuos se distribuyen normalmente e independientemente con
media 0 y varianza común. Esto implica que las regresiones
poblacionales tienen la misma pendiente
 Existe correlación entre la variable dependiente y la covariable.
si no hay correlación, el análisis de covarianza no tendría ventajas
sobre el ANAVA

72
ANÁLISIS DE COVARIANZA
Ejemplo:
Se hizo una prueba del efecto de tres tratamientos al suelo sobre el crecimiento
en altura de arbolitos de dos años. Los tratamientos se asignaron al azar a las tres
parcelas dentro de cada uno de los 10 bloques. Cada parcela incluía 50 arbolitos.
La media del crecimiento de 5 años fue el criterio para evaluar los tratamientos.
Las alturas iniciales y los crecimientos de cinco años, todos ellos medidos en pies,
fueron:
Tratamientos
A B C
Bloque Alt. Ini Crecim Alt. Ini Crecim Alt. Ini Crecim
1 3.6 8.9 3.1 10.7 4.7 12.4
2 4.7 10.1 4.9 14.2 2.6 7.0
3 2.6 6.3 0.8 5.9 1.5 7.4
4 5.3 14.0 4.6 12.6 4.3 10.1
5 3.1 9.6 3.9 12.5 3.3 6.8
6 1.8 6.4 1.7 9.6 3.6 8.3
7 5.8 12.3 5.5 12.8 5.8 11.9
8 3.8 10.8 2.6 8.0 2.0 7.5
9 2.4 8.0 1.1 7.5 1.6 5.2
10 5.3 12.6 4.4 8.4 4.8 10.7
Existen razones para creer que, en el caso de árboles jóvenes, el crecimiento
está afectado por la altura inicial.

73
ANÁLISIS DE COVARIANZA
Resultados del análisis de covarianza:

Análisis de la varianza

Variable N R² R² Aj CV
Crecimiento 30 0.81 0.68 15.09

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor Coef
Modelo 157.32 12 13.11 6.22 0.0004
Bloque 8.66 9 0.96 0.46 0.8839
Tratamiento 16.61 2 8.31 3.94 0.0392
AltInicial 34.59 1 34.59 16.42 0.0008 1.81
Error 35.80 17 2.11
Total 193.12 29

Test:Duncan Alfa:=0.05
Error: 2.1060 gl: 17
Tratamiento Medias n
B 10.67 10 A
A 9.30 10 A B
C 8.89 10 B
Letras distintas indican diferencias significativas(p<= 0.05)

74
ANÁLISIS DE COVARIANZA

Resultados del análisis de varianza:

Análisis de la varianza

Variable N R² R² Aj CV
Crecimiento 30 0.64 0.41 20.56

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor
Modelo 122.73 11 11.16 2.85 0.0235
Bloque 110.43 9 12.27 3.14 0.0186
Tratamiento 12.30 2 6.15 1.57 0.2346
Error 70.39 18 3.91
Total 193.12 29

Tratamiento Medias n
B 10.22 10
A 9.90 10
C 8.73 10

75

Potrebbero piacerti anche