Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Profesor Titular, Facultad de Agronoma, Universidad de San Carlos de Guatemala. Profesor Titular, Campus San Pedro Clver, Universidad Rafael Landvar, Facultad de Ciencias Ambientales y Agrcolas, Facultad de Ciencias Econmicas y Administracin.
Consultas y sugerencias:
Oficina S21, Edificio T-8, Universidad de San Carlos de Guatemala, Facultad de Agronoma, Ciudad Universitaria zona 12. Telfonos: e-mail: (502) 24769794, 24769782. ealbautis@hotmail.com, ezeqbautis@yahoo.com.mx
Dedicatoria
El tiempo y esfuerzo puesto en escribir, editar y elaborar este documento, ha sido cuantioso. El fuerte deseo de contribuir a mejorar constantemente la enseanza de la Estadstica a nivel universitario, me brind las fuerzas para avanzar y poder concluir este material educativo. Agradezco a mi esposa Mashury Vanesssa por su apoyo. Dedico esta obra, A: A: la memoria de mi profesor, amigo y compaero de muchas jornadas, el Maestro en Ciencias Vctor Manuel lvarez Cajas. Y la memoria de mi madre Basilia Bautista. Dicen que las personas, al morir, caen durante mucho tiempo en sueo profundo y despiertan en algn lugar. Mam, quiero despertar a tu lado o quedar dormido para siempre.
PRESENTACIN
El propsito de la Estadstica es ofrecer una base objetiva para el anlisis de datos observados, los cuales estn sujetos a la variacin del azar. Estos datos, en muchos casos, son obtenidos de experimentos, provenientes de estudios realizados a propsito y en condiciones previamente especificadas y controladas. El estudio de experimentos, tales como: su planeacin, ejecucin, toma de datos y anlisis de datos experimentales es lo que constituye el objetivo de la Estadstica Experimental. La Estadstica Experimental tuvo su desarrollo a partir de 1919, cuando Ronald Fisher asumi la direccin del Departamento de Estadstica de la Estacin Experimental de Rothamspstead en Londres. Estudiando la gran cantidad de datos que en el Instituto se haba generado durante largos aos, busc desarrollar mtodos estadsticos que lo llevaran a conclusiones sobre los diversos fenmenos de estudio. Junto con Fisher, otro matemtico, F. Yates tambin contribuy en el desarrollo de la metodologa estadstica en la investigacin experimental. Siendo as, que los mtodos experimentales surgieron primero en las ciencias biolgicas y a partir de entonces se generalizaron para todas las reas del conocimiento humano. A mediados de la dcada de 1950, se tena prcticamente redondeado el conjunto de esquemas experimentales, con los cuales se poda resolver cualquier problema de la investigacin agronmica. A pesar de la antigedad de estas metodologas, continan vigentes y contribuyendo al desarrollo del conocimiento en las ciencias agrcolas. Por esta razn en el pensum de la carrera de Ingeniera Agrnomica se incluye el curso de Diseo y Anlisis de Experimentos. El inters original de escribir este documento es poner a disposicin del alumno, notas que reemplacen a las suyas. Para evitar que los alumnos estn anotando, porque muchas veces no prestan atencin por estar preocupados en escribir. El material no pretende reemplazar a los libros, aunque algunas veces las circunstancias han llevado a situaciones de este tipo. Otro de los objetivos es que los alumnos puedan disponer de un material que les permita estudiar, repasar y practicar, con ejemplos reales, productos de investigaciones realizadas en su mayor parte en Guatemala, tanto en tesis de grado de la Facultad de Agronoma de la Universidad de San Carlos, como por otras instituciones, tales como: CENGICAA, INAB, ICTA, etc. En este documento recopilo informacin bibliogrfica muy valiosa de estadsticos de renombre en Amrica Latina, como el Dr. ngel Martnez Garza (Mxico), Dr. Frederico Pimentel Gomes, Dr. Decio Barbin y Dra. Mara Cristina Stolf Nogueira (Brasil), Dr. Ral Macchiavelli (Puerto Rico), entre otros; tambin de autores clsicos de diseos experimentales (Montgomery, Kempthorne, Ostle y Cochran, por ejemplo). As como algunas anotaciones propias, producto de mi experiencia docente y de campo.
Para terminar, deseo expresar mi agradecimiento ms sincero al colega Ing. Agr. Byron Gonzlez, a mis profesores de Estadstica de la Facultad de Agronoma (FAUSAC): M.Sc. Marino Barrientos y M.C. Vctor lvarez Cajas (QEPD), y del post-grado en Estadstica de la ESALQ/USP (Piracicaba, SP, Brasil), por los conocimientos transmitidos. As mismo agradezco a los estudiantes del curso de Estadstica Aplicada (Agrcola y Forestal) de la FAUSAC y del curso de Diseo y Anlisis de Experimentos de la carrera de Ingeniera Forestal del Campus San Pedro Clver de la Universidad Rafael Landvar, en Chamelco, Alta Verapaz; que por sus dudas en clase o fuera de ella, al utilizar las versiones iniciales de este documento, han contribuido a enriquecerlo.
CONTENIDO
Pgina 1. ASPECTOS GENERALES DEL DISEO Y ANLISIS DE EXPERIMENTOS 1.1 INTRODUCCIN 1.2 PRINCIPIOS BSICOS DEL DISEO EXPERIMENTAL 1.3 ERROR EXPERIMENTAL 1.4 CARACTERISTICAS DEL DISEO EXPERIMENTAL 1.5 ALGUNAS RECOMENDACIONES EN LA APLICACIN DE LOS MTODOS ESTADSTICOS EN LA EXPERIMENTACIN 1.6 VALIDEZ EXPERIMENTAL DISEO COMPLETAMENTE AL AZAR 2.1 INTRODUCCIN 2.2 ANLISIS ESTADSTICO 2.3 ANLISIS DE VARIANZA PARA UN EXPERIMENTO REALIZADO EN UN DISEO COMPLETAMENTE AL AZAR DESBALANCEADO 2.4 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO COMPLETAMENTE AL AZAR 2.5 ANLISIS DE VARIANZA PARA UN EXPERIMENTO REALIZADO MEDIANTE UN DISEO COMPLETAMENTE AL AZAR CON SUBMUESTREO 2.6 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO COMPLETAMENTE AL AZAR CON SUBMUESTREO 2.7 EJERCICIOS PROPUESTOS PRUEBAS DE COMPARACIN MLTIPLE DE MEDIAS 3.1 INTRODUCCIN 3.2 COMPARACI0N MLTIPLE DE MEDIAS SEGN EL CRITERIO DE TUKEY 3.3 COMPARACIN MLTIPLE DE MEDIAS SEGN EL CRITERIO DE DUNCAN 3.4 MTODO DE DUNNETT 3.5 PROGRAMA EN SAS PARA EL ANLISIS POSTANDEVA DE UN EXPERIMENTO USO DE LA REGRESIN EN EL ANLISIS DE VARIANZA: POLINOMIOS ORTOGONALES 4.1 INTRODUCCIN 4.2 MODELOS DE REGRESIN POLINOMIAL 4.3 EJEMPLO DE APLICACIN 4.4 PROGRAMA EN SAS PARA EL ANLISIS DE REGRESIN POLINOMIAL EN UN EXPERIMENTO 4.5 EJERCICIOS PROPUESTOS SUPUESTOS FUNDAMENTALES DEL ANLISIS DE VARIANZA, VERIFICACIN Y TRANSFORMACIN DE DATOS 5.1 INTRODUCCIN 5.2 TRANSFORMACIN DE DATOS 5.3 PROGRAMA EN SAS PARA EL ANLISIS DE LOS SUPUESTOS DE NORMALIDAD Y DE HOMOGENEIDAD DE VARIANZAS 5.4 EJERCICIOS PROPUESTOS DISEO EN BLOQUES COMPLETOS AL AZAR 6.1 INTRODUCCIN 6.2 ANLISIS ESTADSTICO 6.3 EJERCICIOS PROPUESTOS, DBA 6.4 ANLISIS POST ANDEVA: CONTRASTES 1 1 9 13 14 15 16 18 18 19 27 29 30 34 35 38 38 38 43 45 47 48 48 48 50 55 56 58 58 60 69 71 72 72 73 76 77
2.
3.
4.
5.
6.
7.
8.
9.
10.
11
PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO BLOQUES COMPLETOS AL AZAR, CON CONTRASTES ORTOGONALES 6.6 DISEO BLOQUES AL AZAR CON DATOS FALTANTES 6.7 ANLISIS DE VARIANZA PARA UN DISEO BLOQUES AL AZAR CON SUBMUESTREO 6.8 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO BLOQUES COMPLETOS AL AZAR, CON SUBMUESTREO 6.9 EJERCICIOS PROPUESTOS 6.10 EFICIENCIA DEL DISEO EN BLOQUES COMPLETOS AL AZAR DISEO CUADRADO LATINO 7.1 INTRODUCCIN 7.2 ANLISIS ESTADSTICO 7.3 DISEO CUADRADO LATINO (DCL) CON DATOS FALTANTES 7.4 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO CUADRADO LATINO 7.5 DISEO CUADRADO LATINO (DCL) CON SUBMUESTREO 7.6 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO CUADRADO LATINO CON SUBMUESTREO 7.7 EJERCICIOS PROPUESTOS EXPERIMENTOS FACTORIALES 8.1 INTRODUCCIN 8.2 EXPERIMENTOS FACTORIALES EN ARREGLO COMBINATORIO 8.3 EXPERIMENTOS FACTORIALES CON ARREGLO EN PARCELAS DIVIDIDAS EXPERIMENTOS EN FRANJAS 9.1 INTRODUCCIN 9.2 MODELO ESTADSTICO-MATEMTICO 9.3 HIPTESIS 9.4 ESQUEMA DEL ANLISIS DE VARIANZA 9.5 EJEMPLO DE APLICACIN 9.6 PROGRAMA EN SAS PARA UN EXPERIMENTO BIFACTORIAL CON ARREGLO EN FRANJAS DIVIDIDAS 9.7 EJERCICIOS PROPUESTOS ANLISIS DE COVARIANZA (ANCOVA) 10.1 INTRODUCCIN 10.2 SUPOSICIONES BSICAS DEL ANLISIS DE COVARIANZA 10.3 EJEMPLO DE APLICACIN 10.4 PROGRAMA EN SAS PARA UN EXPERIMENTO DONDE SE UTILIZ ANLISIS DE COVARIANZA SIMPLE 10.5 EJERCICIOS PROPUESTOS SERIE DE EXPERIMENTOS 11.1 INTRODUCCIN 10.2 EJEMPLO DE APLICACIN BIBLIOGRAFIA APNDICE
6.5
84 85 88 91 92 94 96 96 98 102 104 105 109 110 112 112 115 126 138 138 139 139 139 141 144 145 146 146 146 148 152 153 155 155 156 161 164
CAPTULO 1
ASPECTOS GENERALES DEL DISEO Y ANLISIS DE EXPERIMENTOS 1.1 INTRODUCCIN
Los investigadores realizan experimentos virtualmente en todos los campos del saber, por lo general para descubrir algo acerca de un proceso o sistema en particular (Montgomery, 1991). Literalmente, un experimento es una prueba o ensayo. Un experimento diseado es una prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la respuesta de salida. Un experimento, tambin es definido como un procedimiento que le permite al investigador, reproducir bajo condiciones controladas un fenmeno real con el objeto de obtener la informacin necesaria para la contrastacin objetiva de hiptesis relativas al efecto de factores especficos de la produccin. Existen diversas razones que hacen imperiosa la necesidad de realizar investigacin agrcola. Desde un punto de vista muy simple, se podra partir de la necesidad de satisfacer una demanda de alimentos, cada da mayor, tanto en cantidad como en calidad. Los fenmenos biolgicos, al no ser determinsticos, requieren de la inferencia estadstica para determinar el grado de incertidumbre que existe en los resultados y poder llegar a conclusiones y recomendaciones vlidas. En la Agronoma a diferencia de otras ciencias, debido a los efectos de la variabilidad gentica y ambiental, es necesario realizar investigacin de carcter local. El conjunto de aspectos que deben resolverse antes de la realizacin de un experimento son una clara evidencia de que la etapa de planificacin de cualquier investigacin experimental no debe ser olvidada. Antes de realizar un experimento hay que planificarlo de tal manera que permita obtener la informacin pertinente al problema bajo investigacin, a esta etapa se le conoce como diseo del experimento, y puede concebirse como la secuencia completa de pasos a realizar para asegurar que se obtendr la informacin necesaria para el contraste de la (s) hiptesis planteada (s). Nogueira (1997) indica que una investigacin planificada consiste en las siguientes etapas que dependen de un perfecto entendimiento entre el investigador y el estadstico. a) Enunciado del problema con formulacin de hiptesis (no en trminos estadsticos)
Estas hiptesis son primero formuladas en trminos cientficos dentro del rea de estudio (hiptesis cientfica), y enseguida deben ser expresadas en trminos estadsticos (hiptesis estadstica). Debe haber una correspondencia perfecta entre las hiptesis cientfica y estadstica para evitar ambigedades. Por tanto, en el enunciado del problema, la hiptesis cientfica debe ser formulada de manera precisa y objetiva. b) Seleccin de los factores y sus respectivos niveles
En una investigacin experimental, generalmente su objetivo es observar de que manera una o ms condiciones impuestas puedan interferir en el comportamiento de variables importantes dentro del contexto de la investigacin. Estas condiciones impuestas y distintas presentes en un experimento son denominadas: factores.
2
En otras palabras, un factor es cada una de las variables independientes cuyo efecto se est interesado en evaluar. Si un experimento consta de un solo factor se llama experimento simple, y si incluye dos o ms factores se llama experimento factorial. Los niveles de un factor pueden ser definidos como las alternativas de ese factor. Por ejemplo, si se est interesado en estudiar el efecto del factor frecuencias de riego en el rendimiento y evapotranspiracin del maz (Zea mays) en la unidad de riego San Cristbal Acasaguastln, El Progreso. Las frecuencias: 8, 10, 12 y 14 das, son los niveles (o tratamientos) de este factor. Si el inters fuera disear un experimento para estudiar el efecto de 4 niveles de nitrgeno (0, 50, 100 y 150 kg/ha/ao) y 4 niveles de fsforo (0, 40, 80 y 120 kg/ha/ao) en el rendimiento de cardamomo (Elettaria cardamomun M.) en la Serie de Suelos Tamahu, en aldea Chaval, Cobn, Alta Verapaz; se tendran dos factores: nitrgeno con 4 niveles y fsforo con 4 niveles. Se puede decir tambin que este experimento involucra 16 tratamientos, correspondientes a las combinaciones de niveles de los dos factores considerados. En cuanto al tipo de nivel, un factor podr ser cualitativo o cuantitativo. Por otra parte, los factores pueden, de acuerdo a la manera como fueron seleccionados los niveles que los componen, ser considerados como un factor de efecto fijo o de tipo I o como un factor de efecto aleatorio o de tipo II. Un factor ser considerado de efecto fijo cuando el investigador establece cules son los niveles a ser utilizados, y ser considerado factor de efecto aleatorio cuando los niveles son seleccionados aleatoriamente de una poblacin de niveles para los cuales las inferencias debern ser vlidas, as, las inferencias obtenidas podrn ser extrapoladas para la poblacin de niveles del factor considerado. En el ejemplo b.1 se dice que el factor variedades es fijo, y en el ejemplo b.2 el factor variedades es aleatorio. Ejemplo b.1 Un investigador tiene 8 variedades de caa de azcar para realizar un experimento de evaluacin de variedades promisorias. Ejemplo b.2 Un investigador, entre todas las variedades de caa de azcar, sorte 6 variedades y con ellas desea realizar un experimento de seleccin de variedades. Un experimento factorial podr existir bsicamente tres tipos bsicos de relacin entre los factores, generando los factores cruzados, factores jerrquicos y los mixtos. De esta forma, los factores pueden ser clasificados en: Clasificacin cruzada: cuando los factores son todos cruzados, y es posible estudiar las interacciones, una vez que al repetirse el mismo nivel del factor en cada uno de los niveles del otro factor es posible estudiar el comportamiento diferencial de un factor cuando el otro cambia de nivel. Clasificacin jerrquica: cuando al cambiar el nivel de un factor (factor de agrupamiento principal) cambian tambin los niveles del otro factor (factor de subagrupamiento). Se nota, en estos casos, que existe una jerarqua entre los factores, o sea, existe un factor principal y el otro factor est anidado o dentro de l. Se observa que el factor de subagrupamiento no puede ser considerado sin que se indique en cual nivel del factor principal est anidado. En este caso no es posible estudiar la interaccin entre los factores, pues cuando se cambia de nivel de un factor, los niveles del otro factor pasan a ser otros, imposibilitando evaluar ese tipo de efecto.
3
Las ideas de interaccin o anidamiento, si fuera el caso, son de gran importancia en el proceso de inferencia de datos de experimentos que involucran ms de un factor. Clasificacin mixta: surge cuando, en el mismo conjunto, aparecen factores cruzados y jerrquicos. Por el propio concepto de factor, se observa que en experimento, la seleccin de los factores y de sus respectivos niveles (que harn parte del experimento), es bsicamente un problema del investigador. c) Seleccin de la unidad experimental
En una gran cantidad de situaciones prcticas, la unidad experimental es determinada por la propia naturaleza del material experimental, se llama parcela a la unidad experimental usada y que recibir un tratamiento. En otras palabras, puede ser considerada como la menor subdivisin del material experimental de tal forma que cualquier unidad experimental podr recibir tratamientos distintos. Es interesante observar la diferencia entre unidad experimental y unidad de observacin. A las unidades experimentales se les aplican los tratamientos, y una unidad de observacin es aquella unidad realmente observada dentro del experimento y que corresponde a una fraccin de la unidad experimental, por ejemplo: en experimentos de campo es usual considerar el efecto de borde, en este caso, la unidad de observacin es considerada como el rea til (parcela neta). La unidad experimental puede asumir las ms diferentes formas y tamaos, dependiendo del objetivo del trabajo y del material experimental. Con relacin al tamao de la unidad experimental, el estadstico debe hacerse las siguientes preguntas: Se han realizado experimentos con la especie que va a investigar? Si se han realizado, y los resultados fueron satisfactorios, con un coeficiente de variacin bajo, se debe trabajar con el mismo tamao de parcela. Si no se han realizado, se debe preguntar al investigador sobre la homogeneidad del material experimental. a) b) Si es homogneo: las parcelas pueden ser pequeas. Si es heterogneo: las parcelas deben ser grandes, pero, de acuerdo con la disponibilidad del material experimental y del personal capacitado para trabajar con ese material.
Cuando existe duda sobre el tamao de la unidad experimental, el investigador debe ser orientado en el sentido de ofrecer al estadstico, o aquel que ir hacer los anlisis estadsticos, las mediciones individuales, pues, con eso se puede medir la VARIACIN DENTRO Y ENTRE LAS UNIDADES EXPERIMENTALES. Esto dar una orientacin sobre el tamao de la unidad experimental. Por ejemplo, tomando el caso de dos unidades:
4
e2
X X X
X X X
X X X
X X X
X X X
X X X
X X X
X X X
X X X
X X X
X X X
X X X
2 2 d sd
1
2 2 d sd
2
2 2 d sd =
varianza estimada de las muestras dentro de las unidades experimentales (est dada por el error de muestreo.
2 d > e2 : Se debe aumentar el tamao de la unidad experimental. 2 d < e2 : Se puede mantener o aumentar el tamao de la unidad experimental.
Ejemplo: Considere los siguientes resultados de un experimento que se realiz con submuestreo:
2 Cuadrado medio del error de muestreo ( sd ):
7.93 11.278 3
2 e
5
2 se2 sd 11.278 7.93 = = 1.2 (Varianza real entre unidades experimentales) m 3
e2 =
Conclusin:
2 Como d > e2 : se plantea la necesidad de aumentar el tamao de las unidades experimentales, y la precisin del muestreo.
Chacn (1976) indica que los factores que influyen en el tamao y la forma de la parcela: 1 2 3 4 5 Extensin superficial del terreno disponible Tipo de suelo Clase de cultivo Objetivo de la investigacin Uniformidad del material experimental 6 7 8 9 10 Mtodo de cultivo Nmero de tratamientos y de repeticiones Recursos econmicos disponibles Muestreo dentro de la unidad experimental Grado de precisin deseado.
Chacn (1976) tambin cita que el mtodo de la Mxima Curvatura fue el primero que se utiliz para conseguir tamao de parcela, es el mtodo general; hace uso de los llamados ensayos en blanco que consisten en sembrar un rea relativamente grande de un solo cultivo aplicando las mismas tcnicas, los mismos mtodos culturales, tratando de que exista la mayor uniformidad posible; por ello se denominan ensayos de uniformidad, ya que el nico factor que se desea que vare es la heterogeneidad del suelo. E1 rea es cosechada en unidades bsicas (rea pequea de cosecha en la cual es dividida el rea total), a estas unidades se les calcula posteriormente la varianza, la desviacin estndar, la media y el coeficiente de variacin. Estos tambin son calculados para parcelas ms grandes creadas con la unin de unidades bsicas contiguas. Luego se plantean en una curva la desviacin estndar con los diferentes tamaos de parcela obtenidas, tambin se puede utilizar el coeficiente de variacin. Se localiza entonces el punto de curvatura mxima y la consiguiente estimacin del tamao ptimo de parcela en forma grfica. E1 punto donde se encuentra el tamao ptimo es aquel donde un aumento en X (rea) no produce un descenso marcado en el coeficiente de variacin, localizndose el punto de mxima curvatura. Para mayor informacin sobre el procedimiento, consulte las tesis de Barrientos Garca, M. (1981), lvarez Cajas, V.M. (1982) y Hernndez Dvila, A. (1982). En cuanto a la forma de la parcela, Chacin (1976) afirma que tiene menos influencia que el tamao en la disminucin de los coeficientes de variacin, por lo tanto en la deteccin de diferencia entre tratamientos. Sin embargo, algunas veces la forma de parcela puede ser muy importante, ella depende mucho del manejo de las diferentes prcticas culturales, forma general del campo y exigencia del cultivo que se trate. Existe una gran variacin en la forma de la parcela, puede haber parcelas rectangulares de diferentes dimensiones y en diferentes sentidos, al igual que forma de parcela cuadrada. La forma rectangular tiene las ventajas de que muchas veces facilita las prcticas culturales del cultivo, uso de mquina, riego, fertilizacin, control de plagas, etc. A continuacin se presenta una recopilacin de algunos tamaos de unidad experimental utilizados en experimentos que se han realizado en Guatemala.
6
Caa de azcar. 6 surcos con caa, de 10 metros de largo, con una distancia de 1.5 m entre surco; haciendo un rea de 90 m2 por unidad experimental. 5 surcos con caa, de 10 metros de largo, con una distancia de 1.5 m entre surco; haciendo un rea de 75 m2 por unidad experimental.
Ctricos. Pia. 16 plantas, distanciadas 0.35 m entre planta y 1.6 m entre surco. 2 surcos/unidad experimental de 3.15 m de largo y 2.1 m de ancho (6.62 m2) 20 plantas, distanciadas 0.5 m entre planta y 1.0 m entre surco. 2 surcos/unidad experimental de 3 m de largo y 2 m de ancho. (6 m2) 40 plantas, distanciadas 0.3 m entre planta y 0.4 m entre surco. 3 surcos/unidad experimental de 4 m de largo y 1.2 m de ancho. (4.8 m2) 1 hasta 4 plantas por parcela
Brcoli. 132 plantas, distanciadas 0.45 m entre planta y 0.5 m entre surco. 11 surcos/unidad experimental de 5.4 m de largo y 6 m de ancho. (32.4 m2)
Chile pimiento. 18 plantas ( en 6.48 m2), 23 plantas ( en 7.68 m2), 27 plantas ( en 8.64 m2), 48 plantas ( en 11.20 m2), hasta 180 plantas ( en 57.6 m2)
Experimentos en laboratorio. 3 semillas germinadas dentro de un tubo de ensayo. 1 explante de aproximadamente 5 mm colocado en frascos de vidrio con 25 ml de medio de propagacin. 1 meristemo con 2 primordios florales en cada tubo de 25 150 mm. En total 10 meristemos por unidad experimental.
Finalmente, la seleccin de la unidad experimental, de un modo general, debe ser orientada en el sentido de minimizar el error experimental, esto es, las unidades experimentales deben ser lo ms homogneas posibles, para que, cuando sean sometidas a tratamientos diferentes, sus efectos sean fcilmente detectados.
7
d) Seleccin de las variables a ser medidas en las unidades experimentales.
En los experimentos, los factores y sus niveles son definidos y aplicados, y sus efectos son observados en las variables de inters, denominadas: variables de respuesta (variables dependientes). Su anlisis es el objetivo bsico de un experimento, una vez que el estudio de la influencia de los factores sobre ellas es el que deber responder a las preguntas de la investigacin. Las medidas realizadas en las unidades experimentales luego de ser sometidas a los tratamientos, constituyen los valores de la variable de respuesta, la cual en general, es determinada a priori por el investigador, o sea que, l sabe cul es la variable que quiere medir. Lo que constituye un problema, algunas veces, es la manera como la variable es medida, pues de esto depende la precisin de las observaciones y la distribucin de probabilidad de la variable, lo cual es esencial para la seleccin del mtodo de anlisis estadstico. Debe seleccionarse la o las variables ms idneas que realmente permitan juzgar o evaluar el comportamiento o efecto de los tratamientos en estudio. Por ejemplo, Castillo Fratti (1996) realiz un experimento para evaluar el efecto de la incisin anular sobre la calidad y el rendimiento de la fruta de uva de mesa en dos localidades del nororiente de Guatemala. Utiliz un diseo de bloques completos al azar, con 5 tratamientos y 4 repeticiones; la unidad experimental estuvo constituida por 3 plantas de uva completamente desarrolladas (adultas) y podadas (en un rea de 6 m2). Las variables de respuesta medidas las clasific en: a) b) c) e) De rendimiento: nmero de racimos por planta, peso del racimo individual y promedio por planta, nmero de bayas por racimo, peso y volumen de la baya. De calidad: tamao de la fruta, grados brix y prueba de aceptacin. Otras variables: relacin de yemas vegetativas y yemas florales y das a la cosecha. Seleccin del diseo experimental.
Para elegir el diseo es necesario considerar el nmero de repeticiones, las condiciones del sitio experimental y las condiciones de manejo del ensayo. De acuerdo con Martnez (1994), cuando se proyecto un experimento, el investigador debe tener en mente dos aspectos bsicos a saber: (1) la eleccin, propiamente hablando, del arreglo geomtrico o diseo experimental, que tiene por objetivo definir el arreglo de los tratamientos sobre las unidades experimentales, y (2) la composicin o proyecto de los tratamientos, lo cual constituye el diseo de los tratamientos, que se refiere al proyecto de las combinaciones de niveles, cuando se examina el efecto de dos ms factores, sobre una caracterstica en estudio. f) Anlisis estadstico de los datos experimentales
Deben emplearse mtodos estadsticos para analizar los datos, de modo que los resultados y conclusiones sean objetivos ms que apreciativos. Si el experimento se dise correctamente y si se ha realizado conforme al diseo, los mtodos estadsticos que se requieren no son complicados. Existen diversos paquetes estadsticos para el anlisis de datos, por ejemplo: SAS, STATISTICA, SYSTAT, SPSS, INFOSTAT, MSTAT, GENSTAT, etc.; y varios mtodos grficos sencillos que son importantes en la interpretacin de tales datos. Las tcnicas estadsticas, aunadas a un buen conocimiento tcnico o del proceso y al sentido comn, suelen llevar a conclusiones razonables.
8
Uno de los mtodos de anlisis de datos provenientes de experimentos es el del anlisis de varianza, generalmente atribuido a Ronald Fisher. El anlisis de varianza es un proceso aritmtico y estadstico que consiste en descomponer la variacin total en fuentes o causas de variacin. La variacin total se entiende como la variacin entre las unidades experimentales. Este proceso permite la descomposicin de la variacin y no de la varianza. Para utilizarse correctamente este proceso es fundamental conocer, adems de la variacin inherente a las unidades experimentales, cules son las otras fuentes previstas de variacin. Las fuentes de variacin presentes en un anlisis de varianza debern ser los efectos principales, los efectos de interaccin, los efectos de anidamiento y el residuo, que estimar la variabilidad inherente a las unidades experimentales. El efecto principal corresponde al efecto de un factor tomado como una media de los dems factores, incluyendo las repeticiones, presentes en el experimento. El efecto referente a las interacciones mide el diferencial de un factor cuando el otro cambia de nivel. Cuando involucra ms de dos factores su significado es ms complejo. El efecto anidado tambin es un efecto medio con relacin a los dems factores dentro de los cuales l no est anidado. El residuo es la fuente de variacin que representa toda la variacin no provocada por el investigador. Si ninguna fuente sistemtica estuviera contenida en el residuo, entonces l es un estimador no sesgado de la varianza poblacional de la variable de respuesta. La identificacin de todas las fuentes de variacin presentes en un experimento, puede ser fcilmente ser realizado a travs de un diagrama esquemtico en forma de un rbol con la raz hacia arriba. Comnmente el diagrama de estructura se conoce como diagrama de Hasse. Es un resultado de conceptos matemticos referidos a estructura Ltice y diseos de estructura experimental, discutidos por Trockmorton (1961), Kempthorne (1961, 1994), Zyskind (1961) y Kempthorne en asocio con Folks (1961), todos ellos citados por Restrepo, L. (2007) El diagrama de Hasse se inicia en un punto, comn a todas las observaciones, designado como . Como es una constante supuestamente presente en todas las observaciones, ella forma la raz del rbol. Cada factor involucrado es identificado por una letra mayscula y es conectado con a travs de una lnea descendente o una rama del rbol. (i) S A es un factor anidado en B, esto es: los niveles de A son considerados dentro de cada nivel de B, representado por A(B) o A|B, entonces A est conectado con a travs de B. De esta manera A y B son conectados a travs de una lnea descendente con B ms prximo de , indicando que A est anidado con B. El diagrama de Hasse para ese caso es el siguiente:
9
(ii) S A y B son factores cruzados, entonces cada factor est conectado a la , por medio de lneas distintas, y el diagrama de Hasse es el siguiente:
Como se observa, todos los factores estn anidados en . Como ejemplo, considerndose el caso del diseo completamente al azar, el diagrama de Hasse es el siguiente:
1.2
1.2.1
Se refiere al nmero de unidades experimentales que recibirn cada tratamiento, y es determinado a partir de informaciones sobre la variabilidad de las unidades experimentales en trminos de la variable dependiente. La importancia de la repeticin est en proporcionar una estimacin del error experimental (varianza), y adems posibilita la estimacin de las medias de los tratamientos. El nmero de repeticiones a ser utilizado es fijado por la experiencia del investigador y depender de la grandeza del error deseado y de la variabilidad del material en estudio. En general se tiene como regla prctica, que el nmero mnimo de parcelas que ir a componer un experimento es de 20 y que el error experimental (residuo) debe tener por lo menos 10 grados de libertad (Gomes, 2000). Una solucin para determinar el nmero de repeticiones es citada por Gomes (2000), y consiste en el uso de la prueba de Tukey y es dada por la siguiente ecuacin:
Nmero de repeticiones =
Siendo: q s2 = =
q 2 s 2 F(n1 ,n 2 , ) d2
amplitud total estudentizada para el experimento a ser realizado (valor tabulado) es el cuadrado medio del error (o residuo) del experimento anterior, con n2 grados de libertad.
10
F(n1 ,n 2 , ) =
d =
valor tabulado para el nivel de significancia seleccionado. diferencia mnima que deber ser estadsticamente probada por el experimento.
Es de notar, que el uso de esta ecuacin requiere datos de experimentos semejantes. Este nmero de repeticiones garantizar una probabilidad de que el ensayo no vaya a comprobar una diferencia d, esto es, una probabilidad 1 de que sea comprobada estadsticamente por la prueba de Tukey. Como los valores de q y de F a ser usados en el segundo miembro dependen del nmero de repeticiones, es claro que solo se puede obtener una solucin por aproximaciones sucesivas, a partir de una tentativa inicial cualquiera. A continuacin se presenta un ejemplo ilustrativo. Se planific un experimento con 5 variedades de caa de azcar, de un ensayo anterior se obtuvo una estimacin de la desviacin estndar del residuo (la raz cuadrada del cuadrado medio del error experimental), s2 = 7.4 TCH (toneladas mtricas de caa por hectrea), con n2 = 60 grados de libertad, y considerando que el nuevo experimento deba comprobar por la prueba de Tukey cualquier diferencia de produccin de 15 TCH o ms. Si en el experimento se utilizar el diseo bloques completos al azar y se considerarn 5 repeticiones, como valor inicial. En este caso, se tendrn 4 grados de libertad (t 1) para tratamientos (variedades) y n1 = 16 grados de libertad para el residuo (gl residuo = (t 1) (r 1) = (5 1) (5 1) = 16), luego, con un nivel de 5% de probabilidad se encuentra en la Tabla 2 que q = 4.33. Por otra parte, el valor de F, tambin con un nivel de significancia de 5% de probabilidad, con n1 = 16 y n2 = 60 grados de libertad, es F = 1.81. Con estos datos se tiene que:
r inicial 5 6 7 8 9 10 11 12 13 14 15 16 51
n1 16 20 24 28 32 36 40 44 48 52 56 60 200
n2 60 60 60 60 60 60 60 60 60 60 60 60 60
q 4.33 4.23 4.17 4.13 4.096 4.082 4.04 4.028 4.016 4.004 3.992 3.98 3.86
F 1.82 1.75 1.70 1.66 1.64 1.61 1.59 1.58 1.57 1.55 1.54 1.53 1.44
r definitivo 8.3 7.6 7.2 6.9 6.7 6.5 6.3 6.2 6.14 6.06 5.99 5.92 5.21
11
9
8
No. repeticiones definitivo
A partir de esta grfica, se puede concluir que el nmero de repeticiones estara entre 5 y 6. Gomes, FP (2000) tambin indica que una solucin interesante se obtiene de manera anloga, cuando se conoce el coeficiente de variacin (CV) y la diferencia mnima d, en porcentaje, a ser comprobada. Se tiene entonces que:
Nmero de repeticiones =
Si por ejemplo, el caso de un coeficiente de variacin, del experimento anterior, CV =15%, calculado con una desviacin estndar del residuo que tena n2 = 60 grados de libertad. Si se desea saber el nmero necesario de repeticiones de un experimento a ser realizado, con 8 tratamientos y d =25%, tomando como punto de partida 3 repeticiones, se encuentra:
Nmero de repeticiones =
12
r inicial 3 4 5 6 7 8 9 10 11 12 13 14 15 16 30 n1 14 21 28 35 42 49 56 63 70 77 84 91 98 105 203 n2 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 q 4.99 4.75 4.63 4.56 4.51 4.48 4.46 4.44 4.43 4.42 4.41 4.40 4.39 4.38 4.29 F 1.86 1.73 1.66 1.62 1.59 1.56 1.54 1.53 1.52 1.51 1.50 1.49 1.48 1.48 1.44 r definitivo 16.7 14.1 12.8 12.1 11.6 11.3 11.0 10.8 10.7 10.6 10.5 10.4 10.3 10.2 9.5
16
14
r definitivo
12
10
10
15
20
25
30
r inicial
1.2.2
Aleatorizacin
Se refiere a la asignacin de los tratamientos a las unidades experimentales, de tal manera que todas las unidades tengan la misma probabilidad de recibir un determinado tratamiento, a travs de sorteo o de la tabla de nmeros aleatorios. Aleatorizar los tratamientos significa eliminar tendencias, errores sistemticos y preferencias que puedan darse en la distribucin de los tratamientos a las unidades experimentales. Si la repeticin hace posible una prueba de hiptesis, la aleatorizacin contribuye a hacerla vlida. Su funcin es evitar posibles inducciones en las conclusiones de la
13
investigacin y garantizar la independencia de los datos, tornando las estimaciones de las medias de los tratamientos y del error experimental no tendencioso. Los principios bsicos de repeticin y de la aleatorizacin son obligatorios en cualquier diseo experimental. 1.2.3 Control local
Se refiere a restringir la aleatorizacin de los tratamientos a grupos de unidades experimentales con poca variabilidad entre s. Este principio es aplicado cuando se sabe a priori de la existencia de variacin en el ambiente experimental, no pudiendo correr el riesgo de efectuar una aleatorizacin completa de los tratamientos en las unidades experimentales. Esta situacin puede y es muchas veces resuelta de forma satisfactoria a travs de un agrupamiento de unidades experimentales homogneas entre si y, dentro de esos grupos de unidades homogneas, tambin conocido como bloques, es realizada la aleatorizacin. Este procedimiento es adoptado con la finalidad de hacer ms eficiente el experimento, incrementando la sensibilidad de las pruebas de significancia al reducir la magnitud del error experimental.
1.3
ERROR EXPERIMENTAL
Es un trmino propio de la experimentacin y no es sinnimo de equivocacin o descuido sino se refiere a la imposibilidad de poder llegar a resultados idnticos con unidades experimentales tratadas de la misma manera. Existen diferencias debidas a factores genticos y ambientales que van ms all del control que el investigador pueda ejercer. Al error experimental tambin se le define como la variabilidad no controlada que existe entre las unidades experimentales que reciben la aplicacin del mismo tratamiento. La existencia del error experimental hace necesarias las tcnicas estadsticas de anlisis de los resultados para obtener buenas estimaciones del efecto de los tratamientos y de las diferencias entre los mismos, las primeras mediante el promedio de los resultados de las unidades experimentales que recibieron cada tratamiento, y el segundo determinando la probabilidad de que las diferencias entre tratamientos hayan ocurrido por casualidad. Se establecen dos fuentes principales de error experimental: 1. Variabilidad inherente al material experimental sobre el cual se aplican los tratamientos. En general, esta variabilidad no es posible evitarla y comprende la heterogeneidad del suelo, la variabilidad gentica, la variabilidad del clima, etc. Variabilidad resultante de cualquier falta de uniformidad en la ejecucin del experimento, es decir, la deficiencia de poder uniformizar la tcnica experimental, tal el caso de: la preparacin del suelo, densidad de siembra, prcticas culturales, mediciones y toma de datos, etc.
2.
Segn su magnitud, el error experimental producir un enmascaramiento de los verdaderos efectos de los tratamientos, lo que a su vez producir un incremento en el riesgo de obtener conclusiones equivocadas. Por esta razn es imperativo reducir (puesto que no es posible eliminar), el efecto de todos aquellos factores que no son lo que interesan en el estudio. Mayor error experimental equivale a menor precisin1. Como un criterio para juzgar la magnitud del error experimental se utiliza el coeficiente de variacin, para una misma variable de
1
Precisin: es la capacidad de detectar diferencias verdaderas entre los promedios de los tratamientos
14
respuesta, el incremento del coeficiente de variacin significa un mayor error experimental, lo cual puede deberse a deficiencias en el diseo o a poco cuidado en la ejecucin de las diversas actividades que el experimento conlleva, si se supone que el experimento fue bien diseado, un coeficiente de variacin alto, generalmente significa mal manejo del experimento, (esto depende del tipo de experimento y de la escala utilizada en la medicin de la variable respuesta). Los procedimientos que se pueden emplear para incrementar la precisin de un experimento consisten en tratar de reducir el error experimental, esto puede lograrse por medio de las siguientes acciones: a) Incrementando el nmero de repeticiones, aunque el grado de mejoramiento decrece rpidamente cuando el nmero de repeticiones aumenta, por ejemplo, para duplicar la precisin de un experimento con 4 repeticiones stas se debern aumentar a 16. Seleccionando material experimental tan homogneo como sea posible o estratificacin cuidadosa del existente (buscar el material experimental que tenga las caractersticas deseadas o seleccionar el diseo ms apropiado a las caractersticas del material con que se cuente). Es deseable seleccionar material uniforme pero no se debe olvidar de la poblacin acerca de la cual se desea hacer inferencias, razn por la cual en agronoma es recomendable usar material experimental de los tipos que se emplearn en la produccin real y estratificar adecuadamente. Ejecutando cuidadosamente el experimento, de manera que se logre uniformidad en la tcnica empleada para que se tenga la oportunidad de medir las diferencias entre los efectos de los tratamientos. Seleccionando el tamao y forma de la unidad experimental. Generalmente a mayor tamao se conseguir menor error experimental. Las parcelas rectangulares de terreno deben ubicarse con sus ejes mayores en el sentido de la mayor variabilidad del suelo. En animales es preferible usar un animal como unidad experimental en lugar de tener varios y as obtener mayor nmero de repeticiones. Usando informaciones proporcionadas por covariables), esto se refiere a la toma de datos de un animal depende del peso inicial, el cosechadas, del contenido de humedad, etc. anlisis de covarianza. variables aleatorias relacionadas (llamadas adicionales, el peso final o la ganancia de peso rendimiento depende del nmero de plantas Esta informacin adicional es utilizada en el
b)
c)
d)
e)
f) g)
Tomando los datos de variables de respuesta solo en la parcela til para evitar el efecto de bordes y cabeceras. Utilizando mtodos de anlisis adecuados al diseo y a la naturaleza de los datos.
1.4
Un buen diseo experimental es aquel que proporciona la informacin requerida con el mnimo esfuerzo experimental. La informacin requerida se refiere a que los datos permitan un anlisis objetivo que conduzca a conclusiones vlidas con respecto al problema que se estudia, en cuanto al esfuerzo experimental se entiende por el ahorro de tiempo, dinero, personal y material experimental. Vale hacer nfasis en caractersticas como:
15
1. 2. Simplicidad: la seleccin de los tratamientos y su disposicin en el experimento debe ser lo ms simple posible, pero consistente con los objetivos del problema. Grado de precisin: el experimento debe ser capaz de medir diferencias entre tratamientos, con el grado de precisin deseado, lo cual est muy asociado a diseo empleado, al tamao de la unidad experimental y al nmero de repeticiones. Ausencia de errores sistemticos: las unidades experimentales que reciben el mismo tratamiento no deben tener diferencias sistemticas con las que reciben cualquier otro tratamiento, para poder obtener una buena estimacin del efecto de los tratamientos. Amplio rango de validez de las conclusiones: es deseable tratar de que las conclusiones a las que se llegue, tengan un rango de validez lo ms amplio posible. Repetir en el tiempo y/o espacio un experimento ayuda para esto, los experimentos factoriales tambin son tiles para este propsito. Grado de incertidumbre: un buen experimento deber permitir calcular la probabilidad de que los resultados hayan sido obtenidos nicamente por casualidad, es decir, que debe proveer los datos suficientes y necesarios para contrastar objetivamente la hiptesis nula.
3.
4.
5.
1.5
Montgomery (1991) cita que el uso inteligente de las tcnicas estadsticas en la experimentacin requiere que el investigador tenga en mente los siguientes puntos: 1. Uso del conocimiento no estadstico del problema. Generalmente los investigadores conocen a fondo su campo de especialidad. En algunos campos puede utilizarse una gran cantidad de teora para explicar las relaciones que hay entre los factores y las respuestas. Este tipo de conocimiento no estadstico es invaluable al elegir los factores y sus niveles, al decidir el nmero de repeticiones que se desean realizar, al analizar los resultados, etc. La estadstica no puede sustituir el hecho de reflexionar sobre el problema. Mantener el diseo y el anlisis tan simple como sea posible. No se debe exagerar el uso de tcnicas estadsticas complejas y muy refinadas. Por lo general, lo ms adecuado son los mtodos de diseo y anlisis relativamente simples. Si se realiza el diseo cuidadosa y correctamente, el anlisis ser con frecuencia, relativamente directo. Reconocer la diferencia entre la significacin prctica y la estadstica. No hay seguridad de que una diferencia sea suficientemente grande, desde el punto de vista prctico, por el solo hecho de que dos condiciones experimentales producen respuestas medias, estadsticamente diferentes. Usualmente los experimentos son iterativos. Generalmente, al inicio de un experimento no se est en condiciones de responder adecuadamente a todas las preguntas de investigacin, pero es posible conocer las respuestas a medida que se avanza en la experimentacin. Esto favorece el empleo del enfoque iterativo o secuencial.
2.
3.
4.
16
1.6 VALIDEZ EXPERIMENTAL
Un experimento es vlido si llega a comprobar lo que en realidad siempre ha sido cierto. En otras palabras, un experimento es vlido s: 1) 2) Los resultados obtenidos se deben solamente a la variable independiente, y Se pueden generalizar los resultados con respecto a situaciones ajenas al ambiente donde se lleva a cabo el experimento.
Cuando los resultados que se obtienen se deben solamente a la variable independiente, se dice que tienen validez interna. Cuando se pueden generalizar los resultados con respecto a otras situaciones se llama: validez externa. Una de las dificultades que se nos presentan al realizar una investigacin experimental, es que es difcil (si no imposible) aumentar al mximo un tipo de validez, a la vez que el otro se aumenta al mximo. Las variables extraas que afectan a la variable dependiente constituyen amenazas a la validez interna de un experimento. Para poder controlar todas las variables extraas (validez interna) sera necesario contar con una situacin tan especial, que se hara difcil generalizar con respecto a otras situaciones (falta de validez externa). Si la situacin experimental es muy natural y constituye un buen ejemplo de lo que son muchas situaciones (validez externa), generalmente es porque existen muchas variables extraas (falta de validez interna).
1.6.1
Campbell, D. y Stanley, J. (1982) identificaron ocho variables extraas que constituyen las principales amenazas a la validez interna de un experimento: 1) 2) Historia: es todo aquello que sucede fuera de la situacin experimental sobre lo cual el investigador no tiene algn control, pero que puede influir en la variable dependiente. Maduracin: se refiere al crecimiento fsico, emocional e intelectual que sucede por obra natural a travs del tiempo. A veces, los cambios de esta naturaleza explican que haya diferencias en la variable dependiente. Uso de tests: constituye una amenaza a la validez interna cuando el pre-test mismo influye en la calificacin que se obtenga en el post-test. Instrumentacin: se refiere a los problemas de confiabilidad que puedan existir en los instrumentos de investigacin. La instrumentacin puede adems resultar problemtica, si el post-test que se aplica es muy distinto al pre-test y si se cambia la manera de calificarlos. Regresin estadstica: puede suceder cuando los grupos se seleccionan con base en calificaciones extremas. Existe una tendencia estadstica cuando se trata de grupos altos y bajos, de regresar hacia la media a travs de la aplicacin de otro test. Seleccin diferencial de sujetos: es otro nombre que reciben algunos sesgos de muestreo. Se refiere especficamente al hecho de que si los sujetos de los grupos experimentales no se seleccionan aleatoriamente, las diferencias que se encuentren en el experimento tal vez obedezcan a diferencias iniciales que haba entre los grupos y no al tratamiento experimental.
3) 4)
5)
6)
17
7) 8) Mortalidad: es sinnimo de prdida de individuos, es decir, otro tipo de sesgo de muestreo. Interaccin: se refiere al efecto que produce la combinacin de dos o ms de las otras amenazas mencionadas anteriormente. Amenazas a la Validez Externa Campbell, D. y Stanley, J. (1982) identificaron cuatro amenazas a la validez externa: 1) Efecto reactivo del pre-test: significa que cabe la posibilidad de que el tratamiento experimental no funcione sin haber aplicado previamente el pre-test. Si en otra situacin se aplicara el tratamiento, sin el pre-test, es posible que no se obtuvieran los resultados esperados. Interaccin entre la seleccin y el tratamiento: es semejante a la amenaza a la validez interna que se conoce como seleccin diferencial de sujetos. La diferencia es que, quizs la diferencia entre el grupo experimental y el grupo de control sea verdadera, pero esos dos grupos son tan particulares que esa misma diferencia no va a encontrarse empleando otras muestras de la poblacin. Situaciones reactivas: se refieren a la manera de realizar el experimento. Interferencia de tratamientos mltiples: se refiere a lo que puede pasar cuando los sujetos reciben ms de un tratamiento. Es posible que el efecto que se haya medido despus de aplicar un segundo tratamiento tenga que ver con el primer tratamiento. **** * **** En los siguientes 10 captulos se presenta la descripcin de los principales diseos experimentales utilizados en la Agronoma y ciencias afines. En cada captulo se desarrollan ejemplos detalladamente, mostrando paso a paso los clculos realizados. Adems se presentan los respectivos programas elaborados en SAS (Statistical Analysis System, v. 6.12). Si desea ampliar sus conocimientos sobre el uso de este software y su aplicacin en Estadstica Experimental, le recomiendo consultar las siguientes pginas: a) Diseo y Anlisis de Experimentos usando SAS. S.P. Sinha. Instituto de Estadstica Aplicada y Computacin, Universidad de Los Andes, Mrida, Venezuela. http://webdelprofesor.ula.ve/economia/sinha/index.htm#beg b) LCE-602 Estatstica Experimental (aulas prticas) A.A. Franco Garca, D. Barbin y S. De Stefano. Departamento de Ciencias Exactas, Escola Superior de Agricultura Luiz de Queiroz, Universidad de So Paulo, Brasil. http://www.lce.esalq.usp.br/sonia.html
1.6.2
2)
3) 4)
18
CAPTULO 2
DISEO COMPLETAMENTE AL AZAR 2.1 INTRODUCCIN
En este tipo de diseo estn incluidos los principios de repeticin y de aleatorizacin, o sea que, es utilizado cuando no hay necesidad del control local, debido a que el ambiente experimental es homogneo y los tratamientos se asignan a las unidades experimentales mediante una aleatorizacin completa, sin ninguna restriccin. 2.1.1 Ventajas a. La estructura del anlisis estadstico es simple. b. Permite mxima flexibilidad en cuanto al nmero de tratamientos y nmero de repeticiones. c. La prdida de observaciones durante la conduccin del experimento no genera dificultades en el anlisis y en la interpretacin de los resultados. d. Rene el mayor nmero de grados de libertad en el residuo, en comparacin con otros diseos. 2.1.2 Inconvenientes a. Cuando el nmero de unidades experimentales es muy grande es difcil encontrar lugares grandes que presenten la homogeneidad requerida. b. Debido a que las fuentes de variacin no asociadas a los tratamientos o a los niveles del factor en estudio, estn incluidas en el residuo como variacin del azar, la buena precisin de los anlisis se ve comprometida. 2.1.3 Aleatorizacin
Considerando un experimento con t = 5 niveles del factor A (tratamientos) y r = 4 repeticiones para cada nivel, se tiene que el nmero total de unidades experimentales (parcelas) incluidas en el experimento es t r = 5 4 = 20. Las (t r) parcelas sern aleatorizadas sin restricciones, los t niveles del factor A en estudio con sus r repeticiones, conforme se muestra en el siguiente croquis. A1 A4 A3 A4 A2
A4
A2
A1
A5
A3
A2
A5
A2
A1
A3
A5
A3
A4
A5
A1
19
Las respuestas obtenidas en funcin de la aplicacin de cada nivel del factor A en estudio en sus respectivas repeticiones pueden ser representadas por yij, que es considerada como una variable aleatoria.
2.2
ANLISIS ESTADSTICO
A continuacin se muestra la representacin de las observaciones de un experimento, con un factor con t tratamientos (o niveles) y r repeticiones. Tratamientos 1 1 2 3 . . . t y11 y21 y31 . . . yt1 2 y12 y22 Y32 . . . yt2 Repeticiones 3 y13 y23 y33 . . . yt3 ... ... ... ... . . . ... r y1r y2r y3r . . . ytr y1. y2. y3. . . . yt. yi.
2.2.1
Y.. =
Y.. tr
para al menos un i; i = 1,2, . . . t. (al menos uno de los tratamientos produce efectos distintos)
2.2.2
Modelo Estadstico Yij = + i + ij siendo, Yij i ij = variable de respuesta de la ij-sima unidad experimental = media general de la variable de respuesta = efecto del i - simo tratamiento (nivel del factor) en la variable dependiente. = error experimental asociado a la ij-sima unidad experimental i = 1,2, . . . t j = 1,2, . . . r
2.2.3
20
a. b. c. d. Los errores son independientes. Los errores estn normalmente distribuidos con media cero y varianza constante Existe homogeneidad de varianzas entre los tratamientos El modelo es lineal y de efectos aditivos.
2.2.4
El anlisis de varianza es un proceso aritmtico y estadstico, que consiste en descomponer la variacin total en fuentes o causas de variacin. Por variacin total se entiende, la variacin entre las unidades experimentales (o parcelas). La variabilidad total de las observaciones Yij, cuando no se considera la informacin acerca de los tratamientos, es medida en trminos de la desviacin total de cada observacin, esto es, la desviacin de los Yij alrededor de la media general Y . . :
Yij Y . .
(1)
Cuando se utiliza informacin acerca de tratamientos, las desviaciones entre cada observacin Yij alrededor de la media estimada de su respectivo tratamiento, reflejan la incertidumbre restante en los datos, y es dada por:
Yij Y i.
(2)
La diferencia entre las desviaciones (1) y (2) refleja la diferencia entre la media estimada de tratamientos y la media general:
(Yij Y . . ) (Yij Y i. ) = Y i. Y . .
(3) Y .. (4)
en dos
Note que a partir de la ecuacin (3), se puede descomponer la desviacin total Yij componentes:
Yij Y . .
Desviacin total
Y i. Y . .
Yij Y i.
Y ..
1. La desviacin de la media estimada de tratamientos alrededor de la media general. 2. La desviacin de Yij alrededor de la media estimada de su tratamiento, que es simplemente, el residuo eij.
21
A partir de la ecuacin (4) se pueden obtener las expresiones matemticas utilizadas para calcular las sumas de cuadrados de tratamientos, error experimental y total. Para realizarlo, se inicia obteniendo la suma de cuadrados de la desviacin total:
( Yij Y . . )2 = [( Y i. Y . . ) + (Yij Y i. ) ]2
Luego, se obtiene la sumatoria de las desviaciones totales al cuadrado:
__ __ __ (Yij Y ..) = (Y i. Y ..) + (Yij Y i. ) i =1 j =1 i =1 j =1 t r __ 2 t r 2
(5)
Como
__
Donde:
__
__
__
__
__
SC total = r (Y i. Y ..) 2
i =1
__
__
(Yij Y i. ) 2
i =1 j =1
__
SCtrat = r (Y i. Y ..) 2
i =1
__
__
__
__
__
__
__
__
__
__
22
__
t __ Yi . 2 , r Y i. = r r i =1
Yi .2 r2 = i =1
t
Yi .2 r i =1
t
__
Y
i =1
__ i.
, se sabe que Y i. =
i =1
__
Yij r
, se tiene que:
Y
i =1
__ i.
=
i =1 j =1
Yij r
, y Y .. =
t r
__
Y
i =1 j =1
ij
tr
entonces:
t r t r
2 r Y .. Y i. = 2 r
i =1
__
__
Yij
i =1 j =1
tr
i =1 j =1
Yij r
2
= 2
Yij
i =1 j =1
Y
i =1 j =1
ij
tr
t r Yij Yij __ __ Y .. Y ..2 Y ..2 i =1 j =1 i =1 j =1 , entonces: = = = , entonces (tr ) Y ..2 = (tr ) S Y .. = 2 tr tr (tr ) tr (tr )
t r
t r Yij i =1 j =1 2 tr
t r t r Yij Yij i =1 j =1 = i =1 j =1 + tr tr
La expresin de suma de cuadrados para tratamientos (o sea, entre tratamientos) queda de la siguiente manera:
Yi .2 r i =1
t t
t r Yij i =1 j =1 . tr
r __
23
SCtotal = Yij 2 Y .. Yij + tr Y ..2 , y como:
2 i =1 j =1 i =1 j =1 t r __ t r __
t r Yij __ Y ..2 Y ..2 i =1 j =1 , la suma de cuadrados total queda: = = (tr ) Y ..2 = (tr ) (tr ) tr (tr ) 2
SCtotal
t r Yij t r i =1 j =1 2 Yij tr i =1 j =1
La suma de cuadrados del error ( o sea, dentro de tratamientos), se obtiene por diferencia: SCee = SCtotal SCtrat.,
SCee
t r Yij 2 t r t i =1 j =1 2 Yi . + = Yij r tr i =1 i =1 j =1
Yi .2 = Yij i =1 r i =1 j =1
t r 2 t
t r Yij i =1 j =1 . tr
SCee
2.2.5
Prueba de F
La estadstica F es definida como la razn de dos variables aleatorias independientes con distribucin 2 (Ji-cuadrada o Chi-Square), cada una de ellas dividida por sus respectivos grados de libertad, o sea:
F=
Q1 / n1 , Q2 / n 2
siendo Q1 una variable aleatoria con distribucin 2 y n1 grados de libertad y Q2 una variable aleatoria con distribucin 2 y n2 grados de libertad, ambas independientes. As, considerando que SCtrat/2 tiene distribucin 2 con (t1) grados de libertad, bajo Ho, y SCeet/ tiene distribucin 2 con t (r1) grados de libertad y, son independientes, entonces el cociente entre esas variables aleatorias, o sea:
2
24
As, se puede decidir por el rechazo de Ho, al nivel de significancia s:
Fo F (; t1; t (r1)),
donde F(;t1; t (r1)), es el cuantil de orden (1) de la distribucin F con (t1) y t (r1) grados de libertad, como se muestra en la grfica siguiente: Regin de aceptacin (o no rechazo) de la hiptesis nula
F (; t1; t (r1))
S el valor observado de F (Fo) es superior al valor crtico F(;t1; t (r1)), la Ho es rechazada, por lo tanto se concluye que existen diferencias significativas entre los tratamientos.
2.2.6
El esquema del anlisis de varianza abreviado como ANDEVA, ANOVA (ANalysis Of VAriance) o bien ANVA; y las expresiones necesarias para la aplicacin de la estadstica F, para la prueba de hiptesis se presentan en el siguiente cuadro.
Valor de F
Tratamientos Error
Yi2 Y..2 . r tr i =1
t
CMtrat / CMee
SCtotal SCtrat
Total
i =1
Yij
2 j=1
Y..2 tr
25
Regla de Decisin Rechazar Ho. No Rechazar Ho. Fcrtica = Si Valor de F F crtico (gl trat; gl error; ) Si Valor de F < F crtico (gl trat; gl error; )
Valor crtico de F encontrado en la tabla F de Fisher & Snedecor, considerando los grados de libertad de tratamientos (v1), los grados de libertad del error (v2) y un determinado nivel de significancia ()
2.2.7
Se le puede considerar como medida relativa de la variacin que no es posible controlar en el experimento (error experimental) y se calcula de la siguiente forma:
CV =
CM ee Y..
100
El coeficiente de variacin da una idea de la precisin del experimento, a un valor alto de CV corresponde un alto error experimental, lo cual indica que existe poca capacidad del experimento para detectar diferencias significativas entre los tratamientos. De modo general, altos coeficientes de variacin indican experimentos mal manejados, pero no siempre. El hecho de que el coeficiente de variacin sea alto puede deberse no solamente al mal manejo del experimento, sino tambin a: Tipo de variable de respuesta (escala de medicin) Tipo de tratamientos. Errores en el anlisis de la informacin, etc.
El CV puede ser utilizado para comparar la precisin experimental de variables experimentales semejantes. Es conveniente que el investigador revise bibliografa sobre los valores de coeficiente de variacin obtenidos en cada cultivo y condicin donde se realiz el experimento (por ejemplo, un valor de CV=10% puede ser considerado un valor bajo, pero para algunas condiciones no). Considere la siguiente situacin donde se tienen las siguientes observaciones de una variable de respuesta: Variable de respuesta 36 16 9 4 16.25 14.06 86.50 Variable de respuesta transformada (con raz cuadrada) 6 4 3 2 3.75 1.71 45.54
Observe que hubo una reduccin del valor del CV% para la variable transformada. Por eso, el CV% no siempre es un buen indicador de la precisin experimental (Dos Anjos, 2003)
26
2.2.8 Ejemplo de Aplicacin
Una persona que realiza plantaciones forestales quiso comparar los efectos de cinco tratamientos de preparacin en el sitio sobre el crecimiento inicial en altura de plntulas de pino en el terreno. Dispuso de 25 parcelas y aplic cada tratamiento a cinco parcelas escogidas al azar. Entonces, las parcelas se plantaron a mano y, al final de cinco aos, se midi la altura de todos los pinos y se calcul la altura promedio de cada parcela. Las medidas de las parcelas (en pies) fueron como sigue: A 15 14 12 13 13 67 13.4 B 16 14 13 15 14 72 14.4 Tratamientos C 13 12 11 12 10 58 11.6 D 11 13 10 12 11 57 11.4 E 14 12 12 10 11 59 11.8
Yi.
Y i.
SCTRAT =
313 12.52
27
2.3 ANLISIS DE VARIANZA PARA UN EXPERIMENTO REALIZADO EN UN DISEO COMPLETAMENTE AL AZAR DESBALANCEADO
El diseo completamente al azar es NO BALANCEADO (o DESBALANCEADO), cuando los niveles del factor en estudio no poseen el mismo nmero de repeticiones, debido a parcelas perdidas o a la falta de material experimental. En este modelo, el hecho de no ser balanceado no trae alteraciones en el proceso del ANDEVA, pero las pruebas utilizadas en las comparaciones mltiples pasan a ser apenas aproximadas.
i = 1, 2,, t j = 1, 2,, ri
Las hiptesis y los supuestos no varan, con respecto al DCA balanceado. RESUMEN DEL ANLISIS DE VARIANZA
Fuentes de variacin
Grados de libertad
Suma de cuadrados
Cuadrados Medios
Tratamientos
t1
Yi.2 Y2 .. r n i =1 i
t
SCtrat / gl trat
CMtrat / CMee
Error Experimental
t ri t i =1
t ri 1 i =1
t
SCtotal SCtrat
SCee / gl ee
Total
i =1
Yij2
j=1
ri
Y..2 n
ri Yij j=1 Yi. = ri
t ri Yij i =1 j=1 .. = t ri i =1
28
Ejemplo de Aplicacin Considere las siguientes producciones diarias (kg) de leche (con 4% de grasa) de vacas para lactacin, sometidas a la administracin de races y tubrculos, como suplemento de invierno en la alimentacin; datos de un experimento citado por Gomes, FP (2000). SIN SUPLEMENTO 19.58 21.07 23.43 25.42 22.81 23.52 135.83 22.64 6 MANDIOCA (Manihot esculenta) 23.40 22.37 24.36 25.12 22.94 118.19 23.64 5 ARARUTA (Maranta arundinacea) 35.43 32.47 34.48 33.79 35.04 35.19 206.40 34.40 6 BATATA DOCE (Ipomoea batata) 22.15 24.37 26.54 20.37 19.54 24.06 137.03 22.84 6
597.452 = 646.06 23
Y.. =
597.45 = 25.98 kg 23
RESUMEN DEL ANLISIS DE VARIANZA
Grados de libertad 3 19 22
** significativo al 1%
CV = 7.23% Con un nivel de significancia de 1% se rechaza la Ho, verificndose que existe efecto de la suplementacin sobre la produccin diaria de leche.
29
2.4 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO COMPLETAMENTE AL AZAR
OPTIONS nodate nonumber; DATA dca; INPUT trat $ alt; LABEL alt = "altura del rbol en pies"; CARDS; A 15 A 14 A 12 A 13 DATA: es el nombre del archivo temporal que utilizar SAS para A 13 ejecutar el programa. B 16 B 14 INPUT: aqu se enlistan las variables que incluye la base de datos a B 13 analizar. En este caso una columna corresponde a trat B 15 (tratamientos) y otra a alt (altura). El signo $ sirve para indicar B 14 que la variable trat es alfanumrica. C 13 C 12 CARDS: indica que a continuacin se presentan los datos. C 11 C 12 PROC: abreviatura de PROCEDURE, indica el tipo de procedimiento C 10 solicitado a SAS, en este caso ANOVA (anlisis de varianza) D 11 D 13 CLASS: aqu se indica cules son las variables independientes. D 10 D 12 MODEL: describe el modelo a analizar. D 11 E 14 MEANS: esta instruccin se utiliza para indicar el tipo de prueba de E 12 comparacin mltiple de medias se va a solicitar a SAS que E 12 ejecute. E 10 E 11 ; TITLE "DCA Balanceado"; PROC anova; CLASS trat; MODEL alt = trat; MEANS trat/Tukey; RUN;
30
2.5 ANLISIS DE VARIANZA PARA UN EXPERIMENTO REALIZADO MEDIANTE UN DISEO COMPLETAMENTE AL AZAR CON SUBMUESTREO
Una situacin comn en la experimentacin agronmica es la de estimar ciertas caractersticas cuantitativas dentro de las unidades experimentales. En la prctica, tales caractersticas se determinan a partir de muestras sobre la poblacin de elementos que existe en cada parcela o unidad experimental. En este caso, el proceso para obtener estas caractersticas se denomina: submuestreo. Considerando el caso ms simtrico y tal vez el ms til, cuando se tienen r repeticiones para cada uno de los t tratamientos y se toman m muestras dentro de cada unidad experimental, se tendrn en total trm observaciones. Algunos ejemplos de submuestreo se presentan a continuacin: a) En un experimento de campo, el investigador puede no tener tiempo para cosechar (totalmente) cada unidad experimental. De esta manera, podr seleccionar al azar varios cuadros por parcela y cosechar el grano en cada cuadro seleccionado. De nuevo, describiramos estas observaciones como muestras dentro de unidades experimentales. En un experimento de tecnologa de alimentos que implic el almacenamiento de fresas congeladas, se almacenaron 10 cajas (unidades experimentales) a cada cinco lapsos de almacenamiento (tratamientos). Cuando se hicieron las determinaciones del cido ascrbico despus del almacenamiento, se hicieron dos determinaciones en caja (muestras dentro de unidades experimentales).
b)
El modelo lineal apropiado para interpretar los resultados de un experimento como los descritos es: i = 1, 2, ... , t 1. Modelo Estadstico: Yijk = + i + ij + ijk j = 1, 2, , r k = 1, 2,,m
Yijk =
ij = ijk =
i =
valor de la variable de respuesta correspondiente a la k-sima muestra sobre la unidad experimental que lleva el tratamiento i en la repeticin j. Media general de la variable respuesta. Efecto del i-simo tratamiento. error experimental asociado a la ij-sima unidad experimental. error de muestreo dentro de la ij-sima unidad experimental.
2. Hiptesis Ho: i i = 1,2,. . . / i = Ha: i i = 1,2,. . . / i 3. Supuestos: a) ij ~ NID (0, e) ij son los errores de parcela, y se asume que son variables aleatorias no correlacionadas, con media 0 y varianza constante desconocida e (varianza residual o varianza entre parcelas)
31
b) ijk ~ NID (0 m) ijk son los errores de muestreo, y se consideran como variables aleatorias no correlacionadas entre s, ni con los errores de parcela, con media 0 y varianza constante desconocida m (varianza muestral o varianza dentro de parcelas) Anlisis de varianza Fuentes de variacin Tratamientos Grados de libertad t 1 Suma de cuadrados Cuadrados Medios .1 SCtrat / gl trat .2 SCee / gl ee F F2
4.
Error Experimental
t ( r1 )
i =1 j=1
Yi j. m
i =1
Yi.. rm
.3
F1 =
CM ee CM em
Error de Muestreo
tr (m1 )
Y
i =1 j=1 k =1
i jk
i =1 j=1
Yij.
.4 SCem / gl em
Total
trm 1
Yi jk 2
i =1 j=1 k =1
Y...2 rtm
Y... = Yijk
i =1 j=1 k =1
Pruebas preliminares de significancia Para evaluar el efecto de submuestreo, se realiza una prueba de hiptesis: Ho: e = 0 Ha: e > 0, comparando el cuadrado medio del error experimental, contra el cuadrado medio del error de muestreo. Bajo la hiptesis nula, el cociente F1 = ( CMee / CMem ), se distribuye como una F con t(r-1) y tr(m-1) grados de libertad. Luego se presentan dos alternativas:
Si F1 F (glee, glem, ), se rechaza Ho, indicando que el submuestreo fue efectivo, por lo que F2 se calcula de la siguiente forma: F2 =
CV =
32
Si F1 < F (glee, glem, ), se acepta Ho, lo cual indica que el submuestreo no fue efectivo, por lo que los errores deben mancomunarse as:
CMep =
y F2 se obtiene de la siguiente manera: F2 =
CV =
Ejemplo de Aplicacin
Considere los siguientes resultados, obtenidos en un experimento donde fue utilizado un DCA con submuestreo: Tratamientos A Yij. B Yij. C Yij.
t = 3 ( A, B, C) r = 4 (I,II,III,IV) m= 2 (submuestras)
Repeticiones I 5.6 5.7 11.30 6.7 8.7 15.4 7.6 7.8 15.4 II 5.0 5.1 10.1 4.7 3.7 8.4 7.4 7.2 14.6 III 5.5 5.4 10.9 5.7 6.5 12.2 7.5 7.6 15.1 IV 5.3 5.5 10.8 6.2 5.8 12.0 5.7 6.7 12.40 57.5 148.6 7.19 6.19
Yi..
43.10
Yi..
5.39
48
6.00
SCtrat
2 +10.12 +...+12.40 2 2
= 3.555
33
RESUMEN DEL ANLISIS DE VARIANZA
Fuentes de variacin Tratamientos Error Experimental Error de Muestreo Total * significativo al 0.05
Grados de libertad 2 9 12 23
Valor de F 5.72*
Como F1 = 5.90 es > F crtica (9,12,0.05) = 2.80, se procede a calcular F2 de la manera habitual, utilizando el CMee:
F2 = CM trat CM ee = 6.4629 = 3.8144 1.6943
DISTRIBUCIN F DE FISHERSNEDECOR
F (2,9,0.05) = 4.26
Conclusin: efecto. Como F2 < Ft(2,9,0.05): se acepta Ho, por lo tanto todos los tratamientos producen el mismo
CV =
CV =
34
2.6 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO COMPLETAMENTE AL AZAR CON SUBMUESTREO
OPTIONS nodate nonumber; DATA dca2; INPUT trat $ rep resp; LABEL resp = "variable de respuesta"; CARDS; A 1 5.6 A 1 5.7 A 2 5 A 2 5.4 A 3 5.5 A 3 5.4 A 4 5.3 A 4 5.5 B 1 6.7 B 1 8.7 B 2 4.7 B 2 3.7 B 3 5.7 B 3 6.5 B 4 6.2 B 4 5.8 C 1 7.6 C 1 7.8 C 2 7.4 C 2 7.2 C 3 7.5 C 3 7.6 C 4 5.7 C 4 6.7 ; PROC anova; TITLE "DCA con submuestreo"; CLASS trat rep; /*con submuestreo*/ MODEL resp = trat rep(trat); /*rep(trat) = error experimental*/ TEST h = trat e = rep(trat); RUN; PROC anova; TITLE "mancomunando errores"; /*sin efecto de submuestreo*/ CLASS trat; MODEL resp = trat; run;
35
2.7
1.
EJERCICIOS PROPUESTOS
Mendoza (2001) evalu el efecto de la pulpa del caf (Coffea arabica L.) sobre el rendimiento y eficiencia biolgica de la cepa ECS-0110 de Pleurotas ostreatus utilizando estopa de coco (Cocus nucifera L.) y estrbilos de pino (Pinus spp.) como sustratos. Los resultados obtenidos para la variable rendimiento, expresado en gramos de hongo fresco obtenido por cada 454 gramos de sustrato seco, se presentan a continuacin: Tratamientos T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 T13 a) b) c) Coco 100% Coco-Pulpa 9:1 Coco-Pulpa 8:2 Coco-Pulpa 7:3 Coco-Pulpa 6:4 Coco-Pulpa 5:5 Pino 100% Pino-Pulpa 9:1 Pino-Pulpa 8:2 Pino-Pulpa 7:3 Pino-Pulpa 6:4 Pino-Pulpa 5:5 Pulpa 100% (Testigo) I 271.09 265.15 254.09 433.68 472.91 372.59 147.64 227.30 197.14 349.87 355.67 527.66 565.82 II 468.24 371.24 171.39 278.76 439.14 484.37 210.93 231.85 234.13 296.03 385.31 428.75 615.15 Repeticiones III IV 345.02 335.15 291.68 318.46 314.33 265.67 309.75 278.80 489.80 371.60 465.79 447.14 164.52 147.62 181.83 195.48 189.77 246.46 376.77 242.20 355.66 281.57 346.29 303.43 552.05 580.26 V 320.37 318.30 285.78 309.78 448.25 484.39 189.84 215.92 246.46 376.77 385.28 362.79 605.12
Los tratamientos son expresados en proporciones de sustrato en peso seco. Plantee las hiptesis a evaluar. Describa el modelo estadstico matemtico Realice el ANDEVA y concluya en trminos del problema Sosa Leonardo (1999) evalu cuatro substancias diluyentes-dispersantes de polen para producir semilla hbrida en cuatro cultivares de Marigold (Tagetes erecta L.) mediante polinizacin artificial en condiciones de invernadero. A continuacin se presentan los datos de campo de las variables: cantidad de aquenios y peso de aquenios (en gramos) medidas en Tagetes erecta P-702-1 Discovery Orange. Tratamientos Testigo Leche 25% Leche 50% Leche 75% Gelatina 25% Gelatina 50% Gelatina 75% Harina Arroz 25% Harina Arroz 50% Harina Arroz 75% Portulaca 25% Portulaca 50% Portulaca 75% Cantidad de aquenios I II III 912 830 835 712 671 630 690 828 759 656 673 769 519 535 550 658 635 611 888 806 723 240 195 120 218 160 190 120 102 135 655 628 601 750 1123 999 570 595 545 Peso de Aquenios (gramos) I II III 1.80 1.50 1.50 1.70 1.41 1.20 1.20 1.48 1.34 1.50 1.68 1.70 1.31 1.04 1.35 1.70 1.31 1.66 1.85 1.81 1.64 1.00 0.90 0.75 0.98 0.40 0.55 0.32 0.25 0.70 1.33 1.04 1.18 1.68 1.83 2.35 1.11 1.40 1.22
2.
36
a) b) c) 3. Plantee las hiptesis a evaluar. Indique el modelo estadstico matemtico Realice el ANDEVA para cada variable y concluya en trminos del problema Se realiz un experimento para evaluar el efecto de la adicin de compuestos vitamnicos al alimento balanceado en la ganancia de peso en cerdos. Tres diferentes compuestos fueron evaluados (A, B y C) y un control (D sin la adicin de compuesto vitamnico). El aumento de peso tras una semana en una muestra aleatoria de 22 cerdos se da a continuacin: Variable de respuesta: aumento de peso (en libras) tras una semana. A B C D 11.1 11.5 10.1 9.2 10.9 11 10.6 9.8 10.8 10.8 11.2 10.1 10.6 10.2 9.7 11.4 11.2 10.4 10.4 10.7 10.9 9.5
a) b) c) d) 4.
Describa el modelo estadstico-matemtico. Cite los supuestos del anlisis de varianza, as como el nombre de las pruebas estadsticas que se utilizan para evaluarlos. Qu es lo que se hace cuando no se cumplen los supuestos? Plantee las hiptesis Realice el anlisis de varianza Se realiz un experimento con el propsito de determinar si existen diferencias entre cinco variedades de menta, denominadas: A, B, C, D y E, para lo cual se sembr cada variedad en tres macetas y se midieron los crecimientos (en cm.) en una semana, de los tallos de cuatro plantas por maceta. Los resultados se presentan a continuacin:
No de planta Variedad A B C D E Maceta 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 5.0 3.5 4.5 5.0 5.5 5.5 8.5 6.5 7.0 6.0 6.0 6.5 7.0 6.0 11 2 5.5 3.5 4.0 4.5 6.0 4.5 6.0 7.0 7.0 5.5 8.5 6.5 9.0 7.0 7.0 3 4.0 3.0 4.0 5.0 5.0 6.5 9.0 8.0 7.0 3.5 4.5 8.5 8.5 7.0 9.0 4 3.5 4.0 5.0 4.5 5.0 5.5 8.5 6.5 7.0 7.0 7.5 7.5 8.5 7.0 8.0
37
5. En un ensayo de campo se incluy cinco tratamientos de fertilizacin para evaluar su efecto sobre el rendimiento de cebada. De las 30 parcelas experimentales homogneas que se dispona, se asignaron al azar seis a cada tratamiento. Al momento de la cosecha se tomaron al azar tres cuadros muestra en cada parcela, cuyos resultados (codificados) se presentan en el siguiente cuadro. Con esta informacin, realice el anlisis de varianza y emita las conclusiones respectivas.
Repeticin I Yi1. II Yi2. III Yi3. IV Yi4. V Yi5. VI Yi6. Yi.. Yi1. 50 37 19 68 65 61 85 74 80 117 93 107 124 102 118 48 35 48 61 60 75 78 89 95 99 87 113 113 109 111 23 36 18 74 47 69 105 85 85 103 90 105 120 101 111 39 39 43 57 61 61 91 82 98 102 93 98 112 104 112 26 38 20 44 68 64 92 89 106 96 89 106 93 110 115 1 57 46 28 2 67 72 66 Tratamiento de fertilizante 3 95 90 89 4 102 88 109 5 123 101 113
4.
Se realiz un experimento con la finalidad de comparar cuatro lneas avcolas (tratamientos), dos especializadas en produccin de carne y dos de doble propsito, los cuales se asignaron en forma aleatoria a cuatro corrales dentro de cada granja (unidad experimental). Las observaciones se hicieron en corrales individuales (muestra) y se midi la conversin alimenticia de las aves. Los datos obtenidos se presentan a continuacin: Lneas avcolas Engorda A No.de granja 2 3 2.3 2.1 2.0 2.5 2.0 2.4 2.5 2.0 B No.de granja 2 3 1.8 2.0 2.0 1.7 2.0 2.0 1.9 1.9 Doble propsito C D No.de granja No.de granja 2 3 4 1 2 3 3.5 4.0 4.0 5.5 4.0 4.0 4.0 3.0 3.5 4.5 5.0 5.0 4.3 3.5 3.5 4.5 5.5 5.0 3.5 3.0 4.0 5.5 5.5 5.5
38
CAPTULO 3
PRUEBAS DE COMPARACIN MLTIPLE DE MEDIAS 3.1 INTRODUCCIN
Para poder tener una mayor comprensin sobre este tema, inicialmente se respondern algunas interrogantes: a) Para qu se utiliza un anlisis posterior al anlisis de varianza?
Se requiere del uso de algn mtodo de anlisis posterior al ANDEVA para contrastar diferentes subhiptesis de inters, despus que se verifica que el valor de la estadstica F para alguna de las hiptesis en la tabla de ANDEVA es significativa. Cada una de las hiptesis que se rechaza en la tabla del ANDEVA, comprobada por el valor crtico respectivo de F, le corresponde una o varias subhiptesis que se deben contrastar por un mtodo apropiado de anlisis posterior. b) b.1) Qu mtodos de anlisis posterior existen? Pruebas de comparacin mltiple de medias, de acuerdo con los criterios de: Tukey (1953) Duncan (1955) SNK (Student-Newman-Keuls). Diseada por Newman (1939) y estudiada por Keuls (1952) Bonferroni Scheff Dunnett (1955, 1964) Gabriel, entre otras. Contrastes lineales ortogonales y no ortogonales Polinomios ortogonales
El nivel de significancia que ha sido utilizado para determinar la significancia de un valor de F en la tabla de ANDEVA, es el que debe ser utilizado para el anlisis posterior. Estos mtodos se aplican nicamente cuando la hiptesis de igualdad de las medias de los tratamientos en el anlisis de varianza haya sido rechazada.
39
Caso I: DCA Balanceado
Ejemplo: El anlisis de varianza que a continuacin se presenta, corresponde a un experimento realizado en arroz (Oryza sativa L.), en el que se evalu nueve insecticidas para el control de larvas de una determinada plaga. La variable de respuesta medida fue el nmero de larvas vivas, a la cual se le aplic la transformacin raz cuadrada. El diseo experimental utilizado fue completamente al azar, con 4 repeticiones. El cuadro resumen del ANDEVA se presenta a continuacin: Fuentes de variacin Insecticidas Error Experimental Total * significativo al 5% Debido a que se detectaron diferencias significativas en el efecto de los insecticidas, se aplicar la prueba de comparacin mltiple de medias de acuerdo con el criterio de Tukey. El procedimiento se detalla a continuacin: 1. Se deben obtener las medias de los tratamientos Insecticida 1 2 3 4 5 6 7 8 9 Medias (*) 1.87 2.02 2.55 2.42 3.91 4.12 0.25 1.39 2.82 Grados de libertad 8 27 35 Suma de Cuadrados cuadrados Medios 46.04 36.43 82.48 5.76 1.35 F 4.26* Valor crtico de F 2.31
(*) Las medias fueron obtenidas a partir de los datos transformados. 2. Se construye una matriz de diferencias entre todos los posibles pares de medias 6 4.12 3.87 2.73 2.25 2.1 1.7 1.57 1.3 0.21 5 3.91 3.66 2.52 2.04 1.89 1.49 1.36 1.09 9 2.82 2.57 1.43 0.95 0.8 0.4 0.27 3 2.55 2.3 1.16 0.68 0.53 0.13 4 2.42 2.17 1.03 0.55 0.4 2 2.02 1.77 0.63 0.15 1 1.87 1.62 0.48 8 1.39 1.14 7 0.25
Insecticida medias 7 8 1 2 4 3 9 5 6 0.25 1.39 1.87 2.02 2.42 2.55 2.82 3.91 4.12
40
Cada una de las diferencias (dii) fueron obtenidas con la siguiente ecuacin:
W = q( t , glee , )
siendo: q . t glee CMee r = = = = = =
CMee r
amplitud total estudentizada. Valor encontrado en tablas y que est en funcin de: (nivel de significancia) (nmero de tratamientos), y (grados de libertad del error experimental) cuadrado medio del error experimental nmero de repeticiones de las medias de los tratamientos a ser comparadas.
Para nuestro ejemplo tenemos que al consultar la Tabla 2 del Apndice, se obtiene: q(9,27,0.05) = 4.76 Como en la tabla no se encuentra el valor exacto de q, se efectu una interpolacin: glee 2724 = 3 6 24 27 30 6 0.09 3 X X = (3 0.09) / 6 = 0.05 q = 4.81 0.05 = 4.76 q 4.81 X 4.72 4.81 4.72 = 0.09
W = 4.76
1.349 = 2.76 4
4.
Volvemos a la matriz de diferencias (Paso 2) y observamos columna por columna, si dii W, significa que existen diferencias significativas entre los efectos de los pares de tratamientos, y colocamos un asterisco para resaltar esas diferencias.
41
Insecticida 7 8 1 2 4 3 9 5 6 5. 6 medias 4.12 0.25 3.87* 1.39 2.73 1.87 2.25 2.02 2.1 2.42 1.7 2.55 1.57 2.82 1.3 3.91 0.21 4.12 5 3.91 3.66* 2.52 2.04 1.89 1.49 1.36 1.09 9 2.82 2.57 1.43 0.95 0.8 0.4 0.27 3 2.55 2.3 1.16 0.68 0.53 0.13 4 2.42 2.17 1.03 0.55 0.4 2 2.02 1.77 0.63 0.15 1 1.87 1.62 0.48 8 1.39 1.14
7 0.25
W=2.76
Presentacin de los resultados Insecticida 6 5 9 3 4 2 1 8 7 Medias 4.12 (20) 3.91 (16) 2.82 (8.50) 2.55 (7.25) 2.42 (6) 2.02 (4.5) 1.87 (5.5) 1.39 (3.25) 0.25 (0.25) Grupo Tukey a a a b a b a b a b a b a b b
Entre ( ) aparecen los promedios de los datos originales (sin transformar). Conclusin: la aplicacin del insecticida 7 presenta los mejores resultados en cuanto al control de larvas. Caso II: DCA No balanceado
Se tomarn los datos del ejemplo desarrollado en la clase. 1. Matriz de diferencias Suplemento Sin Suplemento Batata Doce Mandioca Araruta Media (ri) 22.64 (6) 22.84 (6) 23.64 (5) 34.40 (6) Araruta 34.40 (6) 11.76 * 11.56 * 10.76 * Mandioca 23.64 (5) 1 0.8 Batata doce 22.84 (6) 0.2 Sin Supl. 22.64 (6)
2. Comparador de Tukey a) Entre medias con el mismo nmero de repeticiones, esto es ri = ri, para i i
42
CMee r
W = q(4,19,0.05)
W = 3.98
b)
3.53 = 3.05 6
W ' = q(4,19,0.05)
1 1 1 CMee + 2 ri ri '
W ' = 3.98
c) Presentacin de los resultados
1 1 1 3.53 + = 3.20 2 5 6
Suplemento
Produccin media Grupo diaria de leche Tukey (kg) Araruta 34.40 a Mandioca 23.64 b Batata doce 22.84 b Sin Supl. 22.64 b
Se concluye que el suplemento alimenticio que proporcion la mayor produccin diaria (kg) de leche fue el suplemento preparado con la planta Araruta. Caso III: DCA con submuestreo
Recuerde que primero se realiza una prueba de F con el error de muestreo y el error de muestreo:
F1 =
S el valor de F1 F(glee,glem,)
CMee CMem
S F1 < F(glee,glem,)
F2 =
CM trat CM ee
F2 =
CM trat CM ep
W = q( t , glee , )
CMee r
W = q(t , glep , )
CMep rm
43
Nogueira (1997) indica algunas consideraciones referentes a este mtodo: a) b) c) d) El mtodo Tukey fue basado en la distribucin de la diferencia entre la menor y la mayor estadstica de orden (range) de una muestra; Este mtodo es vlido en la totalidad de los contrastes de medias, dos a dos; El mtodo de Tukey es exacto, cuando los tratamientos estn balanceados; El mtodo de Tukey es exacto para evaluar la mayor diferencia entre dos medias, en los dems casos es conservador.
3.3
Un procedimiento usado ampliamente para comparar todas las parejas de medias es el de la prueba de intervalos mltiples desarrollada por Duncan (1955). La aplicacin de esta prueba es ms laboriosa que la prueba de Tukey, pero se llega a resultados ms detallados y se discrimina con mayor facilidad entre los tratamientos, o sea que, la prueba de Duncan indica resultados significativos en casos en que la prueba de Tukey no permite obtener significancia estadstica. Tal como la prueba de Tukey, la de Duncan exige, para ser exacto, que todos los tratamientos tengan el mismo nmero de repeticiones. Para el uso de esta prueba se necesitan tablas especiales (Tabla 3). A continuacin se presenta un ejemplo ilustrativo. Orellana Najarro (2006) evalu la selectividad de los herbicidas Acetoclor y Alaclor en seis cultivos hortcolas en el municipio de Monjas, Jalapa. Una de las variables utilizadas fue altura de planta (cm) 30 das despus del transplante. El diseo experimental utilizado fue bloques al azar, con 3 repeticiones; el cuadrado medio del error = 18.8827 y los grados de libertad = 10. Los promedios de los tratamientos en orden descendente son: No. tratamiento 1 2 3 4 5 6 Tratamientos Sin herbicida (testigo limpio) Alaclor aplicado 2 das antes del transplante Alaclor aplicado 2 das despus del transplante Sin herbicida (testigo enmalezado) Acetoclor aplicado 2 das antes del transplante Acetoclor aplicado 2 das despus del transplante Altura promedio 26.40 23.13 22.07 21.80 19.00 13.13
Tabla 3, para 10 grados de libertad y = 0.05, inicialmente se calcula una amplitud total mnima significativa (shortest significative range, en ingls) para el contraste de pares de medias, dependiendo de la distancia entre cada par. Con estos datos se calculan los t1 comparadores, usando la ecuacin:
D p = d ( p , glee, )
CMee , p = 2, 3, . . , t (tratamientos) r
44
Siendo: d = . = p = glee = CMee = r =
amplitud total mnima significativa. Valor encontrado en tablas y que depende de: (nivel de significancia) distancia entre dos medias comparadas, y (grados de libertad del error experimental) cuadrado medio del error experimental nmero de repeticiones de las medias de los tratamientos a ser comparadas.
Las diferencias mnimas significativas para el nivel de proteccin =0.05 son las siguientes: D2 = 6.12 D3 = 6.41 D4 = 6.55 D5 = 6.66 D6 = 6.72 d0.05 (2,10) = 3.15 d0.05 (3,10) = 3.30 d0.05 (4,10) = 3.37 d0.05 (5,10) = 3.43 d0.05 (6,10) = 3.46
En la tabla siguiente se presentan las diferencias entre las medias de las variedades confrontadas con el D respectivo.
Contrastes entre medias de tratamientos 12 13 14 15 16 23 24 25 26 34 35 36 45 46 56
Comparador 3.15 3.30 3.37 3.43 3.46 3.15 3.30 3.37 3.43 3.15 3.30 3.37 3.15 3.30 3.15 * * * * * n.s. n.s. * * n.s. n.s. * n.s. * *
La presentacin final queda de la siguiente forma: 1 2 3 4 5 6 Tratamientos Sin herbicida (testigo limpio) Alaclor aplicado 2 das antes del transplante Alaclor aplicado 2 das despus del transplante Sin herbicida (testigo enmalezado) Acetoclor aplicado 2 das antes del transplante Acetoclor aplicado 2 das despus del transplante Altura promedio Grupo Duncan 26.40 a 23.13 b 22.07 b c 21.80 b c 19.00 c d 13.13 d
45
3.4 MTODO DE DUNNETT
En varias ocasiones se ejecutan experimentos, en los que el objetivo principal es comparar determinados tratamientos con un control o testigo, siendo las comparaciones entre los dems tratamientos de inters secundario. As, este mtodo es recomendado cuando se desea evaluar un Y = i. a , contraste de tipo: donde: a = i. = se refiere a la media poblacional del tratamiento testigo o control, y se refiere a la media poblacional del i-simo tratamiento o nivel del factor.
H 0 : i a = 0, o H 0 : i = a , contra H a : i a 0, o H a : i a ,
para i = 1, . . . , a1. El procedimiento de Dunnett (1964) es una modificacin de la prueba de t. Para cada hiptesis se calculan las diferencias que se observan en las medias muestrales:
yi. y a , i = 1,2 . . . , a 1.
1 1 CMee + , ri ri '
en donde la constante d (a 1,gle) se encuentra en la Tabla 4 del Apndice (son posibles tanto pruebas unilaterales como bilaterales). Hay que notar que representa el nivel de significancia conjunto asociado a las a1 pruebas. Ejemplo: Se evaluaron 4 variedades de caa de azcar: CP-722086 (utilizada como testigo), 1, 2 y 3; las variables de respuesta medidas fueron: toneladas de caa por hectrea (TCH) y libras de azcar por tonelada de caa (LATC). En el ensayo se utiliz un diseo de bloques completos al azar, con 5 repeticiones. Para la variable TCH se presenta a continuacin el anlisis de varianza:
FV Variedades Bloques Residuos Total GL 3 4 12 19 SC 1637.00 103.30 1763.50 3503.80 CM 545.67 Fo 3.71 F crtica 3.49
146.96 CV = 10.20%
46
En este ejemplo, a = 4, a1 = 3, glee = 12, r = 5, y con un nivel de 5% de significancia se encuentra en la Tabla 4 del Apndice que d 0.05 (3,12) = 2.68. Por lo tanto la diferencia crtica es:
d 0.05 (3,12) 2 146.96 5 = 2.68 7.67 = 20.55
En consecuencia, una variedad debe considerarse significativamente diferente del control s la diferencia es mayor que 20.55. Las diferencias observadas entre las medias son: Variedad 1 vs. CP-722086: Variedad 2 vs. CP-722086: Variedad 3 vs. CP-722086: y1 ya = 132.00 109.8 = 22.20 * y 2 y a = 111.20 109.8 = 1.40 y3 y a = 122.60 109.8 = 12.80
Slo la diferencia y1 ya indica una diferencia significativa al ser comparada con el testigo (control); por lo tanto se concluye que 1 a Ejercicio: Relacionado con el ejercicio anterior, realice la prueba de Dunnett, usando un 5% de significancia, para la variable LATC. Los resultados del ANOVA se presentan a continuacin:
GL 3 4 12 19
CM 992.93
Fo 3.85
Fcrtica 3.49
257.89
CV Las medias de las variedades son: Variedades CP-722086 1 2 3 Promedio 327.6 303.4 307.6 294.2
5.21 %
47
3.5 PROGRAMA EN SAS PARA EL ANLISIS POSTANDEVA DE UN EXPERIMENTO
OPTIONS nodate nonumber; DATA medias; INPUT var rep latc; LABEL latc = "libras de azcar por tonelada de caa; CARDS; 1 1 320 2 1 322 3 1 307 4 1 285 1 2 330 2 2 267 3 2 297 4 2 288 1 3 339 2 3 288 3 3 306 4 3 287 1 4 331 2 4 299 3 4 295 4 4 290 1 5 318 2 5 341 3 5 333 4 5 321 ; PROC anova; TITLE "Anlisis de varianza prueba de Tukey"; CLASS var rep; MODEL latc = var rep/*diseo bloques completos al azar*/ MEANS var/TUKEY; MEANS var/TUKEY ALPHA=0.01; RUN; PROC anova; TITLE "Anlisis de varianza prueba de Duncan"; CLASS var rep; MODEL latc = var rep/*diseo bloques completos al azar*/ MEANS var/DUNCAN; RUN; PROC anova; TITLE "Anlisis de varianza prueba de Dunnett bilateral"; CLASS var rep; MODEL latc = var rep/*diseo bloques completos al azar*/ MEANS var/DUNNETT (1); RUN;
48
CAPTULO 4
USO DE LA REGRESIN EN EL ANLISIS DE VARIANZA: POLINOMIOS ORTOGONALES 4.1 INTRODUCCIN
Cuando se planean experimentos, puede darse el caso que los niveles de los factores o los tratamientos sean cuantitativos. Por ejemplo, cuando se evala la aplicacin de dosis crecientes de un fertilizante en un determinado cultivo con el objetivo de observar su efecto sobre la produccin. Si adems, los niveles o tratamientos de inters tienen incrementos igualmente espaciados, es interesante conocer la naturaleza de la respuesta ms que la comparacin entre tratamientos o niveles; para ello se recurre a la tcnica de polinomios ortogonales. Un polinomio ortogonal es una ecuacin de regresin. As, se puede suponer que existe una variable dependiente o variable de respuesta, representada por y, dependiendo de k variables independientes o predictoras, por ejemplo: X1, X2, . . . , Xk. Esa relacin entre las variables es caracterizada por un modelo matemticoestadstico. Este modelo es fijo para un conjunto de datos. Si el investigador conoce la forma verdadera de la relacin funcional existente entre y y X1, X2, . . . , Xk, puede considerar que: y = f (X1 , X2 , . . . , Xk ) , en la mayora de los casos, esa relacin funcional es desconocida, y el investigador puede seleccionar una funcin apropiada para aproximar f. Los modelos polinomiales son ampliamente utilizados como funciones aproximadas de f, y en ellos est incluido el modelo de regresin lineal simple.
4.2
El modelo de regresin polinomial de grado p para una nica variable independiente es representado por: 2 3 p y i = 0 + 1 X i + 2 X i + 3 X i + . . . + p X i + i (1)
con: i = 1, 2, . . . , n 0 , 1 , 2 , 3 , . . . , p son los parmetros de la regresin que sern estimados.
49
(i) (ii) P0 (Xi) = 1 ;
P (X ) = 0 ;
k i
(iii)
(iv)
P (X ) P
k i
i =1 n
(X i ) = 0 , para k k, ;
P
k =1
i =1 p
(X i ) 0
Los valores de Pk (Xi), k = 1 , . . . , p; cuando los niveles de la variable X son equidistantes, pueden ser obtenidos a travs de las siguientes expresiones, encontradas en Gomes (2000): X X ; P1 (Xi) = xi ; siendo x i = i q siendo que: Xi son los valores de la variable predictora o independiente, X= 1 n
X
i =1
P3 (X i ) = x i
P4 (X i ) = x i
P5 (X i ) = x i
A travs de la aplicacin del mtodo de los mnimos cuadrados, se obtiene b k , un estimador de mnimos cuadrados de bk, con k = 1 , . . . , p; cuya ecuacin es:
bk =
P
i =1 n
( X i ) y i.
2
P
i =1
(X i )
siendo: Pk (X i ) = coeficientes del polinomio ortogonal de grado k asociado al nivel del factor. = total del nivel i del factor en estudio. yi. r = nmero de repeticiones.
50
Las hiptesis a ser evaluadas son: H0: bk = 0 contra Ha: bk 0, a travs de la estadstica:
Fo = CM Re g k , siendo: CM Re sduo
2
i =1
y se rechaza H0 con un nivel de significancia cuando Fo F (1,m, ). Con estas consideraciones y aplicando el teorema de Cochran (Neter, 1996, pginas 76-77) se tiene que: (i) SC Re g k 2 , bajo la hiptesis nula, tiene distribucin 2 con 1 grado de libertad.
(ii) (iii)
SC Re siduo
2
SC Regk y SC Residuo son independientes. Entonces, el cociente entre esas variables aleatorias, o sea,
1 SC Re siduo
SC Re g k
= m
CM Re g k = Fo CM Re siduo
4.3
EJEMPLO DE APLICACIN
En un experimento de fertilizacin en Eucalipto, realizado en vivero, fueron usadas 4 dosis de potasio (0, 30, 60 y 90 ppm), obtenindose las alturas (en cm) presentadas en el cuadro 1. El diseo utilizado fue: completamente al azar, con 3 repeticiones. Se solicita: a) b) c) Obtener los polinomios ortogonales hasta el 3er. grado. Verificar el ajuste de un polinomio de 3er grado a esos datos. Obtener la ecuacin de regresin polinomial ms adecuada.
51
Cuadro 1. Alturas (expresadas en cm) de plantas de Eucalipto. Dosis K 0 30 60 90 Solucin: El modelo adoptado para el anlisis de varianza fue el siguiente: Yij = + i + ij , con i = 1,2, 3, 4 y j = 1, 2, 3.; siendo: Yij el valor observado referente a la i-sima dosis de potasio aplicada en la j-sima repeticin. i es el efecto de la i-sima dosis de potasio, ij es el error experimental asociado a Yij, tal que ij N (0, 2) e independiente. A continuacin se presentan as hiptesis a ser evaluadas: H0: i = 0, para todo i, contra Ha: i 0, para algn i, a travs de la prueba de F, aplicado al anlisis de varianza, cuyos resultados se encuentran en el cuadro 2. Cuadro 2. Anlisis de Varianza con prueba F
F.V. Dosis Residuo Total GL 3 8 11 SC 7668.92 2702.00 10370.92 CM 2556.31 337.75 Valor de F 7.57 * F crtica 4.07
y i.
237 392 395 247
Se rechaza H0 con un nivel de 5% de significancia, concluyendo que existe efecto de dosis crecientes de potasio sobre la altura de las plantas de Eucalipto. Continuando con el anlisis estadstico, se efectu el anlisis de regresin polinomial, considerando el modelo de regresin polinomial de tercer grado, representado por el modelo que se muestra a continuacin: 2 3 y i = 0 + 1 X i + 2 X i + 3 X i + i , o y i = b 0 + b1 P1 (X i ) + b 2 P2 (X i ) + b 3 P3 (X i ) + i con i = 1, 2, 3, 4. Las hiptesis a ser evaluadas: contra Ha1: b1 0, H01: b1 = 0 H02: b2 = 0 contra Ha2: b2 0, contra Ha3: b3 0, H01: b3 = 0 A travs de la prueba F, aplicando el anlisis de varianza, cuyos resultados se muestran en el cuadro 3.
52
Cuadro 3. Anlisis de regresin polinomial con aplicacin de la prueba F F.V. Reg. Lineal Reg. Cuadrtica Reg. Cbica (Dosis) Residuo Total GL 1 1 1 (3) 8 11 SC 18.15 7650.75 0.01666 (7668.92) 2702.00 10370.92 CM 18.15 7650.75 0.01666 337.75 Valor de F 0.05374 22.652 * 0.000049 F crtica 5.32 5.32 5.32
(i)
Obtencin de los coeficientes que componen los P1 (Xi), P2 (Xi) y P3 (Xi): Dosis K 0 30 60 90 y i. 237 392 395 247 P1 (Xi) 3 1 1 3 P2 (Xi) 1 1 1 1 P3 (Xi) 1 3 3 1
( ii )
i =1
i =1
4 P3 (X i ) y i. 2 2 i =1 = [(1) 237 + (3) 392 + (3) 395 + (1) 247 ] = 1 = 0.016666 SC Re g 3 = 4 3 (20) 60 2 3 P3 (X i )
i =1
Ecuacin de Regresin
1 b 0 = y.. = rt
y
i =1
i.
53
b1 =
i =1
P1 (X i ) y i.
n 2 1
P
i =1
(X i )
33 = = 0.55 60
b2 =
P (X )
2 i i =1
y i. =
P
i =1
(X i )
303 = 25.25 60
P2 (X i ) = x i Luego:
X 2 3X i y i = 105.91667 + 0.018333 X i 0.825 2.25 i + 2.25 1.25 30 900 y i = 105.91667 + 0.018333 X i 0.825 0.028056 X i + 2.525 X i 25.25 y i = 79.8417 + 2.54333 X i 0.028056 X i . Vlida para valores de Xi [ 0 ; 90 ] ppm de K,
2 2
140
Altura (cm)
120
100
80
60
20
40
60
80
100
54
De la ecuacin de regresin obtenida se pueden estimar las medias de la altura asociadas a cada una de las dosis de potasio: Dosis K 0 30 60 90 y i. 79.00 130.67 131.67 82.33
y i.
79.845 130.854 131.283 81.132
R 2 R.g.k =
SC Re g k , con 0 R2 1. SC Dosis
R 2 R.g.1 =
R 2 R.g.2 =
Para el ejemplo ilustrativo, la dosis de potasio que proporciona la altura mxima de planta, es dado por la maximizacin de la funcin de produccin obtenida, es decir, a travs de la aplicacin del clculo diferencial a la ecuacin de regresin obtenida, o sea, derivando la funcin de produccin: 2 y i = 79.8417 + 2.54333 X i 0.028056 X i (2) con relacin a la variable Xi, se tiene: yi = 2.54333 2 (0.028056 X i ) (3) Xi yi = 0 , se obtiene: 2.54333 0.0562 X i * = 0 ; 2.54333 = 0.0562 X i * y considerando que Xi
Xi * = 2.54333 = 45.25 45 ppm . 0.0562
El valor de Xi* se refiere a la abscisa del punto mximo, esto es verificado cuando se deriva la ecuacin (3) con relacin a la variable X, y se observa que su signo es negativo, esto es:
2 yi Xi
2
= 0.0562 X i .
As, sustituyendo el valor de X*=45 en la ecuacin (2) se obtiene la altura mxima de Eucalipto, o sea: y i = 79.8417 + 2.54333 (45) 0.028056 (45) 2 = 137.39 cm
55
Comentarios finales
1.
Gomes FP (2000) resalta que, aunque la regresin polinomial sea de gran utilidad en numerosos casos, en experimentos de fertilizantes, ella no es muy apropiada y debe, siempre que sea posible, ser reemplazada por la Ley Mitscherlich, biolgicamente ms aceptable y de interpretacin ms objetiva. Por otra parte, los polinomios son funciones poco apropiadas para representar fenmenos biolgicos. Lo que los recomienda es principalmente la facilidad de su uso, pues son funciones ms simples. En los experimentos con fertilizantes, aunque sea significativo el componente de 3er. grado, es preferible considerar un polinomio de 2 grado, de propiedades matemticas ms acordes con el fenmeno biolgico estudiado. En algunos casos se prefiere hacer uso de la regresin lineal Plateau (tambin conocida como regresin segmentada)
2.
1er grado 3 1 +1 +3
1er grado 2 1 0 +1 +2
4 grado +1 4 +6 4 +1
Coeficientes para ms niveles, pueden ser consultados en: Gomes, FP. (2000) Curso de Estadstica Experimental. Piracicaba: ESALQ p. 252 260
4.4
OPTIONS nodate nonumber; DATA polin; INPUT dos alt; CARDS; 0 80 30 144 60 151 90 70 0 86 30 151 60 127 90 85 0 71 30 97 60 117 90 92 ;
56
PROC print; RUN; TITLE Anlisis de regresin polinomial; PROC glm; CLASS dos; MODEL alt=dos/SS3; CONTRAST Reg.1 dos -3 -1 1 3; CONTRAST Reg.2 dos 1 -1 -1 1; RUN; TITLE Modelo de regresin polinomial de grado 1; PROC GLM DATA=polin; MODEL alt=dos/SS1; RUN; TITLE Modelo de regresin polinomial de grado 2; PROC GLM DATA=polin; MODEL alt=dos dos*dos/SS1; RUN;
4.5
1.
EJERCICIOS PROPUESTOS
Los datos siguientes se refieren a un experimento de fertilizacin en maz, en bloques al azar. Los tratamientos constaron de fertilizacin con: 0, 25, 50, 75 y 100 kg/ha de P2O5. 0 3.38 5.77 4.90 4.54 a) b) c) d) 25 7.15 9.78 9.99 10.10 50 10.07 9.73 7.92 9.48 75 9.55 8.95 10.24 8.66 100 9.14 10.17 9.75 9.50 Totales de bloques 39.29 44.40 42.80 42.28
Realice el anlisis de varianza Ajuste un modelo de regresin polinomial. Grafique la ecuacin de regresin calculada en el inciso b. Concluya.
2.
Se realiz un experimento para conocer el efecto de la suplementacin de vitamina A en la dieta de gallinas de postura, a travs de la masa del huevo. Para ello se suplementaron cantidades crecientes de vitamina A en la dieta de gallinas. Se consider como unidad experimental un grupo de 20 jaulas individuales y se realizaron cuatro repeticiones por tratamiento en un diseo completamente al azar. Adems de las comparaciones entre tratamientos, el investigador deseaba conocer la dosis ptima recomendada, por lo cual se realiz un anlisis de polinomios ortogonales, dado que los tratamientos de vitamina A estaban igualmente espaciados.
57
Repeticin 1 2 3 4 Niveles de vitamina A (UI/kg) 6000 8000 10,000 50.8 54.5 54.2 52.4 52.4 51.0 49.6 48.0 46.5 51.6 51.3 52.0
En este caso se tienen seis tratamientos y por lo tanto se puede ajustar un polinomio y probar los efectos lineales, cuadrticos, cbicos, curticos y quntuples. 3. Los datos que se presentan a continuacin se refieren a la produccin de soya, en kg/ha, obtenidos en el primer ao de un experimento instalado con el objetivo de verificar la respuesta de la soya a la aplicacin de dosis crecientes de cal. Se utiliz un diseo completamente al azar, con las siguientes dosis: 0, 2, 4, 6, 8, 10 y 12 tm/ha de cal, y seis repeticiones. Repeticiones III IV 1792 2200 2917 2317 2659 2600 3292 2675 2734 3017 2784 2217 2792 2325
Dosis 0 2 4 6 8 10 12
Con estos datos: a) b) c) d) e) Realice el Anlisis de Varianza Obtenga los polinomios ortogonales hasta el 3er. grado. Verifique el ajuste de un polinomio de 3er grado a esos datos. Obtener la ecuacin de regresin polinomial ms adecuada. Determine la produccin mxima
58
CAPTULO 5
SUPUESTOS FUNDAMENTALES DEL ANLISIS DE VARIANZA, VERIFICACIN Y TRANSFORMACIN DE DATOS
5.1
INTRODUCCIN
Para el anlisis e interpretacin de un conjunto de datos provenientes de un experimento, se hace uso del anlisis de varianza o del anlisis de regresin, considerando un modelo matemticoestadstico (Gauss-Markov), lo cual presupone un modelo lineal y la aceptacin de algunas suposiciones bsicas, las cuales son: 1. Los diversos efectos son aditivos. Esa condicin es impuesta por el modelo adoptado. Esta suposicin puede ser verificada por la prueba de Aditividad de Tukey (Tukey test for additivity) Los errores o desvos (eij) son independientes, esto es, la probabilidad de que el error de una observacin cualquiera tenga un determinado valor, no debe depender de los valores de los otros errores. De donde resulta, que los errores no son correlacionados. El cumplimiento de esta suposicin se garantiza, hasta cierto punto, por la aleatorizacin de los tratamientos en las unidades experimentales y mediante una buena tcnica experimental (uso de borduras, evitar contagio entre unidades experimentales, etc). Puede ser utilizada la prueba de las rachas o corridas (run test) para verificar esta suposicin. Los errores (eij) tienen la misma variancia 2 (a esto se le conoce como homocedasticidad u homogeneidad de varianzas). Cuando las varianzas no son homogneas, se dice que existe heterocedasticidad. Para evaluar la heterogeneidad (o la homogeneidadad) de varianzas, se utilizan las pruebas que se describen a continuacin: Hartley (o de F mximo): es sencilla, pero se puede aplicar nicamente cuando los tamaos de muestra (repeticiones) son iguales y si los errores estn normalmente distribuidos. Bartlett: esta prueba puede utilizarse cuando los tamaos de muestra (repeticiones) son iguales o diferentes. Presenta tambin el inconveniente de ser sensible a la falta de normalidad de los datos. Levene modificado: Esta prueba es til an cuando no se cumple con el supuesto de normalidad y adems, no se requiere que los tamaos de muestra sean los mismos para todos los tratamientos.
2.
3.
4.
Los errores eij tienen distribucin normal (o estn normalmente distribuidos). Pruebas de bondad de ajuste, como la de J-cuadrado (2), Shapiro-Wilks, Kolmogorov-Smirnov y su modificacin conocida como la prueba de Lilliefors, pueden ser utilizadas para examinar esta suposicin. Adems, la normalidad de los errores puede ser examinada mediante el uso de histogramas, grficos de cajas de dispersin (box plot) y grficos de probabilidad normal (normal probability plots), como se ilustra a continuacin:
59
Box Plot
18 16 14 12 frecuencia 10 8
20 15 10 5 0 -5
-10
4
-15
2
-20
0 <= -20 (-20,-15] (-15,-10] (-10,-5] (-5,0] (0,5] (5,10] (10,15] > 15
-25 RESIDUOS
RESIDUOS
a)
Histograma
b)
Normal Probability Plot RESIDUOS
2.5
0.5
-0.5
-1.5
-2.5 -25
-20
-15
-10
-5 Value
10
15
20
c)
Segn Nogueira (1997), las anteriores suposiciones tienen por objetivo facilitar la interpretacin de los resultados, tornando las tcnicas estadsticas ms simples, y posibilitando la aplicacin de las pruebas de hiptesis. Entretanto, la validez exacta de esas suposiciones es esencialmente terica, en la prctica, lo que se espera es su validez aproximada, una vez que los procedimientos obtenidos a travs de los modelos lineares son razonablemente robustos y se pierde poco s la validez de las suposiciones fuere apenas aproximada. Cuando esas suposiciones no son satisfechas, esto es, cuando hay desvos, sus efectos son variados y la gravedad del problema, depende de la situacin. De esto modo, se verifica que: a) La aditividad est asociada a la facilidad de interpretacin del modelo, de modo que, si ella es vlida, entonces los datos observados sern siempre combinaciones lineares de los efectos estudiados. Esta suposicin no es siempre necesaria, sea en la estimacin o en las pruebas de hiptesis.
60
b) La homocedasticidad, o sea, la homogeneidad de varianzas es en la mayora de veces, el requisito necesario. Cuando se tiene heterogeneidad de varianzas, el mtodo de los mnimos cuadrados no ofrece los mejores estimadores. La prueba de F, los mtodos de comparaciones mltiples, y la estimacin de los componentes de varianza pueden ser grandemente afectada. En cuanto a la normalidad, es necesaria en las pruebas de hiptesis. En algunas situaciones, no es una suposicin crtica, a no ser que vaya acompaada de heterogeneidad de varianzas. Muchas pruebas aplicadas en el anlisis de varianza son robustas con relacin a la falta de normalidad.
c)
De acuerdo con Macchiavelli (2003), en forma general, la consecuencia del no cumplimiento de los supuestos es que las conclusiones de los anlisis realizados pueden no ser vlidas (los niveles de error pueden ser diferentes a los establecidos, los errores estndar pueden subestimar o sobreestimar los verdaderos errores poblacionales, los lmites de confianza pueden ser incorrectos, etc.). Observando cualquier desvo importante en las suposiciones del anlisis de varianza, dos caminos pueden ser tomados: 1. Aplicacin de tcnicas estadsticas donde no exista la necesidad de suposiciones, tales como: Estadstica No Paramtrica, mtodo de los mnimos cuadrados ponderados, mtodo de los residuos especficos. En vez de realizar el anlisis estadstico con los datos originales, los cuales no cumplen las suposiciones, se pueden utilizar funciones construidas, de tal modo, que las suposiciones sean cumplidas. Esas funciones construidas son conocidas como: Funciones de transformacin de datos (funcin estabilizadora de la varianza).
2.
5.2
TRANSFORMACIN DE DATOS
La heterogeneidad de varianzas puede ocurrir debido a los tratamientos evaluados, esto es, ciertos tratamientos presentan mayor variabilidad que otros, sin que haya necesariamente una relacin entre la media y la varianza, o puede haber sido que si exista esta relacin. Esto ltimo significa que la varianza de y es una funcin de la media, o sea, E(y) = y V(y) = D2(). En este caso, el procedimiento adoptado se refiere a la transformacin de los datos observados a otra escala, antes de realizar el anlisis de varianza.
5.2.1
A continuacin se presenta un ejemplo tomado de las Notas de acompaamiento del curso de Estadstica Experimental Aplicada a la Experimentacin Agronmica de la Dra. Mara Cristina Stolf Nogueira (1997), con el objetivo de ilustrar la metodologa para la verificacin de los supuestos del Anlisis de Varianza y ms adelante para mostrar los diferentes tipos de transformaciones que se pueden realizar. Los siguientes datos se refieren al nmero de larvas vivas encontradas en un rea experimental plantada con arroz (Oryza sativa L.), tratada con diferentes insecticidas. El diseo experimental utilizado fue el completamente al azar (DCA).
61
TRAT.
1 2 3 4 5 6 7 8 9
I 9 4 6 9 27 35 1 10 4
Repeticiones II III 12 0 8 5 15 6 6 4 17 10 28 2 0 0 0 2 10 15
IV 1 1 2 5 10 15 0 1 5
Yi.. 22 18 29 24 64 80 1 13 34
Y i..
5.50 4.50 7.25 6.00 16.00 20.00 0.25 3.25 8.50
i..2
35.00 8.33 30.25 4.67 64.67 212.67 0.25 20.92 25.67
Yij = + i + ij
i = 1, 2, . . . , t j = 1, 2, . . . , r
i ij
nmero de larvas vivas observado en la ij-sima unidad experimental. media general del nmero de larvas vivas. efecto del i-simo insectida. error experimental asociado a la ij-sima unidad experimental.
(todos los tratamientos producen el mismo efecto) para al menos un i; i = 1,2, . . . , t (al menos uno de los tratamientos produce efectos distintos).
2.
Supuestos ij ~ NID (0,2) Los errores son independientes y normalmente distribuidos, con media cero y varianza constante (homogeneidad de varianzas). Diagnstico de los supuestos Las posibles violaciones a las suposiciones bsicas del modelo estadstico pueden ser investigadas fcilmente examinando los residuos. El residuo de la observacin j del tratamiento i se define mediante:
3.
e ij = Yij Yij
Siendo Yij una estimacin de la observacin correspondiente, calculada por: Yij = + i Yij = Y.. + ( Y i . Y..) entonces eij = Yij Y i . , en un diseo completamente al azar (DCA). Para un diseo aleatorizado por bloques tenemos que:
62
Yij = + i + j
El examen de los residuos debe ser automtico en el anlisis de varianza. Si el modelo es correcto y las suposiciones se satisfacen, los residuos no deben tener algn patrn, ni deben estar relacionados con alguna otra variable, incluyendo la respuesta yij.
Una comprobacin sencilla consiste en graficar los residuos contra los valores ajustados Yij (en el caso de un DCA, recordemos que Yij = Y i. , el promedio del i-simo tratamiento). En esta
grfica no debe revelarse algn patrn obvio. Un defecto que en ocasiones revela el grfico es el de una varianza variable. Algunas veces la varianza de las observaciones aumenta a medida que la magnitud de las observaciones lo hace. Esto resulta cuando el error es proporcional a la magnitud de la observacin. Si ste es el caso, los residuos aumentan a medida que Yij lo hace, y el grfico de los residuos contra Yij tendr la siguiente forma:
Residuos
Predichos
Clculo de los residuos para el ejemplo ilustrativo:
63
Tratamiento 1 2 3 4 5 6 7 8 9 Ejemplo:
Repeticiones II III 6.50 -5.50 3.50 0.50 7.75 -1.25 0 -2.00 1.00 -6.00 8.00 -18.00 -0.25 -0.25 -3.25 -1.25 1.50 6.50 e13 = 0 5.50 =
IV -4.50 -3.50 -5.25 -1.00 -6.00 -5.00 -0.25 -2.25 -3.50 3.50,
3.2
En la prueba de normalidad de Shapiro-Wilks, la hiptesis nula que se evala es que los errores siguen aproximadamente una distribucin normal, y la alternativa es que no siguen esa distribucin. Es necesario recordar que si el valor p (Pr < W) es mayor que el nivel de significancia (en general 0.05), entonces concluimos que no se cuenta con evidencia suficiente para rechazar la hiptesis nula, por lo tanto, los errores siguen una distribucin normal.
Shapiro-Wilks
Variable RDUO_Rendimiento n 20 Media 0.00 W* 0.96 Pr < W 0.7824
En este ejemplo el supuesto de normalidad se acepta Ho , debido a que p = 0.7824 es mayor que el valor de (0.05). 3.3 Pruebas estadsticas para evaluar la homocedasticidad
Adems de los grficos de residuos que frecuentemente se utilizan para diagnosticar la igualdad en las varianzas, se han propuesto algunas pruebas estadsticas. stas son pruebas formales para las hiptesis:
2 2 Ho : 12 = 2 = 3 = . . . = i2
Ha : i2 i2 , para algn i i
64
PRUEBA DE HARTLEY O DE F MXIMA Esta prueba consiste en calcular el cociente:
Hc =
i2 (mx) ,i = 1, 2 , . . . , t i2 ( min )
t = nmero de tratamiento y r= nmero de repeticiones
siendo:
i2 =
Regla de decisin: Si Hc H (t, r-1, ), se rechaza Ho, con un nivel de significancia . Siendo H (t, r-1, ) obtenido de la Tabla 5 del Apndice. Esta tabla fue generada por Pearson & Hartley en 1956. Para el ejemplo ilustrativo, se tiene que en el tratamiento con el insecticida 6 se obtuvo la mayor varianza estimada:
i2 =
Por otra parte, los datos observados en el tratamiento 7 presentaron el menor valor de i2 = 0.25 u 2 . Por tanto,
Hc = 212.67 = 850.68 y H (9,3,0.05) = 93.9 (vea la Tabla 1) 0.25
o 2 = 2.3026
k
q c
q = ( N k ) log10 S p 2 ( ni 1) log10 Si 2
i =1
c = 1+
1 k 1 1 (ni 1) ( N k ) 3(k 1) i =1
65
Sp =
(n
i =1
1) Si
Nk
Regla de decisin: Se rechaza Ho para valores grandes de o2; en otras palabras, se rechaza Ho, slo si: o2 >2 (k-1,). El valor de 2 (k-1,) se obtiene de la Tabla 6 del Apndice.
Nota: Varios estudios indican que la prueba de Bartlett es muy sensible a la suposicin de normalidad y no debe ser aplicada cuando exista alguna duda en cuanto a esta suposicin (Montgomery, 1991).
Retomando al ejemplo ilustrativo que se ha venido trabajando, tenemos que: N = total de observaciones k = nmero de grupos (o tratamientos) 2 Cuando todas las estimativas Si son obtenidas con el mismo nmero de observaciones
q = (36 9) log10 (44.71) (4 1) [ log10 (35) + log10 (8.33) + . . . + log10 (25.67)] = 11.92
c = 1+ 1 1 1 9 = 1.12 3(9 1) (4 1) (36 9)
o 2 = 2.3026
2 (8,0.05) = 15.51 Como o2 >2 (8,0.05) , se rechaza Ho, concluyendo que las varianzas son heterogneas.
5.2.2
El proceso de obtencin de la transformacin de datos depende del objetivo que se desea alcanzar con esa transformacin. Es sabido que difcilmente una transformacin de datos ir atender a todos los objetivos, aunque no sea raro, se busca homogeneidad de varianzas y se consigue junto con ella una mejor aproximacin normal. En la prctica, raramente se realizaba la verificacin de las condiciones exigidas por el modelo matemtico, debido a que, datos de peso y altura (variables cuantitativas continuas), generalmente tienen distribucin normal. A continuacin se describen los cuatro principales tipos de transformaciones comnmente utilizados:
66
Raz cuadrada.
Es una transformacin usualmente utilizada para datos con varianzas que cambian proporcionalmente con la media, frecuentemente cuando la variable observada Y se refiere a datos de conteo de insectos u otros organismos, permitiendo suponer que Y tiene distribucin de Poisson. Variables de este tipo deben transformarse mediante la raz cuadrada:
y ij * = y ij o bien
siendo = 0, , 3/8, etc.
y ij * = y ij +
Gomes (2000) indica que cuando se incluyen valores de yij inferiores a 15, conviene tomar = 3/8 (que es lo que comnmente ocurre con experimentos con insectos en laboratorio). Cuando los valores de yij son mayores de 15, se puede tomar = 0. Angular
Otro caso a considerar es el que trata de porcentajes p= (x/n) 100, relativas a n observaciones por parcela. Los porcentajes deben estar basados en un denominador comn (por ejemplo, porcentaje de germinacin calculado a partir de 50 semillas bajo distintos tratamientos). En tales condiciones, los datos tienen, en general, distribucin binomial y la transformacin indicada es:
y ij = arcsen ( y ij )1 / 2 o sea
y ij * = sen 1 ( y ij )1 / 2
Gomes (2000) recomienda que se efecte este tipo de transformacin cuando los porcentajes sean menores de 15% o excedan 85%. As, si todos los datos se encuentran en el intervalo [ 15%, 85% ], la transformacin no es necesaria. Adems, en el caso en que x=0, el valor de 0/n debe ser substituido por (1/4n), y en el caso de x=n, el valor de n/n ser substituido por 1(1/4n). Los datos transformados se expresan en grados (y no en radianes), por ejemplo, si yij = 5%, yij*= arcsen(0.05)1/2 =12.92. Logartmica
Cuando se verifica una proporcionalidad entre medias y desviaciones estndar, se puede usar la transformacin:
y ij = log ( y ij ) o sea
y ij * = log ( y ij + 1)
Macchiavelli (2003) indica que esta transformacin se utiliza para datos que exhiben efectos multiplicativos (una forma de falta de aditividad) o cuando las varianzas son proporcionales al cuadrado de las medias. Gomes (2000) cita que, la transformacin logartmica puede utilizarse tambin, cuando los datos siguen una distribucin log-normal. Recproca Surge en las situaciones en que V (yij) (es proporcional) a 4. Entonces:
y ij * =
1 y ij
67
La utilizacin de esta transformacin es adecuada cuando y est relacionada con el tiempo de sobrevivencia, luego 1/y puede ser considerada como la tasa de mortalidad, o cuando y est relacionada con el tiempo transcurrido hasta un acontecimiento o un nmero de ocurrencias para una unidad de tiempo.
5.2.3
Seleccin de la transformacin.
Montgomery (1991) indica que si el experimentador conoce la relacin entre la varianza y la media de las observaciones, puede utilizar esa informacin como gua al seleccionar la forma de la transformacin apropiada. Sea E(y)=, la media de los valores de y. Y Suponiendo que la varianza V(y)= 2y, es proporcional a alguna potencia de la media de y, tal que: 2y , se desea determinar la transformacin de y que produzca una varianza constante. La transformacin recomendable frecuentemente puede ser obtenida con el auxilio de la b ecuacin de regresin: V ( y ) = , en donde es una constante de proporcionalidad. Al aplicar logaritmo a ambos lados de la anterior ecuacin de regresin, se obtiene la ecuacin (1):
i = 1, 2,..., t
Se deben obtener las estimativas de la media y varianza de los tratamientos. Luego se debe realizar un anlisis de regresin entre los valores de Ln( i2 ) en funcin de los valores de Ln(yi. ) utilizando la ecuacin (1). Para el ejemplo ilustrativo que hemos venido trabajando, tenemos los siguientes resultados: Insecticida 1 2 3 4 5 6 7 8 9 Total
yi.
5.50 4.50 7.25 6.00 16.00 20.00 0.25 3.25 8.50
xi = Ln( yi. )
1.7047 1.5041 1.9810 1.7918 2.7726 2.9957 -1.3863 1.1787 2.1401 14.6824
i2
35.00 8.33 30.25 4.67 64.67 212.67 0.25 20.92 25.67
yi = Ln( i2 )
3.5553 2.12 3.4095 1.5412 4.1693 5.3597 -1.3863 3.0407 3.2453 25.0547
Con esta informacin obtenemos la estimativa del coeficiente angular de la regresin lineal simple:
68
b=
xi yi
i =1
x y
i =1 i i =1
n
n 2
xi n xi2 i=1n i =1
= 1.3918
Para evaluar la hiptesis Ho: =0 contra Ha: 0, se realiza el anlisis de varianza para la regresin lineal, y los resultados se presentan en el siguiente cuadro: Fuentes de variacin Regresin Desvos Total Grados de libertad 1 7 8 Suma de cuadrados 24.99375 4.20259 29.19634 Cuadrados medios 24.99375 0.60037 Valor de F 41.6306* F crtica 5.59
Coeficiente de determinacin (R2) = 0.8561 Por el resultado obtenido, con un 5% de significancia, no se encontr evidencia suficiente para rechazar la hiptesis nula, por lo tanto se concluye que existe relacin entre la media y la varianza de los tratamientos incluidos en el experimento del ejemplo ilustrativo.
la regresin ( b ). En la siguiente tabla se presentan las principales transformaciones a ser adoptadas, en funcin del valor del coeficiente b
Relacin entre V(y)= 2 y 2 Constante 2 2 2 2
b
= 1
b 2
Transformacin Ninguna
y+
lo g
0 1 2 3 4
1 0 1
1
(y
y +
(y
Observacin: puede asumir valores tales como: 0, 3/8, , 1, 2, . . . , con el objetivo de corregir valores nulos o negativos. La transformacin a utilizar en nuestro ejemplo sera:
* yij = yij b 1 2
b 1.3918 1 = 1 = 0.3041 2 2
* yij = yij (
0.3041)
Al utilizar la tabla anterior, se puede verificar que la transformacin adecuada es raz cuadrada, considerando b = 1.3916 1
69
5.3 PROGRAMA EN SAS PARA EL ANLISIS DE LOS SUPUESTOS DE NORMALIDAD Y DE HOMOGENEIDAD DE VARIANZAS
OPTIONS nodate nonumber; DATA supos; /*evaluacion de los supuestos de normalidad y homocedas*/ INPUT insec larvas; CARDS; 1 9 2 4 3 6 4 9 5 27 6 35 7 1 8 10 9 4 1 12 2 8 3 15 4 6 5 17 6 28 7 0 8 0 9 10 1 0 2 5 3 6 4 4 5 10 6 2 7 0 8 2 9 15 1 1 2 1 3 2 4 5 5 10 6 15 7 0 8 1 9 5 ; PROC glm; TITLE Prueba de normalidad; CLASS insec; MODEL larvas=insec/SS1; output out=res r=rlar p=pred; RUN; PROC print data=res; RUN;
70
PROC univariate plot normal data=res; var rlar; RUN; TITLE "Verificacin de la homocedasticidad usando la prueba de Hartley"; proc means mean var CV; by insec; var larvas; RUN; PROC SUMMARY NWAY;/* Calcula y guarda varianza estimada */ TITLE Prueba de Bartlett para contrastar igualdad de varianzas; CLASS insec;/* el nmero de observaciones para cada nivel de trat*/ VAR larvas; OUTPUT OUT= salida VAR=VARIANCE N=NUM; PROC PRINT; RUN; DATA _NULL_; SET SALIDA END=EOF; LOGVARI=LOG(VARIANCE); N=NUM-1; SLOGVAR+LOGVARI*N; TOTN+N; NVAR=N*VARIANCE; SNVAR+NVAR; A+1; SFRACT+1/N; IF EOF THEN DO; M=TOTN*LOG(SNVAR/TOTN)-SLOGVAR; C=1+(1/(3*(A-1)))*(SFRACT-1/TOTN); CHISQ=M/C; PROBCHI=PROBCHI(CHISQ,(A-1)); ALPHA=1-PROBCHI; FILE PRINT; PUT Test de Bartlett para contrastar igualdad de varianzas; PUT ; PUT CHI-CUADRADO = CHISQ ALPHA = ALPHA . ; END; RUN;
71
5.4
1.
EJERCICIOS PROPUESTOS
Efecte el anlisis de varianza para la variable raz cuadrada del nmero de larvas vivas. Los datos (ya transformados) se presentan en el siguiente cuadro:
TRAT.
1 2 3 4 5 6 7 8 9 2.
Repeticiones II III 3.46 0 2.83 2.24 3.87 2.45 2.45 2.00 4.12 3.16 5.29 1.41 0 0 0 1.41 3.16 3.87
Yi.. 7.46 8.07 10.18 9.69 15.64 16.49 1.00 5.57 11.27
Yi.
1.87 2.02 2.55 2.42 3.91 4.12 0.25 1.39 2.89
Navarro (1996) evalu el efecto de aceites y detergentes para el control de fidos (Homptera: Aphididae) en el cultivo del brcoli (Brassica oleracea var. Itlica Plenk), en el municipio de Patzica, departamento de Chimaltenango. A continuacin se presentan los datos de campo del conteo del nmero de fidos por parcela neta, 7 das despus de la segunda aplicacin de los tratamientos. El diseo experimental utilizado fue el de Bloques completos al azar.
Tratamientos Repeticiones II
III
Saf-T-Side (Aceite parafinado) Triona o Medopaz (Aceite mineral de uso agrcola) Carrier (Aceite vegetal de uso agrcola) Olmeca (Aceite vegetal de uso domstico) Bioambar (Detergente biodegradable) Glicerina (Detergente en formulacin lquida) Sulfonato de potasio (Detergente en formulacin semislida) ACT-92 (Carbonato de sodio) Naled (Testigo qumico, insecticida organofosforado) Testigo absoluto (Agua) a) b)
49 19 32 13 41 123 3 26 61 43
26 49 43 13 40 10 70 70 43 37
35 27 42 17 51 60 87 14 4 62
Evale los supuestos del Anlisis de Varianza. En caso de ser necesario, indique y demuestre cul es la transformacin ms adecuada.
72
CAPTULO 6
DISEO EN BLOQUES COMPLETOS AL AZAR
6.1
INTRODUCCIN
El diseo en bloques completos al azar (DBA) toma en cuenta los tres principios bsicos de la experimentacin: repeticin, aleatorizacin y control local. En este diseo las unidades experimentales se distribuyen en grupos homogneos. Cada uno de estos grupos es llamado: bloque. El nmero de unidades experimentales dentro de cada bloque es igual al nmero de tratamientos incluidos en el experimento. Los tratamientos son distribuidos en las unidades experimentales dentro de cada bloque aleatoriamente, as, cada bloque ir a constituir una repeticin. Este tipo de experimento es seleccionado cuando se tienen dudas acerca de la homogeneidad del ambiente o cuando, por experiencia, se sabe de su heterogeneidad.
6.1.1 Criterios de bloqueo
Este diseo es conveniente cuando se logra determinar una gradiente de variabilidad en un sentido, que est influyendo sobre los tratamientos, por ejemplo: grado de inclinacin del terreno donde se realizar el experimento, direccin del viento, gradiente de temperatura, etc. Los bloques se construyen perpendiculares a la direccin de la gradiente de variabilidad.
6.1.2 Aleatorizacin
Se aleatorizan las tratamientos dentro de cada bloque. Debe considerarse que la aleatorizacin se realizar de forma independiente para cada bloque. Ejemplo Suponiendo que se tiene un experimento que incluye un factor con 5 niveles (denotados con las letras A, B, C, D y E), distribuidos en 4 bloques, y considerando que en cada bloque los niveles del factor fueron totalmente aleatorizados, el croquis de campo quedara de la siguiente forma: A C D E B BLOQUE I
BLOQUE II
BLOQUE III
BLOQUE IV
73
6.2 ANLISIS ESTADSTICO
Sea t el nmero de niveles del factor A (tratamientos) distribuidos en r bloques. La notacin adoptada para representar los valores de la variable de respuesta es dada en la tabla siguiente:
Tratamientos 1 2 3 . . t Y.j
Siendo que:
Repeticiones 2 3 ... Y12 Y22 Y32 . . Yt2 Y. 2 Y13 Y23 Y33 . . Yt3 Y. 3 ... ... ... ... ... ... ...
Y .. =
6.2.1
Y i. =
74
Yij i j ij
6.2.3
= = = = =
variable de respuesta observada o medida en el i-simo tratamiento y el j-simo bloque. media general de la variable de respuesta efecto del i-simo tratamiento efecto del j-simo bloque error asociado a la ij-sima unidad experimental.
Supuestos
Significa que un tratamiento no debe modificar su accin (o efecto) por estar en uno u otro bloque.
Anlisis de Varianza
6.2.4
FV
GL
SC
CM
Valor de F
Bloques
r- 1
j =1 t
Y. 2 j t
Y..2 tr
SCtrat /gltrat CMtrat/CMee
Yi.2 Y2 .. r tr i =1
SCtotal (SCtrat + SC bloque)
SCee /glee
tr - 1
i =1
Yij2
j=1
Y..2 tr
CV =
Regla de Decisin
CME 100 Y ..
S el valor de F F crtica (gl trat; gl error; ) S el valor de F < F crtica (gl trat; gl error; )
En un experimento se evalu la aplicacin de productos qumicos para el control de nematodos. Fueron utilizados los siguientes tratamientos:
75
A. B. C. D. E. F. Testigo absoluto (sin aplicacin). Oxamyl 1.5 lt (forma de aplicacin: foliar) Oxamyl 1.5 lt (forma de aplicacin: al suelo) Oxamyl 2.0 lt (forma de aplicacin: foliar) Carbofuran 15 gr. (aplicado al suelo) Oxamyl 2.0 lt (forma de aplicacin: al suelo)
Los tratamientos fueron analizados en un diseo bloques al azar con cinco repeticiones. La variable de respuesta medida fue el nmero de nematodos vivos por unidad experimental. Los datos obtenidos se presentan en la siguiente tabla: Nematicidas A B C D E F Y.j I 307 187 277 115 173 195 1254 II 371 192 328 235 267 131 1524 Bloques III 379 320 363 248 251 171 1732 IV 360 243 195 267 254 253 1572 V 339 296 344 256 200 253 1688 Yi. 1756 1238 1507 1121 1145 1003 7770
Y i.
351.2 247.6 301.4 224.2 229.0 200.6 259
(1756) 2 + (1238) 2 + (1507) 2 + (1121) 2 + (1145) 2 + (1003) 2 (7770) 2 SCtrat = = 79, 750.8 5 (5)(6) (1254) 2 + (1524) 2 + (1732) 2 + (1572) 2 + (1688) 2 (7770) 2 = 23, 477.33 6 (5)(6) (7770) 2 = 148,922 (5)(6)
SCbloques =
Grados de libertad 5 4 20 29
Valor de F 6.98*
CV =
Conclusin:
76
6.3
1.
BLOQUES I II III IV
K1 40 38 35 25
K2 30 36 35 26
K5 40 37 38 29
K6 23 25 24 26
a) Plantee el Modelo Aditivo Lineal y defina sus componentes en trminos del problema. b) Presente el cuadro de ANDEVA y pruebe la hiptesis correspondiente. Utilice =0.05 c) Utilice la prueba de Tukey para realizar las comparaciones de las medias de los tratamientos. 2. En un experimento de riegos en el cultivo de algodn se tuvieron los siguientes tratamientos que estn expresados en metros cbicos de agua absorbidos por hectrea: T1=5400, T2=4800, T3=4200 y T4=3600. El experimento se condujo en parcelas de 300 m2 de rea til y los resultados estn expresados en kilogramos. BLOQUES I II III TRATAMIENTOS T3 53 62 46
T1 68 86 68
T2 73 90 71
T4 50 62 50
a) Plantee el modelo y defina sus componentes b) Defina la hiptesis y construya el cuadro de ANDEVA. Utilice =0.05 c) Efecte la prueba de Tukey para comparar las medias de los tratamientos. 3. Dentro de los estndares de calidad del fruto de mango para que sea exportable como un fruto de primera debe de cumplir con lo siguiente: poseer por lo menos un 20% de coloracin rojiza, sin ningn dao mecnico y que no se encuentre manchado; en la regin de la costa sur est el problema de la falta de coloracin rojiza del fruto, por lo cual se llev a cabo una investigacin en el cultivo de mango (Mangifera ndica L. Var. Tommy atkins) en la cual se evalu el efecto de la fertilizacin foliar en la poca de floracin y crecimiento del fruto sobre la calidad del fruto. Una de las variables de respuesta evaluadas fue el nmero de frutos con coloracin roja. Se utiliz el diseo de bloques al azar debido a que existe una gradiente de variabilidad en la plantacin. Los resultados obtenidos se presentan a continuacin:
77
CUADRO 1: Tratamientos evaluados TRATAMIENTO Potasio + Magnesio + Balanceador + cobre Mono-di-tri-polisacaridos + cidos urnicos + MgO, CaO +B, Zn, Co. Nitrato de Potasio + Aminocidos +cido flico + Nutrientes Testigo CUADRO 2 CDIGO Mezcla 1 Mezcla 2 Mezcla 3 Sin mezcla
Nmero de frutos con coloracin roja en parcelas donde se realiz una poda de aclareo en la etapa de floracin TRATAMIENTO I 637 731 687 547 REPETICIN II III 572 858 603 530 561 489 640 644 IV 732 797 582 586
6.4
En muchos mtodos de comparacin mltiple de medias se utiliza la idea de un contraste. Para definir este trmino, se considerar un experimento con 5 tratamientos, todos con el mismo nmero de repeticiones ( r ), en el cual la hiptesis nula Ho:i =0 fue rechazada. Por lo tanto se sabe que los tratamientos influyen en la variable de respuesta, o sea, algunos de los tratamientos producen diferente efecto; sin embargo cules son estos tratamientos? Si se supone que luego de realizar el experimento, los tratamientos 4 y 5 producen el mismo efecto sobre la variable de respuesta, implica que es deseable probar las hiptesis: Ho: 4 = 5 Ha: 4 5 Estas hiptesis pueden ser probadas investigando una combinacin lineal apropiada de los totales de tratamientos, por ejemplo: Y4. Y5. = 0 De haber supuesto que el promedio de los tratamientos 1 y 3 no difiere del promedio de los tratamientos 4 y 5, las hiptesis que deben probarse son: Ho: 1 + 3 = 4 + 5 Ha: 1 + 3 4 + 5, y esto implica la combinacin lineal: Y1. + Y3. Y4. Y5. = 0
78
En general, la comparacin de medias de tratamientos conlleva una combinacin lineal de totales de tratamientos de la forma: t
C = CiYi. ,
i =1
siendo, Ci = = Yi.
coeficiente del contraste ortogonal asociado a Yi. total del tratamiento i incluido en el contraste;
imponiendo la restriccin
C
i =1
t CiYi. , SCc = i =1 t r Ci 2
i =1
Y tiene un solo grado de libertad. Para probar un contraste se debe comparar su suma de cuadrados con el cuadrado medio del error experimental. La estadstica que resulta tiene una distribucin F con 1 y k grados de libertad, siendo k el nmero de grados de libertad asociado a la suma de cuadrados del error experimental.
C C
i =1 i
i`
=0
Si se tiene t tratamientos, el conjunto de t 1 contrastes ortogonales descomponen la suma de cuadrados debida a tratamientos en t1 componentes independientes con un grado de libertad. Por tanto, las pruebas realizadas sobre los contrastes ortogonales son independientes, lo que significa que no contienen informacin redundante. En otras palabras, la informacin que proporciona un contraste no se traslapa con la proporcionada por otro. Cmo obtener los coeficientes para contrastes ortogonales? Existen muchas maneras de elegir coeficientes de los contrastes ortogonales para un conjunto de tratamientos. Usualmente, algo de la naturaleza del experimento debe sugerir las comparaciones que resultan de inters. Por ejemplo, si se tienen t=3 tratamientos, siendo el tratamiento 1 el control, y los tratamientos 2 y 3 los niveles reales del factor de inters para quien realiza el experimento, los contrastes ortogonales apropiados podras ser los siguientes: Coeficientes para contrastes ortogonales 0 2 1 1 1 1
79
Debe observarse que: Contraste 1 con Ci = 2, 1, 1 compara el efecto promedio de los niveles de inters con el control, mientras que: Contraste 2 con Ci` = 0, 1, 1 compara los dos niveles del factor de inters.
Nota: Los coeficientes de los contrastes deben ser elegidos antes de realizar el experimento y analizar los datos.
6.4.2
Ejemplo de aplicacin
Se utilizar el ejemplo de los nematicidas para ilustrar la aplicacin de la tcnica estadstica de contrastes ortogonales, la cual se puede resumir en los siguientes pasos: 1. Definir con anterioridad un conjunto de (t1) contrastes ortogonales. En este caso, como se tienen 6 tratamientos, los grados de libertad para los tratamientos es de 5, por lo tanto se pueden generar 5 subgrupos, los cuales se describen a seguir: 1. 2. 3. 4. 5. 2. Testigo (A) contra Nematicidas (B, C, D, E, F) Carbofuran (E) contra Oxamyl (B,C,D,F) Oxamyl aplicado al follaje (1.5 y 2.0 lts) contra Oxamyl aplicado al suelo (1.5 y 2.0 lts) Oxamyl 1.5 lt (aplicado al follaje) contra Oxamyl 2.0 lt (aplicado al suelo) Oxamyl 1.5 lt (aplicado al suelo) contra Oxamyl 2.0 lt (aplicado al suelo) Definir los coeficientes de los contrastes (Ci) Contrastes C1 C2 C3 C4 C5 3. A = B+C+D+E+F E = B+C+D+F B+D=C+F B=D C=F Tratamientos A 5 0 0 0 0 B 1 1 1 1 0 C 1 1 1 0 1 D 1 1 1 1 0 E 1 4 0 0 0 F 1 1 1 0 1
C
i =1
0 0 0 0 0
Recuerde que: dos contrastes con coeficientes Ci y Ci son ortogonales si el producto entre los coeficientes de los contrastes, dos a dos, es nulo, o sea, Ci y Ci son ortogonales s:
C C
i =1 i
i'
=0
Si se tienen t tratamientos, el conjunto de t1 contrastes ortogonales descomponen la suma de cuadrados debida a los tratamientos en t1 componentes independientes con un solo grado de libertad. Por tanto, las pruebas realizadas sobre los contrastes ortogonales son independientes. Ejemplo: A continuacin se evaluar la segunda condicin de ortogonalidad entre los contrastes 1 y 2.
80
0 1 1 [ 5 1 1 1 1 1] = (5 0) + (11) + (11) + (11) + (1 4) + (11) = 0 1 4 1
Para evaluar la ortogonalidad entre C1 y C3, se tiene:
0 1 1 [ 5 1 1 1 1 1] = (5 0) + (1 1) + (11) + (1 1) + (1 0) + (11) = 0 1 0 1
y as sucesivamente se va verificando la ortogonalidad por pares de contrastes: C1 y C4, C1 y C5, C2 y C3, C2 y C4,. . . , C4 y C5. 4. Plantear las subhiptesis. En este caso se trabajarn con los totales de cada tratamiento, identificados como: i, i=1,2,. . ., t
2 + 3 + 4 + 5 + 6 51 = 0 2 + 3 + 4 + 6 45 = 0 3 + 6 2 4 = 0 4 2 = 0 6 3 = 0
Obtener el valor numrico de los contrastes, la suma de cuadrados de contrastes (igual a cuadrado medio de contrastes) y evaluar las subhiptesis a travs de la prueba de F.
2 3 4 5 6 i 1 Yi 1756 1238 1507 1121 1145 1003 5 0 0 0 0 1 1 1 1 0 1 1 1 0 1 1 1 1 1 0 1 4 0 0 0 1 1 1 0 1
r Ci
i =1 t 2
C1 C2 C3 C4 C5
C Y
i =1
i i.
81
Clculos:
r Ci
i =1 t 2
Contraste 1: 5 (52 + 12 + 12 + 12 + 12 + 12) Contraste 2: 5 [02 + 12 + 12 + 12 +( 42 )+ 12] Contraste 3: 5 [02 + ( 12 ) +12 + ( 12 ) + 02 +12] Contraste 4: 5 [02 + ( 12 ) + 02 + 12 + 02+ 02] Contraste 5: 5 [02 + 02 + ( 12 ) + 02 + 02+ 12]
= = = = =
= 150 = 100 = 20 = 10 = 10
C Y
i =1
i i.
Suma de cuadrados de contrastes (SCc): como se tiene 1 grado de libertad por contraste, la suma de cuadrados de contraste es igual a cuadrado medio de contraste.
t CiYi. , SCc = CM c = i =1 t r Ci 2
i =1
Contraste 1:
SCc = CM c
( 2766 ) =
150
= 51005.04
F=
Valor crtico de F: 6.
Fc (1,20,0.05) = 4.35
Emitir las respectivas conclusiones Existe efecto diferenciado entre aplicar y no aplicar nematicidas. Se recomienda aplicar nematicidas ya que se reduce la cantidad de nematodos. Existen diferencias significativas en el efecto producido por el Oxamyl 1.5 lt y Oxamyl 2.0 lt ambos aplicados al suelo. Se recomienda la aplicacin de este ltimo, porque dej el menor total de nematodos vivos.
82
6.4.3 Obtencin de las sumas de cuadrados de contrastes en el Diseo Completamente al Azar (DCA)
DCA BALANCEADO
t CiYi. , SCc = i =1 t r Ci 2
i =1
t Ci = 0 i =1 t CC =0 i i ` i =1
DCA DESBALANCEADO
t Ci = 0 i =1 t rC C = 0 i i i ` i =1
t Ci = 0 i =1 t CC =0 i i ` i =1
t CiYi. SCc = i =1 t . rm Ci 2
i =1
83
6.4.4
1.
a) b)
Realice el anlisis de varianza, utilizando un nivel de significancia del 5%. Dada la naturaleza de los tratamientos, interesa realizar las siguientes comparaciones: i. ii. iii. iv. Tratamientos 1, 2 y 3 versus 4 y 5 (nitratos vs. no-nitratos). Tratamientos 1 y 2 versus 3. Tratamiento 1 versus 2. Tratamiento 4 versus 5.
Defina los coeficientes necesarios y realice estos contrastes. c) Son ortogonales estos contrastes? Si lo son, verifique que la sumatoria de sus sumas de
Realice el anlisis de varianza. Formule y pruebe contrastes ortogonales de inters e interprete sus resultados.
84
6.5 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO BLOQUES COMPLETOS AL AZAR, CON CONTRASTES ORTOGONALES
OPTIONS nodate nonumber; DATA contras; INPUT rep nema $ var; CARDS; 1 A 307 1 B 187 1 C 277 1 D 115 1 E 173 1 F 195 2 A 371 2 B 192 2 C 328 2 D 235 2 E 267 2 F 131 3 A 379 3 B 320 3 C 363 3 D 248 3 E 251 3 F 171 4 A 360 4 B 243 4 C 195 4 D 267 4 E 254 4 F 253 5 A 339 5 B 296 5 C 344 5 D 256 5 E 200 5 F 253 ; PROC glm; CLASS rep nema; MODEL var = rep nema/SS1; CONTRAST "T. Abs. vr otros" nema -5 1 1 1 1 1; CONTRAST "Carbofuran vs Oxamyl" nema 0 1 1 1 -4 1; CONTRAST "Oxamylf vs Oxamyls" nema 0 -1 1 -1 0 1; CONTRAST "Oxamyl1.5f vs Oxamyl2s" nema 0 -1 0 1 0 0; CONTRAST "Oxamyl1.5s vs Oxamyl2s" nema 0 0 -1 0 0 1; LSMEANS nema; RUN;
85
6.6 DISEO BLOQUES AL AZAR CON DATOS FALTANTES
Para ejemplificar esta situacin, se utilizarn los datos de contenido de protena (expresados en porcentaje), obtenidos en el experimento sobre amaranto realizado por Alfaro Villatoro (1985). CASO I: Supongamos que al realizar los anlisis de protena, la muestra correspondiente al corte a 25 das en el 4 bloque fue extraviada.
Cuadro de datos Bloque 1 2 3 4 5 6 7 8 Yi. a) 25 30.6 28.5 29.1 Y14 30.6 30.6 28.3 28.7 206.4 = T Edad al corte (das) 40 22.4 24.1 26.3 24.3 18.6 20.9 21.1 23.7 181.4 60 13.6 13.1 15.8 20.2 13.8 12.0 12.7 13.7 114.9 Y.j 66.6 65.7 71.2 44.5 = B 63.0 63.5 62.1 66.1 502.7 = S
Ho : i i= 1, 2, . . . / i = Ha: i i =1,2, . . . / i
b) Siendo: Yij i j ij c)
contenido de protena (%) en la i-sima poca de corte y el j-simo bloque. media general del contenido de protena. efecto de la i-sima poca de corte sobre el contenido de protena efecto del j-simo bloque sobre el contenido de protena. error asociado a la ij-sima unidad experimental.
d)
tT + rB S Yij = (t 1) (r 1)
Siendo que: t = T = r = B = S =
nmero de tratamientos total del tratamiento donde est el dato faltante. nmero de repeticiones total del bloque donde est el dato faltante gran total.
86
Para nuestro caso tenemos que:
e)
Anlisis de varianza
Los clculos para el anlisis de varianza se hacen como habitualmente, con la nica diferencia de que al total y al error experimental se le resta un grado de libertad. Incorporando la estimativa del dato faltante, tenemos que: T = 240.2 B = 78.3
2 2
W = q( t , glee , )
CMee r
Cuando una de las medias a comparar es la que no tuvo prdida de parcela, W se calcula as:
W = q( t , glee, )
2 1 t CMee + 2 r r (r 1)(t 1)
87
CASO II: Supongamos ahora que por alguna razn hace falta los datos correspondientes a las observaciones Y14 y Y35.
Cuadro de datos Bloque 1 2 3 4 5 6 7 8 Yi. 25 30.6 28.5 29.1 Y14 30.6 30.6 28.3 28.7 206.4 Edad al corte (das) 40 22.4 24.1 26.3 24.3 18.6 20.9 21.1 23.7 181.4 60 13.6 13.1 15.8 20.2 Y35 12.0 12.7 13.7 101.1 Y.j 66.6 65.7 71.2 44.5 49.2 63.5 62.1 66.1 488.9
Estimacin de los datos faltantes: Y14 y Y35. a.1) Se debe obtener una estimativa inicial para uno de los datos:
88
3(101.1) + 8(49.2) 522.71 Y35 = = 12.44 (3 1) (8 1)
a.5) T B S Se repite el paso (a.3) con Y35 =12.44 = = = 206.4 44.5 488.9 + 12.44 = 501.34
6.7
Con el objetivo de determinar la cantidad mnima efectiva del atrayente sinttico de machos (trimedlure) a fin de mejorar el mtodo de deteccin de adultos de la mosca del mediterrneo (Ceratitis capitata Wiedemann), se realiz un experimento utilizando trampas tipo Jackson con mechas de algodn como dispensadores. Los tratamientos consistieron en 0.8, 1.6, 2.6, 3.5 y 7.0 ml de trimedlure aplicados en mechas de tamao proporcional al volumen. Las trampas se distribuyeron en un rea con mosca del mediterrneo mediante un diseo en bloques al azar, colocando dos trampas en cada unidad experimental. En el cuadro 1 se reportan los datos del nmero total de insectos capturados en cada trampa, 16 das despus de su instalacin.
89
Cuadro 1. Nmero de machos de mosca del mediterrneo capturados bajo diferentes cantidades de atrayente sexual. Volumen de Trimedlure (ml) 0.8 Y1j. 1.6 Y2j. 2.6 Y3j. 3.5 Y4j. 7.0 Y5j. Y.j. Repeticin 1 55 19 74 60 31 91 62 51 113 82 58 140 99 104 203 621 2 25 13 38 15 60 75 39 19 58 68 24 92 12 44 56 319 3 44 22 66 35 11 46 14 40 54 28 48 76 72 101 173 415 4 63 13 76 19 25 44 14 20 34 27 44 71 88 222 310 535 5 32 15 47 35 27 62 39 71 110 95 11 106 30 64 94 419 6 100 81 181 122 51 173 122 66 188 121 101 222 117 59 176 940 7 83 39 122 60 29 89 77 41 118 34 97 131 129 11 140 600 8 9 10 110 80 190 111 162 273 93 207 300 273 119 392 128 104 232 1387 Yi.. 93 145 23 64 116 209 94 110 154 222 248 332 138 228 130 97 268 325 81 105 46 89 127 194 46 80 79 129 125 209 884 1269
(*) Los datos fueron tomados de la tesis de Ing Agr. Salazar Rodrguez, J.A. (1985)
1. Hiptesis Ho : i i = 1,2, . . . / i = Ha: i i = 1,2, . . . / i 2. Modelo Estadstico: Yijk = + i + j + ij + ijk Siendo: Yij i j ij ijk = = = = = = nmero de moscas machos de mosca del mediterrneo capturadas en el k-cuadro muestra en la i-sima poca de corte y el j-simo bloque. media general del nmero de moscas machos. efecto del i-simo volumen de trimedlure efecto del i-simo bloque sobre el nmero de moscas machos capturadas. error experimental asociado a la ij-sima unidad experimental. error de muestreo asociado a la ij-sima unidad experimental. i = 1, 2, . . . , t j = 1, 2, . . . , r k = 1,2, . . . , m
3. Supuestos ij ~ NID (0, 2) ijk ~ NID (0, n2) No existe interaccin bloque por poca de corte
90
4. ANDEVA a) b) Grados de libertad Total Dosis Bloques Error Experimental Error de Muestreo Suma de cuadrados = = = = = trm 1 t1 r1 (r 1) (t 1) tr(m 1) = = = = = (5)(10)(2) 1 51 10 1 (9) (4) (510)(2 1) = = = = = 99 4 9 36 50
FC =
SC total = Yijk 2 FC
i=1 j=1 k =1
SC trat. =
Y
i=1
i ..
rm
FC
SC bloques =
Y
i=1
. j.
tm
FC
SC ee =
Y
i=1 j =1
ij .
FC SCtrat SCbloques
(74 2 + 382 + . . . + 232 2 ) 545, 973.21 10, 096.74 122, 086.69 = 62,833.80 2
91
Resumen del anlisis de varianza Fuentes de variacin Dosis Bloques Error Experimental Error de Muestreo Total Grados de libertad 4 9 Suma de cuadrados 10,096.74 122,086.69 Cuadrado medios 2,524.185 Valor de F
36 50 99
1,745.39 1,667.496
6.8
PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO BLOQUES COMPLETOS AL AZAR, CON SUBMUESTREO
OPTIONS nodate nonumber; DATA dbam; INPUT dos rep nm; CARDS; 0.8 1 55 0.8 1 19 1.6 1 60 1.6 1 31 2.6 1 62 2.6 1 51 3.5 1 82 3.5 1 58 7 1 99 7 1 104 .. .. .. .. .. .. .. .. .. .. .. .. 0.8 10 110 0.8 10 80 1.6 10 111 1.6 10 162 2.6 10 93 2.6 10 207 3.5 10 273 3.5 10 119 7 10 128 7 10 104 ;
92
PROC glm; CLASS dos rep; /*con submuestreo*/ MODEL nm =rep dos rep*dos/SS1; TEST h=nm E=rep*dos; /*rep*dos representa el error experimental*/ RUN; PROC glm; TITLE "mancomunando errores";/*sin efecto de submuestreo*/ CLASS dos rep; MODEL nm=rep dos/ss1; RUN;
6.9
1.
EJERCICIOS PROPUESTOS
Se desea determinar el efecto de cuatro dietas sobre la ganancia de peso (kg.) postdestete de cabritos, durante una prueba de 200 das. Se utilizaron 32 cabritos en 16 corraletas (dos cabritos por corraleta) distribuyndose los tratamientos por bloques. Se midi la ganancia en peso durante la prueba para cada cabrito. Los resultados se presentan a continuacin: Bloque Dieta A B C D Cabrito 1 2 1 2 1 2 1 2 I 63.0 62.7 51.2 52.0 47.9 44.8 38.9 37.2 II 62.8 62.0 60.9 59.9 56.7 52.8 32.9 41.5 III 63.5 64.0 54.7 69.5 56.2 51.2 32.2 35.9 IV 740.3 72.5 54.3 55.6 54.3 54.8 34.9 33.8
Con esta informacin, efecte el anlisis de varianza y en caso de ser necesario, el anlisis post-ANDEVA. 2. En un experimento se evaluaron cinco atrayentes alimenticios en trampa Mcphail, para deteccin de mosca de la fruta en mango (Manguifera indica L.). Los tratamientos consistieron en: A. Vinagre de mango + melaza + agua B. Vinagre de pia + melaza + agua C. Melaza + agua D. Protena hidrolizada + agua E. Incaparina + agua. Las trampas se distribuyeron mediante un diseo en bloques al azar, colocando dos trampas en cada unidad experimental. El cuadro siguiente se reportan los datos del nmero total de insectos capturados por trampa.
93
Trats. A B C D E Repeticiones 4 5 90 30 200 70 60 30 15 10 20 30 25 25 15 40 35 80 80 30 200 65
1 95 105 55 20 55 25 75 55 80 50
2 35 55 25 15 15 60 45 20 15 45
3 60 101 44 20 40 10 25 55 70 105
7 120 20 83 40 65 25 75 45 100 15
Para los resultados del experimento anterior realice el ANLISIS DE VARIANZA. 3. Navarro (2003) evalu el efecto de cuatro lminas de riego sobre el rendimiento de Pltano (Musa paradisaca var. Currar) bajo las condiciones de la Aldea Los Encuentros, Coatepeque, Quetzaltenango. Como las unidades experimentales fueron demasiado grandes, se llev a cabo un submuestreo. Se tomaron cinco submuestras (1 submuestra = 1 planta de pltano). Una de las variables de respuesta medida fue el rendimiento del fruto de pltano (en kg/ha). Los resultados por tratamiento y bloque se presentan a continuacin: Tratamiento (lmina total aplicada, en mm) 345.63 Bloque Muestra 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 I 21950.11 47891.15 27437.64 21451.24 29931.97 30929.70 39909.29 34920.63 31927.43 29931.97 38911.56 41904.76 44399.09 42403.62 54875.28 45895.69 36018.14 29433.10 39909.209 35918.36 II 34421.76 26938.77 31927.43 29931.97 33922.90 28934.24 38911.56 45895.69 39916.09 39909.29 36417.23 37414.96 45895.69 31428.57 37015.80 41904.76 42902.49 31927.43 30929.70 44897.95 III 24943.31 19954.64 25941.04 37913.83 29931.97 34920.63 35918.36 27936.50 43900.22 27936.50 40408.16 44399.00 46394.55 34920.63 28435.37 50884.35 51882.08 39410.43 33922.90 35419.50 IV 36417.23 32426.30 32426.30 37913.83 33424.03 41904.76 36916.09 39909.29 40907.02 44897.95 43900.22 40408.16 45895.69 38412.69 40907.02 45396.82 35918.36 44399.09 39909.29 38911.56
626.08
830.28
1,003.20
Con esta informacin, efecte el anlisis de varianza y en caso de ser necesario, el anlisis post-ANDEVA.
94
6.10 EFICIENCIA DEL DISEO EN BLOQUES COMPLETOS AL AZAR
6.10.1 Introduccin
Este procedimiento es utilizado para verificar la eficiencia de este diseo con relacin al diseo completamente al azar, indicando si realmente era necesario la construccin de bloques, y est expresado por:
E=
siendo V1 y i . y i. correspondiente a la estimacin de la varianza de la diferencia de dos medias referentes al diseo completamente al azar, siendo:
( V (y
2
V1 y i. y i.
i.
y i.
) , )
V1 yi. yi. =
donde r es el nmero de repeticiones, y
2 CM Re siduo1 , r
CM Re siduo1 =
V2 yi. yi. =
donde r es el nmero de repeticiones, y
2 CM Re siduo 2 r
CM Re siduo 2 =
As, se obtiene el cociente:
E=
que es denominado de eficiencia relativa para el diseo en bloques completos al azar con relacin al diseo completamente al azar, se expresa en porcentaje, indicando cuanto de eficiencia el diseo en bloques completos al azar aument sobre el diseo completamente al azar.
95
BLOQUE MODALIDADES DE INTERCALAMIENTO Caa intercalada con girasol Z-1296 a 15 cm Caa en monocultivo Caa intercalada con girasol Z-1296 a 25 cm Caa intercalada con girasol J-1296 a 15 cm Caa intercalada con girasol J-1296 a 25 cm 1 87.62 115.00 105.48 111.91 105.71 2 106.20 126.19 121.90 105.71 100.95 3 78.81 105.12 130.95 98.10 114.76 4 72.38 110.48 110.00 83.33 123.80 5 85.71 97.81 83.81 141.43 96.67
4 4 16 24
2.07 0.43
3.01 3.01
0.132 0.782
Confrontando el valor obtenido para F con el valor de F crtico, no existe evidencia suficiente para rechazar la hiptesis nula a un nivel de =0.05 de significancia, concluyendo que las diferentes alternativas de intercalamiento no afectan la produccin de caa por hectrea, considerando las condiciones particulares edficas y climticas del sitio experimental.
Clculo de la Eficiencia:
Cuadrado medio del error experimental estimado para un diseo Completamente al Azar Cuadrado medio del error experimental estimado para un diseo Bloques Completos al Azar
E=
CM Re siduo1 = CM Re siduo 2
CM Re siduo1 =
Si por ejemplo, el valor de E hubiese sido de 102.05 %, se concluira que el diseo en bloques completos al azar increment 2.05% de eficiencia relativa al diseo completamente al azar.
96
CAPTULO 7
DISEO CUADRADO LATINO 7.1 INTRODUCCIN
Este diseo tambin es conocido como diseo con un factor y dos restricciones en la aleatorizacin. De esta forma se tiene que el control local, representado por los bloques, es organizado de dos maneras diferentes, siendo uno organizado en el sentido de las filas (o hileras) y otro organizado en el sentido de las columnas. En los experimentos que se realizan en el campo, este diseo es utilizado cuando existe necesidad de eliminar la heterogeneidad del suelo en dos direcciones perpendiculares, esto es, las filas en una direccin y las columnas en otra direccin. En general, un cuadrado latino para p factores, o sea, un cuadrado latino de tamao pp, es un cuadrado que contiene p fila y p columnas. Cada una de las p2 celdas contiene una de las p letras que corresponden a un tratamiento, y cada letra aparece una sola vez en cada fila y en cada columna, de tal manera que cualquier comparacin de tratamientos no se vea afectada por las diferencias existentes entre hileras o entre columnas. En este diseo el nmero de filas o hileras (h), el nmero de columnas (c) y el nmero de tratamientos (t) debe ser igual.
7.1.1 Criterios de bloqueo
Se tiene un experimento planeado en un diseo cuadrado latino, con cinco tratamientos, identificados como: A, B, C, D y E, por lo que, se deben tener cinco filas y cinco columnas. La localizacin de las parcelas en el rea experimental se muestra en el siguiente croquis:
Gradientes de heterogeneidad
Columna 1 Fila 1 A
Columna 2 B
Columna 3 C
Columna 4 D
Columna 5 E
Fila2
Fila 3
Fila 4
Fila 5
Nota: Recuerde que la estructura de distribucin de las unidades experimentales es conceptual y no necesariamente fsica. A continuacin se presentan algunos ejemplos, para ilustrar esta situacin.
97
Ejemplo 1 Se encuentran bajo estudio el efecto que tienen cinco reactivos distintos (A, B, C, D y E) sobre el tiempo de reaccin de un proceso qumico. Cada lote de material nuevo es lo suficientemente grande para permitir que slo se realicen cinco ensayos. Mas an, cada ensayo tarda aproximadamente una hora y media, por lo que solo pueden realizarse cinco ensayos por da. El investigador decide efectuar el experimento utilizando el diseo cuadrado latino, con el fin de controlar sistemticamente las variables lote de material y da La distribucin de los tratamientos se muestra a continuacin: Lote 1 2 3 4 5 1 A C B D E 2 B E A C D Da 3 D A C E B 4 C D E B A 5 E B D A C
Ejemplo 2 Un ingeniero industrial est investigando el efecto que tienen cuatro mtodos de ensamblaje (A, B, C y D) sobre el tiempo de ensamblaje de un componente para televisores a color. Se seleccionaron cuatro operadores para realizar el estudio. Por otra parte, el ingeniero sabe que cada mtodo de ensamblaje produce fatiga, por lo que el tiempo que se tarda en el ltimo ensamblaje puede ser mayor que en el primero, independientemente del mtodo. En otras palabras, se produce un patrn en el tiempo de ensamblaje. Para controlar esta posible fuente de variacin (variabilidad), el ingeniero utiliz el diseo cuadrado latino, que aparece a continuacin: Orden de montaje 1 2 3 4
7.1.2 Aleatorizacin
Operador 1 C B A D 2 D C B A 3 A D C B 4 B A D C
Cuadrado Latino Reducido: Es aquel en el cual la primera hilera y la primera columna estn dispuestas en orden alfabtico. Procedimiento para la aleatorizacin a. b. c. d. Seleccionar un cuadrado latino reducido Permutar hileras aleatoriamente Permutar columnas aleatoriamente Asignar los tratamientos a las letras al azar.
Los incisos b,c,d se pueden realizar usando una tabla de nmeros aleatorios, o bien a travs de un simple sorteo. A continuacin se muestra un ejemplo de aleatorizacin para un cuadrado latino de tamao 5 5
98
a) Cuadrado latino reducido F1 A F2 B F3 C F4 D F5 E B C D E A C D E A B D E A B C E A B C D b) Aleatorizar filas C1 F3 C F1 A F5 E F2 B F4 D C2 D B A C E C3 E C B D A C4 A D C E B C5 B E D A C c) Aleatorizar columnas C4 A D C E B C1 C A E B D C3 E C B D A C2 D B A C E C5 B E D A C
7.2
ANLISIS ESTADSTICO
A continuacin se presentan una tabla de datos para un cuadrado latino 4 x 4: Columnas Filas 1 2 3 4 Total columnas Y.j. 1 Y11k Y21k Y31k Y41k Y. 1 . 2 Y12k Y22k Y32k Y42k Y. 2 . 3 Y13k Y23k Y33k Y43k Y. 3 . 4 Y14k Y24k Y34k Y44k Y. 4 . Total filas Yi.. Y1. . Y2. . Y3. . Y4. . Y. . . (Gran total)
siendo k = 1,2,3,4.
La tabla anterior se obtiene sin modificar el croquis de campo. Puede generarse una tabla adicional para los tratamientos, sumando todas las veces que se repiti cada tratamiento, obteniendo as el respectivo total (Y. . k), como se indica a continuacin: Tratamientos 1 Yij1 Yij1 Yij1 Yij1 Total Tratamientos Y. . k Media Tratamientos Y. . 1 2 Yij2 Yij2 Yij2 Yij2 Y. . 2 3 Yij3 Yij3 Yij3 Yij3 Y. . 3 4 Yij4 Yij4 Yij4 Yij4 Y. . 4
y..1
y..2
y..3
y..4
99
7.2.1 Modelo Estadstico Matemtico
Yijk = + Fi + Cj + k + ijk
i = 1,2,3, . . . t j = 1,2,3, . . . t k =1,2,3, . . . t siendo que: Yijk Fi Cj = = = Valor observado correspondiente al k simo tratamiento en la i-sima fila con la j-sima columna. Media general de la variable de respuesta. Efecto de la i - sima fila en la variable dependiente y mide la separacin de la media i.. en relacin a la media , esto es: Fi =i.. ; i..= media poblacional de la i-sima lnea. Efecto de la j - sima columna en la variable dependiente y mide la separacin de la media .j. en relacin a la media , esto es: Cj = .j. ; .j. = media poblacional de la j-sima columna. Efecto del k - simo tratamiento en la variable dependiente y mide la separacin de la media ..k en relacin a la media , esto es: simo tratamiento. h =c = t
ijk
7.2.2
Supuestos
ijk ~ NID (0, 2) No existe interaccin entre filas y tratamientos. No existe interaccin entre columnas y tratamientos.
7.2.3
Hiptesis
Ho: = i Ha: i
(Todos los tratamientos producen el mismo efecto) para al menos un i; i = 1,2, . . . t. (Al menos uno de los tratamientos produce efectos distintos)
100
7.2.4 Tabla de Anlisis de Varianza
FV Tratamientos
GL t1
SC
CM
Valor de F CMtrat/CMee
Y
k =1
2 .. k
Y..2 . t2
SCtrat/GLtrat
Filas
t1
i =1
Y i2 .. t
Y ...2 t2
Columnas
t1
j =1
Y . 2. j t
Y ...2 t2
SCee/GLee
(t 1) (t 2) t2 1
Y
i =1 j =1 k =1
2 ijk
Y. .2. t2
Regla de Decisin
s Valor de F Valor crtico de F (gl trat; gl error; ) s Valor de F < Valor crtico de F (gl trat; gl error; )
En un experimento sobre evaluacin de variedades de caa de azcar realizado en Brasil, citado por Gomes,FP (2000), fueron usadas cinco variedades: Co-290 (A), Co-421 (B), Co-419 (C), POJ-2878 (D) y CP-3613 (E), dispuestas en un cuadrado latino de tamao 55. Las producciones de caa en kilogramos por parcela son dadas en la tabla siguiente: D 432 C 724 E 489 B 494 A 515 2654 A 518 E 478 B 384 D 500 C 660 2540 B 458 A 524 C 556 E 313 D 438 2289 C 583 B 550 D 297 A 486 E 394 2310 E 331 D 400 A 420 C 501 B 318 1970 Yi.. 2322 2676 2146 2294 2325 11763
Y.j.
101
Cuadro Auxiliar Total Tratamientos Y. . k 2463 2204 3024 2067 2005 11763 Media Tratamientos
Variedad Co-290 (A) Co-421 (B) Co-419 (C) POJ-2878 (D) CP-3613 (E)
Y.. k
492.6 440.8 604.8 413.4 401.0 2352.6
SCtrats =
(2, 463) 2 + . . . + (2, 005) 2 11, 7632 = 137, 488 5 25 (2,322) 2 + . . . + (2,325) 2 11, 7632 = 30, 480 5 25
SCfilas =
SCerror = 257, 724 137, 488 30, 480 55, 640 = 34,116
Resumen del anlisis de varianza
Grados de libertad 4 4 4 12 24
Valor de F 12.09*
2,843
CV =
De acuerdo con los resultados del anlisis de varianza, se concluye que las variedades presentan efectos diferenciados en cuanto a la produccin de caa de azcar, por lo tanto se recomienda efectuar el respectivo anlisis post-andeva.
102
Prueba de comparacin mltiple de medias de acuerdo al criterio de Tukey
1.
Matriz de diferencias Media 401.00 413.40 440.80 492.60 604.80 Co-419 604.80 203.80 * 191.40 * 164.0 * 112.20 * Co-290 492.60 91.60 79.20 51.80 Co-421 440.80 39.80 27.40 POJ-2878 413.40 12.40 CP-3613 401.00
W = q( t , glee , )
3.
CMee t
W = 4.51
2843 = 107.54 5
Presentacin de los resultados Variedad Co-419 Co-290 Co-421 POJ-2878 CP-3613 Media 604.80 492.60 440.80 413.40 401.00 Grupo Tukey a b b b b
7.3
7.3.1
Cuando se tiene una unidad experimental perdida se utiliza la ecuacin que se presenta a continuacin:
Yijk =
Siendo: t
t ( H + C + T ) 2S (t 1) (t 2)
= nmero de tratamientos
H = total de valores observados para la hilera que contiene la unidad faltante C = total de valores observados para la columna que contiene la unidad faltante T S = total del tratamiento que contiene la unidad faltante = gran total de valores observados.
103
Luego se efecta el ANDEVA, restando uno (1) a los grados de libertad del total y del error experimental. Cuando se efectan las comparaciones de medias de tratamientos se deben observar las mismas precauciones mencionadas para el diseo en bloques al azar; es decir, que cuando se est comparando el tratamiento al cual le estimamos el valor se deber usar el error estndar siguiente:
Sx =
2 1 t CME + 2 t (t 1) (t 2)
7.3.2
Si los valores perdidos son dos o ms usar el mtodo iterativo (descrito en bloques al azar) empleando las siguientes ecuaciones: 1. Para calcular el primero de los datos faltantes
Y i ,, + Y . j . + Y ..k a= 3
2. Para calcular el segundo dato faltante y continuar con el proceso iterativo:
Yijk =
t ( H + C + T ) 2S (t 1) (t 2)
Luego se efecta el ANDEVA, restando dos (2) a los grados de libertad del total y del error experimental.
7.3.3 Ejercicio de aplicacin
Los datos a seguir se refieren a la produccin de yuca (kg) en un experimento citado por Nogueira (1997) que involucr cuatro sistemas de plantacin de estacas de yuca, conducido mediante un diseo cuadrado latino de tamao 44. Los tratamientos evaluados fueron: A. B. C. D. Estacas con 0.30 m de largo plantadas con el sistema tradicional (o comn). Estacas con 0.30 m de largo plantadas con 0.15 m enterradas e inclinadas. Estacas con 0.30 m de largo plantadas con 0.15 m enterradas, inclinadas y en camelln. Estacas con 0.30 m de largo plantadas en forma horizontal en la superficie del camelln. Columnas
A B D E
Filas 1 2 3 4
D A C B
B C A D
104
b) Con los siguientes resultados, estime los datos faltantes (tratamiento A en la fila 1 y columna 1 y el tratamiento C en la fila 2 y columna 3) y realice el anlisis de varianza
Filas 1 2 3 4
A B D E
D A C B
7.4
OPTIONS nodate nonumber; DATA dcl; INPUT var $ fil col prod; CARDS; D 1 1 432 C 2 1 724 E 3 1 489 B 4 1 494 A 5 1 515 A 1 2 518 E 2 2 478 B 3 2 384 D 4 2 500 C 5 2 660 B 1 3 458 A 2 3 524 C 3 3 556 E 4 3 313 D 5 3 438 C 1 4 583 B 2 4 550 D 3 4 297 A 4 4 486 E 5 4 394 E 1 5 331 D 2 5 400 A 3 5 420 C 4 5 501 B 5 5 318 ; PROC anova; CLASS var fil col; MODEL prod= var fil col; MEANS var/TUKEY; RUN;
105
7.5 DISEO CUADRADO LATINO (DCL) CON SUBMUESTREO
En un experimento con la variedad de tomate Imperial Rojo, se evaluaron cuatro distanciamientos de siembra: A. B. 0.6 metros 0.8 metros C. D. 1.0 metros 1.2 metros,
determinando su efecto sobre el rendimiento de frutos (expresado en kilogramos por parcela neta). Los resultados se muestran en el siguiente croquis de campo: Filas (i) A Yijk. C Yijk. D Yijk. B Yijk. Y.j.. 1 15 14 29 19 15 34 12 14 26 17 13 30 119 Columnas (j) 2 3 18 D 15 17 15 35 30 13 B 12 13 16 26 28 16 C 18 15 16 31 34 20 A 13 16 15 36 28 128 120 4 14 13 27 17 16 33 16 15 31 13 12 25 116 Yi...
B D A C
C A B D
Cuadro auxiliar Distanciamiento (A) (B) (C) (D) Total Tratamientos Y. . k 121 124 131 107 Media Tratamientos
Y.. k
15.13 15.50 16.38 13.38
El modelo estadstico matemtico asociado a este diseo es: Yijkl = + Fi + Cj + k + ijk + i = 1,2,3, . . . t j = 1,2,3, . . . t k =1,2,3, . . . t l = 1,2,3,. . . m (muestras) h =c = t
ijkl
106
siendo que: Yijkl Fi Cj = = = = = = = valor de la variable de respuesta correspondiente a la l-sima muestra sobre la unidad experimental que lleva el tratamiento k en la fila i y columna j. Media general de la variable de respuesta. Efecto de la i - sima fila Efecto de la j - sima columna Efecto del k - simo tratamiento Error de muestreo dentro de la ijk-sima unidad experimental. Error experimental asociado a la ijk - sima unidad experimental
k ijkl
ijk
Supuestos
ijk ~ NID (0, 2) No existe interaccin entre filas y tratamientos. No existe interaccin entre columnas y tratamientos. ijkl ~ NID (0, m2)
Hiptesis
Ho: = i Ha: i (Todos los tratamientos producen el mismo efecto) para al menos un i; i = 1,2, . . . t. (Al menos uno de los tratamientos produce efectos distintos)
Anlisis de Varianza
El cuadro resumen del anlisis de varianza se presenta en la tabla siguiente:
107
FV GL SC CM
Tratamientos
t1
k =1
Y . .2k .
tm
Filas t1
SCtrat/GLtrat
i=1
2 i ...
tm
t
Columnas
t1
j =1
Y . 2.. j
Y . .2. . t2m
tm
(t 1) (t 2)
SCee/GLee
t (m 1)
Y
i =1 j =1 k =1 l =1
2 ijkl
i =1 j =1 k =1
SCem/GLem
Total
t2m 1
i =1 j =1
2 Yijkl k =1
2 Y....
t 2m
SCtrats =
(121) 2 + (124) 2 + (131) 2 + (107) 2 4832 2 = 38.09 (4)(2) (4) (2) (121) 2 + (121) 2 + (122) 2 + (119) 2 4832 = 0.59 (4)(2) 32 (119) 2 + (128) 2 + (120) 2 + (116) 2 4832 = 9.84 (4)(2) 32
SCfilas =
SCcolumnas =
292 + 352 + . . . + 252 SCem = 7421 = 41.50 2 SCee = 130.72 (0.59 + 9.84 + 38.09 + 41.50) = 40.70
108
Solucin
GL 3 3 3
CM 12.70
Valor de F F2 = 3.40 *
6 16 31
6.78 2.59
F1 = 2.62 NS
F1 =
Conclusin:
Como el valor de la estadstica F1 es menor que el valor crtico de F, entonces, se procede a calcular el valor de la estadstica F2, con el valor de cuadrado medio de tratamientos (CMtrat) y el cuadrado medio del error ponderado (CMep) de la siguiente forma:
CMep =
F2 =
CMtrat 12.70 = = 3.40 , que se compara con el valor crtico de F que est en funcin de los CMep 3.74
grados de libertad de tratamientos, grados de libertad del error ponderado y un determinado nivel de significancia y cuyo valor es Fcrtica(3,22,0.05) = 3.05 Como F2 F crtica(3,22,0.05) , se concluye que los distanciamientos de siembra evaluados producen diferentes efectos en la produccin de frutos de tomate. Por lo que se recomienda efectuar un anlisis post-andeva.
109
7.6 PROGRAMA EN SAS PARA EL ANLISIS DE UN EXPERIMENTO EN UN DISEO CUADRADO LATINO CON SUBMUESTREO
OPTIONS nodate nonumber; DATA dclsub; INPUT trat $ fil col rend; CARDS; A 1 1 15 A 1 1 14 C 2 1 19 C 2 1 15 D 3 1 12 D 3 1 14 B 4 1 17 B 4 1 13 B 1 2 18 B 1 2 17 D 2 2 13 D 2 2 13 A 3 2 16 A 3 2 15 C 4 2 20 C 4 2 16 D 1 3 15 D 1 3 15 B 2 3 12 B 2 3 16 C 3 3 18 C 3 3 16 A 4 3 13 A 4 3 15 C 1 4 14 C 1 4 13 A 2 4 17 A 2 4 16 B 3 4 16 B 3 4 15 D 4 4 13 D 4 4 12 ; PROC anova; TITLE "DCL con submuestreo"; CLASS trat fil col;/*con submuestreo*/ MODEL rend=trat fil col trat(fil*col);/*trat(fil*col)=error experimental*/ TEST h=trat e=trat(fil*col); RUN; PROC anova; TITLE "mancomunando errores"; /*sin efecto de submuestreo*/ CLASS trat fil col; MODEL rend = trat fil col; RUN;
110
7.7
1.
EJERCICIOS PROPUESTOS
Los siguientes datos se refieren al promedio de produccin de leche durante un mes de experimento, de vacas Holstein altas productoras, las cuales fueron alimentadas con una dieta en la cual se vari la cantidad de niacina (0, 4, 8, 12 y 16 g/kg de materia seca). Los animales fueron agrupados por edades (filas) y condicin corporal (columnas) al inicio del experimento, la cual fue evaluada en escala de 1 a 10. Edades: Condicin corporal: Tratamientos: 26, 40, 43, 58 y 60 meses de edad. >9, 8, 7, 6 y 5. A = 0, B = 4, C= 8, D= 12 y E= 16 g/kg de MS
La produccin de leche agrupada por filas, columnas y tratamientos se muestra a continuacin: (D) 732 (A) 728 (E) 1010 (C) 900 (B) 980 (E) 854 (B) 730 (A) 750 (D) 1100 (C) 970 Columnas (C) 641 (D) 854 (B) 860 (A) 860 (E) 1250 (B) 610 (C) 762 (D) 720 (E) 1200 (A) 930 (A) 549 (E) 976 (C) 1000 (B) 920 (D) 1070
Filas
Realice el anlisis de varianza, incluyendo una prueba de Tukey si fuese necesario. Indique sus conclusiones claramente. 2. Se probaron 4 raciones alimenticias para pollos, criados en jaula tipo batera de 4 pisos (filas) y 4 casilleros (columnas). La variable analizada fue: peso del pollo (kg.) a las 8 semanas de edad
Casilleros Pisos 1 2 3 4 1 1.40(A) 1.35(B) 1.38(C) 1.39(D) 2 1.38(B) 1.28(A) 1.40(D) 1.39(C) 3 1.40(C) 1.45(D) 1.42(B) 1.40(A) 4 1.60(D) 1.62(C) 1.63(A) 1.60(B)
a) Presente el Modelo Aditivo Lineal b) Realice la Prueba de Hiptesis correspondiente. Use =0.05 c) Realice la Prueba de Tukey para comparar si existe diferencias entre los tratamientos en estudio. Use =0.05 3. En un ensayo de alimentacin de cerdos reportado por Gomes, FP Gomes (2000), se us un diseo cuadrado latino 4 x 4, con los resultados siguientes, referentes a la ganancia en peso, expresada en kilogramos, al final de 252 das.
Filas Camada 1 Camada 2 Camada 3 Camada 4 .1 Columnas 2 3 B=108.6 C=108.9 D=96.5 A =77.9 A=94.9 D=116.9 C=114.1 B=118.7
111
Los tratamientos fueron: A: Castracin a los 56 das de edad; B: Animales enteros; C: Castracin a los 7 das de edad; D: Castracin a los 21 das. Las columnas tenan como objetivo controlar la variacin de peso de los lechones dentro de cada camada. Con esta informacin analice los datos y compare las medias de los tratamientos. 4. Veras, E. (1992) realiz el trabajo de tesis de grado Evaluacin de dos atrayentes sexuales y tres mezclas de stos en captura de mosca de la fruta del mediterrneo (Ceratitis capitata Wied). Los tratamientos evaluados fueron: Tratamiento T1 T2 T3 T4 T5 Descripcin Trimedlure Capilure 50% Capilure + 50% Trimedlure 75% Capilure + 25% Trimedlure 25% Capilure + 75% Trimedlure
La variable de respuesta evaluada fue: nmero de moscas atrapadas por tratamiento. Los resultados para la semana 16 se presentan a continuacin: Fila
1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5
Columna
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Tratamiento
5 3 2 1 4 4 5 3 2 1 1 4 5 3 2 2 1 4 5 3 3 2 1 4 5
a) b) c)
Verifique los supuestos de normalidad y de homogeneidad de varianzas; y en caso de ser necesario, realice la transformacin ms adecuada. Realice el ANOVA y concluya. De ser necesario aplique una prueba de comparacin mltiple de medias.
112
CAPTULO 8
EXPERIMENTOS FACTORIALES 8.1 INTRODUCCIN
Se denominan experimentos factoriales a aquellos experimentos en los que se estudia simultneamente el efecto de dos o ms factores, y donde los tratamientos se forman por la combinacin de los diferentes niveles de cada uno de los factores. Los experimentos factoriales en si no constituyen un diseo experimental si no que ellos deben ser llevados en cualquiera de los diseos tal como: completamente al azar, bloques al azar, cuadrado latino, etc. Pueden considerarse dos tipos fundamentales de experimentos factoriales: a) factorial completo, el cual ensaya todas las posibles combinaciones de tratamientos que se generan con los distintos niveles de los factores en estudio; b) factorial fraccionado, el cual ensaya solo alguna de las posibles combinaciones de tratamientos que pueden generarse. Dentro de los factoriales completos pueden distinguirse los factoriales simtricos en donde cada factor presenta igual nmero de niveles, pudindose representar mediante la notacin pn, siendo p el nmero de niveles de los factores y n el nmero de factores, ejemplo: 32 indica que tenemos 2 factores con 3 niveles cada uno, y en total tendremos 9 tratamientos. Y los asimtricos en donde cada factor presenta desigual nmero de niveles, pudiendo representarse como p x q, siendo p y q los niveles del factor A y del factor B, respectivamente.
8.1.1 Conceptos fundamentales
a) Factor: Un factor es cada una de las variables independientes, cuyo efecto se est interesado en evaluar. Generalmente se denotan con letras maysculas (A,B, . . . Z o con las iniciales de los factores a probar). Los factores pueden ser cuantitativos (cantidad de fertilizante, de insecticida, una hormona, de tiempo, temperatura, concentracin, etc.) o cualitativos (variedades, mtodos de aplicacin, marcas de producto, razas, procedencia, etc.). b) Nivel: Un nivel de un factor es un cada uno de los valores o modalidades que constituyen un factor. Si el factor es cuantitativo, los niveles estn formados por las cantidades o dosis del mismo; si el factor es cualitativo los niveles los constituyen las manifestaciones del mismo o los tratamientos dentro del factor (nombres de las variedades, diferentes mtodos de aplicacin, las diferentes marcas del producto, las diferentes razas, etc.). Por lo general se identifican con letras minsculas (a1, a2, . . . ; b1, b2, . . .; v1, v2, . . .; etc.) c) Efecto de un factor: El efecto de un factor se define como el cambio en la respuesta producida por un cambio en el nivel del factor. Con frecuencia, ste se conoce como: EFECTO PRINCIPAL, porque se refiere a los factores de inters primordial del experimento. Por ejemplo, considere los datos de la siguiente tabla, referentes a un experimento factorial 2 2.
113
El efecto principal del factor A podra interpretarse como la diferencia entre la respuesta promedio en el primero y segundo nivel de ese factor. Numricamente,
A=
40 + 52 20 + 30 = 21 2 2
Esto es, incrementar el factor A del nivel 1 al nivel 2 produce un cambio en la respuesta promedio de 21 unidades. De forma anloga, el efecto principal de B es:
B=
30 + 52 20 + 40 = 11 2 2
d) Efecto de la interaccin: en algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de los otros factores. Cuando esto ocurre existe una interaccin entre los factores. Por ejemplo, los siguientes datos referentes a un experimento factorial 22 con interaccin:
En el primer nivel del factor B, el efecto de A es: A = 50 20 = 30, mientras que en el segundo nivel de B, el efecto de A es: A = 12 40 = 28. Puede observarse que existe una interaccin entre los factores A y B porque el efecto de A depende del nivel seleccionado de B. Estas ideas pueden ilustrarse grficamente. En la Figura 1 se muestra una grfica de la respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos niveles del factor B.
60 50 Respuesta 40 30 20 10 0
B1 B2
A1
Factor A
A2
Figura 1 Ejemplo de un experimento bifactorial sin interaccin Note que las rectas B1 y B2 son aproximadamente paralelas. Esto indica que no hay interaccin entre los factores A y B. De igual forma, en la Figura 2 se presenta una grfica de la respuesta de los datos de la Tabla 2. En este caso se ve que las rectas B1 y B2 no son paralelas. Esto muestra que existe una interaccin entre A y B.
114
60 50 40 Respuesta 30 20 10 0
B1
B2
A1
A2
Con frecuencia estas grficas son muy tiles para interpretar interacciones significativas, sin embargo, no debe ser la nica tcnica para analizar los datos, porque su interpretacin es subjetiva y su apariencia, a menudo, es engaosa.
8.1.2 Ventajas
a. Se logra una gran eficiencia en el uso de los recursos experimentales disponibles. b. Se obtiene informacin respecto a las diversas interacciones. c. Los resultados experimentales son aplicables a un rango de condiciones ms amplio debido a las combinaciones de los diversos factores en un solo experimento. Los resultados son de naturaleza ms comprensiva. d. Los experimentos factoriales son ms eficientes que los experimentos simples.
8.1.3 Inconvenientes
a. El resultado del experimento y el anlisis estadstico resultante son ms complejos. b. Con un gran nmero de combinaciones de tratamientos, la relacin de unidades experimentales homogneas es ms difcil. c. Convencidos de que algunas de las combinaciones de tratamientos pueden ser de muy poco o ningn inters, algunos de los recursos experimentales pueden ser malgastados. d. El nmero de tratamientos o combinaciones aumentan rpidamente.
8.1.4 Arreglos
Los tipos de arreglos ms utilizados en experimentos factoriales son: a) Combinatorio c) Parcelas subdivididas Parcelas divididas d) Franjas divididas. b)
115
En el caso de experimentos trifactoriales, por ejemplo, se puede utilizar el arreglo en parcelas divididas. Considerando lo siguiente: e) Ubicar un factor en la parcela grande, y los otros dos factores en arreglo combinatorio en la parcela pequea. f) Ubicar dos factores en arreglo combinatorio en la parcela grande, y el restante factor en la parcela pequea.
8.2
8.2.1
El modelo que se describe corresponde a un experimento bifactorial, en arreglo combinatorio dispuesto en un diseo en bloques completos al azar, debido a que es el ms usado. i = 1,2, . . . , a j = 1,2, . . . , b k =1,2, . . . , r
Variable de respuesta observada o medida en la ijk - sima unidad experimental Media general Efecto del i - simo nivel del factor "A" Efecto del j - simo nivel del factor "B"
i j
()ij = Efecto de la interaccin entre el i - simo nivel del factor "A" y el j - simo nivel del factor
"B"
k
ijk
8.2.2
= =
Efecto del k - simo bloque Error experimental asociado a la ijk - sima unidad experimental
Hiptesis
Ho: i = 0, para todo i, contra, Ha: i 0, para algn i; Ho: j = 0, para todo j, contra, Ha: j 0, para algn j; Ho: ()ij = 0, para todo i y j, contra, Ha: ()ij 0, para algn i y j.
Ho: 1.. = . . . = a.., contra Ha: por lo menos i.. i.. para ii; Ho: .1.= . . . = .b., contra Ha: por lo menos .j. .j. para jj; Ho: ij. i.. .j.+ = 0, contra Ha: ij. i.. .j.+ 0 para algn i y j.
116
8.2.3
Anlisis de Varianza
Tabla de Datos para un experimento factorial 3 * 2 en bloques al azar. A1 Bloques I II III . r Yij. B1 Y111 Y112 . . Y11r Y11. B2 Y121 Y122 . . Y12r Y12. B1 Y211 Y212 . . Y21r Y21. A2 B2 Y221 Y222 . . Y22r Y22. B1 Y311 Y312 . . Y31r Y31. A3 B2 Y321 Y322 . . Y32r Y32. Y..k Y. . 1 Y. . 2 . . Y.. r Y...
Y..k . = Total de bloques Yij. = Total de las interacciones Yi.. . = Total del factor "A"
117
Bloque
r1
a1
SCA/glA
CMA/CMee
b1
(a 1) (b 1)
Y. 2. j
j =1
Y2 ... ra abr
SCB/glB
CMB/CMee
AB
i =1 j=1
2 Yij.
SCAB/glAB
CMAB/CMee
Error
ab 1 ( r 1)
Scee/glee
abr 1
Total
i =1 j=1
2 Yijk k =1
2 Y... abr
Los valores de F que aparecen en la tabla sirven para probar hiptesis de la siguiente manera: 1. Para el factor A F = CMA/CMee ; Fcrtica ( a 1; 2. Para el factor B F = CMB/CMee ; Fcrtica ( b 1; 3. Para la interaccin AB F = CMAB/CMee ; Fcrtica
Regla de Decisin
( a 1, b 1 ; glee ; ) glee ; ) glee ; )
118
8.2.4
Anlisis post-ANDEVA
Para efectuar la prueba de Tukey o SNK seguir el procedimiento anteriormente descrito, considerando los comparadores de la manera siguiente: 1. Para el factor A
Wp = q (a ,glee, ) Sx , siendo
Sx =
q a CMee r b
CMee rb
= = = = = = valor obtenido en la tabla de Tukey niveles del factor A. nivel de significancia cuadrado medio del error nmero de repeticiones nmero de niveles del factor B.
2. Para el factor B
Wp = q (b,glee, ) Sx , siendo: Sx =
3. Para la interaccin AB
CMee ra
Wp = q (ab,glee, ) Sx , siendo: Sx =
CMee r
A qu factor o interaccin debe aplicarle la prueba de Tukey? Consulte la siguiente tabla: Efecto A B AB Efectuar la prueba a:
* NS
8.2.5
Ejemplo de Aplicacin
Se estudi el efecto de diferentes dosis de fertilizante fosforado sobre dos tipos de planta de haba (Vicia faba). Se pens que los tipos de planta bien podan responder en forma diferente a la fertilizacin, as que se decidi llevar a cabo un experimento factorial con dos factores:
119
Factor A. Tipo de Planta B. Dsis de Fsforo 1 Corto 0 kg/ha P2O5 Nivel 2 Alto 25 kg/ha P2O5
3 50 kg/ha P2O5
El experimento se llev a cabo en un diseo en bloques completos al azar en arreglo combinatorio, con cuatro repeticiones. Los resultados (produccin en kg/ha) se aprecian en el cuadro 1. Cuadro 1: Produccin (kg/ha) de dos tipos de haba bajo diferentes niveles de fertilizacin de fsforo. Tipo de Planta Dosis de Fsforo 0 Corto 25 50 0 Largo 25 50 Y..k
Solucin:
Bloques I 11.5 17.1 18.2 11.0 8.3 15.7 81.8 II 13.6 17.6 17.6 11.2 10.5 16.7 87.2 III 14.3 17.6 18.2 12.1 9.1 16.6 87.9 Y... = 351.30 IV 14.5 18.1 18.9 12.6 12.8 17.5 94.4
Y ... = 14.64
Tabla adicional:
Tipo de planta A1 53.90 70.40 72.90 197.20 16.43 A2 46.90 40.70 66.50 154.10 12.84
Y. j.
12.60 13.89 17.43
Y i..
Y i.. =
Yi..
i =1
rb
Y. j. =
Y. j.
j=1
ra
Y... =
Y
i =1 j=1
ij.
120
197.22 + 154.102 351.302 = 77.40 (4)(3) (4)(3)(2) 100.82 + 111.102 + 139.402 351.302 = 99.87 (4)(2) (4)(3)(2) 53.92 + 70.402 + . . . + 66.502 351.302 77.40 99.87 = 44.10 4 (4)(3)(2) 81.802 + 87.202 + 87.902 + 94.402 351.302 = 13.32 (3)(2) (4)(3)(2) 351.302 = 243.38 (4)(3)(2)
SC A =
SC B =
SC AB =
SC BLOQUES =
Grados de libertad 3 1 2 2
Cuadrados medios
Valor de F
F crtica
15 23
8.68 243.38
0.58
CV =
Prueba de comparacin mltiple de medias de acuerdo con el criterio de Tukey, para la interaccin a) Medias de las interacciones
121
Y ij.
13.48 17.60 18.23 11.73 10.18 16.63
Wp = q (6,15,0.05)
0.58 4
4.59 0.3807 =
1.7474
c) Matriz de diferencias Interaccin A2B2 A2B1 A1B1 A2B3 A1B2 A1B3 Media 10.18 11.73 13.48 16.63 17.6 18.23 A1B3 18.23 8.05* 6.50* 4.75* 1.60 0.63 A1B2 17.6 7.42* 5.87* 4.12* 0.97 A2B3 16.63 6.45* 4.9* 3.15* A1B1 13.48 3.30* 1.75* A2B1 11.73 1.55 A2B2 10.18
d) Presentacin de resultados Produccin promedio (kg/ha) de haba 18.23 17.60 16.63 13.48 11.73 10.18
Interaccin (A1B3) Corto*50 kg/ha (A1B2) Corto*25 kg/ha (A2B3) Alto*50 kg/ha (A1B1) Corto*0 kg/ha (A2B1) Alto*0 kg/ha (A2B2) Alto*25 kg/ha
Grupo Tukey A A A B C C
122
8.2.6 Programa en SAS para un experimento bifactorial con arreglo combinatorio
OPTIONS nodate nonumber; DATA combin; INPUT bloque planta $ fosforo rend; CARDS; 1 corto 0 11.5 1 corto 25 17.1 1 corto 50 18.2 1 largo 0 11 1 largo 25 8.3 1 largo 50 15.7 2 corto 0 13.6 2 corto 25 17.6 2 corto 50 17.6 2 largo 0 11.5 2 largo 25 10.5 2 largo 50 16.7 3 corto 0 14.3 3 corto 25 17.6 3 corto 50 18.2 3 largo 0 12.1 3 largo 25 9.1 3 largo 50 16.6 4 corto 0 14.5 4 corto 25 18.1 4 corto 50 18.9 4 largo 0 12.6 4 largo 25 12.8 4 largo 50 17.5 ; PROC GLM; CLASS bloque planta fosforo; MODEL rend=bloque planta fosforo planta*fosforo/SS1; LSMEANS planta*fosforo/PDIFF; RUN;
****************************
Dado que en este anlisis la interaccin entre tipo de planta y dosis de fsforo es significativa, podemos estudiar si hay diferencia entre las dosis de fsforo para cada tipo de planta (con Tukey): PROC GLM; CLASS bloque planta fosforo; MODEL rend=bloque planta fosforo planta*fosforo/SS1; LSMEANS planta*fosforo/slice=planta adjust=tukey PDIFF=all; RUN;
123
8.2.7 Ejercicios propuestos
1.
Se realiz un ensayo en el departamento de Chimaltenango en el cual se evalo la respuesta del rendimiento del cultivo de haba (Vicia faba) frente a cuatro niveles de Nitrgeno y cuatro niveles de Fsforo, en el rea exista una gradiente de variabilidad por lo cual se utiliz el diseo de bloques al azar. Llos resultados se presentan en los siguientes cuadros: Niveles de los factores evaluados
FACTOR Nitrgeno NIVEL (kg/ha) 0 50 100 150 0 50 100 150 CODIGO 0 1 2 3 0 1 2 3
Fsforo
I 833 450 450 1083 1250 1083 1083 917 833 1167 1417 1583 750 1500 1333 1167
IV 1083 833 833 833 1250 1083 1000 1250 1333 750 833 1417 417 1083 1167 1250
a) Construya una grfica para mostrar la posible interaccin entre los niveles de los factores nitrgeno y fsforo. b) Realice el ANOVA y concluya c) En caso de ser necesario realice el anlisis post-ANOVA
124
2. El procedimiento para el anlisis de varianza de un experimento bifactorial en Bamb (Bambusa arundinacea) en el que se consideraron dos espaciamientos (Factor A) y 3 edades de los rizomas para la plantacin (Factor B), dispuesto en un diseo de bloques completos al azar con tres repeticiones, es ilustrado a continuacin (Jayaraman, K. 1999). Los niveles de cada factor y sus combinaciones, se presentan en el cuadro siguiente. Edad de los rizomas para la plantacin (meses) 6 (B1) 12 (B2) 24 (B3) Espaciamiento (metros) 10 m x 10 m 12 m x 12 m (A1) (A2) A1 B1 A2 B1 A1 B2 A2 B2 A1 B3 A2 B3
La variable de respuesta medida fue altura mxima promedio de los tallos (caas), expresada en centmetros. Los resultados se presentan a continuacin: Combinacin A1 B1 A1 B2 A1 B3 A2B1 A2 B2 A2 B3 Total Y..k I 46.50 49.50 127.70 49.30 65.50 67.90 Repeticiones II 55.90 59.50 134.10 53.20 65.00 112.70 III 78.70 78.70 137.10 65.30 74.00 129.00
a) Construya una grfica para mostrar la posible interaccin entre los niveles de los factores nitrgeno y fsforo. b) Realice el ANOVA y concluya c) En caso de ser necesario realice el anlisis post-ANOVA 3. Rivera, F. (2001) realiz el trabajo de tesis de grado Evaluacin de N y P, en el rendimiento de cardamomo (Elettaria cardamomun M.) en la serie de suelos Tamah, aldea Chaval, Cobn, Alta Verapaz. Los niveles de nitrgeno evaluados fueron: 0, 50, 100 y 150 kg/ha/ao; y los de fsforo: 0, 40, 80 y 120 kg/ha/ao. La variable de respuesta medida fue la produccin de cardamomo en cereza, expresada en kg/planta. El resumen del ANDEVA se presenta a continuacin:
FV Repeticin Nitrgeno Fsforo NxP Residuo Total GL 2 3 3 9 30 47 SC 0.20820634 24.81599830 6.66365625 12.50315497 6.72683850 50.91785737 8.27199943 2.22121975 1.38923944 0.22422795 36.89 9.91 6.20 0.0001 0.0001 0.0001 CM Valor de F Pr > F
125
Las medias para las interacciones se presentan en el cuadro siguiente:
Nitrgeno
0 0 0 0 50 50 50 50 100 100 100 100 150 150 150 150
Fsforo
0 40 80 120 0 40 80 120 0 40 80 120 0 40 80 120
Rendimiento promedio
1.89942333 2.42085333 2.45696667 2.02227000 2.47586667 2.71211333 2.27741667 2.81606000 3.05296000 4.55483333 4.16739000 4.06344333 2.50773000 4.73571667 4.62098333 2.49463333
a) Interprete el ANOVA y concluya b) Analice el comportamiento de los niveles de fsforo en presencia de cada uno de los niveles de nitrgeno (sugerencia: ajuste un modelo de regresin) 4. Alfaro, M. R. (1999) realiz el trabajo de tesis Evaluacin inicial del efecto de tres intensidades de raleo y tres de poda en el crecimiento de una plantacin de Pinus caribaea Morelet Var. hondurensis, en Livingston, Izabal. En esta investigacin se utiliz un diseo de bloques completos al azar y se evaluaron dos factores: Factor A (raleos): se utiliz el ndice Hart (S%), con intensidades: S%= actual, S%= 22 y S%=28, debido a que el ndice de Hart establece que entre 20 y 30% del espaciamiento, una plantacin puede crecer adecuadamente sin competencia. Factor B (poda): se hizo con las siguientes intensidades: sin poda (SP), y de la altura de la copa viva. Las variables de respuesta medidas fueron: dimetro, altura, rea basal y volumen. A continuacin se presentan los datos para la variable volumen (m3), correspondientes a la tercera medicin.
Poda Raleos Repeticiones II III 0.0569 0.0548 0.0643 0.0673 0.0833 0.0612 0.0542 0.0594 0.0756 0.0869 0.0857 0.0793 0.0625 0.0577 0.0635 0.0105 0.0558 0.0811
S.P. h h
126
8.3
8.3.1 EXPERIMENTOS FACTORIALES CON ARREGLO EN PARCELAS DIVIDIDAS Introduccin
Los experimentos en parcelas divididas (split-plot design, en ingls) as como los experimentos en arreglo combinatorio, incluyen todas las posibles combinaciones de dos ms factores en sus diferentes niveles, y la diferencia entre esos tipos de arreglos est en la manera de instalacin de los experimentos y en el esquema del anlisis de varianza. Si se considera un diseo en bloques al azar, con r bloques y a niveles del factor A. Si cada una de las ra parcelas se divide en b subparcelas, y entre esas b subparcelas se distribuyen al azar los b niveles de un factor B, se tiene entonces, una generalizacin del diseo en bloques al azar, conocida como arreglo en parcelas divididas. Este tipo de arreglo es til cuando ciertos niveles de un factor A, para que sean aplicados en el experimento, requieren grandes parcelas, como ocurre en los sistemas de riego, los distanciamientos entre surcos, etc.; y adems, esos niveles sern combinados con los niveles del factor B, pudiendo ser: fertilizantes, variedades, etc. Los niveles del factor A son distribuidos entre las parcelas grandes, las cuales sufrirn una divisin, de tal modo que los niveles del factor B, que no requieren grandes parcelas, puedan ser distribuidos entre las subparcelas (parcelas pequeas). De esta manera, se crean dos estructuras, una estructura a nivel de parcelas grandes, con los niveles del factor A, y otra estructura a nivel de subparcelas dentro de cada parcela grande, con los niveles del factor B. Los niveles aplicados en las parcelas grandes son denominados: tratamientos primarios, y los niveles del factor aplicado en las parcelas pequeas son denominados: tratamientos secundarios. Debido a esta estructura, los tratamientos primarios son confundidos con las parcelas grandes, en tanto que los tratamientos secundarios no son confundidos, por eso se debe asignar el factor de mayor inters, en la medida de lo posible, a las parcelas pequeas. Este tipo de arreglo, es muchas veces preferido (en comparacin con el arreglo combinatorio), debido a las facilidades de instalacin de los tratamientos en el rea experimental. Desde el punto de vista estadstico, los experimentos que utilizan arreglo combinatorio, por lo general, son ms eficientes que los experimentos donde se utiliza arreglo en parcelas divididas, puesto que, en tanto en el arreglo combinatorio existe un nico residuo para el clculo de F y en las comparaciones mltiples, en los experimentos donde se utiliza arreglo en parcelas divididas hay dos residuos, uno referente a parcelas grandes y otro referente a parcelas pequeas, siendo que el residuo de parcelas grandes, generalmente tiene un nmero de grados de libertad pequeo, llevando a poca sensibilidad en el anlisis. Se pueden distinguir dos tipos de parcelas divididas, de conformidad con la estructura de las parcelas pequeas, o sea:
i) Parcelas divididas en el espacio
Cuando cada parcela grande es dividida en subreas, constituyendo las subparcelas (o parcelas pequeas). Suponiendo, por ejemplo, que se aplica en las parcelas grandes 3 distanciamientos entre surcos, y en las parcelas pequeas, 4 variedades de caa de azcar, distribuidos en 3 bloques, cuyo croquis es el siguiente:
127
E2 V1 V3 V2 V4 V2 V3 E1 V1 V4 V3 V1 E3 V2 V4
Bloque I
E1 V2 V4 V1 V3 V1 V2
E3 V3 V4 V4 V1
E2 V3 V2
Bloque II
E3 V3 V2 V4 V1 V1 V3
E2 V2 V4 V3 V2
E1 V4 V1
Bloque III
Observando el croquis anterior, se verifica que cada parcela grande, independiente del diseo experimental adoptado, constituye un bloque para las parcelas pequeas.
ii) Parcelas divididas en el tiempo
Las parcelas grandes no son divididas en reas, pero peridicamente son tomadas muestras de cada parcela, constituyendo cada muestra como una parcela pequea. Por ejemplo, aplicando en las parcelas grandes reguladores de crecimiento y considerando a nivel de parcelas pequeas las pocas o periodos, caracterizadas por las muestras retiradas de las unidades experimentales durante un cierto periodo de tiempo, pudiendo ser, por ejemplo, a cada 15 das durante 6 meses. La estructura de parcelas divididas en el tiempo, es caracterizada cuando se aplica a las parcelas los niveles de un nico factor A y se toman medidas repetidas en ocasiones sucesivas sobre la misma parcela, admitiendo que esas medidas tomadas en ocasiones distintas tienen varianzas homogneas y son igualmente correlacionadas. En el caso de que esas suposiciones no sean satisfechas, se tiene la estructura de medidas repetidas en el tiempo, cuya metodologa de anlisis de los datos experimentales pasa a ser el anlisis multivariado, que adopta una hiptesis ms general sobre la estructura de covarianzas entre medidas repetidas tomadas sobre una misma parcela, que es el anlisis de perfil. El objetivo del anlisis de ese tipo de experimento es estudiar el efecto global de los niveles del factor A a lo largo del periodo definido, y la variacin de esos niveles a lo largo del tiempo. En ese caso, es interesante observar que la caracterizacin de las parcelas pequeas conduce a una sistematizacin, puesto que no es posible aleatorizarlas dentro de cada parcela. Las parcelas pueden estar dispuestas en cualquier diseo experimental, pero lo usual es utilizar el diseo completamente al azar o en bloques al azar.
8.3.2
Modelo estadstico
Para un experimento bifactorial dispuesto en un diseo en bloques al azar con arreglo en parcelas divididas, el modelo estadstico es el siguiente:
128
= = = = = = = =
Variable de respuesta medida en la ijk - sima unidad experimental Media general Efecto del j - simo bloque Efecto del i - simo nivel del factor A. Efecto de la interaccin del i-simo nivel del factor A con el j - simo bloque, que es utilizado como residuo de parcelas grandes y es representado por error(a) Efecto del k - simo nivel del factor B Efecto debido a la interaccin del i-simo nivel del factor A con el k - simo nivel del factor B. Error experimental asociado a Yijk , es utilizado como residuo a nivel de parcela pequea, y es definido como: Error(b)
Ho: 1.. = . . . = a.., contra Ha: por lo menos i.. i.. para ii; Ho: i.k i.. ..k + = 0, contra Ha: i.k i.. ..k + 0 para algn i y k.
8.3.4 Anlisis de varianza
Ho: ..1= . . . = ..k contra Ha: por lo menos ..k ..k para kk;
A continuacin se muestra la forma de presentar los datos, previo a su anlisis. Tratamiento primario Tratamiento secundario B1 B2 A1 B3 B1 A2 B2 B3 BLOQUES I Y111 Y112 Y113 Y11. Y211 Y212 Y213 Y21. Y.1. II Y 121 Y 122 Y 123 Y12. Y221 Y222 Y223 Y22. Y.2. III Y131 Y132 Y133 Y13. Y231 Y232 Y233 Y23. Y.3. Y i.k Y1.1 Y1.2 Y1.3 Y 1. . Y2.1 Y2.2 Y2.3 Y2 . . Y. . .
129
Tabla adicional: Esta tabla es til para calcular la suma de cuadrados para ambos factores.
Factor "A" Factor "B" B1 B2 B3 Total A1 Y1.1 Y1. 2 Y1. 3 Y1.. A2 Y2. 1 Y2. 2 Y2. 3 Y2.. Total Y...1 Y...2 Y.. 3 Y...
ab
j=1
Y.2 j.
2 Y... arb
SCA/GLA
CMA/CM(a)
SC(a)/GL(a)
j=1 i =1
2 Yij.
2 Y... arb
b1
SCB/GLB
CMB/CM(b)
AB
(a 1) (b 1)
j=1
SCAB/GLAB
CMAB/CM(b)
Error (b)
a (b 1) (r 1)
SC(b)/GL(b)
Total
abr 1
j=1 i =1
2 Yijk k =1
2 Y... arb
130
8.3.5 Anlisis post-Andeva: prueba de comparacin mltiple de medias, de acuerdo con el criterio de Tukey
a)
W = q (a,gl(a ), ) * Sx
b)
Sx =
CM(a) rb
W = q (b,gl(b), ) * Sx
c)
Sx =
CM(b) ra
W = q (ab,gl(b), ) * Sx ,
8.3.6 Ejemplo de Aplicacin
Sx =
CM(b) r
En un experimento se probaron dos mtodos de siembra y tres variedades de arroz. Por razones de facilidad en el manejo del mismo, se decidi utilizar un arreglo en parcelas divididas, en donde las parcelas grandes correspondieron a los mtodos de siembra y en las parcelas pequeas se sembraron las tres variedades de arroz. Los tratamientos se distribuyeron mediante un diseo en bloques completos al azar con 4 repeticiones. La variable de respuesta fu kg/parcela de 72 m2. A continuacin se detallan los factores evaluados. Mtodos de siembra: Variedades: S: Secano BB: Blue Bonnett I: Inundacin BP: Belle Patna CR: Criolla
Rendimiento de arroz en kg/parcela de 72 m2 , al comparar distintos mtodos de siembra en diferentes variedades de arroz. Mtodos de siembra Bloques Variedades BB S BP CR BB I BP CR I 8.5 8.0 10.0 5.8 7.0 8.3 II 8.2 7.0 10.8 5.6 7.1 8.0 III 8.0 7.3 11.0 5.2 7.3 8.0 IV 7.6 6.9 11.6 5.8 7.3 8.7
131
Tabla adicional: Mtodos de siembra Variedades BB BP CR Yi.. Secano 32.30 29.20 43.40 104.90 8.74 Inundacin 22.40 28.70 33.00 84.10 7.01 Y..k 54.70 57.90 76.40
Y..k
6.84 7.24 9.55
Y i..
104.92 + 84.102 1892 = 18.03 SC A = 12 (2)(3)(4) 26.52 + 262 + 26.32 + 26.12 + 21.12 + 20.7 2 + 20.52 + 21.82 1892 = = 18.41 3 (2)(3)(4) 47.62 + 46.7 2 + 46.82 + 47.92 1892 = 0.175 (2)(3) (2)(3)(4)
SCSubtotal
SC Bloques =
SC B =
SC AB =
132
Cuadro resumen del ANDEVA
G.L. 3 1 3 2 2 12 23
C.M.
Valor de F
F crtica
265.15*
10.13
75.24* 17.04*
3.89 3.89
CV =
F= CM A 18.03 = = 265.15 CM Error(a ) 0.068 CM AB 3.886 = = 17.04 CM Error(b) 0.228
F=
Prueba de comparacin mltiple de medias de acuerdo con el criterio de Tukey, para la interaccin
Y ij.
8.08 7.30 10.85 5.60 7.18 8.25
133
b) Comparador
Wp = q (6,12,0.05)
0.228 4
c) Matriz de diferencias Interaccin A2B1 A2B2 A1B2 A1B1 A2B3 A1B3 Media 5.60 7.18 7.30 8.08 8.25 10.85 A1B3 10.85 5.25* 3.67* 3.55* 2.77* 2.60* A2B3 8.25 2.65* 1.07 0.95 0.17 A1B1 8.08 2.48* 0.90 0.78 A1B2 7.30 1.70* 0.12 A2B2 7.18 1.58* A2B1 5.60
d) Presentacin de resultados
Grupo Tukey a b b b b c
8.3.7
Ejercicios propuestos
1.
En un estudio con pasto Napier se evaluaron dos mtodos de siembra y tres densidades de siembra, bajo un arreglo en parcelas divididas y distribucin en bloques al azar. En la parcela grande se ubic el factor mtodos de siembra y en las parcelas pequeas la densidad (kg/ha) Factor A: Mtodos de siembra: Factor B: Densidades: M1= al voleo. M2=20 cm. entre surco D1=15 kg/ha D2=25 kg/ha D3=35 kg/ha
La variable de respuesta medida fue el rendimiento expresado en toneladas mtricas por hectrea (peso fresco) de pasto. Los resultados obtenidos se presentan a continuacin, tal como fueron obtenidos en el campo:
134
M1 D1 49.6 D3 49.9 M2 D2 45.8 D1 46.7 M1 D3 48.7 a) b) c) d) 2. D2 44.8 D1 41.4 D1 39.2 D3 55.3 D3 42.7 D2 50.2 D2 44.6
Construya una tabla para resumir la informacin Realice el anlisis de varianza Realice la prueba de comparacin mltiple de medias (en caso sea necesario) Emita las respectivas conclusiones.
Lpez, EA. (1999) evalu la influencia de la lmina de riego en el efecto del madurante en caa de azcar (Saccharum spp.) var. CP-722086; en la finca El Blsamo, ingenio Pantalen. Los datos de produccin expresados en toneladas de caa por hectrea (TCH) se presentan en la tabla siguiente; y con los cuales se le solicita realizar el ANOVA correspondiente. Parcela grande 6/0 3/0 6/4 0/2 0/0 0/4 2/0 Parcela pequea Con madurante Sin madurante Con madurante Sin madurante Con madurante Sin madurante Con madurante Sin madurante Con madurante Sin madurante Con madurante Sin madurante Con madurante Sin madurante I 119.32 108.71 134.09 131.06 123.87 143.18 115.91 112.88 131.44 130.31 117.43 109.09 118.56 107.96 Repeticiones II 131.44 116.67 137.12 144.70 118.94 119.70 122.35 114.02 102.27 122.73 125.76 113.64 128.79 142.43 III 130.31 140.91 130.31 146.22 154.55 136.37 138.64 120.46 134.09 141.29 131.06 129.93 146.22 159.09
Referencias: 0/0 = Sin aplicacin de riego 2/0 = Distribucin de la lmina de riego en 2 riegos previos a la aplicacin del madurante y frecuencia de 50 das. 3/0 = Distribucin de la lmina de riego en 3 riegos previos a la aplicacin del madurante y frecuencia de 25 das. 0/2 = Distribucin de la lmina de riego en 2 riegos posteriores a la aplicacin del madurante y frecuencia de 25 das. 6/0 = Distribucin de la lmina de riego en 6 riegos previos a la aplicacin del madurante y frecuencia de 10 das. 6/4 = Distribucin de la lmina de riego en 6 riegos previos y 4 posteriores a la aplicacin del madurante y frecuencia de 10 das.
135
3. Se realiz un experimento para conocer la respuesta (cantidad de materia seca MS producida anualmente, ton/ha) de tres tipos de praderas (Estrella Africana, Guinea y Jaragua) deterioradas, a las cuales se les aplicaron diferentes prcticas culturales (quema, chapeo y aplicacin de herbicida) para su recuperacin. El diseo aplicado fue bloques al azar, considerando en la parcela grande el tipo de pradera. Los resultados se presentan a continuacin: Pradera Estrella Africana Guinea Jaragua Prcticas culturales Quema Chapeo Herbicidas Quema Chapeo Herbicidas Quema Chapeo Herbicidas I 12.0 13.5 15.5 10.0 11.0 13.0 7.5 8.0 9.0 Repeticiones II III 13.5 11.0 14.8 10.8 16.3 12.4 10.5 8.7 11.8 9.6 12.5 11.2 7.1 6.7 6.8 7.8 8.3 9.6 IV 9.8 10.0 10.5 7.6 8.3 13.1 6.3 7.0 7.5
a) b) c) d) e) 4.
Describa el modelo estadstico matemtico asociado a este experimento Plantee las hiptesis a evaluar. Realice el anlisis de varianza Realice la prueba de comparacin mltiple de medias (en caso sea necesario) Emita las conclusiones respectivas.
Complete la siguiente tabla de ANDEVA. F.V. Bloques A Error (a) B AB 1 2.72 9.26 G.L. 2 6 S.C. 52.97 28.97 C.M. Valor de F F crtica
136
5. Batres, De Len, Salazar y Saquimux (2000) realizaron una investigacin para determinar la mejor edad de los rboles semilleros de pinabete (Abies guatemalensis), as como el perodo ptimo que debe transcurrir entre la coleccin y la siembra de la semilla. El estudio se realiz en el paraje Chuisapn de la aldea Chimente del municipio de Totonicapn. Se utiliz un diseo de bloques completos al azar con arreglo en parcelas divididas y cuatro repeticiones. Cada unidad experimental estuvo conformada por 500 semillas sembradas en cada caja germinadora de madera, en donde se utiliz arena de ro como sustrato y fue desinfectada con hervida (en ebullicin). Los factores evaluados y sus respectivos niveles se citan a continuacin:
Factor Niveles A1. 20 a 40 aos A2. 40 a 50 aos A3. Mayores de 50 aos B1. Al momento de la extraccin de la semilla de los conos. B2. Tres semanas despus de la extraccin de las semillas. B3. Seis semanas despus de la extraccin de las semillas.
Los resultados para la variable porcentaje de germinacin (datos transformados) se muestran a continuacin:
Bloques Parcela grande 20 a 40 aos Parcela pequea B1 B2 B3 B1 B2 B3 B1 B2 B3 I 2.408 2.145 2.793 2.757 2.408 2.828 2.683 2.324 2.898 II 2.324 2.324 2.145 3.131 2.569 2.79 3.606 2.683 2.683 III 2.236 2.098 2.569 2.646 2.324 2.967 3.606 2.967 2.236 IV 2.324 2.324 2.00 3.098 2.098 2.408 3.742 3.00 2.967
40 a 50 aos
> 50 aos
En el caso de la variable altura de plntulas de pinabete, expresada en centmetros, los datos obtenidos se muestran a continuacin. Para ambas variables realice el ANDEVA y concluya.
Bloques Parcela grande 20 a 40 aos Parcela pequea B1 B2 B3 B1 B2 B3 B1 B2 B3 I 7.82 7.4 7.5 7.25 8.7 7.7 8.1 7.9 8 II 6.02 7.87 7.1 6.9 7.85 7.1 7.5 7.45 7.6 III 6.7 7.5 7.55 8.95 77.5 7.9 9 4.2 8.3 IV 8.8 7.8 8.35 8.8 6.78 7.38 7.6 7.20 7.9
40 a 50 aos
> 50 aos
137
8.3.8 Programa en SAS para un experimento bifactorial con arreglo en parcelas divididas
OPTIONS nodate nonumber; DATA parcela; INPUT bloque metodo $ variedad $ rend; CARDS; 1 S BB 8.5 1 S BP 8 1 S CR 10 1 I BB 5.8 1 I BP 7 1 I CR 8.3 2 S BB 8.2 2 S BP 7 2 S CR 10.8 2 I BB 5.6 2 I BP 7.1 2 I CR 8 3 S BB 8 3 S BP 7.3 3 S CR 11 3 I BB 5.2 3 I BP 7.3 3 I CR 8 4 S BB 7.6 4 S BP 6.9 4 S CR 11.6 4 I BB 5.8 4 I BP 7.3 4 I CR 8.7 ; PROC GLM; CLASS bloque metodo variedad; MODEL rend=bloque metodo variedad metodo*variedad bloque*metodo/ss1; TEST h=metodo e=bloque*metodo; MEANS metodo/TUKEY E=bloque*metodo; MEANS variedad/TUKEY LSMEANS metodo*variedad/PDIFF E=bloque*metodo;
138
CAPTULO 9
EXPERIMENTOS EN FRANJAS 9.1 INTRODUCCIN
Los experimentos en parcelas divididas son frecuentemente utilizados en la experimentacin agronmica cuando, en un experimento de tipo factorial, el material experimental o la propia conduccin del experimento no permite una completa aleatorizacin de todas las combinaciones de los niveles de los factores. Una variacin de los experimentos en parcelas divididas es caracterizada cuando, por diversas razones, aunque se estructuren las parcelas pequeas, no hay posibilidad de una aleatorizacin total de estas parcelas. En este caso, las parcelas relativas a cada factor se posicionan en franjas (o fajas), tanto en filas como en las columnas. Considerando 2 factores, A y B, con a y b niveles, respectivamente, de forma que en cada nivel de A se tienen los niveles de B como subparcelas y viceversa, tanto los niveles de A como los niveles de B son considerados parcelas (factores principales), en tanto que la interaccin (AB) en cada uno de los ndices de A y B constituyen las subparcelas (parcelas pequeas). Para ilustrar este caso, considere un experimento con dos factores A y B, con 3 y 4 niveles, respectivamente, y cada bloque constituido por fajas horizontales Ai y fajas verticales Bj, resultando, para un bloque cualquiera, el siguiente esquema:
B1
B4
B2
B3
A3 A2 A1
Y de igual manera para los dems bloques, los cuales difieren entre s apenas en lo referente a la aleatorizacin. De acuerdo con Gomes, FP (2000) el anlisis de los experimentos en franjas son ms complejos, en comparacin con los dispuestos en un arreglo en parcelas divididas; y dan menor precisin a las comparaciones entre los niveles del factor que se ubica en la parcela pequea. Por ello, los experimentos en franjas deben ser evitados, siempre que sea posible. Sin embargo, existen varias situaciones en que razones de orden prctica nos llevan a adoptarlos. Dentro de estas situaciones, se puede citar: experimentos con pocas de cosecha (cuando la cosecha es mecanizada), tipos de preparacin del suelo, aplicacin mecanizada de fertilizantes, aplicacin de correcciones al suelo, aplicacin de madurantes en caa de azcar, en evaluaciones de distanciamientos de siembra, etc.
139
9.2 MODELO ESTADSTICOMATEMTICO
Segn Kempthorne (1952), citado por Nogueira (2000), el modelo adecuado con dos factores y un diseo bloques completos al azar es el siguiente: i = 1,2, . . . , a j = 1,2, . . . , r Yijk = + i + j + ()ij + k + ()jk + ()ik + ()ijk k =1,2, . . . , b siendo: Yijk j i ()ij k = = = = = = = Variable de respuesta medida en la ijk - sima unidad experimental Media general Efecto del j - simo bloque Efecto del i - simo nivel del factor A. Efecto de la interaccin entre el i-simo nivel del factor A con el j - simo bloque, o sea, es el error experimental asociado al factor A, tal que ()ij ~ N (0, 21) e independientes, es utilizado como error(a). Efecto del k - simo nivel del factor B Efecto de la interaccin entre el k-simo nivel del factor A con el j - simo bloque, o sea, es el error experimental asociado al factor B, tal que ()jk ~ N (0, 22) e independientes, es utilizado como error(b). Efecto debido a la interaccin del i-simo nivel del factor A con el k - simo nivel del factor B. Error experimental asociado a Yijk, tal que ()ijk ~ N (0, 2) e independientes, es utilizado como trmino de error o residuo.
()jk
()ik
= =
()ijk
9.3
HIPTESIS
Ha: i 0, para algn i; Ha: k 0, para algn k; Ha: ()ik 0, para algn i y k.
Ho: i = 0, para todo i, contra, Ho: k = 0, para todo k, contra, Ho: ()ik = 0, para todo i y k, contra,
9.4
CMAxB/CMresiduo
140
Descripcin Suma de Cuadrados
Bloques
SCBLOQUES =
Y
j=1
. j.
ab
Y...2 abr
SCA =
Y
i =1
i..
br
a r
Y...2 abr
A, Bloques
SC(A,BLOQUES) =
Y
i =1 j=1
ij.
Y...2 abr
error (a)
SCB =
Y
k =1
..k
ar
a r
Y...2 abr
B, Bloques
SC(B,BLOQUES) =
Y
i =1 j=1
. jk
Y...2 abr
error (b)
A,B
SC(A,B) =
Y
i =1 k =1
ik.
Y...2 abr
AxB
SC(A x B) = SC(A,B) SCA SCB SCresiduo = SCTOTAL SCBLOQUES SC A SCerror(a ) SCB SCerror(b) SCAxB SCTOTAL = Yijk 2
i =1 j=1 k =1 a r b
Residuo
Total
Y...2 abr
141
Decisin: Se rechaza Ho a un nivel de significancia, cuando:
9.5
EJEMPLO DE APLICACIN
Los datos que se presentan a continuacin se refieren al Pol% de la caa de azcar, obtenido de un experimento en franjas en el ingenio Santa Cruz, citado por Nogueira (2000), que involucr 2 factores A y B; correspondientes a tipos de surcos, asociado con distanciamientos entre surcos y densidades de siembra, con 4 y 3 niveles respectivamente, siendo: A1: A2: A3: A4: B1: B2: B3: surco simple y distanciamiento de 1.40 m. surco doble y distanciamiento de 1.40 m x 0.90 m. surco de base larga y distanciamiento de 1.70 m. surco de base larga y distanciamiento de 1.90 m. 4 toneladas de semilla/ha 6 toneladas de semilla/ha 8 toneladas de semilla/ha Bloques Surcos A1 Densidades B1 B2 B3 B1 B2 B3 B1 B2 B3 B1 B2 B3 I 17.67 17.31 17.49 52.47 17.19 17.21 18.04
52.44 17.39 17.39 17.69 52.47 17.19 16.78
A2
Yik.
69.94 68.87 70.74 70.04 68.7 68.79 69.05 69.44 70.07 70.21 70.41 70.77
A3
A4
17.86
51.83
16.85
51.99
18.12
53.63
17.94
53.94
Y. j.
209.21
207.84
207.89
212.09
837.03
142
Cuadro Auxiliar 1
Bloques Surcos A1 A2 A3 A4 I 52.47 52.44 52.47 51.83 209.21 II 52.13 51.49 52.23 51.99 207.84 III 52.16 51.38 50.72 53.63 207.89 IV 52.79 52.22 53.14 53.94 212.09
Yi..
209.55 207.53 208.56 211.39 837.03
Y. j.
Cuadro Auxiliar 2
Bloques Densidad B1 B2 B3 I 69.44 68.69 71.08 209.21 II 70.19 70.1 67.55 207.84 III 69.2 68.32 70.37 207.89 IV 70.41 70.31 71.37 212.09
Y..k
279.24 277.42 280.37 837.03
Y. j.
Cuadro Auxiliar 3
Densidades Surcos A1 A2 A3 A4 B1 69.94 70.04 69.05 70.21 279.24 B2 68.87 68.7 69.44 70.41 277.42 B3 70.74 68.79 70.07 70.77 280.37
Yi..
209.55 207.53 208.56 211.39 837.03
Y..k
SC BLOQUES = SC A =
SC(A,BLOQUES)
143 SC(A x BLOQUES) = 3.285 0.6753 0.9921 = 1.6173 = SCerror(a ) SC B = 1 837.032 (279.242 + L + 280.37 2 ) = 0.2769 16 48 1 837.032 (69.442 + L + 71.37 2 ) = 3.5625 4 48
SC(B,BLOQUES) =
SC(B x BLOQUES) = 3.5625 0.2769 0.9921 = 2.2935 = SCerror(b) SC(A,B) = 1 837.032 (69.942 + L + 70.77 2 ) = 1.5687 4 48
SC(A x B) = 1.5687 0.6753 0.2769 = 0.6165 SCTOTAL = (17.67 2 + L + 17.942 ) 837.032 = 8.4247 48
GL 3 3 9 2 6 6 18 47
Conclusin:
A travs de la prueba de F no fue constatado efectos de los tipos de surcos, asociado con distanciamientos entre surcos, ni de las densidades de siembra, y tampoco con la interaccin de los niveles de estos dos factores.
144
9.6 PROGRAMA EN SAS PARA UN EXPERIMENTO BIFACTORIAL CON ARREGLO EN FRANJAS DIVIDIDAS
OPTIONS nodate nonumber; TITLE Experimento en franjas; DATA fran; DO surcos=1 TO 4; DO densid=1 TO 3; DO bloque=1 TO 4; INPUT pol @@; OUTPUT; END; END; END; CARDS; 17.67 17.23 17.43 17.61 17.31 17.6 17.05 16.91 17.49 17.3 17.68 18.27 17.19 17.85 17.44 17.56 17.21 17.26 16.71 17.52 18.04 16.38 17.23 17.14 17.39 17.54 16.61 17.51 17.39 17.67 16.77 17.61 17.69 17.02 17.34 18.02 17.19 17.57 17.72 17.73 16.78 17.57 17.79 18.27 17.86 16.85 18.12 17.94 ; PROC print; RUN; TITLE Anlisis de varianza y prueba de Tukey; PROC anova; CLASS surcos densid bloques; MODEL pol = bloques surcos bloques*surcos densid bloques*densid surcos*densid; TEST h=surcos e=bloques*surcos; TEST h=dendid e=bloques*densid; MEANS surcos/TUKEY e=bloques*surcos; MEANS densid/TUKEY e=bloques*densid; MEANS surcos*densid; RUN;
145
9.7
1.
EJERCICIOS PROPUESTOS
Los siguientes datos se refieren a la produccin de trigo obtenido en un experimento donde se utiliz un diseo bloques al azar con arreglo en franjas divididas, con el objetivo de estudiar el efecto de dos sistemas de riego (R1 y R2) y tres dosis de nitrgeno (N0, N1 y N2), distribuidos en cuatro bloques.
Bloques Dosis de N N0 N0 N1 N1 N2 N2 Sistema de riego R1 R2 R1 R2 R1 R2 I 55 71 62 77 69 78 II 63 77 66 79 77 81 III 63 77 70 78 79 80 IV 65 75 66 76 76 79
Analice, interprete y concluya. 2. Estrada, RA (1993) realiz el trabajo de tesis titulado: Evaluacin del efecto de 16 distancias de siembra sobre el crecimiento y rendimiento en el cultivo de chile chocolate (Capsicum sp) en el Valle Central de Guatemala. Los factores y niveles sometidos a evaluacin fueron los siguientes:
Niveles Factor A. Distancia entre surcos (m) B. Distancia entre plantas (m) 1 0.25 0.25 2 0.50 0.50 3 0.75 0.75 4 1.0 1.0
El diseo utilizado fue bloques al azar, con un arreglo en franjas y tres repeticiones. La unidad experimental estuvo formada por 30 plantas, delimitndose una unidad de muestreo de 12 plantas. Se trazaron 6 surcos con 5 plantas dentro de cada surco. El largo de cada bloque fue de 10 m. y el ancho de 12.5 m, dejando una separacin de 1.5 m entre bloques. Con esta informacin responda las siguientes interrogantes: a) b) c) d) e) Describa el modelo estadsticomatemtico asociado a este experimento. Describa las combinaciones a analizar. A su criterio, qu variables de respuesta medira? Dibuje un croquis del experimento, indicando la distribucin aleatorizada de los tratamientos. Investigue por lo menos 2 trabajos de investigacin donde se haya utilizado el arreglo en franjas. Elabore un resumen de la metodologa experimental.
146
CAPTULO 10
ANLISIS DE COVARIANZA (ANCOVA) 10.1 INTRODUCCIN
Uno de los problemas con el que frecuentemente se enfrenta el investigador, es el de controlar aquellos factores que no le he es posible medir y cuyo efecto no puede justificar, los cuales constituyen el error experimental. Una de las formas de minimizar este error es mediante la aleatorizacin de los tratamientos y la utilizacin de material experimental muy homogneo. Sin embargo, la aleatorizacin difcilmente cancela la influencia de las variables involucradas en el error y la disponibilidad de material experimental homogneo no es frecuente en algunos experimentos, principalmente con animales, quedando restringidos a experimentos de laboratorio, invernadero o con animales de bioterio. Ronald Fisher en 1932 desarroll una tcnica conocida como Anlisis de Covarianza, que combina el Anlisis de Regresin con el Anlisis de Varianza. Covarianza significa variacin simultnea de dos variables que se asume estn influyendo sobre la variable respuesta. En este caso se tiene la variable independiente tratamientos y otra variable que no es efecto de tratamientos pero que influye en la variable de respuesta, llamada a menudo: covariable. El Anlisis de Covarianza consiste bsicamente en elegir una o ms variables adicionales o covariables que estn relacionadas con la variable de respuesta, evitando que los promedios de tratamientos se confundan con los de las covariables, incrementando de esa manera la precisin del experimento. Por ejemplo: nmero de plantas por unidad experimental, pesos iniciales en animales, grado de infestacin de garrapatas, das de lactancia o edad de destete, etc.; pueden ser covariables que influyan en el resultado final y cuyo efecto de regresin sobre la variable respuesta el investigador desea eliminar, ajustando las medias de tratamientos a una media comn de X. En este anlisis se asume que la variable dependiente Y est asociada en forma lineal con la variable independiente X, existiendo homogeneidad de pendientes. Como regla general para decidir sobre el empleo de la covarianza, el investigador debiera tener la certeza de que sus covariables no estn influenciadas por los tratamientos estudiados. El procedimiento de anlisis comprende: a) b) c) d) ANDEVA para X (covariable), ANDEVA para Y (variable de respuesta), Estimacin del coeficiente angular de la regresin. Obtencin de la ecuacin de regresin y ajuste a los promedios de la variable de respuesta.
10.2
Como es de esperarse, las suposiciones que se hacen cuando se efecta un anlisis de covarianza son similares a las requeridas para la regresin lineal y el anlisis de varianza. De esta manera, se encuentran las suposiciones usuales de independencia, normalidad, homocedasticidad, X fijas, etc. Para ser ms exactos, se presenta a continuacin los modelos estadsticomatemticos asociados con algunos de los diseos ms comunes cuando se realiza un anlisis de covarianza.
147
a) Diseo Completamente al Azar
j=1,...,r Yij i Xij = = = = = Variable de respuesta medida en la jsima repeticin y el isimo tratamiento. Media general Efecto del isimo tratamiento. Coeficiente angular de la regresin. Variable independiente o covariable. Media general de la covariable. Error experimental.
X..
ij
=
=
b)
X..
ij
=
=
Variable de respuesta medida en la jsima repeticin y el isimo tratamiento. Media general Efecto del isimo tratamiento. Efecto del jsimo bloque o repeticin. Coeficiente angular de la regresin. Variable independiente o covariable. Media general de la covariable. Error experimental.
c)
k=1,...,t j=1,...,r
Yijk i j k Xijk
= = = = = = =
X..
ij k
=
=
Variable de respuesta medida en la jsima repeticin y el isimo tratamiento. Media general Efecto del isimo tratamiento. Efecto de la jsima fila. Efecto de la ksima columna. Coeficiente angular de la regresin. Variable independiente o covariable. Media general de la covariable. Error experimental.
Otra suposicin necesaria para el anlisis correcto de covarianza, es que la variable concomitante X, no debe ser afectada por los tratamientos.
148
10.3 EJEMPLO DE APLICACIN
Un grupo de estudiantes del curso de Investigacin Agrcola de la Escuela Nacional Central de Agricultura evalu en 1990 el efecto del tiempo de cosecha sobre el rendimiento de grano de maz. Se utilizaron 4 tratamientos y 3 repeticiones, con el diseo bloques completos al azar. Los tratamientos fueron: 30, 40, 50 y 60 das despus de la polinizacin. El nmero de plantas planificado por parcela til fue de 52, pero al cosechar se obtuvieron diferentes nmeros de plantas por unidad experimental. Los resultados se presentan en el cuadro siguiente: Tratamientos 30 40 50 60 x.j , y.j 1. x 41 37 37 35 150 I y 4.08 4.72 4.00 4.59 17.39 Repeticiones II x y 24 2.78 32 4.92 34 5.05 22 3.63 112 16.38 III x 31 38 47 44 160 y 2.79 4.50 5.54 6.20 19.03 xi. 96 107 118 101 422 yi. 9.65 14.14 14.59 14.42 52.80
ANDEVA para Y
GL 3 2 6 11 SC 5.64 0.89 4.92 11.45 CM 1.88 0.45 0.82 Valor F 2.29 F crtica 4.76
X = nmero de plantas
2.
t r t r x ij yij i =1 j=1 i =1 j=1 = (422) (52.8) = 1856.8 Factor de correccin = F.C. (x,y) = tr 43
Suma de Productos Total para x y y. SPT(x,y)
SPT(x, y) = x ij yij F.C.(x, y) = [(41 4.08) + (37 4.72) + ... + (44 6.2)] 1856.8 = 60.16
i =1 j=1
SPB(x, y) =
x
i =1 j=1
.j
y. j
F.C.(x, y) =
149
Suma de Productos de Tratamietos para x y y. SPTrat (x,y)
SPTrat(x, y) =
x
i =1 j=1
.j
y. j
F.C.(x, y) =
Este coeficiente da la relacin promedio de rendimiento por planta, es decir, el efecto de una planta en promedio es de 0.1599 kg. Debe aclararse que el coeficiente de regresin se supuso diferente de cero. Si este no fuera el caso, la introduccin de la variable concomitante X sera una complicacin innecesaria. Algunas veces el investigador querr comprobar estas suposiciones. Esto es, evaluar las hiptesis: Ho: = 0 (no hay regresin lineal simple) Ha: 0 Utilizando la estadstica F (FisherSnedecor):
[SPE(x, y)]
r=
t=
r 1 r2
n=
0.976 1 (0.976) 2
5 = 10.02*
t crtica (5,0.05/2) = 2.57 siendo n = 5, el nmero de grados de libertad del residuo, luego de ser ajustado por la regresin (se le rest un grado de libertad).
150
3. a) ANCOVA (los valores ajustados) Clculo de la suma de cuadrados de la regresin lineal.
[SPE(x, y)] SC Re g =
SCE(x)
b)
( 29.322 ) =
183.33
= 4.691
[ SPTrat(x, y) + SPE(x, y) ]2 SCE(y Ajustada) SCTrat Ajustada = [SCE(y) + SCTrat(y) ] SCTrat(x) + SCE(x)
0.23 = 2.914
GL 3 2 6 11
GL 3 5 10
SC 2.914 0.23
CM 0.97 0.04666
Valor F 21.09*
F crtica 5.41
De acuerdo con el ANCOVA, existen diferencias significativas entre tratamientos. En consecuencia, es conveniente hacer un ajuste por nmero de plantas a los promedios de rendimiento, de acuerdo con la siguiente ecuacin:
yi. yi. x i. x
= = = = =
promedio ajustado de cada tratamiento. promedio de cada tratamiento sin ajustar. coeficiente angular de la regresin. promedio del nmero de plantas de cada tratamiento. promedio general del nmero de plantas.
151
e) El error estndar para la diferencia SE(d) entre dos medias ajustadas es dado por:
SE(d) =
Cuando el nmero de repeticiones es el mismo para todos los tratamientos, el error estndar para la diferencia entre dos medias ajustadas es dado por:
SE(d) =
Cuando los valores de x1 , x 2 , . . . , x t no son muy diferentes (lo que se puede concluir cuando los tratamientos no producen efectos significativos en la variable X), se puede usar una estimacin media para el error estndar, aplicable a cualquier contraste entre dos tratamientos. Esta estimacin media tiene la siguiente expresin:
SE(d) =
f)
El clculo de los promedios ajustados del rendimiento de grano de maz yi. se presenta a continuacin:
x i.
32.00 35.67 39.33 33.67 35.17
Tratamientos 30 40 50 60
yi.
yi.
3.72 4.63 4.20 5.05
g)
La presentacin final de los resultados quedar de la siguiente forma: Das despus de la polinizacin 60 40 50 30 Media ajustada (kg/u.exp.) 5.05 4.63 4.20 3.72
a a b b c c
152
10.4 PROGRAMA EN SAS PARA UN EXPERIMENTO DONDE SE UTILIZ ANLISIS DE COVARIANZA SIMPLE
OPTIONS nodate nonumber; DATA ancova; TITLE Anlisis de Covarianza Simple INPUT trat rep x y; CARDS; 30 1 41 4.08 40 1 37 4.72 50 1 37 4.00 60 1 35 4.59 30 2 24 2.78 40 2 32 4.92 50 2 34 5.05 60 2 22 3.63 30 3 31 2.79 40 3 38 4.50 50 3 47 5.54 60 3 44 6.20 ; PROC glm; CLASSES trat rep; MODEL y=trat rep/SS1; PROC glm; CLASSES trat rep; MODEL Y=trat rep x; MEANS trat; lsmeans trat/stderr pdiff; RUN;
153
10.5
1.
EJERCICIOS PROPUESTOS
Un ensayo fue realizado para evaluar el control de plagas en el cultivo del frijol. En ese experimento se utiliz un diseo en bloques al azar y se evaluaron 5 tratamientos: Testigo, Disyston, Ekatin, Keltane y Diazinon. Adems de la produccin (Y), expresada en gramos por unidad experimental, se cont el nmero de plantas de cada parcela (X). Los datos se presentan en la tabla siguiente:
Bloque
Variables X Y X Y X Y X Y X Y X Y X Y X Y
Testigo 9 74 9 51 8 95 9 62 9 60 9 47 6 14 8 19
Disyston 7 58 8 67 5 40 8 58 6 29 8 64 9 55 8 47
Ekatin 9 118 9 48 9 49 9 64 8 67 8 51 8 15 9 29
Keltane 6 41 9 38 8 77 9 92 7 57 7 77 8 59 8 32
Con estos datos realice el Anlisis de Covariaza y concluya. 2. Con el objetivo de evaluar 4 tipos de raciones en cerdos, se realiz una prueba de engorda. El diseo experimental utilizado fue el completamente al azar con 6 repeticiones. Los datos de ganancia en peso (Y) y pesos iniciales (X) de los cerdos, se presentan en el cuadro siguiente: Tratamientos 1 X 30 27 20 21 33 29 Y 165 170 130 156 167 151 X 24 31 20 26 20 25 2 Y 180 169 171 161 180 170 X 34 32 35 35 30 29 3 Y 156 189 138 190 160 172 X 41 32 30 35 28 36 4 Y 201 173 200 193 142 189
154
3. La siguiente tabla muestra la altura inicial (x) y la altura alcanzada luego de cuatro meses (y) de plantas de Leucaena leucocephala, en tres tipos diferentes de suelo en un rea experimental. Se utiliz un diseo completamente al azar, con diez repeticiones. Ambas alturas son expresadas en centmetros. Parcela 1 2 3 4 5 6 7 8 9 10 Tratamiento 1 X Y 18 145 22 149 26 156 19 151 15 143 25 152 16 144 28 154 23 150 24 151 Tratamiento 2 X Y 27 161 28 164 27 172 25 160 21 166 30 175 21 156 30 175 22 158 25 165 Tratamiento 3 X Y 31 180 27 158 34 183 32 175 35 195 36 196 35 187 23 137 34 184 32 184
Con estos datos realice el Anlisis de Covariaza y concluya. 4. Un investigador est estudiando tres tcnicas diferentes de deshidratacin con el propsito de industrializar una fruta. Utiliza un diseo completamente al azar para evaluar el ndice de recuperacin del agua en cada fruta tratada. Debido a que el tamao del fruto estudiado vara, se pesa cada uno de ellos al asignarlo al tratamiento. En este caso el peso es una covariable en el proceso. As, el factor es la tcnica (t) de deshidratacin, la respuesta y: el ndice de rehidratacin y la covariable x; el peso en gramos. Los datos que resultaron al realizar el experimento se presentan a continuacin: y 57 60 69 71 81 83 x 11.5 13.0 15.0 14.0 17.0 18.5 Tratamiento 2 2 2 2 2 2 y 77 89 90 92 104 101 x 15.5 16.5 18.0 19.5 23.0 22.5 Tratamiento 3 3 3 3 3 3 y 58 64 73 75 78 80 x 14.5 15.0 18.0 17.5 19.0 20.0
Tratamiento 1 1 1 1 1 1
Con estos datos, realice el Anlisis de Covarianza y emita las conclusiones respectivas.
155
CAPTULO 11
SERIE DE EXPERIMENTOS 11.1 INTRODUCCIN
En la experimentacin agronmica es comn que ocurra la instalacin de un grupo de experimentos, todos ellos con la misma estructura, sin embargo instalados en localidades distintas, con el objetivo de obtener conclusiones vlidas para toda una regin, admitindose siempre, que el efecto de las localidades es aleatorio. Para cada experimento o para cada localidad se pueden obtener conclusiones analizando los datos individualmente y las conclusiones ms generales sern obtenidas del anlisis conjunto de todo el grupo de experimentos. El agrupamiento de los experimentos para un anlisis conjunto, segn Campos (1984), podr obedecer a diferentes criterios, dentro de los cuales se tiene: a) b) por sectores geogrficos, o por ao agrcolas, etc.
Paca que los experimentos puedan ser reunidos es necesario que existe homogeneidad de varianzas, esto es, que los cuadrados medios del residuo no difieran mucho entre si. Para evaluar esa homogeneidad se puede utilizar cualquiera de las pruebas para verificacin de la homogeneidad de varianzas, por ejemplo, la prueba de F(mx), tambin conocida como Prueba de Hartley. Si la homogeneidad de varianzas no fuera detectada, Nogueira (2000) indica que se debe proceder de la siguiente manera: a) b) Separar en subgrupos los experimentos con cuadrados medios residuales semejantes, o no muy discrepantes y analizarlos separadamente, o Realizar el anlisis de varianza conjunto, y en el momento de tomar la decisin de rechazar o no la hiptesis nula, a travs de la prueba de F, aplicar el mtodo propuesto por Cochran en 1954, que consiste en ajustar los grados de libertad del residuo medio, representado por n, y los grados de libertad de la interaccin Localidades Tratamientos, representado por n ,obtenidos de la siguiente manera:
CM Residuo(1) + . . . + CM Residuo(K) , con GLResiduo(k) < n < n= 2 2 CM Residuo(1) CM Residuo(K ) + ... + GL Residuo(1) GL Residuo(K )
GL
k =1 K
Residuo(k )
n=
(t 1)(K 1) V , (K 2)V2 + V
2 2 1 2 1
V1 =
CM Residuo(k )
k =1
V2 =
CM
k =1
Residuo(k )
Siendo: t es el nmero de tratamientos, K es el nmero de localidades (o experimentos). CMResiduo(k) es el cuadrado medio del residuo, referente a la k-sima localidad o experimento.
156
11.2 EJEMPLO ILUSTRATIVO
Los datos que se presentan a continuacin se refieren a la produccin de caa de azcar por hectrea, obtenidos de tres experimentos sobre evaluacin de seis productos madurantes, instalados en tres fincas del ingenio Palo Gordo, siguiendo un diseo en bloques al azar. Finca Palo Gordo Productos Roundup Roundup Max Touchdown Glifolaq Fusilade Select Testigo Totales Bloques I 96.97 96.97 102.00 96.97 96.97 96.97 103.03 689.88 II 93.94 96.97 93.94 93.94 90.91 90.00 100.00 659.70 III 90.91 90.91 93.94 93.94 93.94 93.94 100.00 657.58 IV 96.97 96.97 93.94 93.94 93.94 96.97 103.03 675.76 Total 378.79 381.82 383.82 378.79 375.76 377.88 406.06 2,682.91 Media 94.70 95.45 95.95 94.70 93.94 94.47 101.52 95.82
Finca Los Patos Productos Roundup Roundup Max Touchdown Glifolaq Fusilade Select Testigo Totales Bloques I 66.67 63.64 63.64 66.67 66.67 63.64 69.70 460.61 II 63.64 63.64 63.64 72.73 66.67 60.61 66.67 457.58 III 66.67 66.67 66.67 63.64 60.61 63.64 66.67 454.55 IV 66.67 60.61 66.67 60.61 69.70 66.67 66.67 457.58 Total 263.64 254.55 260.61 263.64 263.64 254.55 269.70 1,830.30 Media 65.91 63.64 65.15 65.91 65.91 63.64 67.42 65.37
Finca La Reforma Productos Roundup Roundup Max Touchdown Glifolaq Fusilade Select Testigo Totales Bloques I 72.73 72.73 69.70 72.73 69.70 69.70 75.76 503.03 II 69.70 72.73 66.67 72.73 72.73 72.73 75.76 503.03 III 72.73 81.82 72.73 69.70 69.70 75.76 75.76 518.18 IV 69.70 66.67 72.73 72.73 75.76 72.73 78.79 509.09 Total 284.85 293.94 281.82 287.88 287.88 290.91 306.06 2,033.33 Media 71.21 73.48 70.45 71.97 71.97 72.73 76.52 72.62
157
11.2.1 Anlisis de varianza individual (por experimento o localidad) El modelo adoptado fue el siguiente: Yij = + i + j + ij Siendo: Yij = i j ij = = = = i = 1, 2, 3, . . . , t j = 1, 2, 3, . . . , r
toneladas de caa por hectrea referentes al i-simo producto madurante en el el jsimo bloque o repeticin. media general (TCH) del experimento. efecto del i-simo producto madurante efecto del j-simo bloque o repeticin error asociado a la ij-sima unidad experimental.
Las hiptesis evaluadas son las siguientes: Ho: Ha: 1. = . . . = t. por lo menos una i i , para i i,
a travs de la prueba de F y aplicando el anlisis de varianza, cuyos resultados obtenidos para cada localidad o experimento, son los siguientes: L1 Finca Palo Gordo FV Bloques Madurantes Residuo Total GL 3 6 18 27 SC 98.1021 161.8751 70.6234 330.6006 CM 26.9792 3.9235 Valor de F 6.8763 ** F crtica 2.66 P-value 0.00064025
L2 Finca Los Patos FV Bloques Madurantes Residuo Total GL 3 6 18 27 SC 2.6236 44.6019 181.0311 228.2566 CM 7.4336 10.0573 Valor de F 0.73913 NS F crtica 2.66 P-value 0.62512643
L3 Finca La Reforma FV Bloques Madurantes Residuo Total GL 3 6 18 27 SC 21.973 93.795 186.934 302.702 CM 15.6325 10.3852 Valor de F 1.50526 NS F crtica 2.66 P-value 0.23244321
158
Como se observa en los cuadros anteriores, solamente en la finca Palo Gordo se detectaron diferencias significativas en el efecto de los productos utilizados como madurantes. Para poder reunir este grupo de experimentos y realizar el anlisis de varianza conjunto es necesario verificar si ocurre la homocedasticidad entre los experimentos, a travs de la aplicacin de una prueba de homocedasticidad. Las hiptesis a evaluar son:
2 Ho : 2 = 2 = 3 2 1
Ha : 2 2 , para k k, a travs de la prueba de Hartley, cuyo resultado obtenido es, k k CM Residuo(mx ) 10.3852 F(mx ) = = = 2.65 , CM Residuo(mn ) 3.9235
De la Tabla 5 del Apndice se tiene para (0.05;3,18) = 3.19, por lo que no se rechaza la hiptesis nula, esto es, se puede considerar la existencia de homocedasticidad de varianzas, de tal manera, que es posible reunir en un anlisis conjunto este grupo de experimentos. 11.2.2 Anlisis conjunto El modelo adoptado fue el siguiente: Yijk = + i + j / k + lk + (l)ik + ijk Siendo: Yijk = i j / k lk ijk (l)ik = = = = = = i = 1, 2 , . . . , t (madurantes) j = 1, 2, . . . , r (bloques) k = 1, 2, . . . , k (localidades o experimentos) toneladas de caa por hectrea referentes al i-simo producto madurante en el el jsimo bloque o repeticin de la k-sima localidad; media general efecto del i-simo producto madurante efecto del j-simo bloque en la k-sima localidad, efecto de la k-sima localidad, efecto de la interaccin entre el i-simo producto madurante y la k-sima localidad, error experimental asociado a la observacin Yijk.
Barbin (1993) cita que, el efecto de bloques dentro de localidades (j/k) no representa importancia prctica, por lo que puede ser eliminado del modelo. Sin embargo, si en algunos tipos de experimentos ese efecto fuera importante, se puede admitir el modelo completo. Las hiptesis a ser evaluadas son: i) ii) Ho1: Ha1: Ho1: Ha1: iii) Ho1: i = 0, para todo i, contra, i 0, para algn i;
lk = 0, para todo k, contra, lk 0, para algn k;
Ha1:
159
De esta manera se tienen las siguientes fuentes de variacin y el clculo de los grados de libertad:
Fuentes de variacin Bloques dentro de localidades Localidades Tratamientos Localidades x Tratamientos Residuo (error experimental) Total Grados de libertad K (r 1) (r 1) (t 1) (K 1) (t 1) K(t 1) (r 1) (t r K 1)
Para realizar el anlisis de varianza conjunto, se utiliz el programa SAS (Statistical Analysis System). El programa de ingreso se presenta a continuacin: OPTIONS nodate nonumber; TITLE Serie de experimentos en bloques al azar; DATA cana; INPUT loc rep mad tch; CARDS; ; PROC GLM; DATA= cana; CLASS loc rep mad; MODEL tch= loc rep(loc) mad mad*loc/SS3; TEST H =mad E=mad*loc; MEANS loc/tukey; MEANS mad/tukey E=mad*loc; RUN; La salida que genera este programa se presenta a continuacin:
Serie de experimentos en bloques al azar General Linear Models Procedure Class Level Information Class LOC REP MAD Levels 3 4 7 Values 1 2 3 1 2 3 4 1 2 3 4 5 6 7
160
General Linear Models Procedure Dependent Variable: TCH Source Model Error Corrected Total DF 29 54 83 R-Square 0.970818 Source LOC REP(LOC) MAD LOC*MAD DF 2 9 6 12 Sum of Squares 14587.97232738 438.50814286 15026.48047024 C.V. 3.656342 Type III SS 14165.07917381 122.67838214 213.95486190 86.25990952 Mean Square 503.03352853 8.12052116 Root MSE 2.84965281 Mean Square 7082.53958690 13.63093135 35.65914365 7.18832579 F Value 872.18 1.68 4.39 0.89 F Value 61.95 Pr > F 0.0001
Tests of Hypotheses using the Type III MS for LOC*MAD as an error term Source MAD DF 6 Type III SS 213.95486190 General Linear Models Procedure Tukey's Studentized Range (HSD) Test for variable: TCH NOTE: This test controls the type I experimentwise error rate, but generally has a higher type II error rate than REGWQ. Alpha= 0.05 df= 54 MSE= 8.120521 Critical Value of Studentized Range= 3.408 Minimum Significant Difference= 1.8355 Means with the same letter are not significantly different. Tukey Grouping A B C Mean 95.8186 72.6218 65.3714 N 28 28 28 LOC 1 3 2 Mean Square 35.65914365 F Value 4.96 Pr > F 0.0090
General Linear Models Procedure Tukey's Studentized Range (HSD) Test for variable: TCH NOTE: This test controls the type I experimentwise error rate, but generally has a higher type II error rate than REGWQ. Alpha= 0.05 df= 12 MSE= 7.188326 Critical Value of Studentized Range= 4.947 Minimum Significant Difference= 3.8287 Means with the same letter are not significantly different. Tukey Grouping A B B B B B B Mean 81.820 77.528 77.528 77.275 77.275 77.189 76.947 N 12 12 12 12 12 12 12 MAD 7 4 2 5 1 3 6
161
BIBLIOGRAFA
1. Alfaro Argueta, RA. 1999. Evaluacin inicial del efecto de tres intensidades de raleo y tres de poda en el crecimiento de una plantacin de Pinus caribaea Morelet var. hondurensis, en Livingston, Izabal Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 124 p. Alfaro Villatoro, MA. 1985. Evaluacin del rendimiento y composicin qumica del amaranto (Amaranthus hypochondriacus L.) en tres diferentes pocas de corte. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 48 p. lvarez Cajas, VM. 1982. Determinacin del tamao ptimo de parcela experimental en caa de azcar (Saccharum officinarum L.) bajo condiciones de la finca Bulbuxy. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 49 p. Anjos, A. Dos 2003. Planejamento de experimentos I. Curitiba: Universidade Federal do Paran, Setor de Cincias Exatas, Departamento de Estatstica. 94 p. Ayala Marroqun, ME. 1992. Efecto de cuatro frecuencias de riego en el rendimiento y la evapotranspiracin del maz (Zea mays L.), en la Unidad de Riego San Cristbal Acasaguastln, El Progreso. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 101 p. Barbin, D. 1993. Componentes de varincia. Piracicaba: Universidade de So Paulo, Escola Superior de Agricultura Luiz de Queiroz. 108 p. Barrientos Garca, M. 1981. Evaluacin de cuatro mtodos para la determinacin de tamao y forma ptimos de parcela para experimentos agrcolas. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 60 p. Batres, J.; De Len, WE; Salazar, R.; Saquimux, F. 2000. Efecto de la edad de los rboles semilleros en el porcentaje de germinacin de semilla de pinabete (Abies guatemalensis Rehder) en la comunidad de Chimente, Totonicapn, Guatemala. Ministerio de Agricultura, Ganadera y Alimentacin, rea de Recursos Naturales Renovables, Subrea de Forestera, Regin VII. 35 p. Campbell, D. y Stanley, J. (1982). Diseos experimentales y cuasiexperimentales en investigacin social. Buenos Aires: Amorrortu Editores. Campos, H. de. 1984. Estatstica aplicada experimentao com cana-de-acar. Piracicaba: FEALQ. 292 p. Castillo Fratti, AJ. 1996. Evaluacin del efecto de la incisin anular sobre la calidad y rendimiento de la fruta de uva de mesa (Vitis vinifera L.) en dos localidades del nororiente del pas. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 61 p. Castao, E.; Domnguez, J. 2001. Diseo de experimentos para el Desarrollo Tecnolgico y Mejora Industrial. Mxico, D.F.: Just in Time Press, S.A. de C.V. 313 p.
2.
3.
4. 5.
6. 7.
8.
9. 10. 11.
12.
162
13. 14. 15. CENGICAA. 2005. Memoria. 20042005. Guatemala. 185 p. Presentacin de resultados de investigacin. Zafra
Chacin, F. L. 1976. Tamao de parcela experimental y su forma. Revista Facultad de Agronoma (Maracay), 60(3):55-74. Estrada Muy, RA. 1993. Evaluacin del efecto de 16 distancias de siembra sobre el crecimiento y rendimiento en el cultivo de chile chocolate (Capsicum sp) en el valle central de Guatemala. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 48 p. Gomes, FP. 2000. Curso de Estatstica Experimental. 14 Ed. Piracicaba: Novel. 477 p. Gonzlez Ramrez, BH. 1999. Evaluacin agroeconmica del sistema de cultivo intercalado caa de azcar (Saccharum spp.)girasol (Helianthus agnus L.) Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 59 p. Hernndez Dvila, AG. 1982. Determinacin del tamao ptimo de parcela para estudios experimentales en dos variedades de papa (Solanum tuberosum L.) en el altiplano central de Guatemala. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 58 p. Herrera, J.; Barreras, A. 2001. Manual de procedimientos: Anlisis estadstico de experimentos pecuarios (utilizando el programa SAS). 2. Ed. Montecillo: Colegio de Postgraduados. 117 p. Jayaraman, K. 2000. A Statistical Manual for Forestry Research. Bangkok: FORSPA-FAO Publication. 240 p. Kempthorne, O. 1975. The Design and Analysis of Experiments. New York: Krieger. 631 p. Lpez Bautista, EA. 1999. Influencia de la lmina de riego en el efecto del madurante en caa de azcar (Saccharum spp.) var. CP-722086 Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 70 p. Macchiavelli, R. 2004 AGRO 6600 Curso avanzado de Biometra (en lnea). Mayagez, Puerto Rico. Consultado 27 En. 2004. Disponible en: http://cca.uprm.edu/agronomia/profesores/base/rmacchiavelli/extra/agro6600/conferencia3.pdf Martnez Garza, A. 1994. Experimentacin Agrcola. Mxico: Universidad Autnoma de Chapingo. 342 p. Martnez Garza, A. 1988. Diseos Experimentales. Mxico, D.F.: Trillas. Mendoza Leonardo, AO. 2001. Evaluacin del efecto de la pulpa del caf (Coffea arabica L.) sobre el rendimiento y eficiencia biolgica de la cepa ECS-0110 de Pleurotas ostreatus utilizando estopa de coco (Cocus nucifera L.) y estrbilos de pino (Pinus spp.) como sustratos. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 46 p. Montgomery, D. 1991. Diseo y anlisis de experimentos. Mxico D.F.: Iberoamrica. 589 p.
16. 17.
18.
23.
27.
163
28. Navarro Estrada, JG. 2003. Efecto de cuatro lminas de riego sobre el rendimiento de pltano (Musa paradisiaca var. Currar) bajo las condiciones de aldea Los Encuentros, Coatepeque, Quetzaltenango. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 64 p. Navarro Sosa, MR. 1996. Evaluacin de aceites y detergentes para el control de fidos (Homptera: Aphididae) en el cultivo de brcoli en Chimaltenango. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 59 p. Neter, J.; Kutner, M.; Nachtsheim, C.; Wasserman, W. 1996. Applied statistical models. 4a. Ed. New York: McGraw-Hill. 1048 pp Nogueira, MCS. 1997. Apostila da disciplina de Estatstica Experimental aplicada Experimentao Agronmica. Piracicaba: Universidade de So Paulo, Escola Superior de Agricultura Luiz de Queiroz. 250 p. Orellana Najarro, SE. 2006. Evaluacin de la selectividad de los herbicidas Acetoclor y Alaclor en seis cultivos hortcolas en el municipio de Monjas, Jalapa. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 86 p. Ostle, B. 1973. Estadstica aplicada. Mxico D.F.: Limusa-Wiley. 629 p. Quaggio, J.A.; Mascarenhas, H. A. Bataglia, O. C. Resposta da soja aplicao de doses crescentes de calcrio en Latossolo roxo distrfico de cerrado. II. Efeito residual. Revista Brasileira de Cincia do Solo. 6:113-8, 1982. Restrepo, L. Diagramas de estructura en el anlisis de varianza. Revista Colombiana de Ciencias Pecuarias. 20: 200208, 2007. Rivera Aguirre, FA. 2001. Evaluacin de N y P. en el rendimiento de cardamomo (Elettaria cardamomun M.), en la serie de suelos Tamahu, aldea Choval, Cobn, Alta Verapaz. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 56 p. Salazar Rodrguez, JA. 1985. Determinacin de la cantidad mnima efectiva y residualidad del trimedlure, para mejorar la eficiencia de deteccin de la mosca del mediterrneo (Ceratitis capitata Wiedemann) Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 53 p. Sosa Leonardo, JE. 1999. Evaluacin de cuatro substancias diluyentes-dispersantes de polen para producir semilla hbrida en cuatro cultivares de Marigold (Tagetes erecta L.) mediante polinizacin artificial en condiciones de invernadero. Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 60 p. Steel, R.; Torrie, J. 1980. Bioestadstica. Mxico: McGraw-Hill. Veras Castillo, EE. 1992. Evaluacin de dos atrayentes sexuales y tres mezclas de stos en captura de mosca de la fruta del mediterrneo (Ceratitis capitata Wied) Tesis Ing. Agr. Guatemala, Universidad de San Carlos, Facultad de Agronoma. 72 p.
29.
30. 31.
32.
33. 34.
35. 36.
37.
38.
39. 40.
164
165
Tabla 1
Grados de libertad del denominador
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 23 24 25
161.4 199.5 215.7 224.6 230.2 233.9 236.8 238.9 240.54 241.9 242.9 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 248.3 248.6 248.8 249.0 249.3 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 10.13 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 4.35 4.32 4.28 4.26 4.24 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68 3.63 3.59 3.55 3.52 3.49 3.47 3.42 3.40 3.39 9.28 6.59 5.41 4.76 4.35 4.07 3.86 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 3.10 3.07 3.03 3.01 2.99 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 2.87 2.84 2.80 2.78 2.76 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.03 2.96 2.90 2.85 2.81 2.77 2.74 2.71 2.68 2.64 2.62 2.60 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79 2.74 2.70 2.66 2.63 2.60 2.57 2.53 2.51 2.49 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71 2.66 2.61 2.58 2.54 2.51 2.49 2.44 2.42 2.40 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.37 2.36 2.34 19.38 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59 2.54 2.49 2.46 2.42 2.39 2.37 2.32 2.30 2.28 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45 19.45 19.45 19.45 19.45 19.46 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54 2.49 2.45 2.41 2.38 2.35 2.32 2.27 2.25 2.24 8.76 5.94 4.70 4.03 3.60 3.31 3.10 2.94 2.82 2.72 2.63 2.57 2.51 2.46 2.41 2.37 2.34 2.31 2.28 2.24 2.22 2.20 8.74 5.91 4.68 4.00 3.57 3.28 3.07 2.91 2.79 2.69 2.60 2.53 2.48 2.42 2.38 2.34 2.31 2.28 2.25 2.20 2.18 2.16 8.73 5.89 4.66 3.98 3.55 3.26 3.05 2.89 2.76 2.66 2.58 2.51 2.45 2.40 2.35 2.31 2.28 2.25 2.22 2.18 2.15 2.14 8.71 5.87 4.64 3.96 3.53 3.24 3.03 2.86 2.74 2.64 2.55 2.48 2.42 2.37 2.33 2.29 2.26 2.22 2.20 2.15 2.13 2.11 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.18 2.13 2.11 2.09 8.69 5.84 4.60 3.92 3.49 3.20 2.99 2.83 2.70 2.60 2.51 2.44 2.38 2.33 2.29 2.25 2.21 2.18 2.16 2.11 2.09 2.07 8.68 5.83 4.59 3.91 3.48 3.19 2.97 2.81 2.69 2.58 2.50 2.43 2.37 2.32 2.27 2.23 2.20 2.17 2.14 2.09 2.07 2.05 8.67 5.82 4.58 3.90 3.47 3.17 2.96 2.80 2.67 2.57 2.48 2.41 2.35 2.30 2.26 2.22 2.18 2.15 2.12 2.08 2.05 2.04 8.67 5.81 4.57 3.88 3.46 3.16 2.95 2.79 2.66 2.56 2.47 2.40 2.34 2.29 2.24 2.20 2.17 2.14 2.11 2.06 2.04 2.02 8.66 5.80 4.56 3.87 3.44 3.15 2.94 2.77 2.65 2.54 2.46 2.39 2.33 2.28 2.23 2.19 2.16 2.12 2.10 2.05 2.03 2.01 8.65 5.79 4.55 3.86 3.43 3.14 2.93 2.76 2.64 2.53 2.45 2.38 2.32 2.26 2.22 2.18 2.14 2.11 2.08 2.04 2.01 2.00 8.65 5.79 4.54 3.86 3.43 3.13 2.92 2.75 2.63 2.52 2.44 2.37 2.31 2.25 2.21 2.17 2.13 2.10 2.07 2.02 2.00 1.98 8.64 5.78 4.53 3.85 3.42 3.12 2.91 2.75 2.62 2.51 2.43 2.36 2.30 2.24 2.20 2.16 2.12 2.09 2.06 2.01 1.99 1.97 8.64 5.77 4.53 3.84 3.41 3.12 2.90 2.74 2.61 2.51 2.42 2.35 2.29 2.24 2.19 2.15 2.11 2.08 2.05 2.01 1.98 1.96 8.63 5.77 4.52 3.83 3.40 3.11 2.89 2.73 2.60 2.50 2.41 2.34 2.28 2.23 2.18 2.14 2.11 2.07 2.05 2.00 1.97 1.96
166
Tabla 2 Valores de la amplitud total estudentizada, q 0.05, para uso en la prueba de Tukey
glee 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 30 40 50 60 120
2 17.97 6.08 4.50 3.93 3.64 3.46 3.34 3.26 3.20 3.15 3.11 3.08 3.06 3.03 3.01 3.00 2.98 2.97 2.96 2.95 2.92 2.89 2.86 2.83 2.80 2.77
3 26.98 8.33 5.91 5.04 4.60 4.34 4.16 4.04 3.95 3.88 3.82 3.77 3.73 3.70 3.67 3.65 3.63 3.61 3.59 3.59 3.53 3.49 3.44 3.40 3.36 3.31
4 32.82 9.80 6.82 5.76 5.22 4.90 4.68 4.53 4.41 4.33 4.26 4.20 4.15 4.11 4.08 4.05 4.02 4.00 3.98 3.96 3.90 3.85 3.79 3.74 3.68 3.63
Nmero de tratamientos 5 6 7 8 9 10 11 12 13 14 15 16 37.08 40.41 43.12 45.40 47.36 49.07 50.59 51.96 53.20 54.33 55.36 56.32 10.88 11.74 12.44 13.03 13.54 13.99 14.39 14.75 18.08 15.38 15.65 15.91 7.50 8.04 8.48 8.85 9.18 9.46 9.72 9.95 10.15 10.35 10.53 10.69 6.29 6.71 7.05 7.35 7.60 7.83 8.03 8.21 8.37 8.52 8.66 8.79 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.47 7.60 7.72 7.83 5.30 5.63 5.90 6.12 6.32 6.49 6.65 6.79 6.92 7.03 7.14 7.24 5.06 5.36 5.61 5.82 5.82 6.16 6.30 6.43 6.55 6.66 6.76 6.85 4.89 5.17 5.40 5.60 6.00 5.92 6.05 6.18 6.29 6.39 6.48 6.57 4.76 5.02 5.24 5.43 5.77 5.74 5.87 5.98 6.09 6.19 6.28 6.36 4.65 4.91 5.12 5.30 5.59 5.60 5.72 5.83 5.93 6.03 6.11 6.19 4.57 4.82 5.03 5.20 5.46 5.49 5.61 5.71 5.81 5.90 5.98 6.06 4.51 4.75 4.95 5.12 5.35 5.39 5.51 5.61 5.71 5.80 5.88 5.95 4.45 4.69 4.88 5.05 5.27 5.32 5.43 5.53 5.63 5.71 5.79 5.86 4.41 4.64 4.83 4.99 5.19 5.25 5.36 5.46 5.55 5.64 5.71 5.79 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.49 5.57 5.65 5.72 4.33 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.44 5.52 5.59 5.66 4.30 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.39 5.47 5.54 5.61 4.28 4.49 4.67 4.82 4.96 5.07 5.17 5.27 5.35 5.43 5.50 5.57 4.25 4.47 4.65 4.79 4.92 5.04 5.14 5.23 5.31 5.39 5.46 5.53 4.23 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.28 5.36 5.43 5.49 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.18 5.25 5.32 5.38 4.10 4.30 4.46 4.60 4.72 4.82 4.92 5.00 5.08 5.15 5.21 5.27 4.04 4.23 4.39 4.52 4.63 4.73 4.82 4.90 4.98 5.04 5.11 5.16 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 4.88 4.94 5.00 5.06 3.92 4.10 4.24 4.36 4.47 4.56 4.64 4.71 4.78 4.94 4.90 4.95 3.86 4.03 4.17 4.29 4.39 4.47 4.55 4.62 4.68 4.74 4.80 4.85
17 57.22 16.14 10.84 8.91 7.93 7.34 6.94 6.65 6.44 6.27 6.13 6.02 5.93 5.85 5.78 5.73 5.67 5.63 5.59 5.55 5.44 5.33 5.22 5.11 5.00 4.89
18 58.04 16.37 10.98 9.03 8.03 7.34 7.02 6.73 6.51 6.34 6.20 6.09 5.99 5.91 5.85 5.79 5.73 5.69 5.65 5.61 5.49 5.38 5.27 5.15 5.04 4.93
19 58.83 16.57 11.11 9.13 8.12 7.51 7.10 6.80 6.58 6.40 6.27 6.15 6.05 5.97 5.90 5.84 5.79 5.74 5.70 5.66 5.55 5.43 5.31 5.20 5.09 4.97
20 59.56 16.77 11.24 9.23 8.21 7.59 7.17 6.87 6.64 6.47 6.33 6.21 6.11 6.03 5.96 5.90 5.84 5.79 5.75 5.71 5.59 5.47 5.36 5.24 5.13 5.01
167
Tabla 3
Valores de la amplitud total estudentizada, d 0.05, para uso en la prueba de Duncan Nmero de tratamientos 5 6 7 8 9 10 20 18.00 18.00 18.00 18.00 18.00 18.00 18.00 6.09 6.09 6.09 6.09 6.09 6.09 6.09 4.50 4.50 4.50 4.50 4.50 4.50 4.50 4.02 4.02 4.02 4.02 4.02 4.02 4.02 3.83 3.83 3.83 3.83 3.83 3.83 3.83 3.68 3.68 3.68 3.68 3.68 3.68 3.68 3.58 3.60 3.61 3.61 3.61 3.61 3.61 3.52 3.55 3.56 3.56 3.56 3.56 3.56 3.47 3.50 3.52 3.52 3.52 3.52 3.52 3.43 3.46 3.47 3.47 3.47 3.47 3.48 3.39 3.43 3.44 3.45 3.46 3.46 3.48 3.36 3.40 3.42 3.44 3.44 3.46 3.48 3.35 3.38 3.41 3.42 3.44 3.45 3.47 3.33 3.37 3.39 3.41 3.42 3.44 3.47 3.31 3.36 3.38 3.40 3.42 3.43 3.47 3.30 3.34 3.37 3.39 3.41 3.43 3.47 3.28 3.33 3.36 3.38 3.40 3.42 3.47 3.27 3.32 3.35 3.37 3.39 3.41 3.47 3.26 3.31 3.35 3.37 3.39 3.41 3.47 3.25 3.30 3.34 3.36 3.38 3.40 3.47 3.20 3.25 3.29 3.32 3.35 3.37 3.47 3.17 3.22 3.27 3.30 3.33 3.35 3.47 3.14 3.20 3.24 3.28 3.31 3.33 3.47 3.12 3.18 3.22 3.26 3.29 3.32 3.47 3.09 3.15 3.19 3.23 3.26 3.29 3.47
glee 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 30 40 60 100
2 18.00 6.09 4.50 3.93 3.64 3.46 3.35 3.26 3.20 3.15 3.11 3.08 3.06 3.03 3.01 3.00 2.98 2.97 2.96 2.95 2.89 2.86 2.83 2.80 2.77
3 18.00 6.09 4.50 4.01 3.74 3.58 3.47 3.39 3.34 3.30 3.27 3.23 3.21 3.18 3.16 3.15 3.13 3.12 3.11 3.10 3.04 3.01 2.98 2.95 2.92
4 18.00 6.09 4.50 4.02 3.79 3.64 3.54 3.47 3.41 3.37 3.35 3.33 3.30 3.27 3.25 3.23 3.22 3.21 3.19 3.18 3.12 3.10 3.08 3.05 3.02
50 18.00 6.09 4.50 4.02 3.83 3.68 3.61 3.56 3.52 3.48 3.48 3.47 3.47 3.47 3.47 3.47 3.47 3.47 3.47 3.47 3.47 3.47 3.48 3.53 3.67
168
Tabla 4
Valores crticos para la prueba de Dunnett de comparacin de tratamientos con un control, d0.05, comparaciones bilaterales Nmero de medias de tratamientos (excluyendo el control) 2 3 4 5 6 7 8 9 3.03 3.29 3.48 3.62 3.73 3.82 3.90 3.97 2.86 3.10 3.26 3.39 3.49 3.57 3.64 3.71 2.75 2.97 3.12 3.24 3.33 3.41 3.47 3.53 2.67 2.88 3.02 3.13 3.22 3.29 3.35 3.41 2.61 2.81 2.95 3.05 3.14 3.20 3.26 3.32 2.57 2.76 2.89 2.99 3.07 3.14 3.19 3.24 2.53 2.72 2.84 2.94 3.02 3.08 3.14 3.19 2.50 2.68 2.81 2.90 2.98 3.04 3.09 3.14 2.48 2.65 2.78 2.87 2.94 3.00 3.06 3.10 2.46 2.63 2.75 2.84 2.91 2.97 3.02 3.07 2.44 2.61 2.73 2.82 2.89 2.95 3.00 3.04 2.42 2.59 2.71 2.80 2.87 2.92 2.97 3.02 2.41 2.58 2.69 2.78 2.85 2.90 2.95 3.00 2.40 2.56 2.68 2.76 2.83 2.89 2.94 2.98 2.39 2.55 2.66 2.75 2.81 2.87 2.92 2.96 2.38 2.54 2.65 2.73 2.80 2.86 2.90 2.95 2.35 2.51 2.61 2.70 2.76 2.81 2.86 2.90 2.32 2.47 2.58 2.66 2.72 2.77 2.82 2.86 2.29 2.44 2.54 2.62 2.68 2.73 2.77 2.81 2.27 2.41 2.51 2.58 2.64 2.69 2.73 2.77 2.24 2.38 2.47 2.54 2.60 2.65 2.69 2.73 2.21 2.35 2.44 2.51 2.57 2.61 2.65 2.69
glee 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120
1 2.57 2.45 2.36 2.31 2.26 2.23 2.20 2.18 2.16 2.14 2.13 2.12 2.11 2.10 2.09 2.09 2.06 2.04 2.02 2.00 1.98 1.96
169
Tabla 5. Valores crticos de la prueba de F mxima de Hartley para homogeneidad de varianzas
Esta tabla brinda los valores crticos de la prueba del cociente de F mximo de Hartley para homogeneidad de varianzas cuando se tienen muestras de igual tamao en cada grupo. Los valores crticos son dados para = 0.05, 0.01 (en negrito); el nmero de grupos p vara de 2 a 12; y v representa el nmero de grados de libertad para la varianza estimada.
Nmero de grupos ( p ) V 2 3 4 5 6 7 8 9
0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05
2 39.0 199 15.4 47.5 9.60 23.2 7.15 14.9 5.82 11.1 4.99 8.89 4.43 7.50 4.03 6.54 3.72 5.85 3.28 4.91 2.86 4.07 2.46 3.32 2.07 2.63 1.67 1.96 1.00 1.00
3 87.5 448 27.8 85 15.5 37 10.8 22 8.38 15.5 6.94 12.1 6.00 9.90 5.34 8.5 4.85 7.4 4.16 6.1 3.54 4.9 2.95 3.8 2.40 3.0 1.85 2.2 1.00 1.00
4 142 729 39.2 120 20.6 49 13.7 28 10.4 19.1 8.44 14.5 7.18 11.7 6.31 9.9 5.67 8.6 4.79 6.9 4.01 5.5 3.29 4.3 2.61 3.3 1.96 2.3 1.00 1.00
5 202 1036 50.7 151 25.2 59 16.3 33 12.1 22 9.70 16.5 8.12 13.2 7.11 11.1 6.34 9.6 5.30 7.6 4.37 6.0 3.54 4.6 2.78 3.4 2.04 2.4 1.00 1.00
6 266 1362 62.0 184 29.5 69 18.7 38 13.7 25 10.8 18.4 9.03 14.5 7.80 12.1 6.92 10.4 5.72 8.2 4.68 6.4 3.76 4.9 2.91 3.6 2.11 2.4 1.00 1.00
7 333 1705 72.9 216 33.6 79 20.8 42 15.0 27 11.8 20 9.78 15.8 8.41 13.1 7.42 11.1 6.09 8.7 4.95 6.7 3.94 5.1 3.02 3.7 2.17 2.5 1.00 1.00
8 403 2063 83.5 249 37.5 89 22.9 46 16.3 30 12.7 22 10.5 16.9 8.95 13.9 7.87 11.8 6.42 9.1 5.19 7.1 4.10 5.3 3.12 3.8 2.22 2.5 1.00 1.00
9 475 2432 93.9 281 41.1 97 24.7 50 17.5 32 13.5 23 11.1 17.9 9.45 14.7 8.28 12.4 6.72 9.5 5.40 7.3 4.24 5.5 3.21 3.9 2.26 2.6 1.00 1.00
10 550 2813 104 310 44.6 106 26.5 54 18.6 34 14.3 24 11.7 18.9 9.91 15.3 8.66 12.9 7.00 9.9 5.59 7.5 4.37 5.6 3.29 4.0 2.30 2.6 1.00 1.00
11 626 3204 114 337 48.0 113 28.2 57 19.7 36 15.1 26 12.2 19.8 10.3 16.0 9.01 13.4 7.25 10.2 5.77 7.8 4.49 5.8 3.36 4.1 2.33 2.7 1.00 1.00
12 704 3605 124 361 51.4 120 29.9 60 20.7 37 15.8 27 12.7 21 10.7 16.6 9.34 13.9 7.48 10.6 5.93 8.0 4.59 5.9 3.39 4.2 2.36 2.7 1.00 1.00
0.01 10 0.05 0.01 12 0.05 0.01 15 0.05 0.01 20 0.05 0.01 30 0.05 0.01 60 0.05 0.01 0.05 0.01
170
Tabla 6
gl 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 0.995 0.00004 0.01003 0.07172 0.20699 0.41174 0.67573 0.98926 1.34441 1.73493 2.15586 2.60322 3.07382 3.56503 4.07467 4.60092 5.14221 5.69722 6.26480 6.84397 7.43384 8.03365 8.64272 9.26042 9.88623 10.51965 11.16024 11.80759 12.46134 13.12115 13.78672 20.70654 27.99075 35.53449 43.27518 51.17193 59.19630 67.32756