Sei sulla pagina 1di 62

ESCUELA MILITAR DE INGENIERIA UNIDAD ACADMICA SANTA CRUZ UNIDAD DE POSTGRADO

ESTADSTICA SUPERIOR

APLICADA

LA

EDUCACIN

Por: Ing. M.Sc. Francisco Martnez Solaris Mgs. En Educacin Superior

Santa Cruz, Mayo del 2013

INTRODUCCION

La investigacin sobre el aprendizaje y la enseanza ha avanzada tremendamente, y los investigadores buscan contribuir a la mejora de la educacin. Sin embargo, continan las quejas sobre la brecha entre la teora/investigacin por un lado, y las prcticas educativas, por el otro.

Una manera potencial para remediar la brecha entre teora y prctica es llevar a cabo experimentos de diseo que: - Buscan desarrollar una ciencia de diseo de la educacin. - Puedan guiar el desarrollo de ambientes de aprendizaje eficaces novedosos

La experimentacin es instrumento de vital importancia para la investigacin ya que por medio de ella, el investigador es capaz de simular un fenmeno de inters, lo que conduce a una investigacin ms rpida, efectiva, de menor riesgo y con un rigor cientfico, siempre y cuando exista una previa planificacin de la investigacin. Existen diferentes tipos de investigaciones que pueden generar conocimientos ya sean bsicos o bien aplicables. Independientemente del tipo de conocimiento que genere una investigacin, ste tiene que someterse a una valoracin cientfica. Para esto la estadstica ofrece herramientas como los DISEOS EXPERIMENTALES de los cuales el investigador se vale para demostrar sus conjeturas, aceptar o no una hiptesis, comparar resultados, emitir conclusiones, etc. acerca del problema o fenmeno en estudio. "Las teoras basadas en ideologas carecen de experimentacin, y por ello, no son ciencia, lo que no se demuestra con experimento es poltica. Lo que se demuestra con experimentacin, es ciencia (Robert Laughlin, Premio Nobel de Fsica 1998).

Ing. M.Sc. Francisco Martnez Solaris

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

1. REGRESION Y CORRELACION LINEAL SIMPLE 1.1 Regresin Lineal Simple

En muchas reas de la investigacin cientfica, la variacin en las mediciones de una variable en estudio es causada preponderantemente por otras variables relacionadas cuyas magnitudes cambian en el curso del experimento. La incorporacin explcita de los datos de estas variables que influyen en el anlisis estadstico, permite conocer la naturaleza de las relaciones y utilizar esta informacin para mejorar la descripcin y las inferencias de las variables de inters primario. Al probar las relaciones entre variables es importante que el valor de la variable pueda ser predicha de las observaciones de otra variable o an controladas y optimizadas manipulando los factores de influencia. El anlisis de regresin es un conjunto de mtodos estadsticos, que tratan con la formulacin de modelos matemticos que describen las relaciones entre variables y el uso de estas relaciones modeladas con el propsito de predecir e inferir. Supuestos del modelo de Regresin Lineal Simple Al igual que en otros tipos de anlisis estadsticos, el modelo de Regresin Lineal Simple se basa en ciertos supuestos que a continuacin se detallan. Supuesto 1. "Y" es una variable aleatoria cuya distribucin probabilstica depende de "X" Este supuesto quiere decir que para cualquier valor de "X", "Y" es una variable aleatoria con cierta distribucin probabilstica con media y/x y y/x. Note que esta suposicin solamente implica que "Y" es una variable aleatoria que depende de "X", y no toma en cuenta la forma lineal. Por otra parte, significa que la variable X se mide sin error y fijada por el investigador. Supuesto 2. Modelo de la lnea recta Esta suposicin requiere que la ecuacin para y/x sea una lnea recta, es decir que y/x = 0 + 1Xi y, por lo tanto, que la ecuacin de dependencia sea Y = 0 + 1Xi + . Con esta

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

restriccin, la lnea que une a y/x debe de ser una recta, por lo tanto se puede tener una de las siguientes situaciones:
Y

Puede ser que se tenga una relacin positiva entre las variables X y Y, esto quiere decir que a medida que aumenta X, Y tambin aumenta. Otra situacin que se puede dar es una relacin inversa, es decir, que a medida que aumenta X, Y disminuye. En el ltimo caso se recurre al hecho de que regresin tambin se entiende como la tangente inversa del ngulo de inclinacin de una recta. En los dos primeros casos las rectas tienen pendiente y en el tercer caso, no hay pendiente lo cual indica que no existe regresin lineal entre ambas variables. Supuesto 3. Homogeneidad de varianza Esta suposicin es muy importante en el anlisis de regresin. La varianza de la distribuciones de "Y" son idnticas para todos los valores de "X". En otras palabras, se supone que y/x1 = y/x2 = y/xn = , donde es la varianza comn (desconocida) para todas las distribuciones de "Y", independientemente del valor de "X". Esto quiere decir, que la media de "Y" se modifica con el valor de "X", pero la varianza se mantiene constante. Supuesto 4. Independencia Los valores de "Y" debern ser estadsticamente independiente. Un ejemplo donde se viola este supuesto es cuando se realizan mediciones de peso a un mismo individuo en un lapso menor a una hora. Supuesto 5. Normalidad La distribucin de "Y" para cualquier valor de "X" es normal. Esto equivale a suponer que la variable aleatoria no observable es normal y su media es cero ya que "X" se toma como variable no aleatoria susceptible a ser manipulada por el investigador.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Todos los supuestos anteriores se pueden resumir en los siguientes: 1. "Y" es una variable aleatoria cuya distribucin probabilstica depende del valor de "X". 2. La ecuacin de regresin es una lnea recta. 3. Homogeneidad de varianza. 4. Independencia de las observaciones lo que implica que los errores son independientes. 5. Normalidad. En la Figura 1 se muestran los supuestos de normalidad y homogeneidad de varianza.

1.2. Diagrama de Dispersin Este diagrama tiene por objetivo dar una idea de la posible relacin existente entre la variable dependiente Y y la independiente X. Para realizar un diagrama de dispersin se coloca en el eje de las abscisas los valores correspondiente a la variable independiente X y en el eje de las ordenadas los valores de la variable dependiente Y. Luego se colocan puntos en la interseccin de los valores de ambas variables. Un ejemplo de lo anterior se muestra en seguida. Los datos que se muestran a continuacin corresponden a la produccin en miles de millones de dlares de 10 empresas y sus costos de produccin de las mismas en miles de millones de dlares.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Para construir un diagrama de dispersin lo primero que se tiene que hacer es determinar quin es la variable dependiente y quin es la variable independiente, es decir, establecer la relacin entre dichas variables. Esta relacin debe ser lo ms natural posible. En el caso del problema, es de suponerse que a medida que aumenta la produccin tambin se incrementarn los costos de produccin por todo lo concerniente a ello (materia prima, horas hombres, gastos de energa, etc.). Entonces definimos a X, variable independiente, a la Produccin y a Y, variable dependiente, a los costos de produccin. De acuerdo a esto se tiene lo siguiente: Produccin (X) (miles de millones de $us) 10 18 12 16 22 36 30 32 26 12 Costo (Y) (miles de millones $u) 3 5 4 5 8 12 10 14 12 3

El diagrama de dispersin quedara de la siguiente forma:


16 14 12 10 8 6 4 2 0 0 5 10 15 20 25 30 35 40

Costo (Miles de millones $us)

Produccin (Miles de Millones $us)

De acuerdo a la informacin que proporciona el diagrama de dispersin se puede observar que a medida que aumenta la produccin de las industrias, aumentan los costos de
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

produccin de las mismas, es decir, se concluir que existe una relacin positiva entre estas variables y adems se puede ver que esta relacin tiende a ser lineal.

1.3. Mtodo de Mnimos Cuadrado Como lo plantea el supuesto 2 del modelo de regresin lineal simple, "Modelo de la Lnea Recta", que de existir una relacin entre X y Y, sta debe ser una lnea recta. Entonces a partir de muestra (x1, y1), (x2, y2),..., (xn, yn), de las variables "X" y "Y", se trata de obtener una ecuacin que represente la relacin entre dichas variables. El modelo del cual se habla es de una ecuacin punto pendiente como sigue: El problema de esta modelo es que sus componentes son parmetros y por lo tanto, son estados desconocidos de la naturaleza generalmente. Es por ello que es necesario obtener estimadores de 0 y 1 para estimar adecuadamente la recta de regresin y/xi. El estimador de y/xi se denota por:

Para llegar a obtener estos estimadores se hace uso de la tcnica propuesta por Carl Gauss (1777-1855). Este mtodo se basa en la idea de obtener estimadores para los componentes del modelo que minimicen la suma de cuadrados de las distancias entre los valores observados (Yi) y los estimados ( ). Esto significa que se tiene que minimizar la suma de cuadrados de las longitudes de los segmentos de las lneas verticales que unen los datos observados con la recta estimada como se muestra en la Figura 3.

A la tcnica antes mencionada se le denomina "Tcnica de Mnimos Cuadrados". Usando notacin matemtica, el mtodo de mnimo cuadrados consiste en encontrar los estimadores de 0 y 1.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Al aplicar la tcnica de mnimos cuadrados se llegan a obtener las ecuaciones de trabajo de y 1^ (en este caso se ha omitido los procesos de derivacin mediante el cual se llega a obtener las frmulas de trabajo). Estas ecuaciones son las siguientes:

( )

. Donde: Coeficiente de Regresin Intercepto de la recta de estimacin

Ejemplo: Retomando los datos que se utilizaron para construir el diagrama de dispersin y aclarando que X es Produccin (miles de millones de $us) y Y Costos (miles de millones de $us) y haciendo uso de las ecuaciones derivadas a travs de la tcnica de mnimos cuadrados se tiene lo siguiente: X 10 18 12 16 22 36 30 32 26 12 Totales Promedio 214 21.4 Y 3 5 4 5 8 12 10 14 12 3 76 7.6 XY 30 90 48 80 176 432 300 448 312 36 1952 X2 100 324 144 256 484 1296 900 1024 676 144 5348 Y2 9 25 16 25 64 144 100 196 144 9 732

( )

= 0.423738, Coeficiente de regresin

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

; Intercepto, por lo tanto la

ecuacin de estimacin quedara de la siguiente manera: ; o bien se puede decir que: Costos = 0.423738 (Produccin) 1.46798 Un aspecto que no se debe olvidar es que el propsito de la Regresin Lineal Simple es el de predecir el comportamiento de una variable dependiente a travs del conocimiento de una variable independiente, es por ello que se debe estar seguro que la ecuacin de estimacin sirve para este propsito (que existe regresin lineal simple). Por esta razn es que la ecuacin de estimada debe ser sometida a un proceso de validacin. 1.4. Validacin de la Ecuacin de Estimacin Este proceso se puede realizar de dos maneras a saber: A travs del Clculo del Coeficiente de Determinacin (R2) Por medio del Anlisis de Varianza de la Regresin (ANARE)

Coeficiente de Determinacin (R2) o Variabilidad (varianza explicada) El Coeficiente de Determinacin, R2, indica el porcentaje de la variabilidad de Y que puede ser explicada o debida a X, es por ello que mientras ms cerca est del 100% es mucho mejor. Esto es debido a que se trata de predecir el comportamiento de Y a travs del conocimiento de X, es por ello que es deseable que el mayor porcentaje de la variabilidad de la variable dependiente sea debida a X, a tal punto que hay autores que consideran que la ecuacin es buena o sirve para predecir si R2 70%. El coeficiente de Determinacin se calcula a travs de la siguiente ecuacin: ( ) ( ) ( ) ( ) ( ) Para el caso del ejemplo anterior el R2 es el siguiente:

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

( ( ) )(

) (

) )

Este dato indica que del 100% de la variabilidad de Y (Costos), el 89.36% es debido a X (Produccin), por lo tanto tambin se puede concluir que existe un 10.64% de variabilidad de Y (Costos) que no es debida a X (Produccin), a esto se le conoce como variabilidad no explicada. En este caso se puede concluir tambin que la ecuacin estimada sirve para predecir (existe regresin lineal simple. Anlisis de Varianza de la Regresin Lineal Simple (ANARE) De forma general se entienden por anlisis de varianza a la particin de la variabilidad total en fuentes de variacin conocidas que en el caso de regresin lineal son las siguientes: debida a la regresin debida a otras causas (error)

Para tratar de ser un poco ms explcito, estas dos fuentes de variacin se derivan del modelo aditivo lineal de la regresin lnea simple el cual es: Esto tiene correspondencia con una tabla de varianza o salida de varianza que para regresin lineal simple es la siguiente: FV Regresin Error Total gl 1 n-2 n-1 SC SCRegresin SCError SCTotales CM Fc Ft (, glreg, glerr)

La primera columna encabezada por FV (Fuentes de variacin) es donde se declara las fuentes de variacin en las que se est partiendo la variabilidad total. Ntese que en esta tabla no se incluye el efecto de fuente de variacin. , ya que ste es una constante por lo tanto no es una

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

La segunda columna encabeza por gl (Grados de Libertad). De forma general grados de libertad es n-1, para el caso de la fuente de variacin debida a regresin siempre es 1 ya que son dos los parmetros que se estiman, 0 y 1, por lo tanto, 2-1 = 1. Es por ello que para el ANARE de regresin lineal simple, esta fuente de variacin siempre tiene 1 grado de libertad y los grados de libertad del error, siempre en este caso, son n-2. Por n se entiendo al conjunto de pares de datos X Y. La tercera columna es la de Suma de Cuadrados (SC) que vienen a ser los componentes de las varianza a estimar cuyas ecuaciones de trabajo son las siguientes: ( ( )

La cuarta columna es para los Cuadrados Medios (CM) que viene a ser las estimaciones propiamente dichas de las varianza de cada una de las fuentes de variacin. Estas resultan de dividir las sumas de cuadrados de stas entre sus grados de libertad. La quinta columna denominada como Fc se refiere a los F calculados que resultan de dividir el cuadrado medio de regresin entre el cuadrado medio del error, es decir, de la variabilidad no debida a la regresin. Es por ello que el error se considera como un trmino de comparacin entre la variabilidad debida a regresin y el mismo. Si el cuadrado medio del error es mayor que el cuadrado medio de regresin, el resultado que se obtendr ser pequeo y posiblemente menor que el valor de la siguiente columna Ft o F de tabla, valor que se extrae de una tabla de F con un nivel de significancia, grados de libertad de regresin y los grados de libertad del error. Para entender mejor lo anterior se debe de partir del juego de hiptesis que se prueba en un ANARE. Este es: Ho: 1 = 0 Ha: 1 0 La hiptesis nula (Ho) asume el efecto de igual o nulidad de efecto y es la hiptesis que se somete a prueba. Partiendo del hecho de que asume el efecto de nulidad, en este caso indica

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

que no existe regresin lineal simple, y asume que la relacin entre X y Y es una lnea recta sin pendiente, es por ello que es igual a cero. Por hiptesis alternativa se entiende aquella que contradice a la hiptesis nula y que es aceptada una vez que se rechaza la hiptesis nula. Es por ello que est como 1 0 ya que una igualdad se contradice con una desigualdad. Esto significa que la recta tiene pendiente, es decir, que existe regresin lineal simple. Ahora bien, todo el ANARE se hace para realizar la prueba de hiptesis de que si existe o no regresin lineal simple. Se entiende como prueba de hiptesis al proceso a travs del cual se prueba la plausibilidad de una hiptesis. Al realizar la prueba de hiptesis se debe llegar una decisin de aceptar o rechazar Ho. Cundo no se rechaza Ho?, cuando el Fc Ft y se rechaza cuando el Fc Ft. A lo anterior se le llama Regla de Decisin la cual es la siguiente: No Rechazo de Ho si Fc Ft Rechazo de Ho si Fc Ft Si la hiptesis nula no se rechaza significa que no existe regresin lineal simple, por lo tanto la ecuacin estimada no sirve para predecir, si se rechaza Ho, inmediatamente se acepta la hiptesis alternativa la que indica que s existe regresin lineal simple. Un aspecto que todava no se ha aclarado es Nivel de Significancia, , entendido como la probabilidad de tomar una decisin equivocada (conocido tambin como Error Tipo I) es por ello que los valores del son pequeos 0.1. Haciendo el ANARE a un = 0.01 se tiene lo siguiente:
( )

= 154.4 ( )

Vaciando esta informacin en la tabla de ANARE se tiene lo siguiente y obteniendo el valor de F de la tabla correspondiente a: 0.01, 1 y 8 se tiene que este es: 11.26

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

FV Regresin Error Total

gl 1 8 9

SC 137.6897 16.4310 154.4

CM 137.6897 2.053875

Fc 67.0389

Ft 11.26

De los resultados de la tabla se puede observar que el Fc es mayor que el Ft lo cual indica que existe suficiente evidencia para rechazar la hiptesis nula, es decir, que existe regresin lineal simple y por lo tanto se dice que la ecuacin estimada sirve para predecir el comportamiento de Costos (Y) a travs del conocimiento de Produccin (X). Cuando se realiza un anlisis de varianza de la regresin se debe emitir una conclusin que podra ser la siguiente: De acuerdo al anlisis de varianza realizado se concluye con un 99% de confiabilidad, (1 0.01)*100, que existe regresin lineal simple. Una vez que se ha comprobado que la ecuacin estimada es buena (hay regresin lineal) el siguiente paso sera interpretar los componentes de la recta de estimacin.

1.5. Interpretacin de los Componentes de la Ecuacin de Estimacin Cuando se hacer una interpretacin, sta debe ser aplicada al problema en cuestin. En el caso del ejemplo que se ha venido desarrollando sera el siguiente: 1: Este es el coeficiente de regresin que indica la cantidad de cambios que experimenta Y por un cambio en X. En este caso indica que por Un mil millones de dlares que se incremente la produccin, los costos se incrementarn en 0.423738 miles de millones de dlares. Esto porque la pendiente encontrada fue positiva, si hubiera sido negativa, se dira que disminuira esa cantidad. 0: No siempre tienen interpretacin aplicada al problema, es decir, una interpretacin lgica, es por ello que comnmente se le interpreta desde el punto de vista matemtico como el punto donde la recta de estimacin corta al eje de las ordenadas cuando X toma el valor de cero. En el caso del ejemplo, 0 =-1.46798, esto estara indicando que cuando la produccin es cero, los costos son de -1.46798 miles de millones de dlares. Como se ve esta interpretacin carece de lgica lo cual hace que se interprete como se ha mencionado anteriormente.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Existen casos donde si existe interpretacin lgica como lo muestra el trabajo de investigacin realizado por Martnez (1995) donde ajust pesos de becerros al nacimiento.

1.6. Dibujo de la Recta de Estimacin Cualquier recta se define por dos puntos y en el caso de la recta de regresin lineal simple, sta pasa por dos puntos obligados cuyas coordenadas son: ( )y( 0). La recta de

estimacin debe dibujarse dentro del rea de exploracin, es decir, el rea determinada por el diagrama de dispersin que donde se tiene informacin de ambas variables. Para el caso del ejemplo que se ha venido tratando la grfica de la recta de estimacin sera como se muestra a continuacin.
16 Costo (miles de millones de $us) 14 12 10 8 6 4 2 0 0 5 10 15 20 25 30 35 40 Produccin (miles de millones de $us) y = 0.4237x - 1.468 R = 0.8936

1.7. Regresin no Lineal Este tipo de regresin no es objeto de desarrollo del presente documento ya que se consideran para cursos superiores de estadstica lo que se trata es dejar plasmado que una relacin entre dos variables no siempre es una lnea recta, sta puede ser logartmica, exponencial o bien cuadrtica o cbica. Uno de los criterios para definir el ajuste de modelo es el R y adems el Cuadrado Medio del Error del anlisis de varianza. En estos casos el diagrama de dispersin es importante para determinar esas posibles relaciones.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Regresin Mltiple No siempre la dependencia en caso de existir se pueda deber a una sola variable, puede ser que Y como variable dependiente se vea afectada por ms de una variable independiente, en este caso se habla de regresin lineal mltiple, aspecto que no se desarrolla en este documento.

1.8. Correlacin Lineal Simple As como existen tcnicas que cuantifican los cambios de una variable dependiente por un nico cambio de la variable independiente, existen tcnicas que cuantifican la asociacin lineal entre dos variables, esta tcnica es llamada Correlacin Lineal Simple que se exprese como el coeficiente de correlacin (r). Este coeficiente indica el sentido de la asociacin como tambin la magnitud de sta, partiendo del hecho que el coeficiente de correlacin lineal simple toma valores en el rango de: r es 0 r 1. Entre ms se acerca a 1 el valor de r mayor es la asociacin entre dichas variables. De acuerdo a lo anterior algunos autores han determinado lo siguiente rangos: -1 r < -0.8 y 0 r < 0.4

Asociacin negativa

fuerte

No hay asociacin

-0.8 r < - Asociacin 0.4 -0.4 r 0 negativa

dbil

y 0.4 r < Asociacin dbil y positiva 0.8 0.8 r 1 Asociacin positiva fuerte y

No hay asociacin

El coeficiente de Correlacin Lineal Simple se determina a travs de la siguiente ecuacin:


(
( ) ( )

)(

( )

, que para el caso del ejemplo sera el siguiente:


)

)(

= 0.9452
)

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Este valor indica que existe una asociacin fuerte y positiva entre estas variables, es decir, entre la produccin y los costos de esas empresas. Diferencias entre Regresin Lineal Simple y Correlacin Lineal Simple Se pueden llegar a establecer las siguientes diferencias: Regresin Lineal Simple Mide la cantidad de cambios en Y por un nico cambio en X. Existe una variable dependiente y otra independiente 1 puede tomar cualquier valor en la recta numrica Correlacin Lineal Simple Mide asociacin lineal entre dos variables Es indistinto x, y y, x El coeficiente de correlacin toma valores en el intervalo -1 r1

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

2. ASPECTOS GENERALES DE LA EXPERIMENTACIN Antes de ingresar al anlisis de los principales diseos experimentales, es necesario establecer el acervo correspondiente en este campo de la Estadstica llamado Diseos Experimentales que facilite el proceso de aprendizaje que aunado a las bases estadsticas anteriores conlleven al usuario a un mejor uso el presente material. Es por ello que a continuacin se detalla lo siguiente: Experimento: Es todo proceso que consiste en la ejecucin de un acto o prueba una o ms veces, cuyo resultado en cada prueba depende del azar y que genera informacin tanto cualitativa como cuantitativa segn sea el caso. En s viene a ser aquel proceso intencionado provocado por el investigador con el fin de estudiar su origen, esencia e interrelacin con otros procesos o fenmenos. Tratamiento: Es todo elemento o sujeto sometido a estudio o ensayo de comparacin. Viene a ser el conjunto de condiciones experimentales que el investigador impone a las unidades experimentales. Ejemplo: diferentes mtodos de enseanza de la matemtica, etc. Unidad Experimental: Tamao de la Unidad Experimental. Es el material o lugar sobre el cual se aplican los tratamientos. Este trmino se utiliza para representar al conjunto de material experimental al cual se le aplica un tratamiento. El tamao de la unidad experimental depende mucho del tipo de material experimental que se utilice y muchas veces de la esperanza de vida en el caso de usar seres vivos. Cuando se experimenta con aves, la unidad experimental puede estar constituida por un grupo de ellas; sin embargo, cuando se puede experimentar con animales cuya esperanza de vida sea mayor, puede ser que uno solo de ellos pueda ser considerado como una unidad experimental. Factor: Es un tratamiento que genera ms tratamiento Error Experimental: Es la variacin aleatoria (no explicada) ajena al control razonable del investigador. Este trmino no es sinnimo de error, si no que forma parte de las caractersticas propias e innatas de la unidad experimental. Este error no se puede evitar pero si se puede reducir
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

usando

las

repeticiones

necesarias,

usando

unidades

experimentales

los

ms

homogneamente posible y manejndolas de manera uniforme. Testigo El testigo es el tratamiento de comparacin adicional, que no debe faltar en un experimento; la eleccin del tratamiento testigo es de gran importancia en cualquier investigacin, ste se constituye como referencial del experimento y sirve para la comparacin de los tratamientos en prueba.

Diseos Experimentales: Es un mtodo cientfico de investigacin que consiste en hacer operaciones prcticas destinadas a demostrar, comprobar o descubrir fenmenos o principios bsicos. Tiene como propsito proporcionar la mxima cantidad de informacin a un costo mnimo. Disear un experimento es planificarlo, qu es lo que se pretende experimentar, es planearlo de modo que se tenga la secuencia completa de pasos tomados de antemano para asegurar que la informacin que se obtendr permita un anlisis objetivo que conduzca a deducciones (demostracin de hiptesis) vlidas con respecto al problema de investigacin previamente establecido. Principios Bsicos de la Experimentacin: Los principios bsicos de la experimentacin son tres: Repeticin, Azarizacin y Control Local. Repeticin. Es la reproduccin del experimento bsico llamado tambin rplica y solamente a travs de ella se pueden obtener conclusiones de un fenmeno. Tiene dos funciones: Proporcionar una estimacin del error experimental y brindar una medicin ms precisa de los efectos de los tratamientos, es decir, que hace posible la prueba de significancia. Azarizacin. Es la asignacin de los tratamientos a las unidades experimentales de modo que todas tengan la misma posibilidad de recibir un tratamiento. Tiene la como funcin hacer vlida la prueba de significancia. Control Local. Es la cantidad de balanceo, bloqueo o agrupamiento de las unidades experimentales que se emplean en el diseo adoptado. Tiene la funcin de hacer ms eficiente el diseo experimental, es decir, hacer ms sensitiva la prueba de significancia
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

reduciendo con ello la magnitud del error. Los criterios de agrupamiento van a depender del tipo de ciencia donde se est experimentando. Exigencias de la Experimentacin: Las exigencias de la experimentacin son: Tipicidad, Uniformidad, Grado de Precisin, Control efectivo de las medidas y observaciones. Tipicidad. Llamado tambin representatividad, hace mencin que no se pueden extrapolar resultados a condiciones diferentes a las que se originaron. Uniformidad. Indica que todas las unidades experimentales deben ser tratadas uniformemente y que la nica diferencia entre ellos sea los tratamientos que se estn evaluando en ellas. Esto evita tener resultados enmascarados en los experimentos. Grado de Precisin. Un experimento bien planeado debe permitir al investigador medir diferencias en los tratamientos con el grado de precisin esperado evitando para ello comete errores al montar el ensayo y en su misma ejecucin. Esto debe ser una tarea de primer orden por parte del investigador. Es por ello que se debe tener especial cuidado en la conduccin y manejo del experimento. Control efectivo de las medidas y observaciones. Es necesario hacer anotaciones de las manifestaciones de las unidades experimentales que permitan explicar ciertos aspectos del experimento. Los diseos experimentales como tal se dividen en dos grupos: diseos experimentales simples y diseos experimentales complejos. Entre los diseos experimentales simples se tiene al Diseo Completamente al Azar, Diseo en Bloques Completamente al Azar, Diseo Cuadrado Latino principalmente.

3. DISEO COMPLETAMENTE AL AZAR (DCA) O DISEO CON UN SOLO CRITERIO DE CLASIFICACIN

Este diseo es el ms simple de todos; en l se asigna al azar los tratamientos a grupos de unidades experimentales previamente determinadas. Asimismo, todas las variables, excepto las que estn en estudio se mantienen constantes.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

3.1. Cundo utilizar este Diseo? Este diseo se utiliza cuando las unidades experimentales son homogneas, o sea, que la nica diferencia que existe son los tratamientos que se aplican a las unidades experimentales. Este diseo se usa cuando se estudia dos o ms tratamientos bajo las siguientes condiciones: a.- Lugar y unidades experimentales muy uniformes (suelo homogneo, en laboratorios, invernaderos, galpones, aulas, etc.), donde no hay heterogeneidad necesaria de absorber. b.- Cuando sea probable que una parte del experimento se pierda. c.- Cuando se tiene un experimento pequeo y donde la mayor precisin de otras distribuciones no compensan la prdida de grados de libertad en el error. Este tipo de diseo proporciona el mximo nmero de grados de libertad para la estimacin del error experimental; adems, no requiere estimar datos faltantes, es decir, puede analizarse con diferente nmero de repeticiones por tratamiento (diseo desbalanceado). 3.2. Modelo Aditivo Lineal El concepto de modelo lineal es una rplica de algo; as como un edificio puede ser representado en una maqueta. Debe evitarse el error de creer que el modelo lineal es el mundo real; ya que slo es una abstraccin de una realidad que existe en la mente del hombre con el objetivo de ayudarse en el anlisis de los procesos naturales que afectan por diversos factores a fuentes de variacin y que dichos modelos son de naturaleza transitoria y son susceptibles a mejorarse. La consideracin bsica para un diseo Completamente al Azar es que las observaciones pueden representarse por medio del modelo estadstico lineal que es el siguiente:

Donde: Yij = Variable Respuesta = Efecto comn a todas las observaciones Ti = Efecto del i-simo tratamiento Eij = Erro experimental o error del modelo

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

3.3. Supuesto del Anlisis de Varianza De forma general, los supuestos en los que se basa el anlisis de varianza son: Homogeneidad de Varianza, Normalidad, Aditividad y Linealidad del Modelo, e Independencia. 3.3.1. Homogeneidad de Varianza: Las varianzas de las diferentes medas deben ser homogneas. Por lo general, en el anlisis de varianza, se utiliza un promedio de n varianza (CME) para obtener la mejor estimacin de la varianza comn. Pero, si las varianzas dentro de los tratamientos fuesen de hecho distintas, no se tendra justificacin para combinarlas, ya que el promediar varianzas de tratamientos mayores y menores podra proporcionar resultados engaosos. La diferencia entre dos tratamientos con varianzas grandes puede ser considerada significativa cuando en realidad sta puede haber ocurrido por casualidad. Por otra parte, la diferencia entre dos tratamientos con varianzas pequeas puede ser declarada no significativa cuando en verdad lo es. Existen muchas tcnicas para probar homogeneidad de varianza, como la prueba de Bartlett, Prueba de F, propuesta por R.A. Fischer. Por la rapidez de esta ltima prueba se propone la misma para efecto del curso, lo cual no desmerece en ninguna otra prueba. La prueba de F propuesta por Fischer se basa en lo siguiente: ( ) ( ) La prueba de hiptesis que se emplea es la siguiente: Ho: Ha:

La regla de decisin es la siguiente: No Rechazo de Ho si Fc F (m-1, n-1)gl. Esto quiere decir que las varianzas son homogneas. RHo si Fc > F (m-1, n-1)gl, lo cual indica que las varianza son homogneas. Box (S/F; citado por Calzada Benza, 1970) mencion que si la razn entre la varianza mayor y la varianza menor es menor de cuatro, se puede considerar que hay suficiente homogeneidad de varianza, siendo ste posiblemente un criterio ms rpido para probar homogeneidad de varianza.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

3.3.2. Normalidad: Los trminos del error son aleatorios, independientes y normalmente distribuidos. Este supuesto es de gran importancia ya que cuando los datos no se distribuyen normalmente los coeficientes de variacin son muy elevados. Cuando los datos de una variable no presentan normalidad, existen algunas tipos de transformaciones en dependencia de la caracterstica de los datos de la variable en cuestin que la hacen normal. Para probar normalidad tambin existen varias tcnicas entre las que se pueden mencionar la prueba de Shapiro-Wilk y la de Lilliefors. Si el lector est interesado en profundizar sobre estas pruebas se le sugiere consultar a Ramrez y Lpez (1993). (Mtodos Estadsticos no Paramtricos) 3.3.3. Aditividad y Linealidad del Modelo: Lo anterior se cumple en el modelo aditivo lineal ya que todos los efectos se suman y son lineales porque cada uno de sus elementos del modelo lineal, estn a la potencia "1". 3.3.4. Independencia: Es t e s upuest o i m pl i ca que l os t rm i nos del error so n aleatorios, no correlacionados (independientes) normalmente distribuidos; adems, de las varianzas y las medias de las distintas muestras. 3.4. Anlisis de varianza para este Diseo El anlisis de varianza consiste en la particin de la variacin total en fuentes de variacin conocidas y la que no es conocida se atribuye al error. El anlisis de varianza separa parte de la varianza causada por efectos accidentales, no sistemticos (error experimental o simplemente error) de los causados por efectos sistemticos conocidos (tratamientos). Antes de mostrar la tabla de anlisis de varianza para e s t e d i s e o s e m u e s t r a a continuacin un cuadro de concentracin de informacin (Cuadro 1) y

posteriormente las ecuaciones trabajo para el mismo.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 1. Concentracin de los datos para un Diseo Completamente al Azar con i tratamiento y j repeticiones. TRATAMIENTOS 1 2 3 i Y.j REPETICIONES 2 3 Y12 Y13 Y22 Y23 Y32 Y33 Yi2 Yi3 Y.2 Y.3 Yi. Y1. Y2. Y3. Y i. Y..

1 Y11 Y21 Y31 Yi1 Y.1

j Y1j Y2j Y3j Yij Y.j

El modelo lineal para este diseo tiene solo dos fuentes de variacin y es el siguiente: El modelo aditivo de un Diseo Completamente al Azar se corresponde con las salidas de varianza que se muestran en los Cuadro 2 y 3. Cuadro 2. Salida de varianza para un Diseo Completamente al Azar con igual nmero de repeticiones (diseo balanceado). F.V Tratamiento Error Total Donde: F.V = Fuente de variacin gl = Grados de libertad SC = Suma de Cuadrados CM = Cuadrado Medio Fc = F calculado Ft = F tabulado que se encuentra en la tabla de F a un nivel de significancia (probabilidad de error tipo I), grados de libertad de los tratamientos y grados de libertad del error En caso de que los tratamientos tengan diferentes nmero de repeticiones (diseo desbalanceado) la salida de varianza es la siguiente:
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

gl t-1 t(r-1) tr-1

SC SCTRAT. SCError SCTotales (

CM

Fc ( )

Ft )

Cuadro 3. Salida de varianza para un Diseo Completamente al Azar con desigual nmero de repeticiones (diseo desbalanceado). FV Tratamiento Error Total gl t-1 n-t n-1 SC SCTRAT. SCError SCTotales CM Fc ( Ft )

3.4.1. Ecuaciones de trabajo

; Factor de correccin si el experimento es balanceado ; Factor de correccin si el experimento es desbalanceado ; Suma de cuadrados totales ; Suma de cuadrado de tratamiento si el experimento es balanceado ; Suma de cuadrados si el experimento es desbalanceado ; Suma de cuadrados del error 3.4.2. Prueba de Hiptesis en el Anlisis de Varianza de un Diseo Completamente al Azar En el anlisis de varianza de este diseo se prueba el siguiente juego de hiptesis estadsticas: Ho: 1 = 2 = 3 = i (T1 = T2 = T3 = Ti). Esto es lo mismo que: Ho: 1 - 2 - 3 - i = 0 (T1 - T2 - T3 - Ti = 0). Ha: 1 - 2 - 3 - i 0 (T1 T2 T3 Ti). La hiptesis nula asume el efecto de igual, es decir, que los tratamiento ejercen el mismo efecto sobre la variable respuesta. Esta es la hiptesis que se somete a prueba y, la hiptesis alternativa, en su esencia, es la que contradice a la hiptesis nula. Dado que la hiptesis nula es la que se somete a prueba, entonces puede ser aceptada rechazada, si no es rechazada significa que no existe la suficiente evidencia experimental para
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

hacerlo, en caso de rechazarse, de inmediato se acepta la hiptesis alternativa. Para saber cundo aceptar o rechazar la hiptesis nula se toma en cuenta la siguiente regla de decisin. No Rechazo de Ho (NRHo) si Fc Ft (F de tablas) Rechazo de Ho (Rho) si Fc > Ft (F de tablas)

3.5. Interpretacin de Resultados Para una mejor ilustracin de la interpretacin de los resultados de un anlisis en este diseo, se muestra a continuacin el siguiente ejemplo: En un estudio del efecto de la glucosa sobre la liberacin de insulina, se trataron especmenes de tejido pancretico de animales experimentales con cinco concentraciones diferentes de glucosa. Posteriormente se hizo la determinacin de la cantidad de insulina liberada. Se pide realizar el anlisis de varianza correspondiente usando una probabilidad de error Tipo I de (0.01), es decir, = 0.01. Los datos obtenidos se muestran en el Cuadro 4. Cuadro 4. Insulina liberada a diferentes concentraciones de glucosa en las unidades experimentales. Repeticiones 4 5 2.89 3.26 1.89 1.45 5.70 5.62 5.33 8.82 6.49 7.81

Tratamiento 1 2 3 4 5

1 1.53 3.15 3.89 8.18 5.86

2 1.61 3.96 4.80 5.64 5.46

3 3.75 3.59 3.69 7.36 5.69

6 7 8 2.83 2.86 2.59 3.49 1.56 2.44 5.79 4.75 5.33 5.26 8.75 7.10 9.03 7.49 8.98 Adaptado de Wyane (1970)

En el mismo cuadro de informacin se pueden incluir los totales de tratamiento como tambin sus varianzas por cada uno de ellos como se muestra en el Cuadro 5.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 5. Insulina liberada a diferentes concentraciones de glucosa en las unidades experimentales, totales y varianza por tratamiento. Tratamiento 1 2 3 4 5 Y.j 1 1.53 3.15 3.89 8.18 5.86 22.61 2 1.61 3.96 4.8 5.64 5.46 21.47 3 3.75 3.59 3.69 7.36 5.69 24.08 Repeticiones 4 5 2.89 3.26 1.89 1.45 5.7 5.62 5.33 8.82 6.49 7.81 22.3 26.96 6 7 2.83 2.86 3.49 1.56 5.79 4.75 5.26 8.75 9.03 7.49 26.4 25.41 Yi. 8 2.59 21.32 2.44 21.53 5.33 39.57 7.1 56.44 8.98 56.81 26.44 195.67 S 0.5791 0.9702 0.6621 2.2212 2.0718 Y..

Revisando el supuesto de homogeneidad de varianza y tomando en cuenta lo propuesto por Box (S/F; citado por Calzada Benza, 1970) se relacionar la varianza mayor con la varianza menor, en este caso varianza del tratamiento 1 y la del tratamiento 4. Entonces: = 3.8356 Como la relacin entre la varianza mayor y la menor y tomando en cuenta lo propuesto por Box (S/F) se puede concluir que existe homogeneidad de varianza. Comenzando a realizar el anlisis de varianza se tiene lo siguiente:

( (

) )

Analizando los resultados obtenidos al aplicar las ecuaciones de trabajo para este diseo es importante sealar que ninguna de estas sumas de cuadrados puede ser negativa ya que son componentes de varianza y la varianza nunca puede ser negativa. Por otra parte, se puede observar que la Suma de Cuadrados Totales es la mayor, en verdad sta es la variacin total y ninguna de las dems puede ser mayor que sta. Adems se puede observar que la Suma de Cuadrados del Error se obtiene por diferencia entre la Suma de Cuadrados Totales y la de Tratamiento. Esto es producto de la aplicacin misma de lo que es anlisis de varianza. Una vez obtenidas las sumas de cuadrados correspondientes, el siguiente paso es construir

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

la tabla de anlisis de varianza (salida de varianza) la cual queda como se muestra en el Cuadro 6 y adems es recomendable que esta tabla vaya acompaada del Coeficiente de Variacin (C.V) el cual se define como la relacin entre la raz cuadrada del Cuadrado Medio del Error y el Promedio de la Variable respuesta o en estudio. ( ( ) )

Cuadro 6. Salida de varianza para los datos del Cuadro 4. F.V Tratamiento Error Total gl 4 35 39 SC CM Fc F(0.01, 4, 35) 154.921015 38.7302538 29.7714584 3.908 45.5321625 1.30091893 200.453178 C.V. = 23.32%

Si se toma en cuenta el juego de hiptesis de este diseo y la regla de decisin se puede concluir que se rechaza la hiptesis ya que el Fc es mayor que el Ft. A manera de conclusin se puede decir lo siguiente: Con un 99% de confiabilidad se concluye que al menos unos de los tratamientos evaluados ejercen un efecto distinto (P 0.01) sobre la liberacin de insulina. Ahora la pregunta es: Cul es ( o son) ese (esos) tratamiento (s) que hizo (hicieron) rechazar la hiptesis nula?. Esta interrogante no la responde el anlisis de varianza ya que ste solo prueba si existe o no efecto de las variables dependientes sobre la dependiente. Es por ello que se deben hacer otros anlisis para responder esta interrogante. Para responder a estas interrogantes existen dos tcnicas principalmente que son las pruebas a priori o Contrastes Ortogonales y las pruebas obligadas por los datos llamadas tambin Pruebas de Rangos Mltiples o Separacin de Medias. Estas ltimas por el grado de uso que tienen en las investigaciones de ndole experimental son las que se desarrollan a continuacin.

3.6. Pruebas obligadas por los Datos o de Rangos Mltiples Cuando el anlisis de varianza de un experimento reporta diferencias significativas y son ms de dos tratamiento, es necesario saber quin meti el ruido en la prueba de hiptesis que
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

provoc que la hiptesis nula sea rechazada. Para este fin, existen las llamadas pruebas de Rangos Mltiples. Entre estas pruebas estn:

Diferencia Mnima Significativa (DMS) (LSD) Mtodo de Duncan Mtodo de Student-Newman-Keuls (SNK) Mtodo de Tukey (Diferencia Significativa Honesta) Mtodo de Scheff.

Cada uno de estos procedimientos de comparacin de medias est basado en un conjunt o de suposiciones, y son usualmente efectivos para fines especficos. En cualquiera de los casos la hiptesis nula supone la igualdad de las medias y la alternativa lo contrario y se utilizan siempre y cuando en el anlisis de varianza rechace la hiptesis nula. Lo anterior indica que la prueba de hiptesis que se hace es la siguiente: Ho: | Ha: | | |

La hiptesis nula, que es la que se prueba, asume el efecto de igualdad de los promedios a comparar es por ello que la diferencia es igual a cero y por lo tanto, la hiptesis alternativa contradice la hiptesis nula con una desigualdad. La regla de decisin es la siguiente: NRHo | = | | Valor crtico de la prueba est | | o bien dentro de la diferencia:

RHo: Si Valor Crtico de la prueba es | Si el Valor Crtico |

3.6.1. Diferencia Mnima Significativa (DMS) Esta prueba solo debe usarse para comparar medias adyacentes en un arreglo ordenado, medias por orden de magnitud. Cuando DMS se usa indiscriminadamente para probar todas las diferencias posibles entre las diversas medias, ciertas diferencias sern significativas, pero no al nivel de significancia que se ha elegido. El nmero posible de comparaciones de medias tomadas de dos en dos a la vez es igual a
( )

. Los especialistas hacen mencin que este mtodo es adecuado para comparar un

tratamiento estndar (testigo) con otros tratamientos.


Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Esta prueba utiliza un solo comparador y su frmula es la siguiente: , donde:

DMS = Es el valor crtico de la prueba t/2 = Valor tabular de t de student para los grados de libertad del error obtenido a un /2. r = nmero de repeticiones

3.6.2. Mtodo de Duncan Esta prueba es ampliamente utilizada entre las diversas pruebas de Rangos Mltiples. Su mtodo es de naturaleza secuencial, lo que quiere decir, que utiliza un nuevo valor estudentizado, para cada una de las comparaciones de medias adyacentes ordenadas por magnitud en orden descendente. Esta prueba incluye el clculo de las diferencias significativas mnima entre las medias de tratamiento cuando stas se encuentran dispuestas en orden de magnitud. La frmula es la siguiente: Donde: Es el valor extrado de una tabla especial de rango estudentizado, con los grados de libertad del error y con la disposicin relativa de las medias en el arreglo. CMError = Cuadrado Medio del Error r = Nmero de repeticiones.

3.6.3. Mtodo de Student-Newman-Keuls (SNK) Es una prueba de carcter secuencial, es decir, que utiliza un nuevo valor estudentizado para cada comparacin. Para el clculo de esta prueba se requiere determinar la diferencia mnima significativa entre las medias del tratamiento cuando stas se encuentran dispuestas en orden de magnitud. Su frmula es la siguiente:

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Donde:

q = Valor obtenido de tablas especiales de rango estudentizado, para los grados de libertad del error y con la disposicin relativa de las medias en el arreglo CMError = Cuadrado medio del error r = nmero de repeticiones

3.6.4. Mtodo de Tukey Este mtodo es un procedimiento basado en el rango estudentizado, pero no es secuencial, ya que utiliza un slo comparador de q ordinario. Sin embargo, el mtodo de Tukey es til en situaciones en que se desea hacer un primer nfasis en el uso del experimento con un total para determinar la significancia de los pares de medias. Esta prueba slo es exacta cuando los grupos tienen igual nmero de elementos y para medias que no han sido ajustadas por covarianza. Esta prueba se define de la siguiente manera: Donde: q = Valor obtenido de tablas especiales de rango estudentizados, para los grados de libertad del error y con la disposicin relativa de las medias en el arreglo CMError = Cuadrado medio del error r = nmero de repeticiones

3.6.5. Mtodo de Scheff Se considera un mtodo bastante general que utiliza la distribucin de F de Snedecor. El mtodo de Scheff puede aplicarse para probar hiptesis generales de que una funcin lineal de las medias poblacionales es igual a cero. En contraste con las comparaciones mltiples basadas en rangos estudentizados, el mtodo de Scheff es un mtodo exacto para medias provenientes de medias de igual o desigual tamao y para medias que han sido ajustadas por covarianza. Para el clculo se requiere determinar la mnima diferencia significativa entre las medias de los tratamientos cuando stos se encuentran ordenados en
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

orden de magnitud. Su valor crtico se determina a travs de la siguiente expresin: ( Donde: t = Nmero de tratamientos F = Valor que se obtiene de la distribucin de F de Snedecor con t-1 y los grados de libertad del error. CError = Cuadrado medio del error, y ri, rj representan el nmero de observaciones usadas para calcular cada media muestra Ejemplo. A continuacin se aplican todas las pruebas de rangos mltiples antes expuestas de manera que se pueda realizar una comparacin entre stas. Los promedios por tratamiento son los siguientes: ) ( )

Cuadro 7. Medias por tratamientos y Medias ordenadas por magnitud descendente. Tratamiento 1 2 3 4 5 Promedio 2.665 2.69125 4.94625 7.055 7.10125 Tratamiento 5 4 3 2 1 Promedios Ordenados 7.10125 7.055 4.94625 2.69125 2.665

Aplicando DMS a un nivel de significancia = 0.01 que es el mismo nivel de significancia que se utiliz para el anlisis de varianza, adems de la siguiente informacin: CMError = 1.30091893 r=8 t/2(35) = 2.7238 Por lo tanto el valor crtico de la prueba es de 1.5534. A continuacin se presentan en el Cuadro 7 las comparaciones a realizar, las diferencias entre las medias y el resultado de comparar estas diferencias con el valor crtico de la
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

prueba de DMS. Cuadro 7. Resultado de la prueba de DMS para los tratamientos estudiados. Comparacin Diferencia de Medias 0.04625 2.155 4.41 4.43625 2.10875 4.36375 4.39 2.255 2.28125 0.02625 Resultado de la comparacin ns * * * * * * * * ns

T5 versus T4 T5 versus T3 T5 versus T2 T5 versus T1 T4 versus T3 T4 versus T2 T4 versus T1 T3 versus T2 T3 versus T1 T2 versus T1 ns = No significativo * = significativo

Las comparaciones se pueden resumir de acuerdo al siguiente rango de mrito Tratamiento 5 4 3 2 1 Comparacin a a b c c

Promedios con literales distintas son estadsticamente diferentes segn el mtodo de DMS (P 0.01).

Interpretando los resultados de la separacin o comparacin de medias segn DMS se puede decir que las concentraciones de glucosa 5 y 4 producen la misma cantidad de insulina liberada (P 0.01), pero diferente (P 0.01) a las dems concentraciones de glucosa experimentadas. Esto quiere decir que es indistinto utilizar la concentracin 5 o 4. Al comparar el tratamiento 4 (concentracin 4) con las dems, sta tuvo un comportamiento diferente (P 0.01) a las dems concentraciones de glucosa, es decir, 3, 2 y 1. Igualmente mostr la concentracin 3 respecto a la 2 y 1, no as la concentracin 2 que tuvo el mismo comportamiento (P > 0.01) con la concentracin 1. Al aplicar el mtodo de Duncan se obtuvo lo siguiente:

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Para realizar la prueba de Duncan lo primero que se debe hacer es obtener los valores estudentizados extrados de la tabla de Duncan. En este caso se estn utilizando valores interpolados ya que no existen en la tabla grado de libertad igual a 35 solo hay entre 30 y 40 por lo tanto lo que se hizo fue promediar los dos valores. Estos son los siguientes:

Cuadro 8. Valores estudentizado extrado de la tabla de Duncan y valores crticos de la prueba segn el nmero de medias a comparar. Medias a comparar R(0.01, 35) RMS 2 3.855 1.554549 3 4.025 1.623103 4 4.13 1.665445 5 4.195 1.691656

Aqu se puede ver el efecto secuencial de Duncan ya que utiliza un comparador distinto segn el nmero de medias a comparar. Los resultados de aplicar la prueba son los siguientes: Cuadro 9. Contrastacin de las diferencias entre medias adyacentes con los valores crticos de Duncan. Promedios 7.10125 Tratamientos 5 5 0 7.10125 4 7.055 3 4.94625 2 2.69125 1 2.665 RMS 1.69166 ns = No significativo * = significativo Promedios 7.055 4.94625 2.69125 2.665 4 3 2 1 0.04625 ns 2.155 * 4.41* 4.43625 * 0 2.10875* 4.36375* 4.39* 0 2.255* 2.28125* 0 0.02625 ns 0 1.66544 1.62310 1.55455

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Lo anterior se resume en el siguiente rango de mrito:

Tratamiento 5 4 3 2 1

Comparacin a a b c c

Promedios con literales distintas son estadsticamente diferentes segn el mtodo de Duncan (P 0.01).

Como se puede observar, en este caso los resultados obtenidos son los mismos que en la prueba de DMS, por lo tanto, la interpretacin es la misma.

Aplicando SNK: Al igual que la prueba de Duncan, SNK es una prueba secuencial lo que indica que utiliza un valor diferente para cada comparacin de acuerdo al nmero de medias a comparar. Los valores q y valores crticos de SNK se muestran en el Cuadro 10. Cuadro 10. Valores estudentizados de la prueba de SNK de acuerdo al nmero de medias adyacentes a comparar y valores crticos de la misma. Medias a comparar q(0.01, 35) SNK 2 3.855 1.55454932 3 4.41 1.778356 4 4.75 1.9154628 5 4.99 2.0122441

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Los resultados al aplicar la prueba de rangos mltiples de SNK se resumen en el Cuadro 11. Cuadro 11. Resultados de la comparacin de medias segn el mtodo de SNK. Promedios 7.10125 Tratamientos 5 5 0 7.10125 4 7.055 3 4.94625 2 2.69125 1 2.665 SNK 2.0122441 ns = No significativo * = significativo Promedios 7.055 4 0.04625 ns 0 4.94625 3 2.155 * 2.10875* 0 2.69125 2 4.41* 4.36375* 2.255* 0 1.554549 2.665 1 4.43625 * 4.39* 2.28125* 0.02625 ns 0

1.9154628

1.778356

Lo anterior se resume en el siguiente rango de mrito. Tratamiento 5 4 3 2 1 Comparacin a a b c c

Promedios con literales distintas son estadsticamente diferentes segn el mtodo de SNK (P 0.01)

En este caso, los resultados de aplicacin del mtodo de SNK coinciden con el anterior y por ende, la interpretacin es la misma. Aplicando ahora el mtodo de Tukey o Diferencia Honesta Mnima se tiene lo siguiente:

Tukey no es un mtodo secuencial, es decir, que utiliza un solo valor estudentizado para obtener el valor crtico de prueba, utiliza la misma tabla que SNK pero con el nmero mximo de medias a comparar. q(0,01, 5, 35) = 4.99 Los resultados de contrastar la diferencia de medias ordenadas con el valor crtico de la prueba de Tukey se muestra en el Cuadro 12.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 12. Resultados de la aplicacin de la prueba de Tukey a los promedios de los tratamientos estudiados. Comparacin Diferencia de Medias 0.04625 2.155 4.41 4.43625 2.10875 4.36375 4.39 2.255 2.28125 0.02625 Resultado de la comparacin ns * * * * * * * * ns

T5 versus T4 T5 versus T3 T5 versus T2 T5 versus T1 T4 versus T3 T4 versus T2 T4 versus T1 T3 versus T2 T3 versus T1 T2 versus T1 ns = No significativo * = significativo

Resumiendo los resultados del Cuadro 12 en un rango de mrito se tiene lo siguiente:

Tratamiento 5 4 3 2 1

Comparacin a a b c c

Promedios con literales distintas son estadsticamente diferentes segn el mtodo de Tukey (P 0.01).

Aplicando ahora la ltima prueba de separacin de medias de las propuestas en este documento se tiene lo siguiente:

Mtodo de Scheff ( ) ( )

La prueba de Scheff al igual que Tukey no es una prueba secuencial por lo tanto solo utiliza un valor de F de Snedecor que se extrae un nivel de significancia , para el caso del ejemplo = 0.01, con los grado de libertad de tratamientos y los del error experimental. De acuerdo a esto se tiene lo siguiente:
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

F(0.01, 4, 35) = 3.908 ( ) ( )

Cuadro 13. Resultados de la aplicacin de la prueba de Scheff a los promedios de los tratamientos estudiados. Comparacin Diferencia de Medias 0.04625 2.155 4.41 4.43625 2.10875 4.36375 4.39 2.255 2.28125 0.02625 Resultado de la comparacin ns ns * * ns * * * * ns

T5 versus T4 T5 versus T3 T5 versus T2 T5 versus T1 T4 versus T3 T4 versus T2 T4 versus T1 T3 versus T2 T3 versus T1 T2 versus T1 ns = No significativo * = significativo

Resumiendo los resultados del Cuadro 13 en un rango de mrito se tiene lo siguiente: Tratamiento 5 4 3 2 1 Comparacin a a a b b

Promedios con literales distintas son estadsticamente diferentes segn el mtodo de Scheff (P 0.01).

3.7. Cundo, Porqu y Cul Prueba de Rangos Mltiples Utilizar?

Todas las pruebas de rangos mltiples o separacin o comparacin de medias se utilizan siempre y cuando en el anlisis de varianza se rechace la hiptesis ya este anlisis solo detecta si existe efecto o no de los tratamientos sometidos a consideracin pero no indica cul o cules son los tratamientos responsables de este rechazo.
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

En el Cuadro 14 se resumen los resultados obtenidos por cada una de las pruebas de separacin de medias aplicados.

Cuadro 14. Resumen de los resultados obtenidos al aplicar las pruebas de rangos mltiples de DMS, Duncan, SNK, Tukey y Scheff a un nivel de significancia de = 0.05. Tratamiento Promedio 5 7.10125 4 7.055 3 4.94625 2 2.69125 1 2.665 DMS a a b c c Duncan a a b c c SNK a a b c c Tukey a a b c c Scheff a a a b b

Promedios con literales distintas son estadsticamente diferentes (P 0.01 ).

Segn Martnez Garza (1994) el mtodo de Scheff es ms riguroso para detectar diferencias significativas y esto se demuestra con los resultados expuestos en el Cuadro 14, es por ello que se recomiendo usarlo a un = 0.1. Por otra parte se ha podido observar que tanto SNK como Tukey tiende a no detectar diferencias estadstica donde DMS y Duncan lo han hecho con diferencias mayores. Una discusin ms fundamentada sobre las separaciones de medias puede encontrarse en Steel y Torrie (1992) en su obra Bioestadstica: Principios y Procedimientos pero s se puede deducir que para experimentos en fases exploratorias es recomendable usar pruebas que no sean tan rigurosas como es DMS, Duncan e inclusive SNK, sin embargo, si este no es el caso y los promedios no han sido corregidos por efecto de covariable, es recomendable Tukey y si se requiere una prueba ms rigurosa sin importar si el experimento es balanceado o no, si los promedios ha sido corregido o no por covariable, es recomendable usar Scheff.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

4. DISEO EN BLOQUES COMPLETAMENTE AL AZAR (BCA) O CON DOS CRITERIOS DE CLASIFICACIN No siempre el material experimental es homogneo limitando en este caso el uso del Diseo Completamente al Azar (DCA). En estos casos es recomendable usar el Diseo en Bloques Completamente al Azar. 4.1.Cundo utilizar este diseo? Este diseo se utiliza cuando el material experimental presenta un factor de estorbo que no es de inters estudiar pero que s puede afectar los resultados conllevando a conclusiones erradas o bien los llamados efectos enmascarados. Tiene como principio maximizar la variabilidad entre bloques y minimizar la variabilidad interbloque o variabilidad interna. Esto se logra ya que las unidades experimentales dentro de cada bloque son homogneas pero son heterogneas entre bloques. Si se habla de un diseo en Bloques Completamente al Azar, deben existir tantas unidades experimentales dentro de cada bloque como tratamientos se tenga, de manera que cada tratamiento tenga una repeticin en cada bloque. Esto al mismo tiempo se vuelve una desventaja para este diseo ya que si se pierde una unidad experimental o ms, se rompe el principio de bloqueo ya que los tratamientos no tendran el mismo nmero de repeticiones dentro de cada bloque. Es por ello que en este caso para analizar este diseo se deben estimar los datos perdidos conllevando a prdidas de grados de libertad en el error y por ende a un aumento del cuadrado medio del error. El tema de estimacin de datos perdidos no se desarrolla en este documento, pero se pueden consultar las fuentes que citan al final del mismo. 4.2.Modelo Aditivo Lineal de un BCA El modelo aditivo lineal para este diseo es el siguiente:

Donde: Yij = Variable respuesta = Efecto comn a todas las observaciones Bj = Efecto de la j-sima repeticin; j = 1, 2, 3,...r repeticiones Ti = Efecto del j-simo tratamiento; i = 1, 2, 3, i, tratamiento Eij = Error experimental
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

4.3. Anlisis de Varianza para un BCA Antes de exponer la salida de varianza y las ecuaciones de trabajo, se presenta un cuadro de concentracin o vaciamiento de informacin. Cuadro 15. Concentracin de los datos para un Diseo en Bloques Completamente al Azar (BCA). BLOQUES 2 3 Y12 Y13 Y22 Y23 Y32 Y33 Yi2 Yi3 Y.2 Y.3

TRATAMIENTOS 1 2 3 i Y.j

1 Y11 Y21 Y31 Yi1 Y.1

j Y1j Y2j Y3j Yij Y.j

Yi. Y1. Y2. Y3. Y i. Y..

La salida de varianza de este diseo y de acuerdo a su modelo aditivo lineal es el siguiente:

Cuadro 15. Salida de varianza para un diseo en Bloques Completamente al Azar. F.V Bloque Tratamiento Error Total gl r-1 t-1 SC SCBloque SCTRAT. CM CMBloque CMTRAT. CMError Fc ( ( Ft ) )

(t-1)(r-1) SCError tr-1 SCTotales

En este diseo se prueban dos juegos de hiptesis uno para bloques y otros para tratamientos. Estas hiptesis son las siguientes: Para tratamiento Ho: 1 - 2 - 3 - i = 0 (T1 - T2 - T3 - Ti = 0) Ha: 1 - 2 - 3 - i 0(T1 - T2 - T3 - Ti 0). Para Bloques Ho: B1 - B2 - B3 - Bj = 0 (B1 - B2 - B3 - Bj = 0) Ha: B1 - B2 - B3 - Bj 0 (B1 - B2 - B3 Bj 0). Las ecuaciones de trabajo para realizar el anlisis de varianza de este diseo son las
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

siguientes: ; Factor de Correccin ( Ejemplo: Un fisioterapeuta deseaba comparar tres mtodos para ensear a los pacientes el uso de cierto aparato prottico. Tena la sensacin de que la rapidez de aprendizaje sera diferente para pacientes de diferentes edades y deseaba disear un experimento en el que pudiera tomarse en consideracin la influencia de la edad. Para ello seleccin tres pacientes en cada uno de los cuatros grupos de edades para participar en el experimento y, en cada grupo de edad se asign un paciente aleatoriamente a cada uno de los mtodos de enseanza. Los mtodos de instruccin corresponden a los tratamientos y los cinco grupos de edades corresponden a los bloques. La variable medida fue el tiempo (das) requerido para aprender el uso de cierto aparato prottico. Los datos son los siguientes: )

Cuadro 16. Tiempo requerido para el manejo de un aparato prottico bajo tres modalidades de enseanza en grupos de diferentes edades. Mtodo de Enseanza A B C Y.j < a 20 7 9 10 26 Edades (aos) 20 a 29 30 a 39 40 a 49 8 9 10 9 9 9 10 12 12 27 30 31 Yi. 50 y ms 11 45 12 48 14 58 37 151 Adaptado de Wyane (1970)

Realice el anlisis de varianza correspondiente a un = 0.01. Aplicando las ecuaciones de trabajo se tiene lo siguiente: ( )

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

(7 + 8 +14)-1520.06667 = 46.93333 ( ( ( ) ) )

Cuadro 17. Salida de varianza para el ejemplo de Diseos en Bloques Completamente a Azar. F.V Bloques Tratamiento Error Total gl 4 2 8 15 SC CM 6.2333 9.26666 0.43333 Fc 14.38465 21.38458 F(0.01) 7.006 8.649

46.93333

Interpretacin de Resultados Es necesario recalcar que en un diseo de bloques completamente al azar la variable que se est bloqueando no es de inters estudiar, en este caso, el fisioterapeuta est interesado en el manejo del aparato prottico sin embargo, el presume que la edad puede estar afectando esta velocidad de aprendizaje en este tipo de pacientes y por ello que organiza el experimento y agrupa las unidades experimentales de acuerdo a las edades de los paciente. Cuando se establece un diseo en bloques completamente al azar, es necesario estar seguro que en verdad el factor de estorbo existe, caso contrario se pierde grados de libertad en el error, lo cual hace que las diferencias dentro de los tratamientos (error experimental) sean mayores con las consecuencias que corresponden. Para el caso del ejemplo, se puede verificar en la salida de varianza que existe diferencias significativas (P 0.01) en bloques lo cual indica, que el investigador tena razn en realizar el bloqueo por edades de los pacientes. Esto indica tambin que la velocidad de aprendizaje (vista como el manejo del aparato prottico), se ve afectada por la edad. Por otra parte, este mismo anlisis indica que los mtodos de enseanza afectan o ejercen efecto significativo en la velocidad de aprendizaje de los pacientes. Esto se puede concluir a un 99% de confiabilidad. Dado que el anlisis de varianza report diferencias significativas en el tiempo de
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

aprendizaje, se debe aplicar una prueba de rangos mltiples para verificar cul de las tcnicas de enseanza. Para realizar lo antes expuesto lo primero que hay que hacer es ordenar las medias por magnitud (descendente) como se muestra en el Cuadro 18.

Cuadro 18. Promedios por mtodo de enseanza utilizado. Mtodo de Enseanza A B C Promedios 9 9.6 11.6 Mtodo de Enseanza C B A Promedios Ordenados 11.6 9.6 9

Aplicando la prueba de Tukey a un = 0.01

1.65742075

Cuadro 19. Resultados de la aplicacin de la prueba de Tukey a los promedios de los Mtodos de Enseanza estudiados. Comparaciones A versus B A versus C B versus C Diferencias de Medias 2.0 2.6 0.6 Resultado de la Comparacin * * ns

Medias con literales distintas son diferentes estadsticamente (P 0.01).

Resumiendo los resultados de las comparaciones realizadas se puede resumir a travs del siguiente rango de mrito Mtodo de Enseanza C B A Comparacin a b b

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Lo anterior indica que el mtodo donde los pacientes tardan menos son el A y el B, ambos mtodos son estadsticamente iguales, es decir, que ejercen el mismo efecto sobre el tiempo que duran los pacientes para aprender el manejo de aparato prottico y el mtodo donde se tarda ms es el mtodo C ya que aqu los pacientes tardan en promedio 11 das y que fue diferente (P 0.01) a los dems mtodos. 5. DISEO CUADRADO LATINO (DCL) Anteriormente se han analizado los casos de l os di seos C om pl et am ent e al Az ar donde el m at eri al experimental tiene que ser homogneo y Bloques al Azar, donde el material experimental presenta un factor sistemtico o de estorbo. Sin embargo, en la investigacin se presentan casos donde el material experimental presenta dos tipos de efectos no sistemticos o sea dos factores de estorbo, que no son de inters en la investigacin pero pueden afectar los resultados del experimento. Adems, imposibilita el uso de los diseos antes mencionados. 5.1. Cundo Utilizar este Diseo? El diseo Cuadrado Latino, es considerado como una variante del diseo Bloques al Azar. Este diseo es de gran utilidad cuando el material experimental presenta dos efectos de estorbo. Permite controlar dos efectos sistemticos que afectan al material experimental, adems del efecto de tratamiento que es el de inters estudiar. Tiene la caracterstica de controlar los efectos de estorbo a travs de hileras y columna, o sea un doble bloqueo. Para que los efectos de las hileras y las columnas no se confundan con el de los tratamientos, stos se ubican de tal forma que un tratamiento no se repite en la misma columna y la misma hilera. Por esta razn, la cantidad de tratamiento coincide con el mismo nmero de filas y columnas. La principal restriccin de este diseo es que el nmero de repeticiones es igual al nmero de tratamiento, si este ltimo es considerable el nmero de repeticiones requerido se vuelve impracticable. Son pocos usados los Cuadros Latinos 12 x 12, mientras que el tamao ms comn es desde 5 x 5 hasta 8 X 8. Est e di seo present a hast a ciert o punto la m is m a d e s v e n t a j a q u e l o s B l o q u e s a l A z a r d e q u e , e l e r r o r experimental por unidad, se aumente con el tamao del cuadro.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

5.2. Modelo Aditivo Lineal de para un DCL El modelo aditivo lineal para este diseo es el siguiente: Yij(k) = + Hi + Cj + Tk(ij) + Eijk Donde: Yij (k) = Variable respuesta = Efecto comn a todas las observaciones Hi = Efecto de la i - sima hilera i = 1, 2, 3,... i hileras Cj = Efecto de la j-sima columna j = 1, 2, 3, j columnas Tk (ij) = Efecto del k-simo tratamiento en la i-sima hilera y j-sima columna k = 1, 2, 3, k tratamientos. Ejk = Error del modelo En este diseo se prueban hiptesis para columnas, hileras y tratamiento de la misma forma que se ha hecho anteriormente, es decir, la hiptesis nula asume el efecto de igualdad en caso y la alternativa su contradiccin. 5.3. Anlisis de Varianza para un diseo Cuadrado Latino DCL Al igual que los casos anteriores, antes de exponer la salida de varianza, se muestra un cuadro de concentracin de informacin, que es de donde obtiene como tal al anlisis de varianza que se debe corresponder con el modelo aditivo lineal. Cuadro 20. Cuadro de vaciamiento de informacin para un diseo Cuadrado Latino. Hileras H1 H2 H3 Hi Y.j Columnas C1 Y11 Y21 Y31 Yi1 Y.1 C2 Y12 Y22 Y32 Yi2 Y.2 C3 Y13 Y23 Y33 Yi3 Y.3 Cj Y1j Y2j Y3j Yij Y.j Yi. Y1. Y2. Y3. Yi. Y..

Los tratamientos estn entre las hileras y las columnas bajo las caractersticas que se han mencionado anteriormente, es por ello que hay que hacer un resumen de los tratamientos en otro cuadrado como se muestra a continuacin.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 21. Resumen de la informacin de los tratamientos extrado de un diseo Cuadrado Latino. Tratamiento T1 T2 T3 Tk R1 Y11 Y21 Y31 Yi1 Y..1 Repeticiones R2 R3 Y12 Y13 Y22 Y23 Y32 Y33 Yi2 Yi3 Y..2 Y..3 Rj Y1j Y2j Y3j Yij Y..j Yi. Y1. Y2. Y3. Y..k Y

La salida de varianza para un DCL es la siguiente: Cuadro 22. Salida de varianza para un diseo Cuadrado Latino FV Hileras Columnas Tratamiento Error Total gl t-1 t-1 t-1 SC CM Fc ( ( ( Ft ) ) )

SCHileras CMHileras SCColumn CMColumn SCTRAT. CMTRAT. CMError

(t-1)(t-2) SCError t-1 SCTotales

Las ecuaciones de trabajo para el anlisis de varianza de este diseo son las siguientes: ( ) ( )

Ejemplo:

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Se estudia la eficacia de cuatro frmacos diferentes (F1, F2, F3 y F4) en el tratamiento de una enfermedad, para ello, se observa el nmero de das que tardan en curar los enfermos tratados con estos frmacos. Se considera que el factor edad y el factor peso pueden influir en el experimento, por ello, se controlan estos factores y se consideran cuatro niveles de edad (E1, E2, E3 y E4) y cuatro de peso (P1, P2, P3 y P4). Los resultados del experimento diseado segn la tcnica del cuadrado latino se reportan en el Cuadro 23. Qu conclusiones se deducen del experimento a un nivel de significancia del 5%? Cuadro 23. Efecto de cuatro frmacos en los das para una curar una enfermedad en pacientes de cuatro grupos etreos y cuatro tipos de peso. Grupo Etreo E2 E3 9.5 F2 7.0 F4 10.0 F1 8.5 F3 6.5 F4 7.0 F1 5.0 F3 6.0 F2

Peso P1 P2 P3 P4

E1 10.0 F1 8.0 F2 7.0 F3 6.0 F4

E4 11.5 F3 9.0 F4 8.0 F2 9.0 F1

Lo primero que se debe hacer es resumir la informacin para columnas e hileras. Esta es la siguiente: Peso P1 P2 P3 P4 Y.j. Grupo Etreo E2 E3 9.5 7.0 10.0 8.5 6.5 7.0 5.0 6.0 31.0 28.5 Yi.. 38.0 35.5 28.5 26.0 128.0

E1 10.0 8.0 7.0 6.0 31.0

E4 11.5 9.0 8.0 9.0 37.5

y la de tratamiento quedara de la siguiente forma: Frmaco (Tratamiento) F1 F2 F3 F4 1 10.0 8.0 7.0 6.0 2 10.0 9.5 5.0 6.5 3 7.0 6.0 8.5 7.0 4 9.0 8.0 11.5 9.0 Y..k 36.0 31.5 32.0 28.5

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Con esta informacin se puede realizar el anlisis de varianza ( ) ( ( ) ( ( ( ( ) ) ) ) )

Resumiendo lo anterior en la salida de varianza correspondiente a este diseo se tiene lo siguiente: Cuadro 24. Salida de varianza para el diseo Cuadrado Latino del ejemplo. F.V Peso (Hileras) Grupo Etreo (Columnas) Frmaco (Tratamiento) Error Total gl 3 3 3 6 15 SC 24.125 11.125 7.125 4.625 47.0 CM FC 8.0416667 10.432432 3.7083333 4.8108108 2.375 3.0810811 0.7708333 Ft (0.05) 4.757 4.757 4.757

De acuerdo al anlisis de varianza realizado se concluye al 95% de confiabilidad que existe efecto significativo del peso en los das que tardan los enfermos en curarse, de igual manera lo hicieron los grupos etreos estudiados. Al revisar el efecto de los frmacos (tratamiento) se observ que stos ejercieron el mismo efecto en los das para curarse por lo tanto es indistinto usar uno o el otro. En este caso, al igual que en los bloques, si existe efecto de hileras o columnas se concluye nada ms que era necesario bloquear en ese sentido. Si se encuentra efecto de tratamiento, se debe aplicar alguna prueba de rangos mltiples.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

6. DISEOS FACTORIALES Como se mencion en un principio, todos los diseos hasta ahora desarrollados son diseos simples donde solo se ha analizado el efecto de tratamiento. Sin embargo, se presentan situaciones donde la interrogante a investigar se encuentra supeditada por varios factores controlables, por ejemplo: El efecto de diferentes dosis de un desparasitante en nios de diferentes condiciones sociales. El efecto de diferentes productos para reducir triglicridos en pacientes con distintas condiciones corporales, etc. En la parte introductoria de este documento se mencion que un factor es un tratamiento que genera ms tratamiento (niveles de un factor). Puede ser que la reduccin de los triglicridos pueda estar relacionada con tipo de producto y una condicin corporal determinada, es decir, puede ser que exista efecto de interacciones de los niveles de los factores estudiados. Si bien es cierto que en algunos casos se pueden estudiar por separados tales efectos, el tiempo que se requiere para obtener la repuesta es mayor y adems muchas veces se necesita aplicar ambos factores para ver el comportamiento de las interacciones de los niveles de stos. Es por ello que una de las ventajas de este tipo de diseo es que adems de estudiar los efectos principales, se pueden estudiar las interacciones de los niveles de los factores reduciendo el tiempo de experimentacin y adems proporcionando conclusiones ms concretas en el estudio. Los diseos factoriales se dividen en diseos factoriales simples y diseos factoriales complejo. Estos pueden ejecutarse en cualquiera de los diseos simples o clsicos hasta ahora desarrollado, es decir, que se pueden tener diseos factoriales en un diseo completamente al azar, en bloques completamente al azar y en cuadrado latino. De igual forma se puede hacer en los diseos factoriales complejos, todo depende de las caractersticas del material experimental que se utilice en el experimento. A continuacin se desarrollan diseos factoriales simples en arreglos completamente al azar y en bloques completamente al azar.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

6.1. Cundo utilizar diseos factoriales simples en un arreglo completamente al azar? De cuando utilizar estos diseo se ha expuesto anteriormente por lo tanto solo se desarrolla lo de completamente al azar. Los diseos factoriales simples en arreglo completamente al azar su utilizan cuando se est interesado estudiar al mismo tiempo el efecto de dos o ms factores al mismo tiempo y el material experimental a usar es homogneo, es decir, no presenta factor de estorbo alguna que pueda afectar los resultados del experimento. De forma general los diseos factoriales simples se puede clasificar de acuerdo al nmero de factores que se estudien o bien de acuerdo a que si se estudian todos los niveles de los factores (factoriales completos) o se estudian cierto niveles de stos (factoriales incompletos). En funcin del nmero de factores que se estudien, los diseos factoriales pueden ser bifactoriales, trifactoriales, etc. Generalmente es recomendable hasta tres por el efecto de interpretacin. Para el anlisis de experimentos factoriales se analizan primero los efectos principales (factores individuales) y posteriormente las interacciones de los mismos. Hay autores que mencionan que en caso de existir efecto de las interacciones no tiene sentido estudiar los factores por separados ya que para ver el efecto en la variable respuesta se requiere de las interacciones de los niveles de los factores en estudio. 6.2. Arreglo combinatorio Como se ha mencionado anteriormente, un factor es una clase de tratamiento que genera ms tratamiento llamados niveles. Un nivel se refiere a los diferentes tratamientos dentro de un factor y arreglo combinatorio se refiere a la combinacin de los niveles de los factores en estudio. Suponga que se tiene un factor A con tres niveles (a1, a2, a3) y un factor B con cuatro niveles (b1, b2, b3, b4). En este caso se tiene un experimento bifactorial 3 x 4. El arreglo combinatorio de estos dos factores sera el que se muestra en el Cuadro 25. Cuadro 25. Arreglo combinatorio bifactorial 3 x 4. Factor A a1 a2 a3 Factor B b1 a1b1 a2b1 a3b1 b2 a1b2 a2b2 a3b2 b3 a1b3 a2b3 a3b3 b4 a1b4 a2b4 a3b4

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

6.3.Modelo aditivo lineal Para representar un experimento factorial se utiliza un modelo lineal que tome en consideracin la suma de una constante general comn a todas las observaciones ms los efectos principales de los factores a estudiar as como los efectos secundarios (interacciones) adicionndole finalmente un efecto aleatorio o error experimental. Adems se tiene que considerar en el modelo la forma de asignacin de los tratamientos definidos (interacciones) a las unidades experimentales. Esto quiere decir, que si el material experimental es homogneo, se har en un arreglo completamente al azar, si hay un factor de estorbo, entonces se har en bloques completamente al azar, etc. Es importante mencionar que en este tipo de experimentos factoriales, todos los factores se estudian bajo un mismo rigor, cosa que no ocurres en los experimentos factoriales complejos ya que en stos se sacrifica precisin en uno para estudiar con mayor precisin el otro. Supngase que en el ejemplo de arreglo combinatorio expuesto lneas arriba, se lleva a cabo en un diseo o arreglo completamente al azar, entonces su modelo aditivo lineal sera el siguiente: ( Yijk = Variable respuesta = Efecto comn a todas las observaciones Ai = Efecto del i-simo nivel del factor A: i = a1, a2, a3 niveles del factor A Bj = Efecto del j-simo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B (A*B)ij = Interaccin del i-simo nivel del factor A con el j-simo nivel del factor B Eijk = Error del modelo En este diseo se prueban hiptesis tanto para el factor A, factor B y para las interacciones, bajo la misma tipologa desarrollada en este documento (hiptesis nula e hiptesis alternativa). En caso de rechazo de la hiptesis nula, se debe hacer prueba de rangos mltiples segn sea el caso Un cuadro de vaciamiento de informacin para un diseo bifactorial un arreglo completamente al azar se muestra a continuacin. )

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 26. Cuadro de vaciamiento de informacin para un diseo bifactorial en un arreglo completamente al azar. Factor A Factor B b1 b2 b3 bj b1 b2 b3 bj b1 b2 b3 bj b1 b2 b3 bj 1 Y111 Y121 Y131 Y1j1 Y211 Y221 Y231 Y2j1 Y311 Y321 Y331 Y3j1 Yi11 Yi21 Yi31 Yij1 Repeticiones 2 3 Y112 Y113 Y122 Y123 Y132 Y133 Y1j2 Y1j3 Y212 Y213 Y222 Y223 Y232 Y233 Y2j2 Y2j3 Y312 Y313 Y322 Y323 Y332 Y333 Y3j2 Y3j3 Yi12 Yi13 Yi22 Yi23 Yi32 Yi33 Yij2 Yij3 k Y11k Y12k Y13k Y1jk Y21k Y22k Y23k Y2jk Y31k Y32k Y33k Y3jk Yi1k Yi2k Yi3k Yijk Yij. Y11. Y12. Y13. Y1j. Y21. Y22. Y23. Y2i. Y31. Y32. Y33. Y3j. Yi1. Yi2. Yi3. Yij.

a1

a2

a3

ai

De este cuadro se extrae la informacin de los efectos principales y secundarios (interacciones) como se muestra en el Cuadro 27. Cuadro 27. Informacin de los efectos principales y de las interacciones entre los mismos. Factor A a1 a2 a3 ai Y.j. b1 Y11. Y21. Y31. Yi1. Y.1. b2 Y12. Y22. Y32. Yi2. Y.2. Factor B b3 Y13. Y23. Y33. Yi3. Y.3. b4 Y14. Y24. Y34. Yi4. Y.4. bj Y1j. Y2j. Y3j. Yij. Y.j. Yi.. Y1.. Y2.. Y3.. Yi.. Y

Las ecuaciones de trabajo son las siguientes: ( )

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

( (
(

) )
)

(
)

La salida de varianza de acuerdo al modelo aditivo lineal sera la que se muestra en el Cuadro 28.

Cuadro 28. Salida de varianza para un diseo bifactorial en un arreglo completamente al azar. F.V Factor A Factor B A*B Error Total gl a-1 b-1 (a-1)(b-1) ab(r-1) abr-1 SC SCA SCB SCAB SCError SCTotales ( ( )( ) ) CM Fc Ft F(,glA, gl Error) F(,glB, gl Error) F(,glAB, gl Error)

Si el diseo bifactorial se hubiera llevado a cabo en arreglo en bloques completamente al azar el modelo aditivo lineal es el siguiente: ( Yijk = Variable respuesta = Efecto comn a todas las observaciones Ai = Efecto del i-simo nivel del factor A: i = a1, a2, a3 niveles del factor A Bj = Efecto del j-simo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B (A*B)ij = Interaccin del i-simo nivel del factor A con el j-simo nivel del factor B k = Efecto de k-simo bloque: k = 1, 2, 3, bloques Eijk = Error del modelo Y la salida de varianza sera la que se muestra en el Cuadro 29. )

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 29. Salida de varianza para un diseo bifactorial en un arreglo de bloques completamente al azar. F.V Bloque Factor A Factor B A*B Error Total gl k-1 a-1 b-1 (a-1)(b-1) (ab-1)(r-1) abr-1 SC SCBloques SCA SCB SCAB SCError SCTotales ( ( )( ) ) CM Fc Ft F(, glbloque, gl Error F(,glA, gl Error) F(,glB, gl Error) F(,glAB, gl Error)

En este caso se adicionara una hiptesis ms que sera la de bloque y si hubiera un rechazo de Ho, la interpretacin sera la misma que se ha mencionado anteriormente. Ejemplo Un mdico est interesado en determinar si tanto el estado nutricional como la edad (grupo etreo) de la madre tiene efecto sobre el peso del recin nacido. Los estados nutricionales de su inters fueron: Normal, Sobrepeso y Obesa, y los grupos etreos fueron: menores a 15 aos, 15 a 18 aos, 19 a 30 aos y mayores a 30 aos. Seleccion de forma aleatoria cuatro madres para cada combinacin de los niveles de los dos factores, estado nutricional y grupo etreo). Los pesos obtenidos en gramos fueron los que se reportan en el Cuadro 30. En este caso se tiene un experimento bifactorial, Estado Nutricional y Grupo Etreo, cada uno con tres y cuatro niveles, respectivamente. Esto hace que se tenga un bifactorial 3 x 4 (esto vendra a ser un factorial completo asimtrico, asimtrico por no tienen el mismo nmero de niveles y completo por se estudian todos los niveles que han sido propuestos por el investigador. Por otra parte se tiene cuatro repeticiones por tratamiento (combinacin), entonces viene a ser un bifactorial 3 x 4 con 4 repeticiones, haciendo un total de 48 unidades experimentales como se muestra en el Cuadro 30. Para los datos del Cuadro 30 realice lo siguiente: a. Proponga y describa un modelo aditivo lineal para el experimento. b. Proponga los juegos de hiptesis a probar. c. Realice el anlisis de varianza correspondiente de acuerdo al modelo aditivo lineal
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

propuesto en el inciso a., a una significancia del 1%. Realice conclusiones. d. Si existe rechazo de Ho en cualquiera de los factores como en las interacciones de los mismos, realice la prueba de rangos mltiples de Tukey al 99% de confiabilidad. Emita conclusiones Cuadro 30. Pesos de los recin nacidos de acuerdo al estado nutricional de la madre y al grupo etreo de las mismas. Estado Nutricional Grupo Etreo Menor de 15 15 a 18 19 a 30 Mayor a 30 Menor de 15 15 a 18 19 a 30 Mayor a 30 Menor de 15 15 a 18 19 a 30 Mayor a 30 1 1800 2000 3000 3100 2100 2500 2700 2900 3000 3100 2800 2800 Repeticiones 2 3 1900 1700 2400 2900 2800 2900 3300 2600 1800 1900 2900 3200 2900 3100 2600 3200 2800 2400 3300 2900 2500 3200 3100 3400 4 2000 3000 3200 2800 2200 2900 3500 2700 2500 3400 3100 3500

Normal

Con sobrepeso

Obesa

Dado que este experimento fue realizado en un arreglo completamente al azar no es necesario totalizar las columnas por lo tanto se procede a continuacin a obtener la informacin de las interacciones de los niveles de los factores estudiados. Para ello es necesario totalizar en fila las interacciones como se muestra en el Cuadro 31 posteriormente hacer en cuadro de las interacciones que conllevaran a los totales de los efectos principales como se reporta en el Cuadro 32, estos totales se muestran tanto en la suma de las hileras como de las columnas de acuerdo a como se dispongan los factores (totales marginales) y los valores de las interacciones estn dentro del cuadro.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 31. Datos del experimento con las interacciones totalizadas. Estado Nutricional Grupo Etreo Menor de 15 15 a 18 Normal 19 a 30 Mayor a 30 Menor de 15 15 a 18 Con sobrepeso 19 a 30 Mayor a 30 Menor de 15 15 a 18 Obesa 19 a 30 Mayor a 30 1 1800 2000 3000 3100 2100 2500 2700 2900 3000 3100 2800 2800 Repeticiones 2 3 1900 1700 2400 2900 2800 2900 3300 2600 1800 1900 2900 3200 2900 3100 2600 3200 2800 2400 3300 2900 2500 3200 3100 3400 4 2000 3000 3200 2800 2200 2900 3500 2700 2500 3400 3100 3500 Yij. 7400 10300 11900 11800 8000 11500 12200 11400 10700 12700 11600 12800

Cuadro 32. Efectos principales e interacciones de los factores Estado Nutricional y Grupo Etreo. Estado Nutricional Normal Con sobrepeso Obesa Y.j. Grupo Etreo (aos) Menor de 15 15 a 18 19 a 30 7400 10300 11900 8000 11500 12200 10700 12700 11600 26100 34500 35700 Mayor a 30 11800 11400 12800 36000 Yi.. 41400 43100 47800 132300

Desarrollando las actividades solicitadas para el ejemplo se tiene lo siguiente: a. Modelo aditivo lineal ( )

Yijk = Variable respuesta (peso de los recin nacidos) = Efecto comn a todas las observaciones Ni = Efecto del i-simo estado nutricional; i = Normal, Con sobrepeso y Obesa Gj = Efecto del j-simo grupo etreo; menores de 15, 15 a 18, 19 a 30 y mayores a 30 aos (N*E)ij = Efecto de la interaccin del i-simo nivel del factor Estado Nutricional con el jsimo nivel del factor Grupo Etreo Eijk = Error del modelo

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

b. Juego de Hiptesis Como existen dos factores y sus interacciones, las hiptesis son las siguientes: Para el factor Estado Nutricional: Ho: Normal- Sobre peso- Obesa = 0 Ha: Normal- Sobre peso- Obesa 0 Para el factor Grupo Etreo: Ho: menores de 15 - 15 a 18 - 19 a 30 - mayores 30 aos = 0 Ha: menores de 15 - 15 a 18 - 19 a 30 - mayores 30 aos 0 Para las interacciones: Ho: a1b1 - a1b2 - a1b3 - a1b4 - a3b4 = 0 Ha: a1b1 - a1b2 - a1b3 - a1b4 - a3b4 0 c. Anlisis de varianza ( )
( ( ) ( ) )

( ( ( ( )

) ) )

( (

) )

(
(

)
)

Con estos clculos se construye la salida o tabla de varianza como se muestra en el Cuadro 33.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Cuadro 33. Salida de varianza para el diseo bifactorial en un DCA del ejemplo. F.V Estado Nutricional Grupo Etreo Interaccin Error Total gl 2 3 6 36 47 SC 1373750 5510625 1196250 2957500 11038125 CM 686875 1836875 199375 82152.778 Fc 8.3609467 22.359256 2.4268808 Ft (0.01) 5.248 4.377 3.351

De acuerdo a los resultados del anlisis de varianza se puede concluir con 99% de confiabilidad que el peso de los recin nacidos se ve afectado por el Estado Nutricional y por el Grupo Etreo de las madres, es decir, que ejercen efectos significativos (P < 0.01) en el peso de los recin nacidos, no as las interacciones de los niveles estudiados ya que sta result ser no significativa. Esto indica que los factores estudiados ejercen efectos aditivos o bien que actan de forma independiente en la variable respuesta. d. Separacin de media de Tukey al 99% de confiabilidad Cuando se dan este tipo de resultados hay que determinar el nivel o niveles de cada factor que provocaron el rechazo de la hiptesis nula en el anlisis de varianza. Para ello hay que hacer los ajustes necesarios como se muestra en el Cuadro 34. Cuadro 34. Ajuste de los efectos principales y secundarios para la separacin de medias. Efecto A Total Yi.. Promedio Ajuste

Y.j.

AB

Yij.

Aplicando estos ajustes para los efectos principales se tiene lo siguiente:

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Estado Nutricional Normal Con sobrepeso Obesa

Totales 41400 43100 47800

Promedio 2587.5 2693.75 2987.5

Aplicando Tukey para el factor Estado Nutricional se tiene lo siguiente:

Ordenando los promedios de los niveles del factor Estado Nutricional y estableciendo las comparaciones correspondiente se tiene lo siguiente: Estado Nutricional Obesa Con sobrepeso Normal Promedio 2987.5 2693.75 2587.5 Comparaciones Obesa-Sobrepeso Obesa- Normal Sobrepeso - Normal Diferencias Resultado a 293.75 ns ab 400 * b 106.25 ns

En este caso se puede decir que de los niveles del factor Estado Nutricional, solo el nivel Obesa ejerci un efecto distinto (P <0.01) en el peso de los recin nacidos. Los ajustes para los niveles del factor Grupo Etreo se tiene lo siguiente: Grupo Etreo Menor de 15 15 a 18 19 a 30 Mayor a 30 Totales 26100 34500 35700 36000 Promedio 2175 2875 2975 3000

Aplicando la Tukey para los niveles del factor Grupo Etreo

Ordenando los promedios de los niveles del factor Grupo Etreo y estableciendo las comparaciones correspondiente se tiene lo siguiente:

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Comparaciones Mayor a 30 - 19 a 30 Mayor a 30 - 15 a 18 Mayor a 30 - Menor a 15 19 a 30 - 15 a 18 19 a 30 - Menor a 15 15 a 18 - Menor a 15 Grupo Etreo Mayor a 30 19 a 30 15 a 18 Menor de 15

Diferencias 25 ns 125 ns 825* 100 ns 800 * 700 * Resultado a a a b

Promedio 3000 2975 2875 2175

De acuerdo a los resultados de Tukey se puede concluir que de los niveles del factor Grupo Etreo, solamente uno de stos ejerci un efecto distinto el peso de los recin nacidos como las madres menores de 15 aos.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

BIBLIOGRAFIA CONSULTADA PARA ESTRUCTURAR EL DOCUMENTO

COCHRAN, W. y G.M. COX. 1991. Diseos Experimentales. 2da. Edic. Edit. Trillas. Mxico, D.F. FREUD, R.J. and R.C. LITTELL. 1991. SAS System for Regression. SAS Institute Inc, Cary. N.C. USA. HERRERA HARO, J.G y G. LORENZANA. 1994. Aplicaciones del SAS (Statistical Analysis System) a los Mtodos Estadsticos. Instituto Tecnolgico Agropecuario de Oaxaca. Oaxaca, Mxico. HILDERBRAND, P.E. y F. POEY. 1989. Ensayos Agronmicos en Fincas segn el Enfoque de Sistemas Agropecuarios. Edit. Agropecuaria Latinoamericana, Inc. Estados Unidos de Norteamrica. INFANTE GIL, S. y G. ZARATE DE LARA. 1990. Mtodos Estadsticos. Un enfoque interdiciplinario. 2da. Edic. Edit. Trillas. Mxico, D.F. LITTLE, T. y F.J. HILLS. 1989. Mtodos Estadsticos para la Investigacin Agropecuaria. 2da. Edic. Edit. Trillas. Mxico, D.F. LOPEZ, P.F. 1989. Uso del SAS para anlisis estadsticos de datos experimentales. Centro Agronmico Tropical de Investigacin y Enseanza C.A.T.I.E. Turrialba, Costa Rica. MARTINEZ-GARZA, A. 1988. Diseos Experimentales. Mtodos y Elementos de Teora. Edit. Trillas. Mxico, D.F, MARTINEZ-GARZA, A. 1994. Experimentacin Agrcola. Mtodos Estadsticos. Universidad Autnoma Chapingo. Chapingo, Mxico. MARTINEZ SOLARIS, F. 2111.

http://cdn.slidesharecdn.com/ss_thumbnails/estadisticaydiseosexperimentales110925201348-phpapp02-thumbnail.jpg?1316999785
Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

MONTGOMERY, D.C. 1991. Diseos y Anlisis de Experimentos. Edit. Iberoamria. Mxico, D.F. STEEL, R.G.D. y J.H. TORRIE. 1992. Bioestadstica. Principios y Procedimientos. 2da. Edic. Edit. McGraw-Hill. Mxico, D.F. RAO, C.R. 1952. Advanced statistical methods in biometric reseach. John Wiley. New York, USA. RENDON, S.G. 1992. Mtodos Estadsticos (Muestreo, Diseos Experimentales, Estadstica No Paramtrica). Universidad Autnoma de Chapingo. Chapingo, Mxico. REYES, C.P. 1992. Diseo de Experimentos Aplicados: Agronoma, Biologa, Qumica, Industrias, Ciencias Sociales. 3era Edic. Edit. Trillas. Mxico, D.F. RODRIGUEZ del ANGEL, J.M. 1991. Mtodos de Investigacin Pecuaria. Edit. Trillas. Mxico, D.F. WAYNE W. D. 1977. Estadstica con Aplicaciones a las Ciencias Sociales y a la Educacin. Edit. McGraw-Hill. Mxico.

Por Ing. M.Sc. Francisco Martnez Solaris. Mgs. En Educacin Superior

Potrebbero piacerti anche