Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Facultad de Ingenieria
Escuela de Estadistica
Programa Academico de Estadistica
Diseño y analisis de experimentos
Cali, abril de 2019
Problema 1
• ¿Cómo se diseñó el experimento?
Primero se realizo un muestreo del suelo para obserar que le puede proporcionar a la planta, luego se
realizo un muestreo espacial para determinar la variabilidad espacial de las diferentes caracteristicas
del suelo, a partir de esta informacion se establecieron los tratamientos con los que se van a trabajar
en este experimento, y a partir de las diferentes variables respuestas como lo son las biofisicas, las
fotoquimicas, entonces por cada dosis de nutriente, se tienen 5 replicas los cuales estan divididos en
rangos para llevar un control del experimento, y ya con estos elementos, el diseño adecuado para
este tipo de investigaciones seria el diseño de bloques al azar con submuestreo, ya que para cada
bloque existen diferentes medidas y diferentes tratamientos.
• ¿Cómo se ejerció el control local?
Para este experimento se tuvieron en cuenta varios aspectos; el principal es la variabilidad es-
pacial del suelo, para solucionar eso se acudio a una solucion de riego localizado de alta frecuencia,
la cual busca reducir lo maximo posible la variacion entre las concentraciones de nitrogeno y fosforo,
por lo cual se riegan a la misma hora para que cuando el angulo de los rayos del sol se dirijan hacia
los cultivos, estas tengan las mismas concentraciones posibles. Para controlar los cultivos de las
parcelas por bloques, se tuvo en cuenta que como el suelo aporta ciertas cantidades de fosforo y
nitrogeno, para no mezclar las concentraciones de estos, se realizaron unas divisiones de las parcelas
con un espaciamiento considerable y suficiente para que no se mezclaran los fertilizantes agregados
por el sistema de riego.
• ¿De qué manera fueron tomadas las mediciones?
De las variables biofisicas, se tomaron las mediciones de la hoja, del tallo y el numero de hojas
verdes totalmente abiertas de la planta, de las variables fotoquimicas se tomaron mediciones de
una hoja completamente desarrollada, la llevan al laboratorio para observar la huella espectral para
revisar su contenido de clorofila A y B. Y
Punto 1
a) Realice el análisis exploratorio de los datos.
Grafico de puntos.
a Código: 1332293. E-mail: jhonathan.daniel.cano@correunivalle.edu.co
1
Informe final: Diseño de experimentos. 2
B1 B2 B3 B4 B5
B1 B2 B3 B4 B5 ●
●
0.9 ●
● ●
2.5 ●
● ● ●
●
● ● ●
●
● ● ● ●
●
● 0.8
●
●
● ● ● ●
●
● ● ●
● ●
● ● ● ●
● ● ● ● ● ●
●
●
● ● ● ●
● ● ● ●
● ●
● ● ● ● 0.7 ● ●
● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
● ● ●
Chlb
2.0 ● ● ● ●
● ●
● ● ● ●
● ● ● ●
Chla
● ● ● ● ●
● ● ● ● ●
● ● ●
● ● ● ●
● ● 0.6 ● ● ●
● ● ● ●
● ●
● ●
● ● ●
● ● ●
●
● ● ● ● ●
● ● ●
●
● ● ● ●
● ●
●
●
●
0.5
● ●
●
● ●
1.5
●
0.4
●
●
T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4
Como se observa en los graficos, la distribucion de los bloques en general se comportan de manera
muy dispersa, lo que indica que la varianza es muy amplia en el caso de los datos de la clorofila A, en
otro aspecto se observa que el bloque 3 en ambos tipos de clorofila, presentan los valores mas dispersos
que los demas, lo que pudo haber ocurrido en este escenario es la posibilidad de que este bloque estuviera
sesgado de alguna manera.
En particular, en la distribucion de la clorofila B , los datos conservan cierta simetria en los bloques
1, 2 y 4 lo que permite afirmar que los tratamientos en esta seccion estuvieron mejor controlados.
Las caracteristicas a resaltar en los tratamientos para la clorofila A es que tenemos que el tratamiento
4 fue el que obtuvo la media mas con 2.03 mg/m3 y su coeficiente de variacion es de 0.2 % lo cual dice
que tuvo un control local excepcionalmente mejor que los demas tratamientos, que sin embargo, estan
por debajo del 16 % lo que indica que el proceso en cada tratamiento estuvo bien controlado.
En el caso de la clorofila B, se observa que la media del contenido de clorofila en la hoja del tratamiento
3 es de 0.72 mg/m3 y con un coeficiende de variacion del 1 % , y tambien se tuvo un buen control local
en los demas tratamientos, siendo asi una buena ejecucion del experimento.
Estadisticas descriptivas por bloques de Clorofila A y B
Con respecto a los bloques, las medias de contenido de clorofila A, no existen mucha diferencia, sin
embargo resalta la media del bloque 3 con un contenido de 2.03 mg/m3 . Tambien se observan diferencias
con respecto al coeficiente de variacion entre los distintos bloques, por ejemplo los bloques 3 y 4 presentan
las mayores variaciones con respecto al resto con un 16 % en estos y los demas entre 10 % y 13 % lo que
da a pensar que no se tuvo un control tan eficiente como en los demas.
En este caso, las medias de contenido de clorofila B son muy similares entre ellas lo que indica que no
hay diferencias significativas aparentes, con respecto al coeficiente de variacion, se observa que el bloque
3 presenta una variacion del 23 % lo cual es relativamente alto e indica que el control ejercido en este
bloque no fue consistente.
en donde
• yijk = es la cantidad de clorofila teniendo en cuenta el i-esimo tratamiento con el j-esimo bloque.
• µ = Es la cantidad de clorofila promedio sin el efecto del i-esimo tratamiento ni el j-esimo bloque
• τi = Es el efecto del i-esimo tratamiento en la cantidad de clorofila sin tener en cuenta el j-esimo
bloque
• βj = Es el efecto del j-esimo bloque en la cantidad de clorofila sin tener en cuenta el i-esimo
tratamiento.
• αij = es la interaccion entre el i-esimo tratamiento con el j-esimo bloque en la cantidad de clorofila.
• eijk = es el error aleatorio provocado por el i-esimo tratamiento y el j-esimo bloque.
H0 : τ1 = τ2 = τ3 = τ4 = 0 vs H1 : Al menos una τi 6= 0
• tambien se desea probar si entre los bloques existen diferencias significativas a la hora de medir la
cantidad de clorofila, Se plante de la siguiente manera,
H0 : β1 = β2 = β3 = β4 = β5 = 0 vs H1 : Al menos una βj 6= 0
• Se quiere establecer si las interacciones entre los tratamientos y los bloques son significativos o no,
para esto se plantea esta hipotesis.
De acuerdo al analisis de varianza, con un nivel de significancia del 5 % se puede concluir que existen
evidencias significativas en la interaccion de los tratamientos en los bloques, con respecto a los tratamien-
tos y los bloques por si solos, estas no tienen el poder explicativo suficiente por lo que se procedera a
analizar mas detalladamente las interacciones, con una prueba post-ANOVA.
ANOVA para los datos de clorofila B
De manera similar con la anova anterior, hay evidencia estadistica suficiente para afirmar que la
interaccion entre los tratamientos y los bloques por lo cual se hace necesario realizar pruebas post-anova
para verificar qué interacciones resultan mas significativas.
Clorofila A Vc Valor p
Normalidad (AD Test) 0.20035 0.8792
Homocedasticidad (Barlett) 19.93 0.3988
Para la clorofila B
Segun la tabla, tenemos que se cumplen los supuestos mas importantes con un nivel de significancia del
5 %. con los valores p de 0.87 y 0.39 para la normalidad y la homogeneidad de varianza respectivamente.
Clorofila B Vc Valor p
Normalidad (AD Test) 0.41319 0.3303
Homocedasticidad (Barlett) 26.335 0.1211
Para el caso del modelo de la clorofila B, tenemos que con una significancia del 5 % y con los valores
p de las pruebas de 0.33 y 0.12 de normalidad y homogeneidad de varianza respectivamente.
A partir de los resultados del coeficiente de variacion de los 2 modelos de Clorofila podemos decir
que en general, se tuvo un buen control local siendo un experimento de campo en donde existen muchas
variables que no se pueden controlar, como el clima, el suelo, etc.
Problema 2
a) ¿Cuál es el objetivo del estudio?
El objetivo del estudio es evaluar el rendimiento del almidon expuesto a diferentes niveles de secado
y determinar cual es el metodo mas efectivo teniendo en cuenta el tipo de rallanderia y del trabajador.
De acuerdo a las estadisticas descriptivas se puede apreciar que para el caso de los metodos de secado,
el metodo de secado por el sol es el que mas aporta en la resistencia del almidon con un promedio de
49.87, pero tambien es el que posee la desviacion estandar mas grande con 8.17 unidades. otro aspecto
importante a observar en los coeficientes de variacion de los metodos de secado presentan valores bajos
por lo que es posible afirmar que existe un buen control local en el experimento y por lo tanto se obten-
dran resultados coherentes. Con respecto a las rallanderias la Rallanderia 1 es la que mejores resultados
obtuvo con un rendimiento promedio de 48.37 kg en el lote de almidon de yuca y como en el caso anterior,
se observaron que sus coeficientes de variacion son pequeños lo que indica que se tuvo un buen control
local sobre los diferentes complejos donde procesan el almidon de yuca (Rallanderia).
Grafico de puntos
3:R1 3:R2
65 ●
●
● ●
60 ●
● ●
● ●
55 ●
● ●
50 ●
● ● ●
●
45 ●
40
35
2:R1 2:R2
65
60
Rendimiento
55
●
●
●
50
●
●
●
● ● 45
● ●
● ●
●
● ●
● 40
35
1:R1 1:R2
65
60
55
50 ●
●
45 ● ●
● ●
● ●
● ● ●
40 ●
● ●
35 ● ●
●
T1 T2 T3 T1 T2 T3
Observando la distribucion de los trabajadores en conjunto de las rallanderias y los metodos de secado
se puede notar que el trabajador 2 en todos los metodos de secado obtuvo los mejores rendimientos con
respecto a las diferentes rallanderias, tambien se puede notar que el metodo de secado con mejores
resultados en el rendimiento por lote de yuca es el de 50 % sol - 50 % aire caliente, tambien podemos
observar que el trabajador con el menor rendimiento en las rallanderias es el Trabajador 1 en los metodos
1 y 2 correspondientes al sol y al aire caliente respectivamente.
Efectos principales
Rallanderia Rallanderia:Trabajador
55
60
R1 R1:T2
R2 R2:T2
R1:T1
55
R2:T1
R1:T3
mean of Rendimiento
mean of Rendimiento
50
R2:T3
50
45
45
40
40
35
1 2 3 1 2 3
Metodo−Secado Metodo−Secado
En los graficos de los efectos principales podemos notar que no existe interaccion entre los metodos
de secado y las rallanderias por si solas, pero al graficar las interacciones entre las rallanderias y los
trabajadores. En donde se resaltan que el trabajador 2 de la rallanderia 1 se obtuvieron los rendimientos
promedios mas altos que el resto, tambien es plausible afirmar que las interacciones principales aparecen
a partir del cambio entre el segundo y tercer metodo de secado en donde todas las interacciones aumentan
de manera exponencial.
eijkl ≈ N ID(0, σ 2 )
E[eijk ] = 0 ∀i, j, k, l
V [eijk ] = σ 2 ∀i, j, k, l
cov[enijkl , eni0 j 0 k0 l0 ] = 0
Donde:
• yijkl = Es el rendimiento del lote de almidon agrio de yuca entiendo en cuenta el i-esimo metodo
de secado, la j-esima rallanderia, y el k-esimo trabajador en la l-esima replica
• µ= es el rendimiento promedio del lote de almidon sin tener en cuenta ningun efecto del experimento
• τi = es el efecto del i-esimo metodo de secado, sin tener en cuenta el resto de efectos.
• αj = es el efecto de la j-esima rallanderia sin tener en cuenta el i-esimo metodo de secado ni el
k-esimo trabajador,
• γk(j) = es el efecto del k-esimo trabajador teniendo en cuenta la j-esima rallanderia y sin tener en
cuenta el i-esimo trabajador.
• (τ α)ij = Es la interaccion entre el i-esimo metodo de secado y el j-esima rallanderia en el rendimiento
del almidon.
• (τ γ)ik(j) = es el efecto de la interaccion del i-esimo metodo de secado y el k-esimo trabajador
teniendo la j-esima rallanderia.
• e(ijk)l = Es el error aleatorio
H0 : τ1 = τ2 = τ3 = 0 vs H1 : Al menos una τi 6= 0
Tambien se quiere observar si existen diferencias entre las diferentes rallanderias, por ende se plantea
la siguiente hipotesis:
H0 : α1 = α2 = α3 = 0 vs H1 : Al menos una αj 6= 0
A partir de este punto, se evaluaran si todas las interacciones son significativas, por lo cual, se plantean
las hipotesis de la siguiente manera,
De acuerdo al analisis de varianza, se puede observar que existen diferencias significativas en los
diferentes factores a un nivel de significancia del 5 % , Tambien podemos observar que las interacciones
entre las rallanderias y los trabajadores suelen ser significativas tambien, por otro lado tenemos que la
interaccion entre los metodos de secado y las diferentes rallanderias no representan diferencias notorias
a un nivel de 5 %. Con la incertidumbre no saber cuales son las mejores caracteristicas de los diferentes
factores, se hace necesario realizar pruebas post anova para identificar cuales son las condiciones que
sobresalen en este diseño y permiten realizar con mayor exactitud estimaciones de los rendimientos del
almidon.
●
2
●
●
●
●
●
●
1
●●
●●
●●
●●●
Sample Quantiles
●●●●●
●●●
●●●●
0
●●●●●
●●
●
●
●
●
●●
●●●
● ●●
−1
●
●
●
−2
−2 −1 0 1 2
Theoretical Quantiles
Segun el grafico qqplot, se tiene que los residuos se comportan de manera normal y para verificar este
resultado, se utilizara la prueba shapiro-wilk para dar sentencia a la siguiente hipotesis :
Con un nivel de significancia del 5 % no existe suficiente evidencia para decir que los datos no provienen
de una distribucion normal.
Homogeneidad de varianza
Para verificar si la varianza es constante entre los datos, se realizara la prueba de Barlett para iden-
tificar si en verdad estos son homogeneos con respecto a la varianza.
A un nivel de significancia del 5 % no existe evidencia estadistica suficiente para decidir que los datos
no poseen la misma varianza.
s
CV = ∗ 100
X
y para nuestro caso sera:
7.560409
CV = ∗ 100 = 16.09549
46.97222
A partir de este resultado se puede concluir que se obtuvo un buen control local en general, ya que
el CV arrojo una variacion del 16 % lo cual resulta bastante bajo y muy estable con respecto a cambios
futuros o nuevas investigaciones similares sobre estos topicos.
Se tiene que para el trabajador 1 se resalta que en la rallanderia 1, para los metodos de secado 1 y
2 no se encontraron diferencias significativas y para el resto de las rallanderias se encuentran diferencias
significativas entre ellas. Para el trabajador 2 se tiene que en los metodos de secado 1 y 2 se tiene que
no hay diferencias significativas y para el metodo de secado numero 3 se tienen que existen diferencias
fuertes con el resto de las los metodos de secado. Y con el trabajador 3 se tiene que existen diferencias
entre el metodo de secado 1 y 2 con unas medias de 38.5667 y 49.9333 respectivamente, ademas se puede
observar una tendencia de que el tercer metodo de secado en general es mejor sin importar la rallanderia
ni el trabajador.
Se tiene que para los metodos de secados, realizando el mismo experimento con 2 replicas tenemos
una potencia del 99 %, para las rallanderias se tiene que con una replica se obtiene una potencia del
98.5 %, para los trabajadores tenemos que con 4 replicas para cada trabajador se obtiene una potencia
del 99 %, Para las interacciones, se tiene que la interaccion entre el metodo de secado con la rallanderia
se necesitan 2 replicas para obtener una potencia del 68 % lo cual es relativamente baja con respecto
a sus pares individuales y por ultimo se tiene que el metodo de secado con el trabajador incluyendo la
rallanderia se tiene una potencia del 79.8 %.
En general se necesitan pocas replicas para obtener una potencia significativa para todas las hipotesis,
la unica que no esta tan alta es la de la interaccion entre el metodo de secado con la rallanderia, lo cual
indica que esta relacion necesitaria muchas mas replicas para obtener una potencia adecuada.