Sei sulla pagina 1di 44

DISEÑO COMPLETAMENTE

RANDOMIZADO O AL AZAR
(DCA)
Prof. Reynán Cóndor Alarcón
DISEÑO COMPLETAMENTE RANDOMIZADO O
AL AZAR
Este diseño experimental es el más simple de todos los diseños
experimentales y útil cuando las unidades experimentales son
esencialmente homogéneas; es decir cuando la variación entre ellas es
pequeñas que al agruparlas en bloques la ganancia en precisión sería
insignificante. En este diseño los tratamientos se asigna aleatoriamente
a las unidades experimentales sin imponer restricción. Es decir, cada
unidad experimental tiene la misma oportunidad o probabilidad de
recibir un tratamiento. Esto puede realizarse mediante el uso de
números aleatorios.
Proceso de aleatorización
Ejemplo
Se desea comparar los rendimientos de tres variedades de un cultivar:
A, B y C. Suponga que se cuenta con 15 parcelas (numeradas del 1 al
15) y se decide usar 5 repeticiones por tratamiento.
Podemos aletorizar usando R.
> runif(15)
[1] 0.69246954 0.74541673 0.34586751 0.92537023 0.96553459
0.98898732
[7] 0.80900678 0.12943117 0.03193816 0.74635908 0.30062693
0.85686832
[13] 0.63212632 0.48316790 0.49302399
Ventajas

• Este diseño es flexible en cuanto a que el número de tratamiento y


repeticiones sólo está limitado por el número de unidades experimentales.
• El número de repeticiones puede variar de un tratamiento a otro, aunque
generalmente lo ideal es tener el mismo número de repeticiones por cada
tratamiento
• El análisis estadístico es simple, aun cuando se pierde unidades
experimentales o tratamientos completos, el diseño se mantiene es decir
sigue siendo un diseño completamente al azar
• El número de grados de libertad para estimar el error experimental es
máximo, esto mejora la precisión del experimento, lo cual toma mayor
importancia con experimento pequeño (en aquellos cuyos grados de
libertad para el error es menor a 20).
Desventaja

Su principal desventaja es su ineficiencia, debido a que el error incluye


toda la variación entre las unidades experimentales excepto a la debida
a los tratamientos.
EL Análisis de Varianza

• El análisis de varianza (ANOVA) es la técnica central en el análisis de


datos experimentales. La idea general de esta técnica es separar la
variación total en las partes con las que contribuye cada fuente de
variación en el experimento. En el caso del DCA, se separan la
variabilidad debida a los tratamientos y la debida al error. Cuando la
primera predomina “claramente” sobre la segunda, es cuando se
concluye que los tratamientos tienen efecto (figura 3. 1b), o dicho de
otra manera, las medias son diferentes. Cuando los tratamientos no
dominan (contribuyen igual o menos que el error), se concluye que
las medias son iguales (figura 3.1a).
 i  i  
Tabla. Datos de un diseño completamente
aleatorizado

DISPOSICIÓN DE LAS
UNIDADES
EXPERIMENTALES
BAJO UN DISEÑO Disponer los
COMPLETAMENTE datos en una
RANDOMIZADO base de datos
El modelo aditivo

Yij     i   ij
i  1, 2,..., ni
j  1, 2,..., a
 : la media global
 i : efecto del tratamiento i -ésimo
 ij : término de error
A continuación, se muestra una tabla de ANVA que
muestra una forma extendida de calcular las
sumatorias de cuadrados
Ejemplo. En la tabla 6.3.1.2 se da el contenido de nitrógeno, en
miligramos, de plantas de trébol rojo inoculadas con cultivos de
cepas de Rhizobium trifolii más un compuesto de 5 cepas de
Rhizobium meliloti.
N° Cepas Tratamientos
1 Cepa 3DOk1 3DOk1
2 Cepa 3DOk5 3DOk5
3 Cepa 3DOk4 3DOk4
4 Cepa 3DOk7 3DOk7
5 Cepa 3DOk13 3DOk13
6 compuesto de 5 cepas Compuesto
de Rhizobium meliloti
Tabla Contenido de nitrógeno (mg) de plantas de trébol rojo
inoculadas con cepas de Rhizobium trifolii y una combinación
de cepas de Rhizobium meliloti.

3DOk1 3DOk5 3DOk4 3DOk7 3DOk13 Compuesto


19.4 17.7 17 20.7 14.3 17.3
32.6 24.8 19.4 21 14.4 19.4
27 27.9 9.1 20.5 11.8 19.1
32.1 25.2 11.9 18.8 11.6 16.9
33 24.3 15.8 18.6 14.2 20.8
1. Modelo

Yij     i   ij ; i  1, 2,..., ni ; j  1, 2,..., a

2. Hipótesis

H 0 : 1  2  3  4  5  6
H A : al menos una 
Tábla. Análisis d varianza
Decisión
• Si el valor calculado de la Fc es mayor que el valor crítico de Fα, se
rechaza la hipótesis nula.
• Dado que 14.37 es mayor que 2.621, se rechaza la hipótesis nula,
hipótesis alternativa.
Conclusión
• Por lo tanto, existe al menos una diferencia entre el efecto de los
tratamientos.
Comparaciones múltiples
Cuando el ANVA resulte estadísticamente significativo, se sabrá que las medias de
los grupos son diferentes entre sí, pero hay que profundizar más y preguntarse
dónde están específicamente esas diferencias. Para ello se usan los contrastes del
ANVA, que buscan diferencias particulares entre grupos y pueden seguir dos
aproximaciones:
1. A priori. Se realizan pocas comparaciones y se planifican antes de iniciar el
análisis de los datos. Se seleccionan solo las comparaciones más interesantes,
juiciosas y razonables para la investigación. Es la mejor opción, pues hace explícitas
las hipótesis de interés y evita el mal recurso automático de comparar todo con
todo (llamado a veces excursión de pesca, en la jerga estadística). Las
comparaciones a priori pueden ser ortogonales o no ortogonales. Las ortogonales
extraen el máximo partido a los datos.
2. A posteriori (o post hoc). No están planificadas y en ellas se compara todo
con todo, es decir, se establecen todas las posibles comparaciones de medias (dos a
dos). Se podrían hacer a(a- l)/2 contrastes dos a dos. Es decir, si hay, por ejemplo,
cinco grupos (a = 5), se podrán realizar 10 comparaciones por parejas.
Comparaciones múltiples
• DMS
• Duncan
• S-N-K
• Tukey
• Scheffe
• Bonferroni
Supuestos del ANVA
La validez de los resultados obtenidos en cualquier
análisis de varianza queda suspeditado a que los
supuestos del modelo se cumplan.
• Normalidad
• Varianza homogéneas
• Independencia
Normalidad
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Cepas de Rhizobium Estadístico gl Sig. Estadístico gl Sig.
Contenido de nitrógeno 3DOk1 ,314 5 ,120 ,802 5 ,085
(mg)
3DOk4 ,211 5 ,200* ,963 5 ,826
3DOk5 ,334 5 ,071 ,858 5 ,220
3DOk7 ,296 5 ,175 ,826 5 ,129
3DOk13 ,345 5 ,052 ,745 5 ,027
Compuesto ,209 5 ,200* ,936 5 ,638
*. Esto es un límite inferior de la significación verdadera.
a. Corrección de significación de Lilliefors
Varianza homogéneas
Gráfica de cajas
Diagnóstico de supuestos con gráficos con R

Residuals vs Fitted Normal Q-Q

2
5

1
Standardized residuals
0

0
Residuals

-1
-5

13
6 13

-2
6
-10

-3
1

15 20 25 -2 -1 0 1 2

Fitted values Theoretical Quantiles

Constant Leverage:
Scale-Location Residuals vs Factor Levels

2
1
1.5

1
Standardized residuals

Standardized residuals
13

0
1.0

-1
0.5

-2
13
6

-3
1
0.0

trat :
15 20 25 3DOk1 3DOk13 3DOk4 3DOk5 3DOk7 Compuesto

Fitted values Factor Level Combinations


Diagnóstico de supuestos con gráficos con Minitab
Gráfica de probabilidad normal
Utilice esta gráfica para detectar no normalidad. Los puntos
que siguen aproximadamente una línea recta indican
que los residuos están distribuidos normalmente.
Histograma
Utilice esta gráfica para detectar múltiples picos, valores
atípicos y no normalidad. Busque un histograma
normal, que es aproximadamente simétrico y en forma
de campana.
vs. ajustes
Utilice esta gráfica para detectar varianza no constante,
términos faltantes de orden superior y valores atípicos.
Busque residuos que estén dispersos aleatoriamente
alrededor de cero.
vs. orden
Utilice esta gráfica para detectar la dependencia del tiempo
de los residuos. Inspeccione la gráfica para asegurarse
de que los residuos no muestren ningún patrón obvio.
¿Si los datos no son normales, se podrá
realizar algún análisis alternativo?
• Bootstrap: Utilizado, entre otros propósitos, para obtener intervalos de confianza para
datos no normales.
• Tests no paramétricos: Análogos a las pruebas paramétricas tradicionales (Test T, ANOVA,
etc.)
• Tests de permutaciones: También son una excelente alternativa a las pruebas
paramétricas tradicionales y funcionan, incluso, para conjuntos pequeños de datos. Son
tests “exactos”, pero necesitan que Ud. disponga de un buen “tarro” (computador) pues
son computationally-intensive methods.
• Modelos lineales generalizados: Idóneos para modelar datos discretos como cuentas de
células (leucocitos, ufc, etc.) o variables dicotómicas (Conforme/No Conforme), etc.
• Transformación de datos: Especialmente útiles son la transformación de Johnson y la de
Box-Cox.
• Estadística Robusta: No tan sólo son útiles para minimizar el efecto de valores anómalos
(outliers), sino también para obener estimadores de datos que no son normales.

Carlos Gómez
MODELOS DE EFECTOS FIJOS Y DE EFECTOS
ALEATORIOS
En muchos experimentos factoriales los tratamientos los elige
deliberadamente el experimentador. Se dice que estos experimentos
siguen un modelo de efectos fijos. En algunos casos, los tratamientos
se eligen en forma aleatoria de una población de tratamientos posibles.
En estos casos se dice que los experimentos siguen un modelo de
efectos aleatorios. En un modelo de efectos fijos interesan los
tratamientos específicos elegidos por el experimento. En un modelo de
efectos aleatorios, interesa toda la población de tratamientos posibles,
y no sólo los que se eligen para el experimento.
En un diseño experimental de acuerdo con el
tipo de efecto que se desea analizar se
presenta dos tipos de modelo:

Modelo de efectos fijos (modelo I) Ocurre cuando los niveles del


factor son especificado o fijado por el investigador.

Modelo de efectos aleatorios (Modelo II) Ocurre cuando los niveles


del factor son elegidos al azar de una población grande.
MODELOS DE EFECTOS FIJOS

• En el primer modelo las únicas conclusiones que se pueden obtener son


acerca de los tratamientos empleados en realidad en el experimento.
MODELOS DE EFECTOS ALEATORIOS
• Sin embargo, en un modelo de efectos aleatorios, debido a que los
tratamientos son una muestra aleatoria simple de una población de
tratamientos, se pueden obtener conclusiones con respecto a toda la
población, incluyendo los tratamientos que no incluyen en realidad
en el experimento.
• En el modelo de efectos aleatorios no se necesita que se lleven a cabo
más contrastes, incluso aunque H0 haya sido rechazada. El propósito
del experimento es hacer un planteamiento general relativo a las
poblaciones de las que se extraen las k muestras poblacionales. Esto
es lo que se ha hecho.
Ejemplo
• Los medios de cultivo bacteriológico utilizados en los laboratorios de los
hospitales proceden de diversos fabricantes. Se sospecha que la calidad de estos
medios de cultivo varía de un fabricante a otro. Para comprobar esta teoría, se
hace una lista de fabricantes de un medio de cultivo concreto, se seleccionan
aleatoriamente los nombres de tres de los que aparecen en la lista y se
comparan las muestras de los instrumentos procedentes de éstos. La
comparación se realiza colocando sobre una placa dos dosis, en gotas, de una
suspensión medida de un microorganismo clásico, Escherichia coli, dejando al
cultivo crecer durante veinticuatro horas y determinando después el número de
colonias (en millares) del microorganismo que aparecen al final del período. El
propósito no es comparar precisamente estos tres fabricantes; se les eligió
aleatoriamente y únicamente constituyen una muestra de todos los fabricantes
de instrumentos. Más bien, lo que buscamos es apoyo estadístico para el
supuesto general de que la calidad del instrumental difiere entre fabricantes.
• En el experimento, se eligen aleatoriamente tres fabricantes de medios de
cultivo bacteriológico. De las existencias de cada uno se extraen muestras de
tamaño 10 y se comparan. Se obtienen los siguientes datos estadísticos:

Potrebbero piacerti anche