Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
introducción
Unidad 4
4.1 diseño en bloques completos al azar
Resumen 4.1
4.2 diseño en cuadrado latino
Resumen 4.2
4.3 diseño en cuadrado grecolatino
resumen 4.3
4.4 uso de software estadístico
resumen 4.4
Unidad 5
5.1 diseños factoriales con dos factores
Resumen 5.1
5.2 diseños factoriales con tres factores
Resumen 5.2
5.3 diseño factorial general
Resumen 5.3
5.4 modelos de efectos aleatorios
Resumen 5.4
5.5 uso de software estadístico
Resumen 5.5
Conclusión
bibliografía
introducción
El presente documento, trata de realizar un resumen tipo ensayo, sobre el diseño
en bloques y factoriales. Mostrando la formulación general del modelo, así como
sus ventajas y desventajas en la aplicación de un modelo experimental.
Encontrarán un análisis teórico del diseño dicho, y las diferencias existentes
respecto a un diseño en bloque y factoriales.
El objetivo de un diseño es estudiar el efecto de varios factores sobre una o varias
respuestas o características de calidad, es decir, lo que se busca es estudiar la
relación entre los factores y la respuesta, con la finalidad de conocer mejor cómo
es esta relación y generar conocimiento que permita tomar acciones y decisiones
que mejoren el desempeño del proceso.
Por ejemplo, uno de los objetivos particulares más importantes que en general
tiene un diseño factorial es determinar una combinación de niveles de los factores
en la cual el desempeño del proceso sea mejor que en las condiciones de
operación actuales, es decir, encontrar nuevas condiciones de operación del
proceso que eliminen o disminuyen cierto problema de calidad en la variable de
salida.
Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador,
la presencia o ausencia de una operación previa, etc.) , o de tipo cuantitativo
(temperatura, humedad, velocidad, presión, etc.). Para poder estudiar la manera
en cómo influye cada factor sobre la variable respuesta, es necesario elegir al
menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial
completo se corren aleatoriamente en el proceso todas las posibles
combinaciones que pueden formarse con los niveles seleccionados.
Para estudiar el efecto de factores en la variable de respuesta es necesario elegir
al menos dos niveles de prueba para cada uno de ellos. Uno de sus objetivos es
determinar una combinación de niveles de los factores en la que el desempeño del
proceso sea mejor.
Con el diseño factorial completo se corren aleatoriamente todas las posibles
combinaciones que pueden formarse con los niveles de los factores a investigar.
La matriz de diseño o arreglo factorial es el conjunto de puntos experimentales o
tratamientos que pueden formarse considerando todas las posibles combinaciones
de los niveles de los factores.
4.1 DISEÑO EN BLOQUES COMPLETOS AL AZAR
Modelo estadístico
Cuando se decide utilizar un DBCA, el experimentador piensa que cada medición
será el resultado del efecto del tratamiento donde se encuentre, del efecto al que
pertenece y de cierto error que se espera sea aleatorio. El modelo estadístico para
este diseño está dado por:
Hipótesis a probar
La hipótesis de interés es la misma para todos los diseños comparativos, y está
dada por:
Ejemplo
En el ejemplo donde se planteó la comparación de los cuatro métodos de
ensamble, ahora se va a controlar activamente en el experimento a los operadores
que realizaran el ensamble, lo que da lugar al siguiente diseño en bloques
completamente al azar.
Recordemos que la variable de respuesta son los minutos en que se realiza. Para
comparar los cuatro métodos se plantea la hipótesis:
la cual se prueba mediante el análisis de varianza dado en la siguiente tabla
( Excel y Minitab)
Nota: para capturar la tabla en Excel se sombrea totalmente, tal y como está
indicada la tabla anterior, en la herramienta de Análisis de varianza de dos
factores con una sola muestra por grupo).
esta tabla se observa que para los métodos se obtuvo un valor-p = 0,003, por lo
que se rechaza la de que el tiempo medio poblacional de los métodos de
ensamble son iguales, y se acepta que al menos dos de los métodos son
diferentes en cuanto al tiempo medio que se requiere. De la misma manera para
operadores, como su valor-p = 0,030, el factor de bloque (operadores) también
afecta, es decir, existen diferencias entre los operadores en cuanto al tiempo
promedio.
resumen 4.1
Al igual que en el cuadro latino, cada letra (latinas y griegas) debe aparecer sólo
una vez en cada renglón y en cada columna. Además, cada par de letras debe
aparecer sólo una vez en todo el arreglo. El modelo estadístico que describe a las
mediciones en un cuadro grecolatino está dado por:
donde las sumas miden la variabilidad debida a los factores de bloque
renglón, columna y de letras griegas, respectivamente. Para K tratamientos, los
grados de libertad correspondientes a cada suma son:
Ejemplo
En el caso del ejemplo donde se comparan los cuatro métodos de ensamble y se
tiene el factor de bloque operador, se podrían tener dos factores de bloque
adicionales:
Orden en el que se hace el ensamble
Lugar donde se hace
De acuerdo con esto, el diseño en cuadro grecolatino se observa en la siguiente
tabla:
El modelo en cuadrado greco-latino se puede considerar como una extensión del
cuadrado latino en el que se incluye una tercera variable de control o variable de
bloque. En este modelo, como en el diseño en cuadrado latino, todos los factores
deben tener el mismo número de niveles K y el número de observaciones
necesarias sigue siendo K2 . Este diseño es, por tanto, una fracción del diseño
completo en bloques aleatorizados con un factor principal y 3 factores secundarios
que requeriría K4 observaciones.
Los cuadrados greco-latinos se obtienen por superposición de dos cuadrados
latinos del mismo orden y ortogonales entre sí, uno de los cuadrados con letras
latinas el otro con letras griegas. Dos cuadrados reciben el nombre de ortogonales
si, al superponerlos, cada letra latina y griega aparecen juntas una sola vez en el
cuadrado resultante. En el Apéndice C se muestra una tabla de cuadrados latinos
que dan lugar, por superposición de dos de ellos, a cuadrados greco-latinos.
Notamos que no es posible formar cuadrados greco-latinos de orden 6. La Tabla
5-8 ilustra un cuadrado greco-latino para K = 4
Donde:
µ es un efecto constante, común a todas las unidades.
τi es el efecto producido por el i-ésimo nivel del factor fila. Dichos efectos
están sujetos a la restricción i τi = 0.
βj es el efecto producido por el j-ésimo nivel del factor columna. Dichos efectos
están sujetos a la restricción j βj = 0.
γh es el efecto producido por el h-ésimo nivel del factor letra latina. Dichos
efectos están sujetos a la restricción h γh = 0.
δp es el efecto producido por el p-ésimo nivel del factor letra griega. Dichos
efectos están sujetos a la restricción p δp = 0.
ǫij(hp) son variables aleatorias independientes con distribución N(0, σ).
La notación yij(hp) indica que los niveles i y j determinan los niveles h y p para
un cuadrado greco-latino especificado. Es decir, los subíndices h y p toman
valores que dependen de la celdilla.
Se utiliza la siguiente notación:
N = K2 es el número total de observaciones.
El total y el promedio de todas las observaciones.
Como en el diseño en cuadrado latino los residuos suman cero por filas, por
columnas, para cada letra latina y además también deben sumar cero para cada
letra griega. Por lo tanto, el número de grados de libertad de los residuos es (K −
1)(K − 3). En efecto
Se verifican las mismas propiedades para los estimadores máximo-verosímiles
que en los modelos anteriores. En este modelo la expresión de la varianza
residual tiene la siguiente forma:
Tipos de software
Software gratis -Este término define un tipo de software que se distribuye sin
costo, disponible para su uso, pero que mantiene el copyright, por lo que no se
puede modificar o utilizar libremente como ocurre con el software libre.
Como estos dos efectos de A en función del nivel de B son muy diferentes,
entonces es evidencia de que la elección más conveniente del nivel de A depende
del nivel en que esté B, y viceversa. Es decir, eso es evidencia de que los factores
de A y B interactúan sobre Y. En la práctica, el cálculo del efecto A en cada nivel
de B no se hace, y más bien se calcula el efecto global de la interacción de los dos
factores, que se denotan por AB y se calculan como la diferencia entre la
respuesta media cuando ambos factores se encuentran en el mismo nivel: (-1, -1);
(1, 1), y la respuesta media cuando los factores se encuentran en niveles
opuestos: (-1, 1) (1, -1). Para el ejemplo, el efecto de interacción levadura x
temperatura está dado por:
Los valores absolutos (sin importar el signo) de los efectos principales y del efecto
de interacción son una medida de importancia de su efecto sobre la variable de
respuesta. Sin embargo, como se tienen estimaciones muéstrales, para saber si
los efectos son estadísticamente significativos (diferentes de coro) se requiere el
análisis de varianza (ANOVA).
Los diseños factoriales se utilizan para estudiar los efectos en una respuesta o
salida de al menos dos variables o factores cuando éstos cambian de valor
simultáneamente.
• Si tenemos k factores y se eligen variar cada uno a mk niveles, el número de
combinaciones experimentales es de m1 *m2 *m3 *…*mk
Para estudiar el efecto de factores en la variable de respuesta es necesario elegir
al menos dos niveles de prueba para cada uno de ellos.
• Uno de sus objetivos es determinar una combinación de niveles de los factores
en la que el desempeño del proceso sea mejor.Con el diseño factorial completo se
corren aleatoriamente todas las posibles combinaciones que pueden formarse con
los niveles de los factores a investigar.
• La matriz de diseño o arreglo factorial es el conjunto de puntos experimentales o
tratamientos que pueden formarse considerando todas las posibles combinaciones
de los niveles de los factores.
Diseño factorial con dos factores
Consta de a niveles del factor A y b niveles del factor B, los cuales se disponen en
un diseño factorial con n réplicas; es decir, cada réplica del experimento contiene
todas las ab combinaciones de los tratamientos.
RESUMEN 5.1
En resumen, se tienen siete efectos de interés sin considerar desglose, y con ellos
se pueden plantar las siete hipótesis nulas.
Al restar éstas del total, la suma de cuadrados del error resulta ser:
cuyos respectivos grados de libertad se dan en la tabla anterior. Una vez hecho el
ANOVA, se procede a interpretar los efectos activos, y luego (aunque no
necesariamente después) a diagnosticar la calidad del modelo.
Ejemplo
El experimento. Se desea investigar el efecto del tipo de suspensión (A), abertura
de malla (B) y temperatura de ciclaje (C) en el volumen de sedimentación Y(%) de
una suspensión. Para ello se decide correr un experimento factorial 3 x 2 x 2 con
seis réplicas, y las observaciones obtenidas en las 72 corridas experimentales se
muestran en la siguiente tabla:
Los niveles de prueba para cada factor, tanto en unidades originales como en
unidades codificadas, se muestran en la siguiente tabla:
Este diseño es una variación del diseño 2k y son muy útiles como las que se
emplean cuando todos los factores actúan a tres niveles. En los últimos años se
ha observado un creciente interés por algunas de las ideas del profesor Genechi
Taguchi acerca del diseño experimental y su aplicación al mejoramiento de la
calidad.
Este es un diseño que consta de k factores con tres niveles cada uno. Los
factores y las interacciones se representan mediante letras mayúsculas. Los tres
niveles de los factores pueden referirse como nivel inferior, intermedio y superior.
Estos niveles se representan mediante los dígitos 0 (nivel inferior), 1 (intermedio) y
2 (superior). Cada combinación de tratamientos de un diseño 3 k se presenta
mediante k dígitos, donde el primero incida el nivel de A, el segundo señale al
nivel de B,..... y el k-ésimo dígito, el nivel del factor k. Por ejemplo, es un diseño 3 2
el 00 representa la combinación de tratamientos, en la que tanto el factor A como
el B están en el nivel inferior, y el 01 representa la combinación de tratamientos
que corresponde al factor A en el nivel inferior y a B en el nivel intermedio.
En éste, el sistema de notación que se prefiere usar es el de + - en virtud de que
facilita la interpretación geométrica del diseño y de que es directamente aplicable
al modelado por regresión, la formación de bloques y la construcción de factoriales
fraccionarios. La adición de un tercer nivel permite modelar con una relación
cuadrática la relación entre la respuesta y cada factor.
Diseño 32
El diseño más simple es el 32 que consta de dos factores con tres niveles cada
uno.
Como hay 32 = 9 combinaciones de tratamientos, existen 8 grados de libertad
entre ellas, Los efectos principales A y B tienen dos grados de libertad cada uno, y
la interacción AB tiene cuatro grados de libertad. Si hay n réplicas habrá un total
de n32 - 1 grado de libertad, correspondiendo para el error 3 2 (n-1) grados de
libertad.
Diseño 33
Si se supone que se están estudiando tres factores (A, B, C) y que cada factor
tiene tres niveles acomodados en un experimento factorial.
En este tema vemos que es un diseño de variación del diseño 2 k y son muy útiles
como las que se emplean cuando todos los factores actúan a tres niveles. En los
últimos años se ha observado un creciente interés por algunas de las ideas del
profesor Genechi Taguchi acerca del diseño experimental y su aplicación al
mejoramiento de la calidad.
Este es un diseño que consta de k factores con tres niveles cada uno. Los
factores y las interacciones se representan mediante letras mayúsculas. Los tres
niveles de los factores pueden referirse como nivel inferior, intermedio y superior.
Estos niveles se representan mediante los dígitos 0 (nivel inferior), 1 (intermedio) y
2 (superior).
Diseñar un sistema de manufactura para elaborar un producto requiere de
conocimientos técnicos además de una gran experiencia en el área a la cual
pertenece el producto.
Para más de tres factores, las interacciones superiores a tres suelen suponerse
nulas, lo que permite obtener una estimación del error experimental.
Los diseños factoriales consisten en un análisis de varianza donde se van a probar
dos o más factores donde cada uno va a tener dos o más niveles.
A cada factor se le llamará factor A, B, C...etc, y los niveles de cada factor serán
0,1,2,3... Una vez definidos los factores y los niveles, se definen los tratamientos.
Cada tratamiento es una combinación de los factores y niveles.
El objetivo de la prueba es investigar si existe diferencia entre los tratamientos
mediante el análisis de varianza, pero especificando si existe diferencia entre los
niveles de cada factor y entre la interacción de los factores.
A la tabla de análisis de varianza, se le agregan varios renglones debajo del
renglón de tratamientos, con el fin de realizar el análisis detallado de los factores.
El análisis de varianza inicial puede ser completamente al azar o bloques al azar
Lo que se ha dicho para los dos diseños factoriales con 2 y 3 factores puede
extenderse fácilmente para cuando se tienen más factores. Considerarse f
factores A, B, C,…, K con niveles a,b,c,…….k.. respectivamente, donde la letra K
denota al f-ésimo o último factor del conjunto a estudiar, no necesariamente el
undécimo, que es el lugar de esta letra en el alfabeto. Con estos niveles y factores
se puede construir el diseño factorial general a x b x…x k que consiste de a x b
x…x k tratamientos o puntos de prueba. Con este diseño se pueden estudiar f
efectos principales (f-1)/2 interacciones dobles f(f-1)(f-2)(3x2) interacciones triples,
y así sucesivamente hasta la única interacción de los f factores (ABC…K). El
cálculo del número de interacciones de cierta cantidad m de factores se hace
mediante la operación ¨combinaciones de f en Que
cuenta el
Por ejemplo
el diseño factorial 25 tiene cinco efectos principales, 10 interacciones dobles, 10
interacciones triples, cinco interacciones cuádruples y una interacción quíntuple, lo
cual da un total de 31 efectos. Por su parte, el factorial 3 5 también tiene este
mismo número de efectos, pero al contar con tres niveles en cada factor, cada
efecto principal se puede descomponer en su parte lineal y cuadrática. Cabe
destacar que mientras el diseño factorial 2 5 tiene 32 tratamientos, el factorial 3 5
tiene 243, una cantidad de tratamientos difícil de manejar. Aun si pudiera correrse,
representa una opción muy ineficaz; además, existen arreglos experimentales más
pequeños y eficientes.
Los resultados del ANOVA para dos factores pueden ser extendidos a un caso
general en donde a son los niveles del factor A, b son los niveles del factor B, c
son los factores del nivel C, y así sucesivamente, los cuales pueden ser
arreglados en un experimento factorial, en el cual el número de réplicas es n.
Está diseñada para generar procesos de calidad. TAGUCHI desarrolló una
aproximación al diseño de experimentos con el objetivo de reducir los costos
emanados de la experimentación, esta aproximación es más práctica que teórica y
se interesa más por la productividad y los costos de producción que en las reglas
estadísticas. Los conceptos de estas técnicas están basados en las relaciones de
costos y ahorros. Diseñar un sistema de manufactura para elaborar un producto
requiere de conocimientos técnicos además de una gran experiencia en el área a
la cual pertenece el producto. Los diseños factoriales son ampliamente utilizados
en experimentos en los que intervienen varios factores para estudiar el efecto
conjunto de estos sobre una respuesta. Existen varios casos especiales del
diseño factorial general que resultan importantes porque se usan ampliamente en
el trabajo de investigación, y porque constituyen la base para otros diseños de
gran valor práctico. En los últimos años se ha observado un creciente interés por
algunas de las ideas del profesor Genechi Taguchi acerca del diseño experimental
y su aplicación al mejoramiento de la calidad el diseño factorial fraccionario 2 k-p
se usa en experimentos de escrutinio para identificar con rapidez y de manera
eficiente el subconjunto de factores que son activos, y para obtener alguna
información sobre la interacción. La propiedad de proyección de estos diseños
hace posible en muchos casos examinar los factores activos con más detalle. La
combinación secuencia de estos diseños a través del plegamiento es una forma
muy eficaz de obtener información extra acerca de las interacciones, la cual puede
identificarse en un experimento inicial como potencialmente importante.
Se supone que:
a) los factores son fijos
El diseño 2k es particularmente útil en las primeras fases del trabajo experimental,
cuando es probable que haya muchos factores por investigar.
Conlleva el menor número de corridas con las cuales pueden estudiarse k factores
en un diseño factorial completo. Debido a que sólo hay dos niveles para cada
factor, debe suponerse que la respuesta es aproximadamente lineal en el intervalo
de los niveles elegidos de los factores. Este diseño es una variación del diseño
2k y son muy útiles como las que se emplean cuando todos los factores actúan a
tres niveles. En los últimos años se ha observado un creciente interés por algunas
de las ideas del profesor Genechi Taguchi acerca del diseño experimental y su
aplicación al mejoramiento de la calidad.
Este es un diseño que consta de k factores con tres niveles cada uno. Los
factores y las interacciones se representan mediante letras mayúsculas. Los tres
niveles de los factores pueden referirse como nivel inferior, intermedio y superior.
Estos niveles se representan mediante los dígitos 0 (nivel inferior), 1 (intermedio) y
2 (superior).
k
Cada combinación de tratamientos de un diseño 3 se presenta mediante k dígitos,
donde el primero incida el nivel de A, el segundo señale al nivel de B, ..... y el k-
ésimo dígito, el nivel del factor k.
RESUMEN 5.3
Resumen 5.3
Hasta aquí los modelos de efectos que se han utilizado son modelos de efectos o
factores fijos, lo cual significa que todos los niveles de prueba en cada factor son
todos los disponibles para ese factor, o bien, se estudian todos los niveles de
interés en ese factor; es en este sentido que los niveles están fijos. Éste es el
caso, por ejemplo, cuando en el factor operador se toman los tres únicos
operadores como los niveles de prueba, o cuando los niveles del factor máquinas
son las cuatro máquinas existentes. O bien, cuando se comparan tres tipos de
material porque son los que interesa comprar, aunque existan otros materiales de
ese tipo. Con factores fijos, las conclusiones obtenidas sólo son válidas para los
niveles de prueba que se estudian en el experimento.
En ocasiones, los niveles de prueba son una muestra aleatoria de la población de
niveles posibles. En este caso es más apropiado utilizar un modelo de efectos o
factores aleatorios. Un ejemplo de esta situación es cuando se prueban cinco
instrumentos de medición, pero la población de los mismos es de 100
instrumentos; obviamente, no es posible experimentar con todos los equipos.
Entonces se experimenta sólo con cinco de ellos elegidos al azar, y las
conclusiones obtenidas se infieren como válidas para la población entera de
instrumentos.
La aplicación de un modelo de efectos aleatorios conlleva la necesidad de
considerar la incertidumbre asociada con la elección aleatoria de los niveles de
prueba. Es decir, ya no tiene sentido, para un factor A, preocuparse por el efecto
ai del nivel i como en efectos fijos. Lo que ahora (con efectos aleatorios) tiene
sentido es hablar de la varianza con la que el factor aleatorio contribuye a la
variación total; es decir, es preciso estimar dicha varianza y probar si su
contribución a la variabilidad total es significativa.
donde Sexo ij es la variable dummy para niños / niñas, ij raza es la variable ficticia
para los alumnos blancos / negro, y ParentsEduc ij registra el nivel promedio de
educación de los padres del niño. Se trata de un modelo mixto, no un modelo de
efectos puramente aleatorios.
La varianza de Y ij es la suma de las varianzas τ 2 y σ 2 de U y W i ij
respectivamente.
Deje
igual a la media, no de todos los resultados de la i ª escuela, pero de los que están
en la i ª escuela que se incluyen en la muestra aleatoria. Sea
Estos " cuadrados medios esperados "pueden ser utilizados como base
para la estimación de los "componentes de la varianza" σ 2 y τ 2. Insesgadez.
Resumen 5.4
Utilizando Minitab
Resumen 5.5
La conclusión final nos lleva a que en los temas anteriores vistos utilizamos varios
métodos, formulas y tablas para tratar de llegar a un resultado, siendo diseños
cuadráticos o factoriales. Para poder estudiar el efecto de factores en la variable
de respuesta es necesario elegir al menos dos niveles de prueba para cada uno
de ellos. Uno de sus objetivos es determinar una combinación de niveles de los
factores en la que el desempeño del proceso sea mejor. Con el diseño factorial
completo se corren aleatoriamente todas las posibles combinaciones que pueden
formarse con los niveles de los factores a investigar. La matriz de diseño o arreglo
factorial es el conjunto de puntos experimentales o tratamientos que pueden
formarse considerando todas las posibles combinaciones de los niveles de los
factores. Los diseños factoriales son los más eficientes para analizar los posibles
efectos combinados de dos o más factores sobre la variable de respuesta. Es un
diseño experimental que sirve para estudiar el efecto individual y de interacción de
varios factores sobre una o varias respuestas.
Referencias
http://educommons.anahuac.mx:8080/eduCommons/estadistica-e
investigacion-operativa/diseno-de experimentos/Tema%208_Experimentos
%20factoriales.pdf
https://www.academia.edu/18242976/ESTADISTICA_INFERENCIAL_II_LIBRO
GUTIERREZ, P. H y DE LA VARA, S. R. 2008. Segunda edición. Análisis y Diseño
de Experimentos. Mc Graw Hill.
MONTGOMERY, C.D.; G.C, RUNGER. 2010. Segunda edición. Probabilidad y
Estadística. LIMUSA WILEY
MONTGOMERY, C.D. Diseño y Análisis de Experimentos. Segunda edición.
LIMUSA WILEY
WALPOLE, R.; MAYERS, R.H.; MAYERS, S.L. 1998. Sexta edición. Probabilidad y
Estadística Para Ingenieros. Pearson Education
ANDERSON, D.R.; SWEENEY, D.J.; WILLIAMS, T.A.2005. Octava edición.
Estadística para Administración y Economía. MATH LEARNING
BERENSON, M.L.; LEVINE, D.M.; KREHBIEL, T.C. 2001. Segunda edición.
Estadística para Administración. Prentice Hall