Trabajo Estadistica 4 y 5 Unidad

Índice
introducción
Unidad 4
4.1 diseño en bloques completos al azar
 Resumen 4.1
4.2 diseño en cuadrado latino
 Resumen 4.2
4.3 diseño en cuadrado grecolatino
 resumen 4.3
4.4 uso de software estadístico
 resumen 4.4
Unidad 5
5.1 diseños factoriales con dos factores
 Resumen 5.1
5.2 diseños factoriales con tres factores
 Resumen 5.2
5.3 diseño factorial general
 Resumen 5.3
5.4 modelos de efectos aleatorios
 Resumen 5.4
5.5 uso de software estadístico
 Resumen 5.5
Conclusión
bibliografía
introducción
El presente documento, trata de realizar un resumen tipo ensayo, sobre el diseño
en bloques y factoriales. Mostrando la formulación general del modelo, así como
sus ventajas y desventajas en la aplicación de un modelo experimental.
Encontrarán un análisis teórico del diseño dicho, y las diferencias existentes
respecto a un diseño en bloque y factoriales.
El objetivo de un diseño es estudiar el efecto de varios factores sobre una o varias
respuestas o características de calidad, es decir, lo que se busca es estudiar la
relación entre los factores y la respuesta, con la finalidad de conocer mejor cómo
es esta relación y generar conocimiento que permita tomar acciones y decisiones
que mejoren el desempeño del proceso.
Por ejemplo, uno de los objetivos particulares más importantes que en general
tiene un diseño factorial es determinar una combinación de niveles de los factores
en la cual el desempeño del proceso sea mejor que en las condiciones de
operación actuales, es decir, encontrar nuevas condiciones de operación del
proceso que eliminen o disminuyen cierto problema de calidad en la variable de
salida.
Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador,
la presencia o ausencia de una operación previa, etc.) , o de tipo cuantitativo
(temperatura, humedad, velocidad, presión, etc.). Para poder estudiar la manera
en cómo influye cada factor sobre la variable respuesta, es necesario elegir al
menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial
completo se corren aleatoriamente en el proceso todas las posibles
combinaciones que pueden formarse con los niveles seleccionados.
Para estudiar el efecto de factores en la variable de respuesta es necesario elegir
al menos dos niveles de prueba para cada uno de ellos. Uno de sus objetivos es
determinar una combinación de niveles de los factores en la que el desempeño del
proceso sea mejor.
Con el diseño factorial completo se corren aleatoriamente todas las posibles
combinaciones que pueden formarse con los niveles de los factores a investigar.
La matriz de diseño o arreglo factorial es el conjunto de puntos experimentales o
tratamientos que pueden formarse considerando todas las posibles combinaciones
de los niveles de los factores.
4.1 DISEÑO EN BLOQUES COMPLETOS AL AZAR
Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor,

es deseable que las posibles diferencias se deban principalmente al factor de
interés y no a otros factores que no se consideran en el estudio. Cuando esto no
ocurre y existen otros factores que no se controlan o nulifican para hacer la
comparación, las conclusiones podrían ser afectadas sensiblemente.
Por ejemplo, supongamos que se quieren comparar varias máquinas, si cada
máquina es manejada por un operador diferente y se sabe que éste tiene una
influencia en el resultado, entonces es claro que el factor operador debe tomarse
en cuenta si se quiere comparar a las máquinas de manera justa. Un operador
más hábil puede hacer ver a su máquina (aunque ésta sea la peor) como la que
tiene el mejor desempeño, lo cual impide hacer una comparación adecuada de los
equipos. Para evitar este sesgo hay dos maneras de anular el posible efecto del
factor Cooperador:
la manera lógica es utilizar el mismo operador en las cuatro máquinas; sin
embargo, tal estrategia no siempre es aconsejable, ya que utilizar el mismo sujeto
elimina el efecto del factor operador, pero restringe la validez de la comparación
condicho operador, y es posible que el resultado no se mantenga al utilizar a otros
operadores. La otra forma de anular el efecto operador en la comparación consiste
en que cada operador trabaje durante el experimento con cada una de las
máquinas. Esta estrategia es la más recomendable, ya que utilizar a todos los
operadores con todas las máquinas permite tener resultados de la comparación
que son válidos para todos los operadores. Esta forma de nulificar el efecto de
operadores, recibe el nombre de Bloqueo.
 Factores de bloque
A los factores adicionales al factor de interés que se incorporan de manera
explícita en un experimento comparativo se les llama factores de bloque. Éstos
tienen la particularidad de que no se incluyen en el experimento porque interese
analizar su efecto, sino como un medio para estudiar de manera adecuada y
eficaz al factor de interés. Los factores de bloque entran al estudio en un nivel de
importancia secundaria con respecto al factor de interés y, en este sentido, se
puede afirmar que se estudia un solo factor, porque es uno el factor de interés.
En un diseño en bloques completos al azar (DBCA) se consideran tres fuentes de
variabilidad:
 El factor de tratamientos
 El factor de bloque
 El error aleatorio
decir, se tienen tres posibles ¨culpables¨ de la variabilidad presente en los datos.
La palabra completo en el nombre del diseño se debe a que en cada bloque se
prueban todos los tratamientos, o sea, los bloques están completos. La
aleatorización se hace dentro de cada bloque; por lo tanto, no se realiza de
manera total como en el diseño completamente al azar. Los factores de bloqueo
que aparecen en la práctica son: Turno, lote, día, tipo de material, línea de
producción, operador, maquina, método, etc. Supongamos una situación
experimental con k tratamientos y b bloques. El aspecto de los datos para este
caso se muestra en la tabla 3,1. Considerando una repetición en cada
combinación de tratamiento y bloque.
 Modelo estadístico
Cuando se decide utilizar un DBCA, el experimentador piensa que cada medición
será el resultado del efecto del tratamiento donde se encuentre, del efecto al que
pertenece y de cierto error que se espera sea aleatorio. El modelo estadístico para
este diseño está dado por:
 Hipótesis a probar
La hipótesis de interés es la misma para todos los diseños comparativos, y está
dada por:
Que también se puede expresar como:
En cualquiera de estas hipótesis la afirmación a probar es que la respuesta media

poblacional lograda con cada tratamiento es la misma para los tratamientos y que,
por lo tanto, cada respuesta media es igual a la media global poblacional. De
manera alternativa, es posible afirmar que todos los efectos de tratamiento sobre
la variable de respuesta son nulos, porque cuando el efecto, entonces
necesariamente la respuesta media del tratamiento es igual a la media global.
 Análisis de varianza
La hipótesis dada se prueba con un análisis de varianza con dos criterios de
clasificación, porque se controlan dos fuentes de variación: el factor de
tratamientos y el factor de bloque. En la tabla 3.2 se muestra el aspecto del
ANOVA para diseño DBCA.
Los cálculos necesarios pueden ser manuales, pero siempre es más práctico
hacerlos con un software estadístico, porque además proporciona muchas otras
opciones gráficas y tabulares útiles (no sólo el ANOVA). Utilizando la notación de
puntos, las fórmulas más prácticas para calcular las sumas de cuadrados son
 Ejemplo
En el ejemplo donde se planteó la comparación de los cuatro métodos de
ensamble, ahora se va a controlar activamente en el experimento a los operadores
que realizaran el ensamble, lo que da lugar al siguiente diseño en bloques
completamente al azar.
Recordemos que la variable de respuesta son los minutos en que se realiza. Para
comparar los cuatro métodos se plantea la hipótesis:
la cual se prueba mediante el análisis de varianza dado en la siguiente tabla
( Excel y Minitab)
Nota: para capturar la tabla en Excel se sombrea totalmente, tal y como está
indicada la tabla anterior, en la herramienta de Análisis de varianza de dos
factores con una sola muestra por grupo).
esta tabla se observa que para los métodos se obtuvo un valor-p = 0,003, por lo
que se rechaza la de que el tiempo medio poblacional de los métodos de
ensamble son iguales, y se acepta que al menos dos de los métodos son
diferentes en cuanto al tiempo medio que se requiere. De la misma manera para
operadores, como su valor-p = 0,030, el factor de bloque (operadores) también
afecta, es decir, existen diferencias entre los operadores en cuanto al tiempo
promedio.
resumen 4.1
El objetivo principal es tener comparaciones precisas entre los tratamientos bajo

estudio. Utilizar bloques es una forma de reducir y controlar la varianza del error
para tener mayor precisión.
En el diseño completamente al azar se supone que son relativamente
homogéneas con respecto a factores que afectan la variable de respuesta. Sin
embargo, algunas veces no tenemos disponibles suficiente número de
homogéneas.
Cualquier factor que afecte la variable de respuesta y que varíe entre u.e.
aumentará la varianza del error experimental y disminuirá la precisión de las
comparaciones.
Factores como la edad y el peso de los animales, diferentes lotes de material,
sexo de las personas y parcelas alejadas son ejemplos de variables externas a los
tratamientos que pueden incrementar la variación entre las observaciones de la
variable de respuesta.
En cualquiera de las hipótesis la afirmación a probar es que la respuesta media
poblacional obtenida con cada tratamiento es la misma para los tratamientos y
que, por lo tanto, cada respuesta media es igual a la media global poblacional.
De manera alternativa, es posible afirmar que todos los efectos de tratamiento
sobre la variable de respuesta son nulos, porque cuando el efecto, entonces
necesariamente la respuesta media del tratamiento es igual a la media global.
Los cálculos necesarios pueden ser manuales, pero siempre es más práctico
hacerlos con un software estadístico en la cual se utilizan tipos de fórmulas y
estadísticas específicas para poder obtener el resultado requerido.
4.2 DISEÑO EN CUADRADO LATINO

En el diseño en cuadro latino (DCL) se controlan dos factores de bloque y se
estudia un factor de tratamientos, por lo que se tienen cuatro fuentes de
variabilidad que pueden afectar la respuesta observada, estas son:
 Los tratamientos
 El factor de bloque I (renglones)
 El factor de bloque II (columnas)
 El error aleatorio
Se llama cuadro latino por dos razones: es un cuadro debido a que tiene la
restricción adicional de que los tres factores involucrados se prueban en la misma
cantidad de niveles, y es latino porque se utilizan letras latinas para denotar a los
tratamientos o niveles del factor de interés. Sean A, B, C, …, K , los k tratamientos
a comparar, por lo tanto ambos factores de bloques tienen también k niveles cada
uno. El aspecto de los datos se muestra en la siguiente tabla.
Ahora se necesitan al menos tres subíndices, por ejemplo, la respuesta Y 313 se

generó en el tratamiento tres (C), en el primer nivel del factor renglón y en el tercer
nivel del factor columna. El modelo estadístico para describir el comportamiento de
las observaciones está dado por:
columna. Otra vez, la hipótesis fundamental es la de los tratamientos; las otras dos
proporcionan un adicional al objetivo inicial y permiten comprobar la relevancia
los factores de bloque.
Un cuadrado latino es una matriz de n×n elementos en la que cada casilla está

ocupada por uno de los n símbolos de tal modo que cada uno de ellos aparece
exactamente una vez en cada columna y en cada fila.
Las siguientes matrices son cuadrados latinos:
Los cuadrados latinos se dan como una tabla de multiplicar empleadas para

operar en los cuasi grupos y que son aplicables para la elaboración de
experimentos numéricos.
Si cada entrada de un cuadrado latino de n × n se escribe como una tripleta
(f, c, s), donde f es la fila, c la columna y s el símbolo (para nuestro caso un
número), se obtendrán n2tripletas, llamado arreglo ortogonal del cuadrado. Por
ejemplo, para el primer cuadrado latino de todos estos ejemplos, el arreglo
ortogonal será así:
{ (1,1,1),(1,2,2),(1,3,3),(2,1,2),(2,2,3),(2,3,1),(3,1,3),(3,2,1),(3,3,2) },
Donde, por ejemplo, la tripleta (2,3,1) representa que el valor en la fila 2 columna 3
es 1. La representación de un cuadrado latino puede escribirse en términos del
arreglo ortogonal, y queda así:
 existen n2 tripletas de la forma (f, c, s), donde 1 ≤ f, c, s ≤ n;

 todos los pares (f, c) son diferentes, todos los pares (f, s) son diferentes, y
todos los pares (c, s) son diferentes.
La representación por arreglos ortogonales muestra que las filas, columnas y
símbolos representan un papel muy similar.
Mucha operación sobre un cuadrado latino produce otro cuadrado latino (por
ejemplo, alternar filas).
Si permutamos las filas, permutamos las columnas, y permutamos los símbolos de
un cuadrado latino obtenemos un nuevo cuadrado latino que decimos que es
isotópico del primero. El isotopismo es una relación de equivalencia; basándose
en esto, se dice que todos los cuadrados latinos están divididos en subgrupos,
llamados clases isotópicas; según esto, dos cuadrados de la misma clase se dice
que son isotópicos, y dos de clases diferentes son no isotópicos.
Otro tipo de operación puede explicarse fácilmente usando la representación de
estos por arreglos ortogonales. Si se reorganizan consciente y sistemáticamente
los tres elementos de cada tripleta (f, c, s) por (c, f, s), lo cual corresponde a una
transposición del cuadrado (reflejado en la diagonal principal), o es posible
reemplazar cada tripleta (f, c, s) por (c, s, f), lo que es una operación más
complicada. Todas juntas dan 6 posibilidades, incluida la de no hacer nada, lo que
da 6 cuadrados latinos llamados conjugados del cuadrado original.
Finalmente, es posible combinar estas dos operaciones equivalentes: dos
cuadrados latinos son para tópicos si uno de ellos es conjugado del otro. Esto es
nuevamente una relación de equivalencia, con la clase de equivalencia principal
llamada clase principal, especies o clase para tópica. Cada clase contiene 6
clases isotópicas.
No se conoce una fórmula para el cálculo fácil del número de cuadrados latinos
de n × n son para n=1, 2,...,n. Los límites superiores e inferiores más exactos
conocidos para n más grande están demasiado separados. Aquí se dispone de
todos los valores exactos conocidos. Es posible notar que los números crecen
exageradamente rápido.
Para cada n, el número de cuadrados latinos disponibles
(secuencia A002860 en OEIS ) es n! (n-1)! veces el número de cuadrados latinos
reducidos (secuencia A000315 en OEIS).
Para cada n, cada clase isotópica (secuencia A040082 en OEIS) contiene hasta
(n!)3 cuadrados latinos (el número exacto varia), y cada clase principal
(secuencia A003090 en OEIS) contiene alguna de las 1, 2, 3 o 6 clases isotópicas.
Resumen 4.2
Para que el análisis de varianza en el diseño de cuadrados latinos tenga validez,

deben cumplirse los mismos supuestos mencionados para el diseño de bloques al
azar: Normalidad, Homocedasticidad e Independencia.
adicionalmente debe cumplirse el supuesto de aditividad entre filas, columnas y
tratamientos, con esto se quiere decir que, no debe haber interacción entre los
mismos. Respecto a la normalidad e independencia, el procedimiento es el mismo
que en el caso de un diseño completamente al azar y de un diseño en bloques al
azar.
la normalidad se evaluará con ayuda de un programa llamado INFOSTAT y la
prueba de Shapiro – Wilk con ello la independencia se garantizará con la
asignación aleatoria de los tratamientos a las unidades experimentales.
En el caso del supuesto de Homocedasticidad, para el diseño de cuadrados
latinos se presenta la misma situación donde el problema de índole computacional
que habíamos mencionado para el diseño de bloques al azar, pues los programas
estadísticos actuales son incapaces de evaluar el supuesto en cualquier diseño
diferente al completamente al azar, razón por la cual se debe asumir que el
supuesto se cumple.
Le llamamos cuadro latino por dos razones: es un cuadro debido a que tiene la
restricción adicional de que los tres factores involucrados se prueban en la misma
cantidad de niveles, y es latino porque se utilizan letras latinas para denotar a los
tratamientos o niveles del factor de interés.
Sean A, B, C, …, K , los k tratamientos a comparar, por lo tanto ambos factores de
bloques tienen también k niveles cada uno.
4.3 DISEÑO EN CUADRO GRECOLATINO
Con el diseño en cuadro grecolatino (DCGL) se controlan tres factores de bloque,

además del factor de tratamiento. Se llama cuadro grecolatino porque los cuatro
factores involucrados se prueban en la misma cantidad de niveles, de aquí que se
pueda escribir como un cuadro (ver tabla 3.5); además, se utilizan letras latinas
para denota a los tratamientos y letras griegas para nombrar a los niveles del
tercer factor de bloque.
Al igual que en el cuadro latino, cada letra (latinas y griegas) debe aparecer sólo
una vez en cada renglón y en cada columna. Además, cada par de letras debe
aparecer sólo una vez en todo el arreglo. El modelo estadístico que describe a las
mediciones en un cuadro grecolatino está dado por:
donde las sumas miden la variabilidad debida a los factores de bloque
renglón, columna y de letras griegas, respectivamente. Para K tratamientos, los
grados de libertad correspondientes a cada suma son:
Un bosquejo del análisis de varianza se muestra en la tabla 3.6, en la cual se

prueban las hipótesis de igualdad de letras latinas (tratamientos), de renglones, de
columnas y de letras griegas.
Ejemplo
En el caso del ejemplo donde se comparan los cuatro métodos de ensamble y se
tiene el factor de bloque operador, se podrían tener dos factores de bloque
adicionales:
 Orden en el que se hace el ensamble
 Lugar donde se hace
De acuerdo con esto, el diseño en cuadro grecolatino se observa en la siguiente
tabla:
El modelo en cuadrado greco-latino se puede considerar como una extensión del
cuadrado latino en el que se incluye una tercera variable de control o variable de
bloque. En este modelo, como en el diseño en cuadrado latino, todos los factores
deben tener el mismo número de niveles K y el número de observaciones
necesarias sigue siendo K2 . Este diseño es, por tanto, una fracción del diseño
completo en bloques aleatorizados con un factor principal y 3 factores secundarios
que requeriría K4 observaciones.
Los cuadrados greco-latinos se obtienen por superposición de dos cuadrados
latinos del mismo orden y ortogonales entre sí, uno de los cuadrados con letras
latinas el otro con letras griegas. Dos cuadrados reciben el nombre de ortogonales
si, al superponerlos, cada letra latina y griega aparecen juntas una sola vez en el
cuadrado resultante. En el Apéndice C se muestra una tabla de cuadrados latinos
que dan lugar, por superposición de dos de ellos, a cuadrados greco-latinos.
Notamos que no es posible formar cuadrados greco-latinos de orden 6. La Tabla
5-8 ilustra un cuadrado greco-latino para K = 4
En un diseño en cuadrado greco-latino la variable respuesta yij(hp) viene descrita

por la siguiente:
Donde:
 µ es un efecto constante, común a todas las unidades.
 τi es el efecto producido por el i-ésimo nivel del factor fila. Dichos efectos
están sujetos a la restricción i τi = 0.
 βj es el efecto producido por el j-ésimo nivel del factor columna. Dichos efectos
están sujetos a la restricción j βj = 0.
 γh es el efecto producido por el h-ésimo nivel del factor letra latina. Dichos
efectos están sujetos a la restricción h γh = 0.
 δp es el efecto producido por el p-ésimo nivel del factor letra griega. Dichos
efectos están sujetos a la restricción p δp = 0.
 ǫij(hp) son variables aleatorias independientes con distribución N(0, σ).
 La notación yij(hp) indica que los niveles i y j determinan los niveles h y p para
un cuadrado greco-latino especificado. Es decir, los subíndices h y p toman
valores que dependen de la celdilla.
 Se utiliza la siguiente notación:
 N = K2 es el número total de observaciones.
 El total y el promedio de todas las observaciones.
 El total y el promedio para cada fila
El total y el promedio para cada columna
El total y el promedio para cada letra latina
El total y el promedio para cada letra griega
 y..h. se obtiene sumando las K observaciones en las que la letra latina se ha

fijado al nivel h.
 y...p se obtiene sumando las K observaciones en las que la letra griega se ha
fijado al nivel p.
Siguiendo el mismo proceso que en los diseños anteriores se obtienen los
siguientes estimadores máximos verosímiles de los parámetros del modelo.
 Los residuos en este modelo adoptan la expresión
Como en el diseño en cuadrado latino los residuos suman cero por filas, por
columnas, para cada letra latina y además también deben sumar cero para cada
letra griega. Por lo tanto, el número de grados de libertad de los residuos es (K −
1)(K − 3). En efecto
Se verifican las mismas propiedades para los estimadores máximo-verosímiles
que en los modelos anteriores. En este modelo la expresión de la varianza
residual tiene la siguiente forma:
Siguiendo el mismo procedimiento que en los modelos anteriores se comprueba

que la ecuación básica del análisis de la varianza es:
que simbólicamente se puede escribir:

SCT = SCF + SCC + SCL + SCG + SCR
denominando por esas siglas los términos en el orden en que figuran en la
ecuación 8.14 y que reciben los siguientes nombres
1) SCT suma total de cuadrados.
2) SCF suma de cuadrados debida al efecto fila.
3) SCC suma de cuadrados debida al efecto columna.
4) SCL suma de cuadrados debida a las letras latinas.
5) SCG suma de cuadrados debida a las letras griegas.
6) SCR suma de cuadrados del error.

Resumen 4.3
Los cuadrados greco-latinos se obtienen por superposición de dos cuadrados

latinos del mismo orden y ortogonales entre sí, uno de los cuadrados con letras
latinas el otro con letras griegas.
Al igual que en el cuadro latino, cada letra ya sea latinas o griegas debe aparecer
sólo una vez en cada renglón y en cada columna. Además, cada par de letras
debe aparecer sólo una vez en todo el arreglo.
El desarrollo del diseño de cuadrados grecolatinos es muy similar al de
cuadrados latinos, en su estructura, este desarrollo conlleva los mismos pasos
iniciales.
Se llama cuadro grecolatino porque los cuatro factores involucrados se prueban en
la misma cantidad de niveles, de aquí que se pueda escribir como un cuadro;
además, se utilizan letras latinas para denotar a los tratamientos y letras griegas
para nombrar a los niveles del tercer factor de bloque.
El modelo en cuadrado greco-latino se puede considerar como una extensión del
cuadrado latino en el que se incluye una tercera variable de control o variable de
bloque.
Como en el diseño en cuadrado latino los residuos suman cero por filas, por
columnas, para cada letra latina y además también deben sumar cero para cada
letra griega. Se verifican las mismas propiedades para los estimadores máximo-
verosímiles que en los modelos anteriores.
La hipótesis fundamental es la de los tratamientos; las otras dos (las hipótesis de
los bloques) proporcionan un adicional al objetivo inicial y permiten comprobar la
relevancia de controlar los factores de bloqueo.
La diferencia que deben tener entre sí para concluir que los tratamientos o que los
bloques son diferentes lo determina el análisis de varianza (ANOVA).
4.4 USO DE UN SOFTWARE ESTADÍSTICO
Es un programa informático especialmente diseñado para resolver
problemas en el área de la estadística. Existen muchos programas que no
son especialmente estadísticos pero que pueden hacer algunos cálculos
aplicables en estadística aplicada. Estos programas han impulsado y siguen
impulsando la labor de los investigadores que desean utilizar la estadística
como apoyo en su trabajo.
 Tipos de software
Software libre - Se refiere al conjunto de software (programa informático)

que por elección manifiesta de su autor puede ser: copiado, estudiado,
modificado, utilizado libremente con cualquier fin y redistribuido con o sin
cambios o mejoras. Es el software que respeta la libertad de los usuarios y
la comunidad. Significa que los usuarios tienen la libertad de ejecutar,
copiar, distribuir, estudiar, modificar y mejorar el software. Es decir, el
«software libre» es una cuestión de libertad, no de precio. Para entender el
concepto, piense en «libre» como en «libre expresión», no como en «barra
libre». Un programa informático es software libre si otorga a los usuarios de
manera adecuada las denominadas cuatro libertades (libertad de usar,
estudiar, distribuir y mejorar). De lo contrario no se trata de software libre.
De acuerdo con la definición establecida por Richard Stallman, un software
es "libre" cuando garantiza las siguientes libertades:
 Software de código abierto
Es el software cuyo código fuente y otros derechos que normalmente son
exclusivos para quienes poseen los derechos de autor, son publicados bajo una
licencia de código abierto o forman parte del dominio público. También
denominado OSS (“Open Source Software”). No tiene que ser necesariamente
sinónimo de software gratuito (“freeware”). Éste es quizá el error más extendido en
relación al concepto de OSS. Sólo exige que el código fuente (“source code”) sea
público y esté disponible de forma gratuita. Como el software libre de código
abierto no tiene nada que ver con el precio, un precio bajo no indica que el
programa sea más “libre” o esté más cerca de serlo. En teoría, una aplicación
basada en OSS nunca “muere”, ya que al estar el código fuente disponible,
cualquiera puede seguir desarrollándola, incluso cuando los autores iniciales no lo
hagan. Al poder tener muchos programadores o desarrolladores (“developers”)
trabajando en el código fuente, éste puede mejorar notablemente .
 Software gratis
Este término define un tipo de software que se distribuye sin costo, disponible para
su uso, pero que mantiene el copyright, por lo que no se puede modificar o utilizar
libremente como ocurre con el software libre. El freeware suele incluir una licencia
de uso comercial, que permite su redistribución, pero con algunas restricciones,
como no modificar la aplicación en sí ni venderla, y dar cuenta de su autor.
También puede desautorizar el uso en una compañía con fines comerciales o en
una entidad gubernamental, o bien requerir pagos si se le va a dar uso comercial.
Aunque se trate de software gratuito, mantiene el copyright, por lo que solo puede
usarse según lo establecido en su licencia. Como se ha indicado, el software
gratuito no es necesariamente software abierto.
 Ejemplos de software estadísticos
SAS (Statistical Analysis System) – PAGO / PRIVATIVO
Es un sistema de programas para el análisis de datos. Consiste en un conjunto de
módulos capaces de entregar resultados de diferentes procesos como regresión,
análisis de varianza, estadística básica, distribución de frecuencias y
procedimientos multivariados. Es un paquete de software desarrollado por SAS
Instituto para análisis avanzados, análisis multivalente, inteligencia empresarial,
gestión de datos y análisis predictivo.
 SPSS (Statistical Package for the Social Sciences) - PAGO / PRIVATIVO

Es la herramienta estadística más utilizada a nivel mundial en el entorno
académico. Puede trabajar con bases de datos de gran tamaño. Además, de
permitir la recodificación de las variables y registros según las necesidades del
usuario. El programa consiste en un módulo base y módulos anexos que se han
ido actualizando constantemente con nuevos procedimientos estadísticos.
 Stata – PAGO / PRIVATIVO
Es utilizado principalmente por instituciones académicas y empresariales
dedicadas a la investigación, especialmente en economía, sociología, ciencias
políticas, biomedicina y epidemiología. Stata permite, entre otras funcionalidades,
la gestión de datos, el análisis estadístico, el trazado de gráficos y las
simulaciones.
 Statgraphics – PAGO / PRIVATIVO
Statagraphics es un paquete de estadísticas que realiza y explica funciones
básicas y avanzadas de estadística. Es una potente herramienta de análisis de
datos que combina una amplia gama de procedimientos analíticos con
extraordinarios gráficos interactivos para proporcionar un entorno integrado de
análisis que puede ser aplicado en cada una de las fases de un proyecto, desde
los protocolos de gestión Six Sigma hasta los procesos de control de calidad.
Incluye funciones estadísticas avanzadas, capaces de proporcionar rigurosos
análisis propios de los profesionales estadísticos más exigentes y experimentados,
y al mismo tiempo ofrece un interface muy intuitiva, con funciones de asistencia
exclusivas, de tal forma que proporciona la simplicidad suficiente para permitir a
un analista inexperto realizar procedimientos complejos.
RESUMEN 4.4
Es un programa informático especialmente diseñado para resolver problemas en

el área de la estadística. Existen muchos programas que no son especialmente
estadísticos pero que pueden hacer algunos cálculos aplicables en estadística
aplicada.
Algunos de ellos son:
Software libre - Se refiere al conjunto de software (programa informático) que por

elección manifiesta que puede ser: copiado, estudiado, modificado, utilizado
libremente con cualquier fin y redistribuido con o sin cambios o mejoras.
Software de código abierto - Es el software cuyo código fuente y otros derechos

que normalmente son exclusivos para quienes poseen los derechos de autor, son
publicados bajo una licencia de código abierto o forman parte del dominio público.
Software gratis -Este término define un tipo de software que se distribuye sin
costo, disponible para su uso, pero que mantiene el copyright, por lo que no se
puede modificar o utilizar libremente como ocurre con el software libre.
SAS (Statistical Analysis System) – PAGO / PRIVATIVO - Es un sistema de

programas para el análisis de datos. Consiste en un conjunto de módulos capaces
de entregar resultados de diferentes procesos como regresión, análisis de
varianza, estadística básica, distribución de frecuencias y procedimientos
multivariados.
Stata – PAGO / PRIVATIVO - Es utilizado principalmente por instituciones

académicas y empresariales dedicadas a la investigación, especialmente en
economía, sociología, ciencias políticas, biomedicina y epidemiología.
Statgraphics – PAGO / PRIVATIVO - es un paquete de estadísticas que realiza y

explica funciones básicas y avanzadas de estadística. Es una potente herramienta
de análisis de datos que combina una amplia gama de procedimientos analíticos
con extraordinarios gráficos interactivos para proporcionar un entorno integrado de
análisis que puede ser aplicado en cada una de las fases de un proyecto.
5.1 DISEÑOS FACTORIALES CON DOS FACTORES
El experimento factorial más sencillo es en el que intervienen solamente dos

factores, por ejemplo, A y B. Hay a niveles del factor A y b niveles del factor B. El
experimento tiene n réplicas y cada réplica contiene todas las combinaciones de
tratamientos ab.
Considere los factores A y B con a y b(a,b>2) niveles de prueba, respectivamente.
Con ellos se puede construir el arreglo o diseño factorial a x b, que consiste de a x
b tratamientos. Se llama réplica cada repetición completa del arreglo factorial. Los
diseños factoriales que involucran menos de cuatro factores se corren replicados
para poder tener la potencia necesaria en las pruebas estadísticas sobre los
efecto de interés, de tal forma que si se hacen n réplicas, el número total de
corridas experimentales es n (a x b).
 Efecto principal y efecto de interacción
El efecto de un factor se define como el cambio observado en la variable de
respuesta debido a un cambio de nivel de tal factor. En particular, los efectos
principales son los cambios en la media de la variable de respuesta que se deben
a la acción individual de cada factor. En términos matemáticos, el efecto principal
de un factor con dos niveles es la diferencia entre la respuesta media observada
cuando tal factor estuvo en su primer nivel, y la respuesta media observada
cuando el factor estuvo en su segundo nivel.
por lo que en términos absolutos el efecto principal de B es mayor. Por otra parte,
se dice que dos factores interactúan entre sí o tienen un efecto de interacción
sobre la variable de respuesta, cuando el efecto de un factor depende del nivel en
que se encuentra el otro. Por ejemplo, los factores A y B interactúan si el efecto de
A es muy diferente en cada nivel de B, o viceversa. Ahora veamos esto con los
datos de la tabla 4.1: el efecto de A cuando B es baja está determinado por:
Como estos dos efectos de A en función del nivel de B son muy diferentes,
entonces es evidencia de que la elección más conveniente del nivel de A depende
del nivel en que esté B, y viceversa. Es decir, eso es evidencia de que los factores
de A y B interactúan sobre Y. En la práctica, el cálculo del efecto A en cada nivel
de B no se hace, y más bien se calcula el efecto global de la interacción de los dos
factores, que se denotan por AB y se calculan como la diferencia entre la
respuesta media cuando ambos factores se encuentran en el mismo nivel: (-1, -1);
(1, 1), y la respuesta media cuando los factores se encuentran en niveles
opuestos: (-1, 1) (1, -1). Para el ejemplo, el efecto de interacción levadura x
temperatura está dado por:
Los valores absolutos (sin importar el signo) de los efectos principales y del efecto
de interacción son una medida de importancia de su efecto sobre la variable de
respuesta. Sin embargo, como se tienen estimaciones muéstrales, para saber si
los efectos son estadísticamente significativos (diferentes de coro) se requiere el
análisis de varianza (ANOVA).
Los diseños factoriales se utilizan para estudiar los efectos en una respuesta o
salida de al menos dos variables o factores cuando éstos cambian de valor
simultáneamente.
• Si tenemos k factores y se eligen variar cada uno a mk niveles, el número de
combinaciones experimentales es de m1 *m2 *m3 *…*mk
Para estudiar el efecto de factores en la variable de respuesta es necesario elegir
al menos dos niveles de prueba para cada uno de ellos.
• Uno de sus objetivos es determinar una combinación de niveles de los factores
en la que el desempeño del proceso sea mejor.Con el diseño factorial completo se
corren aleatoriamente todas las posibles combinaciones que pueden formarse con
los niveles de los factores a investigar.
• La matriz de diseño o arreglo factorial es el conjunto de puntos experimentales o
tratamientos que pueden formarse considerando todas las posibles combinaciones
de los niveles de los factores.
En general, la familia de diseños factoriales 2 k consiste en k factores, todos con

dos niveles de prueba y la familia de diseños factoriales 3 k consiste en k factores,
cada uno con tres niveles de prueba. Es claro que si los k factores no tienen la
misma cantidad de niveles, debe escribirse el producto de manera explícita. Los
factores pueden ser de tipo cualitativo (máquinas, tipo de material, operador,
etcétera) o de tipo cuantitativo (temperatura, humedad, etcétera).
• Los diseños factoriales son los más eficientes para analizar los posibles efectos
combinados de dos o más factores sobre la variable de respuesta.
• Es un diseño experimental que sirve para estudiar el efecto individual y de
interacción de varios factores sobre una o varias respuestas.
• El efecto de un factor se define como el cambio en la respuesta, producido por

un cambio en el nivel del factor. Consideremos el ejemplo de un experimento de
dos factores con dos niveles en cada factor:
El efecto principal del factor A puede visualizarse como la diferencia entre la

respuesta promedio con el nivel bajo de A y la respuesta promedio del nivel alto de
A. Numéricamente esto es:
Es decir, cuando el factor A se incrementa del nivel bajo al nivel alto se produce un
incremento en la respuesta promedio de 21. De manera similar, el efecto principal
de B es:
Una interacción ocurre cuando la diferencia en la respuesta entre los niveles de un

factor no es la misma para todos los niveles de los otros factores. Considere el
ejemplo anterior:
Una interacción ocurre cuando la diferencia en la respuesta entre los niveles de un

factor no es la misma para todos los niveles de los otros factores. Considere el
ejemplo anterior:
 Ventajas de los diseños factoriales

 Diseño factorial con dos factores
Consta de a niveles del factor A y b niveles del factor B, los cuales se disponen en
un diseño factorial con n réplicas; es decir, cada réplica del experimento contiene
todas las ab combinaciones de los tratamientos.
RESUMEN 5.1
En este tema un factor se define como el cambio observado en la variable de

respuesta debido a un cambio de nivel de tal factor. En particular, los efectos
principales son los cambios en la media de la variable de respuesta que se deben
a la acción individual de cada factor.
se dice que dos factores interactúan entre sí o tienen un efecto de interacción
sobre la variable de respuesta, cuando el efecto de un factor depende del nivel en
que se encuentra el otro.
En la práctica, el cálculo del efecto A en cada nivel de B no se hace, y más bien se
calcula el efecto global de la interacción de los dos factores, que se denotan por
AB y se calculan como la diferencia entre la respuesta media cuando ambos
factores se encuentran en el mismo nivel.
Se dice que los diseños factoriales se utilizan para estudiar los efectos en una
respuesta o salida de al menos dos variables o factores cuando éstos cambian de
valor simultáneamente.
Uno de sus objetivos principales es determinar una combinación de niveles de los
factores en la que el desempeño del proceso sea mejor.
Es un diseño experimental que sirve para estudiar el efecto individual y de
interacción de varios factores sobre una o varias respuestas.
El cual permite estudiar el efecto individual y de interacción de los distintos
factores.
5.2 diseños factoriales con tres factores

Cuando se quiere investigar la influencia de tres factores (A, B y C) sobre una o
más variables de respuesta, y el número de niveles de prueba en cada uno de los
factores es a, b y c, respectivamente, se puede construir el arreglo factorial a x b x
c, que consiste de a x b x c tratamientos o puntos experimentales. Entre los
arreglos de este tipo que se utilizan con frecuencia en aplicaciones diversas se
encuentran: la factorial 23, el factorial 23 y los factoriales mixtos con no más de
cuatro niveles en dos de los factores, por ejemplo, el factorial 4 x 3 x 2 y el factorial
4 x 4 x 2, por mencionar dos de ellos.
El estudio factorial de tres factores (A, B y C) permite investigar los efectos: A, B,

C, AB, AC, BC y ABC, donde el nivel de desglose o detalle con el que pueden
estudiarse depende del número de niveles utilizando en cada factor. Por ejemplo,
si un factor se prueba en dos niveles, todo su efecto marginal (individual) es lineal,
o sea que su efecto individual no se puede descomponer; pero, si tuviera tres
niveles su efecto marginal se puede descomponer en una parte lineal y otra
cuadrática pura.
En resumen, se tienen siete efectos de interés sin considerar desglose, y con ellos
se pueden plantar las siete hipótesis nulas.
cada una aparejada con su correspondiente hipótesis alternativa. El ANOVA para

probar estas hipótesis se muestran en la siguiente tabla.
Al efecto cuyo valor-p sea menor al valor especificado para alfa, se declara
estadísticamente significativo o se dice que está activo. Las sumas de cuadrados
son muy similares a las obtenidas para dos factores; habrá que considerar un
subíndice adicional para el tercer factor, y comenzando otra vea, por la suma total
de cuadrados, éstas resultan ser:
donde N =a b c n es el total de observaciones en el experimento. Las sumas de

cuadrados de efectos son:
Al restar éstas del total, la suma de cuadrados del error resulta ser:
cuyos respectivos grados de libertad se dan en la tabla anterior. Una vez hecho el
ANOVA, se procede a interpretar los efectos activos, y luego (aunque no
necesariamente después) a diagnosticar la calidad del modelo.
Ejemplo
El experimento. Se desea investigar el efecto del tipo de suspensión (A), abertura
de malla (B) y temperatura de ciclaje (C) en el volumen de sedimentación Y(%) de
una suspensión. Para ello se decide correr un experimento factorial 3 x 2 x 2 con
seis réplicas, y las observaciones obtenidas en las 72 corridas experimentales se
muestran en la siguiente tabla:
Los niveles de prueba para cada factor, tanto en unidades originales como en
unidades codificadas, se muestran en la siguiente tabla:
El análisis de varianza para este ejemplo se muestra en la siguiente tabla. De aquí

se concluye que no influyen los efectos ABC, AC ni A, dado que su valor-p es
mayor que . Por otra parte, se encuentran activos los efectos B, C, AB y
en menor medida BC. Éstos son los cuatro efectos que se deben interpretar. Los
efectos que no influyeron se pueden eliminar mandándolos al término error.
El ANOVA simplificado, pero con el efecto A note que el CM E en ambos ANOVAS

es prácticamente igual. En general se recomienda interpretar sólo los efectos
significativos.
Este diseño es una variación del diseño 2k y son muy útiles como las que se
emplean cuando todos los factores actúan a tres niveles. En los últimos años se
ha observado un creciente interés por algunas de las ideas del profesor Genechi
Taguchi acerca del diseño experimental y su aplicación al mejoramiento de la
calidad.
Este es un diseño que consta de k factores con tres niveles cada uno. Los
factores y las interacciones se representan mediante letras mayúsculas. Los tres
niveles de los factores pueden referirse como nivel inferior, intermedio y superior.
Estos niveles se representan mediante los dígitos 0 (nivel inferior), 1 (intermedio) y
2 (superior). Cada combinación de tratamientos de un diseño 3 k se presenta
mediante k dígitos, donde el primero incida el nivel de A, el segundo señale al
nivel de B,..... y el k-ésimo dígito, el nivel del factor k. Por ejemplo, es un diseño 3 2
el 00 representa la combinación de tratamientos, en la que tanto el factor A como
el B están en el nivel inferior, y el 01 representa la combinación de tratamientos
que corresponde al factor A en el nivel inferior y a B en el nivel intermedio.
En éste, el sistema de notación que se prefiere usar es el de + - en virtud de que
facilita la interpretación geométrica del diseño y de que es directamente aplicable
al modelado por regresión, la formación de bloques y la construcción de factoriales
fraccionarios. La adición de un tercer nivel permite modelar con una relación
cuadrática la relación entre la respuesta y cada factor.
 Diseño 32
El diseño más simple es el 32 que consta de dos factores con tres niveles cada
uno.
Como hay 32 = 9 combinaciones de tratamientos, existen 8 grados de libertad
entre ellas, Los efectos principales A y B tienen dos grados de libertad cada uno, y
la interacción AB tiene cuatro grados de libertad. Si hay n réplicas habrá un total
de n32 - 1 grado de libertad, correspondiendo para el error 3 2 (n-1) grados de
libertad.
 Diseño 33
Si se supone que se están estudiando tres factores (A, B, C) y que cada factor
tiene tres niveles acomodados en un experimento factorial.
 Diseño del proceso

Diseñar un sistema de manufactura para elaborar un producto requiere de
conocimientos técnicos además de una gran experiencia en el área a la cual
pertenece el producto. TAGUCHI define la calidad de la siguiente manera. “la
calidad de un producto es la perdida mínima impartida por el producto a la
sociedad, desde el momento en que es embarcado. “El fabricante es quien más
resiente las pérdidas debido a la reacción negativa del consumidor de un producto
de mala calidad.Taguchi quiere decir por desarrollo de tecnología es lo siguiente:
El desarrollo de tecnología es realizar una investigación, tras completar el diseño
de un sistema, para optimizar la robustez de la función básica de una familia de
productos. La investigación es realizada en un laboratorio,
Resumen 5.2
En este tema vemos que es un diseño de variación del diseño 2 k y son muy útiles
como las que se emplean cuando todos los factores actúan a tres niveles. En los
últimos años se ha observado un creciente interés por algunas de las ideas del
profesor Genechi Taguchi acerca del diseño experimental y su aplicación al
mejoramiento de la calidad.
2 (superior).
Diseñar un sistema de manufactura para elaborar un producto requiere de
conocimientos técnicos además de una gran experiencia en el área a la cual
pertenece el producto.
Para más de tres factores, las interacciones superiores a tres suelen suponerse
nulas, lo que permite obtener una estimación del error experimental.
Los diseños factoriales consisten en un análisis de varianza donde se van a probar
dos o más factores donde cada uno va a tener dos o más niveles.
A cada factor se le llamará factor A, B, C...etc, y los niveles de cada factor serán
0,1,2,3... Una vez definidos los factores y los niveles, se definen los tratamientos.
Cada tratamiento es una combinación de los factores y niveles.
El objetivo de la prueba es investigar si existe diferencia entre los tratamientos
mediante el análisis de varianza, pero especificando si existe diferencia entre los
niveles de cada factor y entre la interacción de los factores.
A la tabla de análisis de varianza, se le agregan varios renglones debajo del
renglón de tratamientos, con el fin de realizar el análisis detallado de los factores.
El análisis de varianza inicial puede ser completamente al azar o bloques al azar
5.3 DISEÑO FACTORIAL GENERAL
Lo que se ha dicho para los dos diseños factoriales con 2 y 3 factores puede
extenderse fácilmente para cuando se tienen más factores. Considerarse f
factores A, B, C,…, K con niveles a,b,c,…….k.. respectivamente, donde la letra K
denota al f-ésimo o último factor del conjunto a estudiar, no necesariamente el
undécimo, que es el lugar de esta letra en el alfabeto. Con estos niveles y factores
se puede construir el diseño factorial general a x b x…x k que consiste de a x b
x…x k tratamientos o puntos de prueba. Con este diseño se pueden estudiar f
efectos principales (f-1)/2 interacciones dobles f(f-1)(f-2)(3x2) interacciones triples,
y así sucesivamente hasta la única interacción de los f factores (ABC…K). El
cálculo del número de interacciones de cierta cantidad m de factores se hace
mediante la operación ¨combinaciones de f en Que
cuenta el
numero de diferentes maneras de selección m factores de los f, donde f!=(fx(f-

1)x…x2…x1.
Por ejemplo
el diseño factorial 25 tiene cinco efectos principales, 10 interacciones dobles, 10
interacciones triples, cinco interacciones cuádruples y una interacción quíntuple, lo
cual da un total de 31 efectos. Por su parte, el factorial 3 5 también tiene este
mismo número de efectos, pero al contar con tres niveles en cada factor, cada
efecto principal se puede descomponer en su parte lineal y cuadrática. Cabe
destacar que mientras el diseño factorial 2 5 tiene 32 tratamientos, el factorial 3 5
tiene 243, una cantidad de tratamientos difícil de manejar. Aun si pudiera correrse,
representa una opción muy ineficaz; además, existen arreglos experimentales más
pequeños y eficientes.
De acuerdo con lo antes dicho, en el factorial general a x b x….x k se pueden

plantear 2f-1 hipótesis que se prueban mediante el análisis de varianza. Si se
tienen n réplicas. Las primeras tres columnas de este ANOVA se muestran en la
siguiente tabla:
La suma de cuadrados totales está dada por:
Donde N=abc…kn es el total de observaciones en el experimento. Las sumas de

cuadrados de efectos son:
En el ANOVA para el factorial general a x b x…x k se observa la necesidad de
contar con al menos dos réplicas del experimento para calcular la suma de
cuadrados del error (SCE),y completar toda la tabla ANOVA. Sin embargo, esta
necesidad de réplicas (n-2), que se ha mencionado, Es para el caso irreal de que
interesan los 2f-1 efectos. Pero resulta que, con excepción de la factorial 2 2, en
una factorial completa prácticamente nunca interesan todos sus posibles efectos,
puesto que en términos generales sólo algunos de ellos están activos. El principio
de Pareto, que en este contexto también se llama principio de esparcidad de
efectos, dice que la mayoría de la variabilidad observada se debe a unos pocos de
los efectos posibles; por lo común se debe a algunos efectos principales e
interacciones dobles.
Los resultados del ANOVA para dos factores pueden ser extendidos a un caso
general en donde a son los niveles del factor A, b son los niveles del factor B, c
son los factores del nivel C, y así sucesivamente, los cuales pueden ser
arreglados en un experimento factorial, en el cual el número de réplicas es n.
Está diseñada para generar procesos de calidad. TAGUCHI desarrolló una
aproximación al diseño de experimentos con el objetivo de reducir los costos
emanados de la experimentación, esta aproximación es más práctica que teórica y
se interesa más por la productividad y los costos de producción que en las reglas
estadísticas. Los conceptos de estas técnicas están basados en las relaciones de
costos y ahorros. Diseñar un sistema de manufactura para elaborar un producto
requiere de conocimientos técnicos además de una gran experiencia en el área a
la cual pertenece el producto. Los diseños factoriales son ampliamente utilizados
en experimentos en los que intervienen varios factores para estudiar el efecto
conjunto de estos sobre una respuesta. Existen varios casos especiales del
diseño factorial general que resultan importantes porque se usan ampliamente en
el trabajo de investigación, y porque constituyen la base para otros diseños de
gran valor práctico. En los últimos años se ha observado un creciente interés por
algunas de las ideas del profesor Genechi Taguchi acerca del diseño experimental
y su aplicación al mejoramiento de la calidad el diseño factorial fraccionario 2 k-p
se usa en experimentos de escrutinio para identificar con rapidez y de manera
eficiente el subconjunto de factores que son activos, y para obtener alguna
información sobre la interacción. La propiedad de proyección de estos diseños
hace posible en muchos casos examinar los factores activos con más detalle. La
combinación secuencia de estos diseños a través del plegamiento es una forma
muy eficaz de obtener información extra acerca de las interacciones, la cual puede
identificarse en un experimento inicial como potencialmente importante.
Los diseños factoriales son a ampliamente utilizados en experimentos en los que

intervienen varios factores para estudiar el efecto conjunto de estos sobre una
respuesta. Existen varios casos especiales del diseño factorial general que
resultan importantes por qué. se usan ampliamente en el trabajo de investigación,
y porque constituyen la base para otros diseños de gran valor práctico.
El más importante de estos casos especiales ocurre cuando se tienen k factores,
cada uno con dos niveles. Estos niveles pueden ser cuantitativos como sería el
caso de dos valores de temperatura presión o tiempo. También pueden ser
cualitativos como sería el caso de dos máquinas, dos operadores, los niveles
"superior" e "inferior" de un factor, o quizás, la ausencia o presencia de un factor.
Una réplica completa de tal diseño requiere que se recopilen 2 x 2 x .... x 2 =
2k observaciones y se conoce como diseño general 2k.
El segundo caso especial es el de k factores con tres niveles cada uno, conocido
como diseño factorial 3k.
Se supone que:
a) los factores son fijos
b) los diseños son completamente aleatorios
c) se satisface la suposición usual de normalidad
El diseño 2k es particularmente útil en las primeras fases del trabajo experimental,
cuando es probable que haya muchos factores por investigar.
Conlleva el menor número de corridas con las cuales pueden estudiarse k factores
en un diseño factorial completo. Debido a que sólo hay dos niveles para cada
factor, debe suponerse que la respuesta es aproximadamente lineal en el intervalo
de los niveles elegidos de los factores. Este diseño es una variación del diseño
2k y son muy útiles como las que se emplean cuando todos los factores actúan a
tres niveles. En los últimos años se ha observado un creciente interés por algunas
de las ideas del profesor Genechi Taguchi acerca del diseño experimental y su
aplicación al mejoramiento de la calidad.
2 (superior).
k
Cada combinación de tratamientos de un diseño 3 se presenta mediante k dígitos,
donde el primero incida el nivel de A, el segundo señale al nivel de B, ..... y el k-
ésimo dígito, el nivel del factor k.
Por ejemplo, es un diseño 3 2 el 00 representa la combinación de tratamientos, en

la que tanto el factor A como el B están en el nivel inferior, y el 01 representa la
combinación de tratamientos que corresponde al factor A en el nivel inferior y a B
en el nivel intermedio.

fraccionarios.
La adición de un tercer nivel permite modelar con una relación cuadrática la
relación entre la respuesta y cada factor.
El diseño más simple es el 32 que consta de dos factores con tres niveles cada
uno.
Como hay 32 = 9 combinaciones de tratamientos, existen 8 grados de libertad
entre ellas, Los efectos principales A y B tienen dos grados de libertad cada uno, y
la interacción AB tiene cuatro grados de libertad. Si hay n réplicas habrá un total
de n32 - 1 grado de libertad, correspondiendo para el error 3 2 (n-1) grados de
libertad.
RESUMEN 5.3
Resumen 5.3
Con este diseño se pueden estudiar diferentes efectos f principales (f-1)/2

interacciones dobles f(f-1)(f-2)(3x2) interacciones triples, y así sucesivamente
hasta la única interacción de los f factores (ABC…K).
Por su parte, la factorial 35 también tiene este mismo número de efectos, pero al
contar con tres niveles en cada factor, cada efecto principal se puede
descomponer en su parte lineal y cuadrática.
se observa la necesidad de contar con al menos dos réplicas del experimento para
calcular la suma de cuadrados del error (SCE),y completar toda la tabla ANOVA.
Sin embargo, esta necesidad de réplicas (n-2), que se ha mencionado, Es para el
caso irreal de que interesan los 2f-1 efectos.
para dos factores pueden ser extendidos a un caso general en donde a son los
niveles del factor A, b son los niveles del factor B, c son los factores del nivel C, y
así sucesivamente, los cuales pueden ser arreglados en un experimento factorial,
en el cual el número de réplicas es n. Está diseñada para generar procesos de
calidad
Los diseños factoriales son ampliamente utilizados en experimentos en los que
respuesta. Existen varios casos especiales del diseño factorial general que
resultan importantes porque se usan ampliamente en el trabajo de investigación, y
porque constituyen la base para otros diseños de gran valor práctico.
Los diseños factoriales son a ampliamente utilizados en experimentos en los que
respuesta.
fraccionarios.
5.4 MODELOS DE EFECTOS ALEATORIOS
Hasta aquí los modelos de efectos que se han utilizado son modelos de efectos o
factores fijos, lo cual significa que todos los niveles de prueba en cada factor son
todos los disponibles para ese factor, o bien, se estudian todos los niveles de
interés en ese factor; es en este sentido que los niveles están fijos. Éste es el
caso, por ejemplo, cuando en el factor operador se toman los tres únicos
operadores como los niveles de prueba, o cuando los niveles del factor máquinas
son las cuatro máquinas existentes. O bien, cuando se comparan tres tipos de
material porque son los que interesa comprar, aunque existan otros materiales de
ese tipo. Con factores fijos, las conclusiones obtenidas sólo son válidas para los
niveles de prueba que se estudian en el experimento.
En ocasiones, los niveles de prueba son una muestra aleatoria de la población de
niveles posibles. En este caso es más apropiado utilizar un modelo de efectos o
factores aleatorios. Un ejemplo de esta situación es cuando se prueban cinco
instrumentos de medición, pero la población de los mismos es de 100
instrumentos; obviamente, no es posible experimentar con todos los equipos.
Entonces se experimenta sólo con cinco de ellos elegidos al azar, y las
conclusiones obtenidas se infieren como válidas para la población entera de
instrumentos.
La aplicación de un modelo de efectos aleatorios conlleva la necesidad de
considerar la incertidumbre asociada con la elección aleatoria de los niveles de
prueba. Es decir, ya no tiene sentido, para un factor A, preocuparse por el efecto
ai del nivel i como en efectos fijos. Lo que ahora (con efectos aleatorios) tiene
sentido es hablar de la varianza con la que el factor aleatorio contribuye a la
variación total; es decir, es preciso estimar dicha varianza y probar si su
contribución a la variabilidad total es significativa.
En estadística, un modelo de efectos aleatorios, también conocido como modelo

de componentes de la varianza, es una especie de modelo lineal jerárquico. Se
supone que el conjunto de datos que se analiza consiste en una jerarquía de
diferentes poblaciones cuyas diferencias se refieren a esa jerarquía.
En econometría, se utilizaron modelos de efectos aleatorios en el análisis de la

jerárquica o de datos de panel cuando se supone no hay efectos fijos (que permite
efectos individuales). El modelo de efectos aleatorios es un caso especial
del modelo de efectos fijos. En contraste esto con las definiciones bioestadísticas,
que utilizan efectos "fijos" y "al azar" para referirse, respectivamente, a los efectos
de la media de la población y de individuos específicos (donde la media de éstos
generalmente se asume como no conocida, por lo que se usan variables latentes).
Tales modelos ayudan en el control de la heterogeneidad no observada cuando
esta heterogeneidad es constante en el tiempo y correlacionado con variables
independientes. Esta constante puede ser retirada de los datos a través de
diferenciación, por ejemplo, mediante la adopción de una primera diferencia, lo
que eliminará cualquier componente invariante en el tiempo del modelo.
Hay dos supuestos comunes realizados sobre el efecto específico individual, el
supuesto de efectos aleatorios y el supuesto de efectos fijos. El supuesto de
efectos aleatorios (hecho en un modelo de efectos aleatorios) es que los efectos
específicos individuales no están correlacionados con las variables
independientes. El efecto supuesto de fijo es que el efecto específico individuo
está correlacionado con las variables independientes. Si el supuesto de efectos
aleatorios sostiene, el modelo de efectos aleatorios es más eficiente que el modelo
de efectos fijos. Sin embargo, si esta hipótesis no se sostiene (es decir, si la
prueba de Durbin-Watson falla), el modelo de efectos aleatorios no es consistente.
Supongamos que hay m grandes escuelas primarias, las cuales son elegidas al
azar de entre las miles que hay en un país grande. Supongamos también
que n alumnos de la misma edad son elegidos al azar en cada escuela
seleccionada. Sus puntuaciones en una prueba de aptitud estándar se determinan.
Sea Yij la puntuación del j alumno en la escuela. Una manera simple para modelar
las relaciones de estas cantidades es:
donde
μ es la puntuación media de prueba para toda la población. En este modelo U i es
el efecto aleatorio de la escuela específica: mide la diferencia entre la puntuación
media en la escuela i y el puntaje promedio en todo el país y que es "aleatorio"
porque la escuela ha sido seleccionada al azar de una población mayor de
escuelas. El término, W ij es el error-individuo específico. Es decir, es la
desviación de la puntuación de la j-ésima del alumno de la media de la escuela i.
De nuevo, esto es considerado como aleatorio, debido a la selección aleatoria de
los alumnos dentro de la escuela, a pesar de que es una cantidad fija para
cualquier alumno determinado.
El modelo se puede aumentar mediante la inclusión de variables explicativas
adicionales, que capten las diferencias en las puntuaciones entre los diferentes
grupos. Por ejemplo:
donde Sexo ij es la variable dummy para niños / niñas, ij raza es la variable ficticia
para los alumnos blancos / negro, y ParentsEduc ij registra el nivel promedio de
educación de los padres del niño. Se trata de un modelo mixto, no un modelo de
efectos puramente aleatorios.
La varianza de Y ij es la suma de las varianzas τ 2 y σ 2 de U y W i ij
respectivamente.
Deje
igual a la media, no de todos los resultados de la i ª escuela, pero de los que están
en la i ª escuela que se incluyen en la muestra aleatoria. Sea
ser el "gran promedio".

Sea
ser, respectivamente, la suma de cuadrados debido a las diferencias dentro de los
grupos y la suma de cuadrados debido a la diferencia entre los grupos. Entonces
se puede demostrar que:
Estos " cuadrados medios esperados "pueden ser utilizados como base
para la estimación de los "componentes de la varianza" σ 2 y τ 2. Insesgadez.
Resumen 5.4
el modelo de efectos aleatorios se parte de la base de que el tamaño de efecto

sigue una distribución de frecuencias normal dentro de la población, por lo que
cada estudio estima un tamaño de efecto diferente. Por lo tanto, además de
la varianza intraestudios debida al error del muestreo aleatorio, el modelo incluye
también la variabilidad entre estudios, que representaría la desviación de cada
estudio respecto del tamaño de efecto medio. Estos dos términos de error son
independientes entre sí, contribuyendo ambos a la varianza del estimador de los
estudios.
Otra consideración a realizar es la de la aplicabilidad o validez externa de los
resultados del metanálisis. Si hemos utilizado el modelo de efectos fijos será
comprometido generalizar los resultados fuera de las poblaciones con
características similares a las de los estudios incluidos.
La aplicación de un modelo de efectos aleatorios conlleva la necesidad de
considerar la incertidumbre asociada con la elección aleatoria de los niveles de
prueba. Es decir, ya no tiene sentido, para un factor A, preocuparse por el efecto
ai del nivel i como en efectos fijos.
un modelo de efectos aleatorios, también conocido como modelo de componentes
de la varianza, es una especie de modelo lineal jerárquico. Tales modelos ayudan
en el control de la heterogeneidad no observada cuando esta heterogeneidad es
constante en el tiempo y correlacionado con variables independientes.
El efecto supuesto de fijo es que el efecto específico individuo está correlacionado
con las variables independientes. Si el supuesto de efectos aleatorios sostiene, el
modelo de efectos aleatorios es más eficiente que el modelo de efectos fijos, la
suma de cuadrados debido a las diferencias dentro de los grupos y la suma de
cuadrados debido a la diferencia entre los grupos.
Cuando existen efectos aleatorios, podemos estar interesados en estimar el valor
de la varianza correspondiente a cada efecto aleatorio y compararlo con la
varianza del error.
5.5 uso de un software estadístico
Utilizando Minitab
1. El primer paso consiste en seleccionar la opción Estadísticas del Menú

Principal de Minitab y, dentro de esa opción, seleccionar la opción DOE
luego Factorial y Crear diseño factorial como se presenta en la siguiente
Figura:
2 Como consecuencia de la acción anterior le debe aparecer la siguiente
pantalla<<Crear diseño factorial>>. El paso en esta pantalla será seleccionar en
Tipo de diseño la casilla de Diseño factorial completo general luego escoger el
número de factores considerados en el experimento (en nuestro ejemplo son dos
factores: A y B), por tanto en la casilla<<Número de factores>> usted deberá tener
el número 2. Luego
debe oprimir el botón de la opción<<Diseños>> para poder escoger su diseño,

número de repeticiones y otras opciones.
En la siguiente ventana escribir el nombre de nuestros factores A y B, además de

indicar el numero de niveles para ambos (4 y 3 respectivamente), también indicará
que realizamos tres repeticiones por tratamiento, para esto en la casilla<<Número
de replicas>>, usted deberá tener el valor de 3. Finalice esta pantalla
oprimiendo<<Aceptar>>. Esto lo devolverá a la pantalla anterior<<Crear diseño
factorial>>.
De vuelta en la pantalla<<Crear diseño factorial>>. Seleccionar factores y
aparecerá una siguiente ventana.
En la casilla<<Tipo>> seleccionar texto para ambos factores, <<Valores de nivel>>

, indicar los valores correspondientes tanto para el factor A así como para el factor
B, luego indicar aceptar, lo que lo llevara nuevamente a la pantalla<<Crear diseño
factorial>>.
De vuelta a la pantalla<<Crear diseño factorial>> oprima<<Aceptar>>. MINITAB le

creará la siguiente pantalla. Minitab crea las columnas de los tratamientos, lo único
que usted tiene que ingresar a MINITAB es una columna con la respuesta del
experimento. Proceda entonces a ingresar los datos en la columna C7
Una vez capturados los datos (estos datos deberán corresponder al factor A con
respecto a factor B de acuerdo a la tabla original) en su correspondiente renglón.
El siguiente paso es regresar al paso 1.
sólo que esta vez seleccionaría la secuencia:<<Estadísticas>> seguida

de<<DOE>>, <<Factorial>> y <<Analizar diseño factorial>>.
Esta acción resultará en la pantalla donde sólo es necesario indicar la columna de

la variable de respuesta <<Respuesta>> seguido de aceptar y MINITAB le
ofrecerá el resultado correspondiente
Esta acción resultará en la pantalla donde sólo es necesario indicar la columna de
la variable de respuesta <<Respuesta>>seguido de aceptar y MINITAB le ofrecerá
el resultado correspondiente. Para capturar los datos en Minitab,de tres factores,
es idéntico al de dos factores, solo que en la ventana correspondiente indicar que
se trata de tres factores, y se aplica la misma secuencia.
Resumen 5.5
Minitab es un programa de computadora diseñado para ejecutar funciones

estadísticas básicas y avanzadas. Combina lo amigable del uso de Microsoft
Excel con la capacidad de ejecución de análisis estadísticos.
Como consecuencia de la acción anterior le debe aparecer una pantalla<<Crear
diseño factorial>>. El paso en esta pantalla conlleva seleccionar en Tipo de diseño
la casilla de Diseño factorial completo general luego escoger un número de
factores considerados en el experimento, lo único que queda por hacer ingresar a
MINITAB en una columna con la respuesta del experimento.
Para capturar los datos en Minitab, de tres factores, es idéntico al de dos factores,
solo que en la ventana correspondiente indicar que se trata de tres factores, y se
aplica la misma secuencia.
Conclusión
La conclusión final nos lleva a que en los temas anteriores vistos utilizamos varios
métodos, formulas y tablas para tratar de llegar a un resultado, siendo diseños
cuadráticos o factoriales. Para poder estudiar el efecto de factores en la variable
de respuesta es necesario elegir al menos dos niveles de prueba para cada uno
de ellos. Uno de sus objetivos es determinar una combinación de niveles de los
factores en la que el desempeño del proceso sea mejor. Con el diseño factorial
completo se corren aleatoriamente todas las posibles combinaciones que pueden
formarse con los niveles de los factores a investigar. La matriz de diseño o arreglo
factorial es el conjunto de puntos experimentales o tratamientos que pueden
formarse considerando todas las posibles combinaciones de los niveles de los
factores. Los diseños factoriales son los más eficientes para analizar los posibles
efectos combinados de dos o más factores sobre la variable de respuesta. Es un
diseño experimental que sirve para estudiar el efecto individual y de interacción de
varios factores sobre una o varias respuestas.
Referencias
1. Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L.

(2002). Analysis of Longitudinal Data (2nd edición). Oxford University
Press. pp. 169-171. ISBN 0-19-852484-6.
2. ↑ Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied
Longitudinal Analysis. Hoboken: John Wiley & Sons. pp. 326-328. ISBN 0-
471-21487-6.
3. ↑ Laird, Nan M.; Ware, James H. (1982). «Random-Effects Models for
Longitudinal Data». Biometrics 38 (4): 963-974. JSTOR 2529876.
4. ↑ Gardiner, Joseph C.; Luo, Zhehui; Roman, Lee Anne (2009). «Fixed
effects, random effects and GEE: What are the differences?». Statistics in
Medicine 28: 221-239. doi:10.1002/sim.3478.
http://educommons.anahuac.mx:8080/eduCommons/estadistica-e
investigacion-operativa/diseno-de experimentos/Tema%208_Experimentos
%20factoriales.pdf
https://www.academia.edu/18242976/ESTADISTICA_INFERENCIAL_II_LIBRO
GUTIERREZ, P. H y DE LA VARA, S. R. 2008. Segunda edición. Análisis y Diseño
de Experimentos. Mc Graw Hill.
MONTGOMERY, C.D.; G.C, RUNGER. 2010. Segunda edición. Probabilidad y
Estadística. LIMUSA WILEY
MONTGOMERY, C.D. Diseño y Análisis de Experimentos. Segunda edición.
LIMUSA WILEY
WALPOLE, R.; MAYERS, R.H.; MAYERS, S.L. 1998. Sexta edición. Probabilidad y
Estadística Para Ingenieros. Pearson Education
ANDERSON, D.R.; SWEENEY, D.J.; WILLIAMS, T.A.2005. Octava edición.
Estadística para Administración y Economía. MATH LEARNING
BERENSON, M.L.; LEVINE, D.M.; KREHBIEL, T.C. 2001. Segunda edición.
Estadística para Administración. Prentice Hall

Trabajo Estadistica 4 y 5 Unidad

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Trabajo Estadistica 4 y 5 Unidad

Caricato da

Copyright:

Formati disponibili

Índice

Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor,

Que también se puede expresar como:

En cualquiera de estas hipótesis la afirmación a probar es que la respuesta media

El objetivo principal es tener comparaciones precisas entre los tratamientos bajo

4.2 DISEÑO EN CUADRADO LATINO

Ahora se necesitan al menos tres subíndices, por ejemplo, la respuesta Y 313 se

Un cuadrado latino es una matriz de n×n elementos en la que cada casilla está

Los cuadrados latinos se dan como una tabla de multiplicar empleadas para

 existen n2 tripletas de la forma (f, c, s), donde 1 ≤ f, c, s ≤ n;

Para que el análisis de varianza en el diseño de cuadrados latinos tenga validez,

Con el diseño en cuadro grecolatino (DCGL) se controlan tres factores de bloque,

Un bosquejo del análisis de varianza se muestra en la tabla 3.6, en la cual se

En un diseño en cuadrado greco-latino la variable respuesta yij(hp) viene descrita

 El total y el promedio para cada fila

El total y el promedio para cada columna

El total y el promedio para cada letra latina

El total y el promedio para cada letra griega

 y..h. se obtiene sumando las K observaciones en las que la letra latina se ha

 Los residuos en este modelo adoptan la expresión

Siguiendo el mismo procedimiento que en los modelos anteriores se comprueba

que simbólicamente se puede escribir:

2) SCF suma de cuadrados debida al efecto fila.

3) SCC suma de cuadrados debida al efecto columna.

4) SCL suma de cuadrados debida a las letras latinas.

5) SCG suma de cuadrados debida a las letras griegas.

6) SCR suma de cuadrados del error.

Los cuadrados greco-latinos se obtienen por superposición de dos cuadrados

Software libre - Se refiere al conjunto de software (programa informático)

 SPSS (Statistical Package for the Social Sciences) - PAGO / PRIVATIVO

Es un programa informático especialmente diseñado para resolver problemas en

Software libre - Se refiere al conjunto de software (programa informático) que por

Software de código abierto - Es el software cuyo código fuente y otros derechos

SAS (Statistical Analysis System) – PAGO / PRIVATIVO - Es un sistema de

Stata – PAGO / PRIVATIVO - Es utilizado principalmente por instituciones

Statgraphics – PAGO / PRIVATIVO - es un paquete de estadísticas que realiza y

5.1 DISEÑOS FACTORIALES CON DOS FACTORES

El experimento factorial más sencillo es en el que intervienen solamente dos

En general, la familia de diseños factoriales 2 k consiste en k factores, todos con

• El efecto de un factor se define como el cambio en la respuesta, producido por

El efecto principal del factor A puede visualizarse como la diferencia entre la

Una interacción ocurre cuando la diferencia en la respuesta entre los niveles de un

Una interacción ocurre cuando la diferencia en la respuesta entre los niveles de un

En este tema un factor se define como el cambio observado en la variable de

5.2 diseños factoriales con tres factores

El estudio factorial de tres factores (A, B y C) permite investigar los efectos: A, B,

cada una aparejada con su correspondiente hipótesis alternativa. El ANOVA para

donde N =a b c n es el total de observaciones en el experimento. Las sumas de

El análisis de varianza para este ejemplo se muestra en la siguiente tabla. De aquí

El ANOVA simplificado, pero con el efecto A note que el CM E en ambos ANOVAS

 Diseño del proceso

5.3 DISEÑO FACTORIAL GENERAL

numero de diferentes maneras de selección m factores de los f, donde f!=(fx(f-

De acuerdo con lo antes dicho, en el factorial general a x b x….x k se pueden

La suma de cuadrados totales está dada por:

Donde N=abc…kn es el total de observaciones en el experimento. Las sumas de

Los diseños factoriales son a ampliamente utilizados en experimentos en los que

b) los diseños son completamente aleatorios

c) se satisface la suposición usual de normalidad

Por ejemplo, es un diseño 3 2 el 00 representa la combinación de tratamientos, en

En éste, el sistema de notación que se prefiere usar es el de + - en virtud de que

Con este diseño se pueden estudiar diferentes efectos f principales (f-1)/2

5.4 MODELOS DE EFECTOS ALEATORIOS