Sei sulla pagina 1di 14

INTRODUCCIN AL DISEO Y ANLISIS DE EXPERIMENTOS (ADE)

1. OBJETIVOS
Al final de este laboratorio, el estudiantes ser capaz de analizar un experimento con un diseo factorial
para dos factores a dos niveles cada uno utilizando EXCEL. La meta es proveer al estudiante con la
habilidad de planear, disear, analizar y concluir vlidamente con bases estadsticas de este tipo particular
de experimentos.
2. MATERIALES

Excel versin 98 o ms nuevo


Notas de clase provistas en la sesin impartida por el instructor

3. ANTECEDENTES

El Diseo y Anlisis de Experimentos (ADE) es el rea de la estadstica que tiene como objeto estudiar los
efectos de variables de inters dispuestas en varios niveles en una o varias respuestas o medidas de
desempeo. Sir Ronald A. Fisher introdujo ADE por primera vez en la primera mitad de los aos 1930s en
el rea de la agricultura. La mayora de los campos de ingeniera y ciencias ahora practican las ideas de
Fisher junto con las cuantiosas contribuciones de muchos otros investigadores en el rea.
Los ingenieros usan experimentos en su prctica diaria para alcanzar diversos objetivos. Algunos ejemplos
incluyen: encontrar condiciones factibles de operacin paa un proceso o una mquina, optimizar una
medida de desempeo, investigar las causas de defectos de calidad, disear un sistema nuevo o hacer un
proceso insensible a la variacin externa (robustez).
En general, se considera que la experimentacin es una disciplina iterativa, donde se debe prestar debida
atencin a la planeacin, el diseo, y el anlisis del o de los experimentos.
Los mtodos estadsticos en ADE pueden hacer ms eficiente la ejecucin de experimentos y a menudo
fortalecen las conclusiones obtenidas de esta manera (Montgomery, 1997). Sin embargo, es siempre
recomendable usar el conocimiento no-estadstico de un proceso o sistema para complementar el proceso
de experimentacin, as como para mantener el tamao y la concentracin del experimento dentro de
lmites adecuados.
4. PROCEDIMIENTO
Este laboratorio se divide en dos partes:
La primer parte consiste en reproducir el anlisis mostrado por el instructor en la primera sesin con ayuda
de EXCEL.
En la segunda parte se proveer un conjunto de datos nuevo para que los estudiantes puedan llevar a cabo
un anlisis similar a aqul de la primera parte.

Primera parte
Se recomienda mantener copias del material de la sesin impartida por el instructor para el material,
dado que este manual lo referenciar con frecuencia bajo el nombre de NOTAS.
En la sesin de clase, se explic que el objetivo de este experimento es especificar el contenido de la carga y
la temperatura del molde en un proceso de moldeo de SMC para mejorar la calidad de la superficie descrita
por un ndice de calidad. Supongamos que ya hemos planeado el experimento, y que decidimos usar un
diseo factorial para dos factores a dos niveles cada uno, sto es un experimento factorial 22. (Ver pginas 10
y 11 de las NOTAS). Supongamos tambin que el experimento ya se llev a cabo. Ahora lo que necesitamos
hacer es el anlisis estadstico
1. Abrir Excel.
2. Introducir los datos experimentales.
Aqu estn los datos del experimento (Pgina 12 de las NOTAS), cada nmero representa una
medicin del ndice de calidad bajo las condiciones especificadas por el rengln y la columna
correspondiente:

Carga (%)
40
44

90
85

86
104

Temperatura del Molde (oF)


302
327
98
87
89 107 102
105
82
79
84
72
77
78

94
82

91
67

Esta manera de representar los resultados de un experimento es muy conveniente dado que permite
visualizar la variacin a travs de columnas y renglones. Comencemos por introducir esta tabla en Excel
respetando el formato sealado arriba, y respetando las filas y columnas que se muestran en la ilustracin.

3. Crear una tabla de operaciones preliminares


Una vez que se han introducido los datos, podemos calcular la tabla de anlisis de varianza usando las
frmulas que se detallan en las pginas 12-15 de las NOTAS. Esencialmente, queremos ver al final la tabla
que sigue (de la pgina 16 de las NOTAS).

Sin embargo, para llegar a esta tabla final, es necesario hacer algunos clculos preliminares. Para ello, y
siempre siguiendo las frmulas todava de la pgina 12 de las NOTAS, podemos generar la siguiente tabla de
clculos preliminares.

Primero introduzca las etiquetas carga, temperatura, sumas de columna, sumas de rengln,
cuadrados de suma de rengln y suma de cuadrados as como las etiquetas 40, 44, 302 y 327.
En la celda D11, se introducirn la suma de las rplicas de los datos tomados bajo un determinado nivel de
carga y de temperatura. En este caso en D11 se introduce la frmula =SUMA(C4:G4), donde el rango C4:G4
contiene los cinco datos tomados con una carga de 40% y una temperatura de 302 oF. Introducir frmulas
similares para las celdas D12, E11, y E12.
Las sumas de columna y de rengln contienen las sumas correspondientes de datos. En este caso, la celda para
la columna 1, D13, contiene la frmula =SUMA(D11:D12), donde el rango D11:D12 contiene las sumas de
datos a travs de cada condicin experimental especfica (Nivel de carga, Temperatura). Introducir una
frmula similar para la celda E13.
De manera similar, las sumas de rengln contienen las sumas a travs de las columnas para cada rengln. Para
el primer rengln, la celda F11 contiene la suma de D11+E11. Introducir una frmula similar para el segundo
rengln.
El gran total, en celda D13 contiene la suma de las celdas F11 y F12, que a su vez contienen sumas de
rengln.
Una columna ms de clculos (columna G) se necesita para obtener valores que necesitaremos despus. stos
son los cuadrados de las sumas de rengln. Para el primer rengln, por ejemplo, se introduce la frmula:
F11^2. Introduzca frmulas similares para el rengln 2, y para cuadrar el gran total.

La suma de cuadrados en la celda D15 eleva al cuadrado cada medicin experimental y suma estas cantidades.
Para lograrlo se introduce la frmula = SUMA.CUADRADOS (C4:L5), donde el rango C4:L5 contiene todos
los datos experimentales.
Una vez terminado estos pasos, la tabla de clculos preliminares se deber ver como la tabla siguiente.

4. Crear la tabla de anlisis de varianza


Con las frmulas de la pgina 14 y 15 de las NOTAS, procederemos a crear la tabla de anlisis de varianza.
Hay que recordar que el primer factor se encuentra variado a 2 niveles, asignamos a =2. De la misma manera,
el segundo factor se encuentra variado a b = 2 niveles. Y en total tenemos n = 5 rplicas por combinacin de
condiciones experimentales.
Procederemos entonces a introducir las siguientes frmulas (pginas 14 y 15 de las NOTAS detallan las
frmulas):

Una vez que se hayan introducido estas frmulas, se debern observar los nmeros siguientes:

Las sumas de cuadrados nos dan una idea un tanto burda de cunta variacin gener cada una de las fuentes
en nuestra medida de desempeo.
Los grados de libertad esencialmente nos indican el nmero de trminos independientes en nuestras
sumatorias.
El cuadrado medio, que es la suma de cuadrados dividida entre los grados de libertad, puede entenderse como
la variacin ajustada proveniente de cada fuente. El cuadrado medio del error es precisamente nuestro
estimador de la varianza en nuestros datos.
Los cocientes F0 comparan la variacin generada por cada una de las fuentes (en el numerador), contra
aquella que tenemos como variacin aleatoria, expresada por el cuadrado medio del error o varianza. Por
supuesto, cocientes mayores a 1 indican una variacin producida mayor a la variacin considerada aleatoria, y
aquellos menores a 1, una variacin menor a aquella considerada aleatoria. Sin embargo, estos cocientes
deben an compararse contra un valor de tablas para establecer bases estadsticas. ste es el valor F alpha,
grados de libertad del numerador, grados de libertad del denominador. Alpha () es la probabilidad de un
error tipo I, que en este contexto se refiere a concluir que hay un efecto significativo de alguna fuente cuando
en realidad no lo hay.
Con la salvedad de checar algunos supuestos acerca de los residuos (que explicamos ms adelante), para
obtener conclusiones de la tabla de anlisis de varianza se utilizan generalmente los siguientes criterios:
1) Si F0 F, GL num, GL denom para determinada fuente de variacin, entonces concluiremos que esta fuente de
variacin afecta significativamente a la medida de desempeo al nivel especificado.
2) Si valor-p para determinada fuente de variacin, entonces concluiremos que esta fuente de variacin
afecta significativamente a la medida de desempeo al nivel especificado.
Es conveniente notar en este punto que el nivel escogido para estos ejemplos es de 5% ( = 0.05), y que ese
valor se introdujo en EXCEL junto con los grados de libertad para el numerador y el denominador para
obtener la F, GL num, GL denom. Alternativamente se pudo haber encontrado este valor de las tablas de la
distribucin F. Tambin es necesario hacer hincapi que se utilizaron las funciones de EXCEL para
determinar convenientemente el valor-p, lo cual puede ser un poco trabajoso si se utilizan las tablas. Una
interpretacin general del valor-p es decir que es el mnimo valor de bajo el que an concluiramos que
determinada fuente de variacin tiene un efecto significativo. Con esta interpretacin no debe sorprender que
5

un valor-p muy bajo (digamos < 0.005) indica una fuerte evidencia en favor de que una fuente de variacin
sea significativa.
Entonces, salvo un anlisis de residuos, hasta este punto los resultados apuntan a que, al nivel especificado
1) La carga tiene un efecto estadsticamente significativo en el ndice de calidad. sto quiere decir que
podramos ajustar independientemente el contenido de carga en nuestra formulacin para manipular este
ndice).
2) La temperatura del molde no tiene un efecto estadsticamente significativo por s solo si se vara
independientemente.
3) Sin embargo, la interaccin entre ambos factores (nivel de carga y temperatura de molde) es
significativa. sto quiere decir que cuando se varan juntos, el ndice de calidad muestra un
comportamiento completamente distinto que cuando uno de los factores se vara por s slo.
5. Hacer un anlisis de residuos
Cuando se hace un anlisis de varianza, en realidad lo que se est haciendo es tratar de aproximar los datos
con un modelo estadstico. En este caso, el modelo es el llamado modelo lineal general de efectos fijos y tiene
la forma:
yijk=+i+j+()ij+ijk
donde i=1,2,,a; j=1,2,,b; y k=1,2,,n
es el efecto promedio general, I es el efecto del factor A en su i-simo nivel , j es el efecto del factor B en
j-simo nivel, ( )ij es el efecto de la interaccin del factor A con el factor B cuando A est en su i-simo
nivel y B en su j-simo nivel; y por ltimo, ijk es un componente de error aleatorio denominado residuo que
se supone que sigue una distribucin normal con media igual a 0 y con un valor de desviacin estndar .
Podemos obtener las cantidades , 1, 2, 1, 2, ( )11, ( )12, ( )21, ( )22 para nuestro ejemplo, dado que
son los efectos fijos. Los podemos calcular de la siguiente manera: primero definamos una tabla para calcular
promedios como se muestra a continuacin tanto en las frmulas como en la salida numrica:

Ahora utilizaremos estos nmeros para encontrar los parmetros de nuestro modelo estadstico usando las
frmulas siguientes (verificar que se obtengan los valores mostrados):

Usaremos estos trminos para predecir nuestros datos experimentales. Ntese, sin embargo, que solamente
tenemos cuatro combinaciones experimentales (ver pgina 11 de NOTAS), as que solamente podremos hacer
estas cuatro predicciones. Sin embargo, sabemos que tenemos 5 rplicas por cada combinacin experimental
(20 datos experimentales en total), por lo tanto, para cada una de las cinco rplicas nuestra prediccin ser la
misma y tendremos una discrepancia. Esta discrepancia es un residuo. Evidentemente en nuestro experimento
tenemos 20 residuos.
Introduzcamos primero las frmulas para nuestras predicciones:

Para corroborar los valores que se deben mostrar en la pantalla son los siguientes:

Obtengamos ahora los residuos o errores de nuestro experimento.

Para corroborar, los valores que se deben tener en los residuos despus de estas frmulas son:

Estos residuos, tal como lo sealamos anteriormente, deben cumplir con tres supuestos: (1) deben ser
normalmente distribudos, (2) deben ser independientes, y (3) deben mantener una desviacin estndar
constante .
Aunque existen tcnicas estadsticas formales para probar estos tres supuestos, nuestro inters aqu es mostrar
la intuicin de un mtodo grfico.

Antes de comenzar a graficar, ser necesario crear la siguiente tabla para contar la frecuencia de los datos en
intervalos dados (el tamao de los intervalos lo decide uno):

Por otro lado, necesitaremos la siguiente tabla (esencialmente con clculos anteriores):

10

SUPUESTO 1: Los residuos deben ser distribuidos normalmente.


Para verificar este supuesto utilizaremos (un tanto liberalmente) un histograma de frecuencia.

El histograma de los residuos debe asemejar una distribucin normal centrada en 0. Al examinar el histograma
que obtuvimos, se puede ver que aproximadamente sigue una forma de campana similar a la de una
distribucin formal, aunque un poco sesgada a la izquierda. Se considera que desviaciones de normalidad
como las que se muestran en este histograma no son de mucha importancia. Se debera revisar la corrida que
tiene el residual con magnitud cercana al 20 para cerciorarse que no es un error de dedo, de organizacin, o
incluso de la ejecucin del experimento (como la falta de calibracin, cambio accidental de condiciones, etc.).

SUPUESTO 2: Los residuos deben ser independientes.


Para verificar este supuesto utilizaremos un par de diagramas de dispersin.

SUPUESTO 3: Los residuos deben tener una desviacin estndar constante.


Para verificar este supuesto utilizaremos un par de diagramas de dispersin tambin.

11

El primero de los grficos, residuos vs. Orden de experimentacin, se realiza para observar que no haya un
patrn reconocible i.e. que los residuos efectivamente se comportan de una manera aleatoria alrededor de 0. Si
este no es el caso, puede estarse violando el supuesto de independencia. En este caso la grfica no muestra un
patrn determinado, aunque nuevamente hay un residuo que sobresale, el cual es el mismo que se detect en
el histograma. Decidimos dejar este punto porque no se encontr nada que nos indicara que estuviera
equivocado en nuestro experimento, de tal manera que creemos que es variacin que se puede encontrar en
nuestro proceso.
Los siguientes dos grficos, residuos vs. Carga y residuos vs. Temperatura, proveen una buena manera de
checar que se tenga aproximadamente la misma dispersin alrededor de 0, i.e. que los residuos tengan un
desviacin estndar aproximadamente constante. Dejando de lado el residuo grande que decidimos dejar, los
grficos de este caso no acusan algo extremadamente problemtico.
El ltimo grfico, residuos vs. Predicciones, nos sirve para checar que los residuos no se encuentren
correlacionados con la magnitud de las predicciones (pues eso violara el supuesto de independencia), as
como checar que la dispersin sea aproximadamente la misma.
En resumen, hemos verificado que los supuestos de normalidad, independencia y homogeneidad de varianza
no se hayan violado en los experimentos a travs del anlisis de residuos. Checar que efectivamente no haya
una violacin a estos supuestos, transfiere un buen apoyo estadstico y fortaleza a las conclusiones de nuestro
experimento.

12

6. Crear grficas de efectos principales y de interaccin.


Por ltimo, se pueden crear las grficas de efectos principales y de interaccin a manera de ilustrar nuestras
conclusiones, aunque se debe evitar hacer conclusiones basados en el slo uso de estos grficos.

Segunda Parte
En la segunda parte de este laboratorio, se pide al estudiante repetir el procedimiento anterior con un Nuevo
conjunto de datos. Aunque los pasos son los mismos, el anlisis del experimento y las conclusiones se debern
basar en el nuevo conjunto de datos.
Temperatura de Molde (oF)
Carga (%)
40
44

77
76

72
75

275
75
75

77
69

80
62

90
85

86
104

302
98
82

87
79

89
84

13

EJERCICIO ADICIONAL

El director de operaciones de ComPsitos S.A., compaa que produce partes de resina polister reforzada
con fibra de vidrio (SMC), sabe que el tiempo de curado (tc) de las partes que producen en sus prensas
podra ser reducido ya sea incrementando la temperatura del molde (Tw) o precalentando el preformado de
SMC, esto es incrementando la temperatura inicial del material (To). Un tiempo menor de curado
implicara un potencial aumento de su produccin.
El director no sabe, sin embargo, si ambas acciones son importantes o no, o si es en realidad necesario
ejecutar ambas para mejorar ms. Est dispuesto a asignar parte de su presupuesto para comprar una
unidad de precalentamiento para el material pero solamente si se puede justificar la adquisicin.
Se ha pedido tu ayuda a tomar esta decisin. T (inteligentemente) sugieres que se lleve a cabo un
experimento factorial 22 para investigar los efectos que ambos, Tw y To, tienen en el tiempo de curado (tc).
Aqu estn los resultados (el tiempo de curado se reporta en segundos y la temperatura en grados kelvin.
Temperatura del Molde (K)
Temperatura inicial
del material (K)
298
323

74.9
66.9

73.4
74.0

413
68.5
75.6

76.1
75.0

81.3
76.5

41.1
40.3

39.1
32.4

423
42.3
41.2

37.7
45.5

35.9
43.3

Se deber comprar una unidad de precalentamiento de material?

En su respuesta, provea toda la evidencia estadstica necesaria (tabla de anlisis de varianza, anlisis de
residuos, grficos de efectos principales y de interaccin, etc.) as como una discusin de qu indica el
anlisis.

14

Potrebbero piacerti anche