Sei sulla pagina 1di 692

Diseo y anlisis

Q .

M o ntgom ery

CD
CD
X
U

CD

CD
3

O
(/)
Segunda edicin

H L IM U S A W IL E Y

DISEO Y
ANLISIS DE
EXPERIMENTOS

DISEO Y
ANLISIS DE
EXPERIMENTOS
segunda edicin

Douglas C. Montgomery
UNIVERSIDAD ESTATAL DE ARIZONA

HLIMUSA WILEY

V e r s i n a u t o r iz a d a en e s p a o l d e la o b r a p u b l ic a d a
EN INGLS CON EL TTULO;

DESIGN AND ANALYSIS OF EXPERIMENTS


J o h n W ile y & S o ns, In c ., N e w Y o r k , C h ic h e s te r,
B ris b a n e , S in g a p o re , T o r o n t o and W einheim.
C

o l a b o r a d o h e n l a t r a d u c c i n :

RODOLFO PINA GARCA


R e v is i n :

GRISELDA ZETINA VLEZ


I n g e n ie r a q u m ic a po r l a F ac u lta d d e Q u m ic a d e la
U n iv e r s id a d N a c io n a l A u t n o m a d e M x ic o . D o c e n t e
EN MATEMTICAS. PROFESORA EN LA ESCUELA DE CIENCIAS

Q um ic a s de la U n iv e rs id a d L a S a lle
La p re s e n ta c i n y d is p o s ic i n en c o n ju n to de

DISEO Y ANLISIS DE EXPERIMENTOS


SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE EST OBRA PUEDE
SER HEPHODUCIDA O TRANSMITIDA, MEDIANTE NINGN SISTEMA O
MTODO, ELECTRNICO O MECANICO (INCLUYENDO EL FOTOCOPIADO, LA GRABACIN 0 CUALQUIER SISTEMA DE RECUPERACIN
Y ALMACENAMIENTO DE INFORMACIN), SIN CONSENTIMIENTO POR
ESCRITO DEL EDITOR.

D e re c h o s reservado s:

2004, EDITORIAL LIMUSA, S.A. de C.V.


GRUPO NORIEGA EDITORES
B a ld e r a s 9 5 , M x ic o , D .F .

C.P. 06040
3 5 8503 8050
01(800) 706 9100
O 5512 2903
w limusa@noriega.com.mx
' T ' www.noriega.com.mx
CANIEM Nm. 121
H e c h o en M x ic o

ISBN 968-18-6156-6

Prefacio

El presente libro es un texto de introduccin que aborda el diseo y anlisis de experimentos. Tiene como
base los cursos sobre diseo de experim entos que he im partido durante ms de 25 aos en la Universidad
E statal de Arizona, la Universidad de W ashington y el Instituto de Tecnologa de Georgia. Refleja asimis
mo los m todos que he encontrado tiles en mi propia prctica profesional como consultor en ingeniera
y estadstica en las reas generales de diseo de productos y procesos, m ejoram iento de procesos e inge
niera de control de calidad.
El libro est destinado a estudiantes que han llevado un prim er curso de m todos estadsticos. Este
curso previo debe incluir por lo m enos algunas de las tcnicas de estadstica descriptiva, la distribucin
norm al y una introduccin a los conceptos bsicos de los intervalos de confianza y la prueba de hiptesis
para medias y varianzas. Los captulos 10 y 11 requieren un m anejo elem ental de lgebra matricial.
Como los requisitos para llevar este curso son relativam ente modestos, este libro puede usarse tam
bin en un segundo curso de estadstica enfocado en el diseo estadstico de experim entos para estudian
tes de licenciatura de ingeniera, fsica, ciencias fsicas y qumicas, m atem ticas y otros campos de las
ciencias. D urante varios aos he im partido un curso basado en este libro en el prim er ao de estudios de
posgrado de ingeniera. Los estudiantes de este curso provienen de los campos tradicionales de ingenie
ra, fsica, qumica, matem ticas, investigacin de operaciones y estadstica. Tkmbin he usado este libro
como base de un curso breve para el sector industrial sobre diseo de experim entos para tcnicos en ejer
cicio con una amplia diversidad en su formacin profesional. Se incluyen num erosos ejemplos que ilustran
todas las tcnicas de diseo y anlisis. E stos ejem plos se basan en aplicaciones del diseo experim ental
en el mundo real, y se han tom ado de diferentes campos de la ingeniera y las ciencias. Esto lleva al terreno
de las aplicaciones a un curso acadmico para ingenieros y cientficos y hace de este libro una til herra
m ienta de referencia para experim entadores de una amplia gama de disciplinas.

ACERCA DEL LIBRO


L a presente edicin constituye una revisin sustancial del libro. H e procurado m antener el equilibrio en
tre los tpicos de diseo y anlisis; sin embargo, hay varios tem as y ejemplos nuevos; asimismo he reorga
nizado gran parte del m aterial. E n la presente edicin se resalta ms el uso de la com putadora. D urante
los ltimos aos han surgido varios productos de software excelentes que auxilian al experim entador en
las fases del diseo y el anlisis para esta m ateria. H e incluido las salidas de dos de estos productos, Minitab y Design-Expert, en varias partes del texto. M initab es un paquete de software de estadstica de carc
ter general am pliam ente disponible, que cuenta con tiles herram ientas de anlisis de datos y que m aneja
bastante bien el anlisis de experim entos tanto con factores fijos como aleatorios (incluyendo el modelo
mixto). Design-Expert es un paquete que se enfoca exclusivamente en el diseo experimental. Tiene m u
chas herram ientas para la construccin y evaluacin de diseos, as como mltiples caractersticas de an
lisis. En el sitio web de este libro puede obtenerse una versin para estudiantes de Design-Expert, y se hace
una am plia recom endacin para usarlo. Exhorto a todos los profesores que usen este libro para que incor
poren software de com putadora en sus cursos. E n mi caso particular, llevo a todas mis clases una compu-

vi

PREFACIO

tad o ra laptop y un m onitor, y todos los diseos o tpicos del anlisis tratados en clase se ilustran con la
com putadora.
E n esta edicin destaco an ms la conexin entre el experim ento y el m odelo que puede desarrollar
el experim entador a partir de los resultados del experimento. Los ingenieros (y en gran m edida los cient
ficos de la fsica y la qumica) aprenden los mecanismos fsicos y sus modelos mecanicistas fundam entales
al principio de su formacin acadmica, pero en la mayor parte de sus carreras profesionales tendrn que
trabajar con estos modelos. Los experim entos diseados estadsticam ente ofrecen al ingeniero una base
vlida para desarrollar un modelo emprico del sistema bajo estudio. Despus este modelo emprico p ue
de m anipularse (tal vez utilizando una superficie de respuesta o una grfica de contorno, o quiz m atem
ticam ente) como cualquier otro m odelo de ingeniera. A lo largo de muchos aos de docencia he
descubierto que este enfoque es muy eficaz para despertar el entusiasm o p o r los experimentos diseados
estadsticam ente en la com unidad de ingeniera. E n consecuencia, al inicio del libro planteo la nocin de
un m odelo emprico fundam ental para el experim ento y las superficies de respuesta y destaco la im por
tancia del mismo.
Tambin m e he esforzado por presentar m ucho ms rpido los puntos crticos en los que intervienen
los diseos factoriales. Para facilitar este objetivo, condens en un solo captulo (el 3) el m aterial intro
ductorio sobre los experimentos com pletam ente aleatorizados con un solo factor y el anlisis de varianza.
H e ampliado el m aterial sobre los diseos factoriales y factoriales fraccionados (captulos 5 al 9) en un es
fuerzo por hacer que el m aterial fluya con mayor eficiencia en la perspectiva tanto del lector como del
profesor y por hacer mayor hincapi en el modelo emprico. El captulo sobre las superficies de respuesta
(el 1 1 ) sigue inm ediatam ente al m aterial sobre diseos factoriales y factoriales fraccionados y m odelado
de regresiones. H e ampliado este captulo, agregando nuevo m aterial sobre diseos ptimos alfabticos,
experim entos con mezclas y el problem a de un diseo param trico robusto. E n los captulos 12 y 13 se
analizan experimentos que incluyen efectos aleatorios, as como algunas aplicaciones de estos conceptos
en diseos anidados y parcelas subdivididas. El captulo 14 es una descripcin general de tem as im portan
tes de diseo y anlisis: la respuesta no norm al, el m todo de Box-Cox para seleccionar la form a de una
transform acin, y otras alternativas; experim entos factoriales no balanceados; el anlisis de covarianza,
incluyendo covariables en un diseo factorial y mediciones repetidas.
A lo largo del libro he destacado la im portancia del diseo experim ental como una herram ienta que
el ingeniero en ejercicio puede usar en el diseo y desarrollo de productos, as como en el desarrollo y m e
joram iento de procesos. Se ilustra el uso del diseo experim ental en el desarrollo de productos que sean
robustos a factores ambientales y a otras fuentes de variabilidad. Considero que el uso del diseo experi
m ental en las fases iniciales del ciclo de u n producto puede reducir sustancialm ente el tiem po y el costo de
conducirlo, redundando en procesos y productos con un m ejor desem peo en campo y una mayor confiabilidad que los que se desarrollan utilizando otros enfoques.
El libro contiene ms m aterial del que puede cubrirse sin prisas en un solo curso, por lo que espero
que los profesores puedan variar el contenido de cada curso o bien estudiar ms a fondo algunos temas,
dependiendo de los intereses de la clase. A l final de cada captulo hay un grupo de problem as (excepto en
el 1). E l alcance de estos problem as vara desde ejercicios de clculo, destinados a consolidar los funda
m entos, hasta la ampliacin de principios bsicos.
M i curso en la universidad lo enfoco principalm ente en los diseos factoriales y factoriales fracciona
dos. E n consecuencia, por lo general cubro el captulo 1, el captulo 2 (muy rpido), la mayor parte del ca
ptulo 3, el captulo 4 (sin incluir el m aterial sobre bloques incompletos y m encionando slo brevem ente
los cuadrados latinos), y trato en detalle los captulos 5 al 8 sobre diseos factoriales con dos niveles y di
seos factoriales fraccionados. Para concluir el curso, introduzco la m etodologa de superficies de res
puesta (captulo 1 1 ) y hago un repaso general de los modelos con efectos aleatorios (captulo 1 2 ) y los
diseos anidados y en parcelas subdivididas (captulo 13). Siempre pido a los estudiantes que realicen un

PREFACIO

v ii

proyecto sem estral que consiste en disear, conducir y presentar los resultados de un experim ento dise
ado estadsticam ente. Les pido que trabajen en equipos, pues es la m anera en que se realiza la mayor
parte de la experim entacin industrial. D eben hacer la presentacin de los resultados de su proyecto de
m anera oral y por escrito.

MATERIAL SUPLEMENTARIO DEL TEXTO


Con esta edicin he preparado un suplem ento para cada captulo del libro. E n este m aterial suplem enta
rio se desarrollan tem as que no pudieron tratarse con mayor detalle en el libro. Tkmbin presento algunos
tem as que no aparecen expresam ente en el libro, pero que para algunos estudiantes y profesionistas en
ejercicio podra resultar de utilidad una introduccin de los mismos. El nivel m atem tico de parte de este
m aterial es ms elevado que el del texto. Estoy consciente de que los profesores usan este libro con una
am plia variedad de audiencias, y es posible que algunos cursos de diseo m s avanzados puedan benefi
ciarse al incluir varios de los temas del m aterial suplem entario del texto. E ste m aterial est en form ato
electrnico en el CD /RO M del profesor (disponible slo en ingls) y se encuentra en el sitio web de este
libro.

SITIO WEB
E n el sitio web http://www.wiley.com/legacylcollege/engin/montgomery316490lstudentlstudent.html est
disponible el m aterial de apoyo para profesores y estudiantes. E ste sitio se usar para com unicar inform a
cin acerca de innovaciones y recom endaciones para el uso eficaz de este texto. El m aterial suplem enta
rio del texto puede encontrarse en este sitio, junto con versiones electrnicas de las series de datos
utilizadas en los ejemplos y los problem as de tarea, un plan de estudios del curso y proyectos semestrales
del curso en la Universidad Estatal de Arizona.

RECONOCIMIENTOS
Expreso mi agradecim iento a los muchos estudiantes, profesores y colegas que han usado antes este libro
y quienes me han hecho llegar tiles sugerencias para esta revisin. Las contribuciones de los doctores
Raym ond H. Myers, G. Geoffrey Vining, Dennis Lin, John Ram berg, Joseph Pignatiello, Lloyd S. Nelson,
A ndre Khuri, P eter Nelson, John A. Cornell, George C. Runger, B ert Keats, Dwayne Rollier, N orm a Hubele, Cynthia Lowry, Russell G. Heikes, H arrison M. Wadsworth, William W. Hines, Arvind Shah, Jane
Ammons, D iane Schaub, Pat Spagon y William DuM ouche, y los seores M ark A nderson y Pat W hitcomb
fueron particularm ente invaluables. Mi Jefe de D epartam ento, el doctor Gary Hogg, ha proporcionado
un am biente intelectualm ente estim ulante en el cual trabajar.
Las contribuciones de los profesionistas en activo con quienes he trabajado han sido invaluables. Es
imposible mencionarlos a todos, pero algunos de los principales son D an McCarville y Lisa Custer de M o
torola; Richard Post de Intel; Tbm Bingham, Dick Vaughn, Julin A nderson, R ichard Alkire y Chase
Neilson de Boeing Company; Mike Goza, D on Walton, K aren Madison, Jeff Stevens y Bob Kohm de
Alcoa; Jay G ardiner, John Butora, D ana Lesher, Lolly Marwah, Paul Tbbias y Leon M ason de IBM; Eli
zabeth A. Peck de The Coca-Cola Company; Sadri Khalessi y Franz Wagner de Signetics; R obert V. Bax
ley de M onsanto Chemicals; H arry Peterson-Nedry y Russell Boyles de Precision Castparts Corporation;
Bill New y Randy Schmid de Allied-Signal Aerospace; John M. Fluke, hijo, de John Fluke M anufacturing

v iii

PREFACIO

Company; L ariy Newton y Kip Howlett de Georgia-Pacific, y Ernesto Ram os de BBN Software Products
C orporation.
M e encuentro en deuda con el profesor E.S. Pearson y con Biometrka, John Wiley & Sons, Prentice-Hall, The Am erican Statistical Association, The Institute of M athem atical Statistics y los editores de
Biometrics por el perm iso para usar m aterial protegido por derechos de autor. Lisa C uster realiz un ex
celente trabajo de presentacin de las soluciones que aparecen en el C D /RO M del profesor, y la doctora
Cheryl Jennings realiz una correccin de estilo eficaz y de suma utilidad. Estoy agradecido con la Office
of Naval Research, la N ational Science Foundation, las compaas integrantes de NSF/Industry/University Cooperative Research C enter in Quality and Reliability Engineering de la Universidad Estatal de
Arizona, e IBM C orporation por apoyar gran parte de mis investigaciones de estadstica y diseo experi
m ental de ingeniera.
Douglas C. M ontgomery
Tempe, Arizona

Contenido

Captulo 1.
1*1
1-2
1-3
1-4
1-5
1-6
Captulo 2.
2-1
2-2
2-3
2-4

2-5

2-6
2-7
Captulo 3.
3-1
3-2
3-3

Introduccin

Estrategia de experimentacin
Algunas aplicaciones tpicas del diseo experimental
Principios bsicos
Pautas generales para disear experimentos
Breve historia del diseo estadstico
Resumen: uso de tcnicas estadsticas en la experimentacin

1
11
13
17
19

Experimentos comparativos simples

21

Introduccin
Conceptos estadsticos bsicos
Muestreo y distribuciones de muestreo
Inferencias acerca de las diferencias en las medias, diseos aleatorizados
2-4.1 Prueba de hiptesis
2-4.2 Eleccin del tamao de la muestra
2-4.3 Intervalos de confianza
2-4,4 Caso en que a * a \
2-4.5 Caso en que se conocen of y a\
2-4.6 Comparacin de una sola media con un valor especificado
2-4.7 Resumen
Inferencias acerca de las diferencias en las medias, diseos de comparaciones pareadas
2-5.1 El problema de las comparaciones pareadas
2-5.2 Ventajas del diseo de comparaciones pareadas
Inferencias acerca de las varianzas de distribuciones normales
Problemas

21
22
26
33
33
40
42
44
44
45
46
47
47
50
51
54

Experimentos con un solo faeton el anlisis de varianza

60

Un ejemplo
El anlisis de varianza
Anlisis del modelo con efectos fijos
3-3.1 Descomposicin de la suma de cuadrados total
3-3.2 Anlisis estadstico
3-3.3 Estimacin de los parmetros del modelo
3-3.4 Datos no balanceados

60
63
65

66

69
74
75

CONTENIDO

3-4

3-5

3-6
3-7

3-8
3-9

3-10

3-11
Captulo 4.
4-1

4-2
4-3
4-4

4-5

Verificacin de la adecuacin del modelo


3-4.1 El supuesto de normalidad
3-4.2 Grfica de los residuales en secuencia en el tiempo
3-4.3 Grfica de los residuales contra los valores ajustados
3-4.4 Grficas de los residuales contra otras variables
Interpretacin prctica de los resultados
3-5.1 Un modelo de regresin
3-5.2 Comparaciones entre las medias de los tratamientos
3-5.3 Comparaciones grficas de medias
3-5.4 Contrastes
3-5.5 Contrastes ortogonales
3-5.6 Mtodo de Scheff para comparar todos los contrastes
3-5.7 Comparacin de pares de medias de tratamientos
3-5.8 Comparacin de inedias de tratamientos con un control
Muestra de salida de computadora
Determinacin del tamao de la muestra
3-7.1 Curvas de operacin caracterstica
3-7.2 Especificacin de un incremento de la desviacin estndar
3-7.3 Mtodo para estimar el intervalo de confianza
Identificacin de efectos de dispersin
El enfoque de regresin para el anlisis de varianza
3-9.1 Estimacin de mnimos cuadrados de los parmetros del modelo
3-9.2 Prueba general de significacin de la regresin
Mtodos no paramtricos en el anlisis de varianza
3-10.1 La prueba de Kruskal-Wallis
3-10,2 Comentarios generales sobre la transformacin de rangos
Problemas

76
77
79
80

89
90
93
95
96
103
104
107
107
109
110
110
112
112
114
116
116
118
119

Bloques aleatorizados, cuadrados latinos y diseos relacionados

126

Diseo de bloques completos aleatorizados


4-1.1 Anlisis estadstico del diseo de bloques completos aleatorizados
4-1.2 Verificacin de la adecuacin del modelo
4-1.3 Otros aspectos del diseo de bloques completos aleatorizados
4-1.4 Estimacin de los parmetros del modelo y la prueba general de
significacin de la regresin
Diseo de cuadrado latino
Diseo de cuadrado grecolatino
Diseos de bloques incompletos balanceados
4-4.1 Anlisis estadstico del diseo de bloques incompletos balanceados
4-4.2 Estimacin de mnimos cuadrados de los parmetros
4-4.3 Recuperacin de informacin interbloques en el diseo de bloques
incompletos balanceados
Problemas

126
127
135
136

86
86

87
88

141
144
151
154
155
159
161
164

CONTENIDO

Captulo 5.
5-1
5-2
5-3

5-4
5-5
5-6
5-7
Captulo 6.
6-1
6-2
6-3
6-4
6-5
6 -6

6-7
Captulo 7.
7-1
7-2
7-3
7-4
7-5
7-6
7-7
7-8
Captulo 8.
8-1
8-2
8-3
8-4
8-5
8 -6

8-7
8 -8

xi

Introduccin a los diseos factoriales

170

Definiciones y principios bsicos


La ventaja de los diseos factoriales
Diseo factorial de dos factores
5-3.1 Un ejemplo
5-3.2 Anlisis estadstico del modelo con efectos fijos
5-3.3 Verificacin de la adecuacin del modelo
5-3.4 Estimacin de los parmetros del modelo
5-3.5 Eleccin del tamao de la muestra
5-3.6 El supuesto de no interaccin en un modelo de dos factores
5-3.7 Una observacin por celda
Diseo factorial general
Ajuste de curvas y superficies de respuesta
Formacin de bloques en un diseo factorial
Problemas

170
174
175
175
177
185
185
189
190
191
194
201
207
211

Diseo factorial 2*

218

Introduccin
El diseo 22
El diseo 23
El diseo general 2*
Una sola rplica del diseo 2*
Adicin de puntos centrales en el diseo 2*
Problemas

218
219
228
242
244
271
276

Formacin de bloques y confusin en el diseo factorial 2*

287

Introduccin
Formacin de bloques de un diseo factorial 2* con rplicas
Confusin del diseo factorial 2k
Confusin del diseo factorial 2* en dos bloques
Confusin del diseo factorial 2* en cuatro bloques
Confusin del diseo factorial 2* en 2Pbloques
Confusin parcial
Problemas

287
287
288
289
296
297
299
301

Diseos factoriales fraccionados de dos niveles

303

Introduccin
La fraccin un medio del diseo 2*
La fraccin un cuarto del diseo 2k
El diseo factorial fraccionado 2*_f general
Diseos de resolucin III
Diseos de resolucin IV y V
Resumen
Problemas

303
304
317
326
337
347
349
350

x ii

CONTENIDO

Captulo 9.
9-1

9-2

9-3

9-4

9-5
Captulo 10.
10-1
10-2

10-3
10-4

10-5

10-6

10-7

10-8

10-9
Captulo 11.
11-1
11-2

11-3

Diseos factoriales y factoriales fraccionados con tres niveles y con niveles mixtos

363

Diseo factorial 3*
9-1.1 Notacin y motivacin del diseo 3*
9-1.2 El diseo 32
9-1.3 El diseo 33
9-1.4 El diseo general 3*
Confusin en el diseo factorial 3*
9-2.1 El diseo factorial 3* en tres bloques
9-2.2 El diseo factorial 3* en nueve bloques
9-2.3 El diseo factorial 3* en y bloques
Rplicas fraccionadas del diseo factorial 3*
9-3.1 La fraccin un tercio del diseo factorial 3k
9-3.2 Otros diseos factoriales fraccionados 3k~p
Diseos factoriales con niveles mixtos
9-4.1 Factores con dos y tres niveles
9-4.2 Factores con dos y cuatro niveles
Problemas

363
363
365
367
372
373
373
377
378
379
379
382
383
384
385
387

Ajuste de modelos de regresin

392

Introduccin
Modelos de regresin lineal
Estimacin de los parmetros en modelos de regresin lineal
Prueba de hiptesis en la regresin mltiple
10-4.1 Prueba de significacin de la regresin
10-4,2 Pruebas de los coeficientes de regresin individuales y de grupos de coeficientes
Intervalos de confianza en regresiones mltiples
10-5.1 Intervalos de confianza para los coeficientes de regresin individuales
10-5.2 Intervalo de confianza para la respuesta media
Prediccin de nuevas observaciones de la respuesta
Diagnsticos del modelo de regresin
10-7.1 Residuales escalados y PRESS
10-7.2 Diagnsticos de influencia
Prueba de falta de ajuste
Problemas

392
393
394
409
409
412
415
415
416
416
416
417
420
421
422

Mtodos de superficies de respuesta y otros enfoques para la optimizacin de


procesos

427

Introduccin a la metodologa de superficies de respuesta


Mtodo del ascenso ms pronunciado
Anlisis de una superficie de respuesta de segundo orden
11-3.1 Localizacin del punto estacionario
11-3.2 Caracterizacin de la superficie de respuesta
11-3.3 Sistemas de cordilleras

427
430
436
436
440
447

CONTENIDO

11-4

11-5
11-6
11-7

11-8
Captulo 12.
12-1
12-2
12-3
12-4
12-5
12-6
12-7

12-8
Captulo 13.
13-1

13-2
13-3
13-4
13-5

13-6
Captulo 14.
14-1

x iii

11-3.4 Respuestas mltiples


Diseos experimentales para ajustar superficies de respuesta
11-4.1 Diseos para ajustar el modelo de primer orden
11-4.2 Diseos para ajustar el modelo de segundo orden
11-4.3 Formacin de bloques en los diseos de superficie de respuesta
11-4.4 Diseos (ptimos) generados por computadora
Experimentos con mezclas
Operacin evolutiva
Diseo robusto
11-7.1 Antecedentes
11-7.2 El enfoque de la superficie de respuesta para el diseo robusto
Problemas

448
455
455
456
462
466
472
484
488
488
492
500

Experimentos con factores aleatorios

511

Modelo con efectos aleatorios


Diseo factorial de dos factores aleatorios
Modelo mixto con dos factores
Determinacin del tamao de la muestra con efectos aleatorios
Reglas para los cuadrados medios esperados
Pruebas F aproximadas
Algunos temas adicionales sobre la estimacin de los componentes de la
varianza
12-7.1 Intervalos de confianza aproximados para los componentes de la varianza
12-7.2 Mtodo de grandes muestras modificado
12-7.3 Estimacin de mxima verosimilitud de componentes de la varianza
Problemas

511
517
522
529
531
535

Diseos anidados y en parcelas subdivididas

557

Diseo anidado de dos etapas


13-1.1 Anlisis estadstico
13-1.2 Verificacin del diagnstico
13-1,3 Componentes de la varianza
13-1.4 Diseos anidados por etapas
Diseo anidado general de m etapas
Diseos con factores anidados y factoriales
Diseo de parcelas subdivididas
Otras variantes del diseo de parcelas subdivididas
13-5.1 Diseo de parcelas subdivididas con ms de dos factores
13-5.2 Diseo de parcelas con doble subdivisin
13-5.3 Diseo de parcelas subdivididas en franjas
Problemas

557
558
563
565
566
566
569
573
578
578
580
583
584

Otros tpicos de diseo y anlisis

590

Respuestas y transformaciones no normales

590

543
543
545
547
552

x iv

CONTENIDO

14-1.1 Seleccin de una transformacin: el mtodo de Box-Cox


14-1.2 Modelo lineal generalizado
14-2 Datos no balanceados en un diseo factorial
14-2.1 Datos proporcionales: un caso sencillo
14-2.2 Mtodos aproximados
14-2.3 Mtodo exacto
14-3 Anlisis de covarianza
14-3.1 Descripcin del procedimiento
14-3.2 Solucin por computadora
14-3.3 Desarrollo mediante la prueba general de significacin de la regresin
14-3.4 Experimentos factoriales con covariables
14-4 Mediciones repetidas
14-5 Problemas

590
594
600
600
601
604
604
605
614
616
619
624
627

Bibliografa

630

Apndice

637

Tbbla I.

Distribucin normal estndar acumulada

638

Tbla II.

Puntos porcentuales de la distribucin t

640

Tbla III.

Puntos porcentuales de la distribucin x1

641

Tbbla IV.

Puntos porcentuales de la distribucin F

642

Tbbla Y
l b la VI.

647

Tbla VII.
Tbbla VIII.
Ibbla IX.

Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos fijos
Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos
aleatorios
Rangos significativos para la prueba del rango mltiple de Duncan
Puntos porcentuales del estadstico del rango studentizado
Valores crticos para la prueba de Dunnett para comparar tratamientos con un control

Dabla X.
Ihbla XI.
Habla XII.

Coeficientes de polinomios ortogonales


Nmeros aleatorios
Relaciones de alias para diseos factoriales fraccionados 2k~p con k < 15 y n <. 64

661
662
663

Tabla XIII.
ndice

Glosario para el uso de Design Expert

680
681

651
655
656
658

Introduccin

1-1

ESTRATEGIA DE EXPERIMENTACIN

Investigadores de prcticam ente todos los campos de estudio llevan a cabo experimentos, p or lo general
para descubrir algo acerca de un proceso o sistema particular. E n un sentido literal, un experim ento es
una prueba. E n una perspectiva ms formal, un experimento puede definirse como una prueba o serie de
pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para
observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida.
E ste libro trata de la planeacin y realizacin de experim entos y del anlisis de los datos resultantes a
fin de obtener conclusiones vlidas y objetivas. L a atencin se centra en los experim entos de ingeniera y
las ciencias fsicas y qumicas. E n ingeniera, la experim entacin desem pea un papel im portante en el di
seo de productos nuevos, el desarrollo de procesos de m anufactura y el m ejoram iento de procesos. El
objetivo en muchos casos serla desarrollar un proceso robusto, es decir, un proceso que sea afectado en
form a m nima por fuentes de variabilidad externas.
Como ejemplo de un experim ento, suponga que un ingeniero m etalrgico tiene inters en estudiar el
efecto de dos procesos diferentes de endurecim iento, el tem plado en aceite y el tem plado en agua salada,
sobre una aleacin de aluminio. El objetivo del experim entador es determ inar cul de las dos soluciones
de tem plado produce la dureza mxima para esta aleacin particular. El ingeniero decide som eter varios
ejem plares o m uestras para ensayo de la aleacin a cada m edio de tem plado y m edir la dureza de los
ejem plares despus del tem plado. Para determ inar cul de las soluciones es la mejor, se usar la dureza
prom edio de los ejem plares tratados en cada solucin de tem plado.
A l examinar este sencillo experim ento salen a relucir varias cuestiones im portantes:
1.
2.
3.
4.

Estas dos soluciones son los nicos medios de tem plado de inters potencial?
Hay en este experim ento otros factores que podran afectar la dureza y que deberan investigar
se o controlarse?
Cuntas m uestras para ensayo de la aleacin debern probarse en cada solucin de tem plado?
Cmo debern asignarse las m uestras para ensayo de prueba a las soluciones de tem plado y en
qu orden debern colectarse los datos?

CAPTULO 1

5.
6.

INTRODUCCIN

Q u m todo de anlisis de datos deber usarse?


Q u diferencia en la dureza prom edio observada entre los dos m edios de tem plado se conside
rar im portante?

Tbdas estas preguntas, y tal vez m uchas ms, tendrn que responderse satisfactoriam ente antes de llevar a
cabo el experimento.
E n cualquier experim ento, los resultados y las conclusiones que puedan sacarse dependen en gran
m edida de la m anera en que se recabaron los datos. Para ilustrar este punto, suponga que el ingeniero
m etalrgico del experim ento anterior utiliz ejem plares de una hornada para el tem plado en aceite y
ejem plares de una segunda hornada para el tem plado en agua salada. Entonces, cuando com pare la dure
za prom edio, el ingeniero no podr saber qu parte de la diferencia observada es resultado de la solucin
de tem plado y qu parte es el resultado de diferencias inherentes entre las hornadas .1 Por lo tanto, el m
todo utilizado para recabar los datos ha afectado de m anera adversa las conclusiones que pueden sacarse
del experimento.
E n general, los experim entos se usan para estudiar el desem peo de procesos y sistemas. El proceso o
sistema puede representarse con el m odelo ilustrado en la figura 1-1. El proceso puede por lo general vi
sualizarse como una combinacin de mquinas, m todos, personas u otros recursos que transform an cier
ta entrad a (con frecuencia un m aterial) en una salida que tiene una o ms respuestas observables.
Algunas variables del procesox lfx 2,...,x p son controlables, m ientras que otras z u z 2, ..-,zq son no controla
bles (aunque pueden serlo para los fines de una prueba). Los objetivos del experim ento podran com
pren d er los siguientes:
1.
2.
3.
4.

D eterm inar cules son las variables que tienen mayor influencia sobre la respuesta y.
D eterm inar cul es el ajuste de las* que tiene mayor influencia p ara quey est casi siempre cerca
del valor nom inal deseado.
D eterm inar cul es el ajuste de las* que tiene mayor influencia para que la variabilidad d e 7 sea
reducida.
D eterm inar cul es el ajuste de las x que tiene mayor influencia p ara que los efectos de las varia
bles no controlables z lt z 2, , zq sean mnimos.

Como se puede ver por el anlisis anterior, los experim entos incluyen m uchas veces varios factores.
H abitualm ente, uno de los objetivos de la persona que realiza un experim ento, llam ada el experimenta*
dor, es determ inar la influencia que tienen estos factores sobre la respuesta de salida del sistema. Al enfo-

Factores controlables
*1

Entradas

ii
Proceso

TFT

*1 22
2,
Factores no controlables

Salida

Figura 1-1 Modelo general de un pro

ceso o sistema.

Un especialista en diseo experimental dira que los efectos de los medios de templado y las hornadas se confundieron-, es decir, los
efectos de estos dos factores no pueden separarse.

1-1 ESTRATEGIA DE EXPERIMENTACIN

que general para planear y llevar a cabo el experim ento se le llama estrategia de experimentacin. Existen
varias estrategias que podra usar un experim entador. Se ilustrarn algunas de ellas con un ejem plo muy
sencillo.
Al autor le gusta m ucho jugar golf. D esafortunadam ente, no le agrada practicar, por lo que siempre
busca la m anera ms sencilla para bajar su puntuacin. Algunos de los factores que l considera importantes, o que podran influir en su puntuacin, son los siguientes:
1.

.
3.
4.
5.
6.
7.
8.

El tipo de palo usado (grande o normal).


El tipo de pelota usada (de gom a de balata o de tres piezas).
Cam inar cargando los palos de golf o hacer el recorrido en un carrito
B eber agua o cerveza durante el juego.
Jugar en la m aana o en la tarde.
Jugar cuando hace fro o cuando hace calor.
E l tipo de spikes usados en los zapatos de golf (metlicos o de hule).
Jugar en un da con viento o en uno apacible.

Evidentem ente, hay muchos otros factores que podran considerarse, pero supongamos que stos son los
de inters prim ario. Adems, teniendo en cuenta su larga experiencia en el juego, el autor decide que los
factores 5 al 8 pueden ignorarse; es decir, estos factores no son im portantes porque sus efectos son tan pe
queos que carecen de valor prctico. Los ingenieros y los investigadores deben tom ar a m enudo este tipo
de decisiones acerca de algunos de los factores que examinan en experim entos reales.
Considerem os ahora cmo podran probarse experim entalm ente los factores 1 al 4 para determ inar
su efecto sobre la puntuacin del autor. Suponga que en el curso del experim ento pueden jugarse un m
ximo de ocho rondas de golf. U n enfoque consistira en seleccionar una combinacin arbitraria de estos
factores, probarlos y ver qu ocurre. P or ejemplo, suponga que se selecciona la combinacin del palo
grande, la pelota de goma de balata, el carrito y el agua, y que la puntuacin resultante es 87. Sin embargo,
durante la ronda el autor not varios tiros descontrolados con el palo grande (en el golf, grande no siem
pre es sinnimo de bueno) y, en consecuencia, decide jugar otra ronda con el palo norm al, m anteniendo
los dems factores en los mismos niveles usados anteriorm ente. Este enfoque podra continuar de m ane
ra casi indefinida, cambiando los niveles de uno (o quiz dos) de los factores para la prueba siguiente, con
base en el resultado de la prueba en curso. E sta estrategia de experim entacin, conocida como enfoque de
la m ejor coqjetura, es comn entre ingenieros y cientficos. Funciona de m anera adecuada si los experi
m entadores cuentan con una gran cantidad de conocimientos tcnicos o tericos del sistema que estn es
tudiando, as como amplia experiencia prctica. Sin embargo, el enfoque de la m ejor conjetura presenta
al m enos dos desventajas. Prim era, supngase que la m ejor conjetura inicial no produce los resultados de
seados. E ntonces el experim entador tiene que hacer otra conjetura acerca de la combinacin correcta de
los niveles de los factores. Esto podra continuar por m ucho tiem po, sin garanta alguna de xito. Segun
da, supngase que la m ejor conjetura inicial produce un resultado satisfactorio. Entonces, el experim en
tador se ve tentado a suspender las pruebas, aun cuando no hay ninguna garanta de que se ha encontrado
la m ejor solucin.
O tra estrategia de experim entacin muy comn en la prctica es el enfoque de un factor a la vez. Este
m todo consiste en seleccionar un punto de partida, o lnea base de los niveles, para cada factor, para des
pus variar sucesivamente cada factor en su rango, m anteniendo constantes los factores restantes en el ni
vel base. Despus de haber realizado todas las pruebas, se construye por lo general una serie de grficas
en las que se m uestra la form a en que la variable de respuesta es afectada al variar cada factor m antenien
do los dems factores constantes. E n la figura 1-2 se presenta una serie de grficas para el experim ento
del golf, utilizando como lnea base los niveles de los cuatro factores: el palo grande, la pelota de goma de

CAPTULO 1

INTRODUCCIN

-L

Palo

Figura 1-2

GB (goma TP (tres
de balata)
pietas)
Pelota

unito)

Manera de desplazarse

Bebida

Resultados de la estrategia de un factor a la vez para el experimento de golf.

balata, caminar y beber agua. La interpretacin de esta grfica es directa; por ejemplo, debido a que la
pendiente de la curva de la m anera de desplazarse es negativa, se concluira que hacer el recorrido en el
carrito m ejora la puntuacin. Con base en estas grficas de un factor a lavez, la combinacin ptim a que
se seleccionara sera el palo norm al, desplazarse en el carrito y beber agua. El tipo de pelota de golf apa
rentem ente carece de importancia.
L a desventaja principal de la estrategia de un factor a la vez es que no puede tom ar en consideracin
cualquier posible interaccin entre los factores. Hay una interaccin cuando uno de los factores no p ro
duce el mismo efecto en la respuesta con niveles diferentes de otro factor. E n la figura 1-3 se m uestra una
interaccin entre los factores del tipo de palo y la bebida para el experim ento del golf. Observe que si el
autor utiliza el palo norm al, el tipo de bebida consum ida prcticam ente no tiene efecto alguno sobre su
puntuacin, pero si utiliza el palo grande, se obtienen resultados m ucho m ejores cuando bebe agua en lu
gar de cerveza. Las interacciones entre factores son muy comunes y, en caso de existir, la estrategia de un
factor a la vez casi siem pre producir resultados deficientes. M uchas personas no perciben esto y, en
consecuencia, los experim entos de un factor a la vez son com unes en la prctica. (D e hecho, algunas
personas piensan que esta estrategia se relaciona con el m todo cientfico o que es un principio slido
de ingeniera.) Los experim entos de un factor a la vez siempre son m enos eficientes que otros mtodos
basados en un enfoque estadstico del diseo experimental. El tem a se analizar con mayor detalle en el
captulo 5.
El enfoque correcto para trabajar con varios factores es conducir un experim ento factorial. Se trata
de una estrategia experim ental en la que los factores se hacen variar en conjunto, en lugar de uno a la vez.

TP(tre$

pisas)
1

-8

GB
(goma dB
balata)

G (grande)
Tipo de bebida

Figura 1-3 Interaccin entre el


tipo de palo y el tipo de bebida para
el experimento del golf.

N (normal)

Tipo de palo
Figura 1-4 Experimento factorial de dos
factores que incluye el tipo de palo y el tipo
de pelota.

1-1 ESTRATEGIA DE EXPERIMENTACIN

El concepto de diseo experimental factorial es de suma importancia, y varios captulos de este libro se
dedican a presentar experimentos factoriales bsicos, as como algunas variantes y casos especiales tiles.
Para ilustrar la form a en que se lleva a cabo un experim ento factorial, considere el experim ento de
golf y suponga que slo dos de los factores son de inters, el tipo de palo y el tipo de pelota. E n la figura
1-4 se m uestra un experim ento factorial para estudiar los efectos conjuntos de estos dos factores sobre la
puntuacin de golf del autor. Observe que en este experimento factorial ambos factores tienen dos nive
les y que en el diseo se usan todas las combinaciones posibles de los niveles de ambos factores. G eom
tricam ente, las cuatro corridas form an los vrtices de un cuadrado. A este tipo particular de experimento
factorial se le llama diseo factorial 22 (dos factores, cada uno con dos niveles). Debido a que el autor
considera razonable suponer que jugar ocho rondas de golf para investigar estos factores, un plan facti
ble sera jugar dos rondas de golf con cada combinacin de los niveles de los factores, como se m uestra en
la figura 1-4. U n diseador de experim entos dira que se han hecho dos rplicas del diseo. Este diseo
experim ental perm itira al experim entador investigar los efectos individuales (o los efectos principales)
de cada factor y determ inar si existe alguna interaccin entre los factores.
E n la figura 1-5 se presentan los resultados obtenidos al realizar el experim ento factorial de la figura
1-4. E n los vrtices del cuadrado se indican las puntuaciones de cada ronda de golf jugada con las cuatro
combinaciones de prueba. Observe que hay cuatro rondas de golf que proporcionan informacin acerca
del uso del palo norm al y cuatro rondas que proporcionan informacin sobre el uso del palo grande. Al
encontrar la diferencia prom edio de las puntuaciones que estn en los lados derecho e izquierdo del
cuadrado (como en la figura 1-5b), se tiene una medida del efecto de cambiar del palo grande al palo normal, o
,
9 2 + 9 4 + 9 3 + 9 1 88+91 + 88+90
Efecto del palo = ------------------------------
----------= 3.25

G (grande)
N (normal)
Tipo de palo
a) Puntuaciones del experimento da golf
TP (tres
piezas)

TP (tres
piezas)

ffi

al

GB (goma |
de balata)
_L
_L
G (grande)
N (normal)
G (grande)
N (normal)
Tipo de palo
Tipo de palo
b) Comparacin de las puntuaciones c) Comparacin de las puntuaciones
que conducen al efecto de la pelota
que conducen al efecto del palo

GB (goma
de balata)

Figura 1-5

Tipo de palo

d ) Comparacin de las puntuaciones


que conducen al efecto de la
interaccin pelota-palo

Puntuaciones del experimento del golf de la figura 1-4 y clculo de los efectos de los factores.

CAPTULO 1

INTRODUCCIN

Es decir, en prom edio, al cam biar del palo grande al norm al la puntuacin se increm enta 3.25 golpes por
ronda. D e m anera similar, la diferencia prom edio de las cuatro puntuaciones de la parte superior del cua
drado y de las cuatro puntuaciones de la parte inferior m iden el efecto del tipo de pelota usado (ver la fi
gura l-5c):

,
88+91 + 92+ 94 88 + 9 0 + 9 3 + 9 1
Efecto de la pelota ---------------------------------------------- = 0.75
4
4
Por ltim o, puede obtenerse una m edida del efecto de la interaccin entre el tipo de pelota y el tipo de
palo restando la puntuacin prom edio en la diagonal de izquierda a derecha del cuadrado de la puntua
cin prom edio de la diagonal de derecha a izquierda (ver la figura l-5d), cuyo resultado es

j , *
-,
w
,
9 2 + 9 4 + 8 8 + 9 0 88+91 + 93+91
_
Efecto de la interaccin pelota-palo = ---------------------------------- ------ = 0.25
Los resultados de este experim ento factorial indican que el efecto del palo es mayor que el efecto de
la p elo ta o que el de la interaccin. P odran usarse pruebas estadsticas p a ra d eterm inar si cualquiera
de estos efectos difiere de cero. D e hecho, el caso es que hay evidencia estadstica razonablem ente slida
de que el efecto del palo difiere de cero y de que no es el caso para los otros dos efectos. Por lo tanto, tal
vez el autor debera jugar siem pre con el palo grande.
E n este sencillo ejem plo se pone de m anifiesto una caracterstica muy im portante del experim ento
factorial: en los diseos factoriales se hace el uso ms eficiente de los datos experimentales. N ote que este
experim ento incluy ocho observaciones, y que las ocho observaciones se usan para calcular los efectos
del palo, de la pelota y de la interaccin. N inguna otra estrategia de experim entacin hace un uso tan efi
ciente de los datos. sta es una caracterstica im portante y til de los diseos factoriales.
E l concepto de experim ento factorial puede extenderse a tres factores. Suponga que el autor desea
estudiar los efectos del tipo de palo, el tipo de pelota y el tipo de bebida consum ida sobre su puntuacin
de golf. Suponiendo que los tres factores tienen dos niveles, puede establecerse un diseo factorial como
el que se m uestra en la figura 1-6. Observe que hay ocho combinaciones de prueba de estos tres factores
con los dos niveles de cada uno de ellos y que estos ocho ensayos pueden representarse geom tricam ente
como los vrtices de un cubo. Se trata de un ejem plo de un diseo factorial 23. Como el autor slo desea
jugar ocho rondas de golf, este experim ento requerira que se juegue una ronda con cada una de las com
binaciones de los factores representadas por los ocho vrtices del cubo de la figura 1-6. Sin embargo, al
com parar esta situacin con el diseo factorial de dos factores de la figura 1-4, el diseo factorial 2 3 p ro
ducira la misma informacin acerca de los efectos de los factores. Por ejemplo, en ambos diseos hay
cuatro pruebas que proporcionan inform acin acerca del palo norm al y cuatro pruebas que proporcionan

Figura 1-6 Experimento factorial de tres factores que


incluye el tipo de palo, el tipo de pelota y el tipo de bebi
da.

1-1 ESTRATEGIA DE EXPERIMENTACIN


Manera de desplazarse

!---En carrito

Caminando

Figura 1-7 Experimento factorial de cuatro factores que incluye el tipo de


palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse.

inform acin acerca del palo grande, suponiendo que se repite dos veces cada corrida del diseo de dos
factores de la figura 1-4.
E n la figura 1-7 se ilustra la form a en que podran investigarse los cuatro factores el palo, la pelota,
la bebida y la m anera de desplazarse (cam inando o en carrito) en un diseo factorial 24. Como en cual
quier diseo factorial, se usan todas las combinaciones posibles de los niveles de los factores. Puesto que
los cuatro factores tienen dos niveles, sigue siendo posible hacer la representacin geom trica de este di
seo experimental m ediante un cubo (en realidad un hipercubo).
E n general, si hay k factores, cada uno con dos niveles, el diseo factorial requerira 2k corridas. Por
ejemplo, el experim ento de la figura 1-7 requiere 16 corridas. Evidentem ente, cuando el nm ero de facto
res de inters aum enta, el nm ero de corridas requeridas se increm enta con rapidez; por ejem plo, un
experim ento con 10 factores en el que todos los factores tienen dos niveles requerira 1024 corridas. Esto
pronto se vuelve im practicable en lo que se refiere al tiem po y los recursos. E n el experim ento del golf,
el autor slo puede jugar ocho rondas, p o r lo que incluso el experim ento de la figura 1-7 resulta dem asia
do largo.
Por fortuna, cuando se trabaja con cuatro, cinco o ms factores, por lo general no es necesario probar
todas las combinaciones posibles de los niveles de los factores. U n experimento factorial fraccionado es
una variacin del diseo factorial bsico en la que slo se realiza un subconjunto de las corridas. E n la fi
gura 1 - 8 se ilustra un diseo factorial fraccionado para la versin de cuatro factores del experim ento del
golf. Este diseo requiere slo 8 corridas en lugar de las 16 originales y se llam ara fraccin un medio. Si el
autor slo puede jugar ocho rondas de golf, ste es un excelente diseo en el cual estudiar los cuatro facto
res. Proporcionar informacin adecuada acerca de los efectos principales de los cuatro factores, as
como cierta inform acin acerca de la form a en que interactan estos factores.
Los diseos factoriales fraccionados son muy comunes en la investigacin y el desarrollo industrial,
as como en el m ejoram iento de procesos. Estos diseos se analizarn en el captulo 8 .

Manera de desplazarse

-------- *--------- V
En carrito

Caminando

'

1-*

'

i
i
i

j * - -

Figura 1-8 Experimento factorial fraccionado de cuatro factores que incluye


el tipo de palo, el tipo de pelota, el tipo de bebida y la manera de desplazarse.

CAPTULO 1

INTRODUCCIN

1-2

ALGUNAS APLICACIONES TPICAS DEL DISEO EXPERIMENTAL

Los m todos del diseo experim ental han encontrado amplia aplicacin en diversas disciplinas. D e h e
cho, la experim entacin puede considerarse parte del proceso cientfico y uno de los medios para conocer
el funcionam iento de sistemas y procesos. E n general, el aprendizaje ocurre a travs de una serie de acti
vidades en las que se hacen conjeturas acerca de un proceso, se llevan a cabo experimentos para generar
datos del proceso y despus se usa la inform acin del experim ento para establecer nuevas conjeturas, lo
que lleva a nuevos experimentos, y as sucesivamente.
E l diseo experimental es una herram ienta de im portancia fundam ental en el mbito de la ingeniera
para m ejorar el desem peo de un proceso de m anufactura. Tambin tiene mltiples aplicaciones en el de
sarrollo de procesos nuevos. L a aplicacin de las tcnicas del diseo experim ental en las fases iniciales del
desarrollo de un proceso puede redundar en
1.

M ejoras en el rendim iento del proceso.


. Variabilidad reducida y conformidad ms cercana con los requerimientos nominales o proyectados.
3. Reduccin del tiempo de desarrollo.
4. Reduccin de los costos globales.
2

Los m todos del diseo experim ental desem pean tam bin un papel im portante en las actividades
del diseo de ingeniera, donde se desarrollan productos nuevos y se hacen m ejoram ientos en los produc
tos existentes. E ntre las aplicaciones del diseo experimental en el diseo de ingeniera se encuentran:
1.
2.
3.
4.

La evaluacin y com paracin de configuraciones de diseos bsicos.


L a evaluacin de m ateriales alternativos.
L a seleccin de los parm etros del diseo para que el producto tenga un buen funcionam iento en
una amplia variedad de condiciones de campo, es decir, para que el producto sea robusto.
L a determ inacin de los parm etros clave del diseo del producto que afectan el desem peo del
mismo.

E l uso del diseo experim ental en estas reas puede redundar en productos cuya fabricacin sea ms sen
cilla, en productos que tengan un desem peo y confiabilidad de campo m ejorados, en costos de produc
cin ms bajos y en tiem pos ms cortos para el diseo y desarrollo del producto. A continuacin se
presentan varios ejemplos que ilustran algunas de estas ideas.

E JE M P L O 1-1

------* .............................................................................................................................................

Caracterizacin de un proceso
E n el proceso de fabricacin de tarjetas de circuitos impresos se utiliza una m quina de soldadura lquida.
L a m quina limpia las tarjetas en un fundente, las som ete a un proceso de precalentam iento y despus las
hace pasar por una onda de soldadura lquida m ediante una transportadora. E n este proceso de soldadu
ra se hacen las conexiones elctricas y mecnicas de los com ponentes recubiertos de plomo en la tarjeta.
E l proceso opera actualm ente con un nivel de defectos aproximado de 1%. Es decir, cerca de 1% de
las juntas de soldadura de una tarjeta son defectuosas y requieren correccin manual. Sin embargo, debi
do a que la tarjeta de circuitos impresos prom edio contiene ms de 2 0 0 0 juntas de soldadura, incluso un
nivel de defectos de 1 % representa un nm ero dem asiado alto de juntas de soldadura que requieren co
rreccin. Al ingeniero responsable del proceso en esta rea le gustara usar un experim ento diseado
para determ inar cules son los parm etros de la m quina que influyen en la ocurrencia de los defectos de
soldadura y qu ajustes deberan hacerse en dichas variables para reducir los defectos de soldadura.

1-2 ALGUNAS APLICACIONES TPICAS DEL DISEO EXPERIMENTAL

E n la m quina de soldadura lquida hay diversas variables que pueden controlarse. stas incluyen:
1.
2.
3.
4.
5.
6.
7.

L a tem peratura de la soldadura.


L a tem peratura del precalentam iento.
L a velocidad de la transportadora.
El tipo de fundente.
L a gravedad especfica del fundente.
L a profundidad de la onda de soldadura.
El ngulo de la transportadora.

Adems de estos factores controlables, hay otros que no es sencillo m anejar durante el proceso de fabri
cacin, aunque podran controlarse p ara los fines de una prueba. Estos son:
1. El espesor de la tarjeta de circuitos impresos.
2. El tipo de com ponentes usados en la tarjeta.
3. La disposicin de los com ponentes en la tarjeta.
4. El operador.
5. La rapidez de produccin.
E n esta situacin, el inters del ingeniero es caracterizar la m quina de soldadura lquida; es decir,
quiere determ inar los factores (tanto los controlables como los no controlables) que afectan la ocurrencia
de defectos en las tarjetas de circuitos impresos. Para ello puede disear un experim ento que le perm itir
estim ar la m agnitud y direccin de los efectos de los factores; es decir, cunto cambia la variable de res
puesta (defectos por unidad) cuando se m odifica cada factor, y si la modificacin de los factores en con
junto produce resultados diferentes que los obtenidos m ediante el ajuste individual de los factores; es
decir, existe interaccin entre los factores? En ocasiones a un experim ento como ste se le llam a experi
m ento tam iz o de exploracin exhaustiva. D e m anera tpica, los experim entos tamiz incluyen el uso de di
seos factoriales fraccionados, como en el ejemplo del golf de la figura 1 -8 .
L a informacin obtenida de este experim ento tamiz se usar para identificar los factores crticos del
proceso y determ inar la direccin del ajuste de dichos factores a fin de conseguir una reduccin adicional
del nm ero de defectos por unidad. El experim ento tam bin puede proporcionar inform acin acerca de
los factores que deberan controlarse con m ayor atencin durante el proceso de fabricacin a fin de evi
ta r los niveles elevados de defectos y el desem peo errtico del proceso. Por lo tanto, una consecuencia
del experim ento podra ser la aplicacin de tcnicas como las cartas de control a una o ms de las varia
bles del proceso (la tem peratura de la soldadura, por ejemplo), aunadas a las cartas de control de la pro
duccin del proceso. Con el tiempo, si se consigue una m ejora sensible del proceso, quiz sea posible
basar la mayor parte del program a de control del mismo en el control de las variables de entrada del p ro
ceso en lugar de aplicar cartas de control a la produccin.

EJEMPLO 1*2 ..................................................................................................................................


Optimizacin de un proceso
E n un experim ento de caracterizacin, el inters suele centrarse en determ inar las variables del proceso
que afectan la respuesta. El siguiente paso lgico es la optimizacin, es decir, determ inar la regin de los
factores im portantes que conduzca a la m ejor respuesta posible. Por ejemplo, si la respuesta es el rendi-

10

CAPTULO 1

INTRODUCCIN

m iento, se buscara la regin del rendim iento mximo, m ientras que si la respuesta es la variabilidad de
una dimensin crtica del producto, se buscara una regin de variabilidad mnima.
Supongamos que el inters se centra en m ejorar el rendim iento de un proceso qumico. Por los resul
tados de un experim ento de caracterizacin se sabe que las dos variables m s im portantes del proceso que
influyen en el rendim iento son la tem peratura de operacin y el tiem po de reaccin. El proceso opera ac
tualm ente a 145Fy con 2.1 horas de tiem po de reaccin, produciendo rendim ientos de cerca de 80%. En
la figura 1-9 se m uestra una vista desde arriba de la regin tiem po-tem peratura. E n esta grfica las lneas
de rendim iento constante se unen para form ar los contornos de respuesta, y se m uestran las lneas de con
torno para rendim ientos de 6 0 ,7 0 ,8 0 ,9 0 y 95 por ciento. Estos contornos son las proyecciones en la re
gin tiem po-tem peratura de las secciones transversales de la superficie del rendim iento correspondiente
a los rendim ientos porcentuales arriba m encionados. A esta superficie se le llam a en ocasiones superficie
de respuesta. El personal del proceso no conoce la verdadera superficie de respuesta de la figura 1-9, por
lo que se necesitarn m todos experim entales para optimizar el rendim iento con respecto al tiem po y la
tem peratura.
P ara localizar el rendim iento ptim o, es necesario llevar a cabo un experim ento en el que se hagan
variar conjuntam ente el tiem po y la tem peratura, es decir, un experim ento factorial. E n la figura 1-9 se
m uestran los resultados de un experim ento factorial inicial realizado con dos niveles tanto del tiem po
como de la tem peratura. Las respuestas que se observan en los cuatro vrtices del cuadrado indican que,
para increm entar el rendim iento, los cambios deberan hacerse en la direccin general del aum ento de la

Tiempo (horas)

Figura 1-9 Grfica de contorno del rendimiento como una fun


cin del tiempo de reaccin y la tem peratura de reaccin, la cual
ilustra la experimentacin para optimizar un proceso.

1-3 PRINCIPIOS BSICOS

11

tem peratura y la reduccin del tiem po de reaccin. Se realizaran algunas corridas adicionales en esta di
reccin, y esta experimentacin adicional llevara a la regin del rendim iento mximo.
U na vez que se ha encontrado la regin del rendim iento ptimo, el siguiente paso tpico sera realizar
un segundo experimento. E l objetivo de este segundo experim ento es desarrollar un modelo emprico del
proceso y obtener una estimacin m s precisa de las condiciones de operacin ptimas para el tiem po y la
tem peratura. A este enfoque para la optimizacin de un proceso se le llama la metodologa de superficies
de respuesta, la cual se examina en detalle en el captulo 11. El segundo diseo ilustrado en la figura 1-9 es
un diseo central compuesto, uno de los diseos experim entales ms im portantes que se usan en los estu
dios de optimizacin de procesos.

EJEMPLO 1-3 ..................................................................................................................................


Ilustracin del diseo de un producto
Con frecuencia los m todos de diseo experim ental pueden aplicarse en el proceso de diseo de un pro
ducto. Para ilustrar esto, suponga que un grupo de ingenieros est diseando el gozne de la puerta de un
automvil. La caracterstica de calidad del producto que les interesa es el esfuerzo am ortiguador, es de
cir, la capacidad de retencin del tope que impide que la puerta se cierre cuando el vehculo se estaciona
en una pendiente. El mecanismo am ortiguador consta de un resorte de hojas y un cilindro. Cuando la
p u erta se abre, el cilindro se desplaza por un arco que hace que el resorte de hojas se comprima. Para ce
rrar la puerta es necesario vencer la fuerza del resorte, la cual produce el esfuerzo am ortiguador. El equi
po de ingenieros considera que el esfuerzo am ortiguador es una funcin de los siguientes factores:
1.
2.
3.
4.
5.

La
La
La
La
La

distancia que se desplaza el cilindro.


altura del resorte del pivote a la base.
distancia horizontal del pivote al resorte.
altura libre del resorte auxiliar.
altura libre del resorte principal.

Los ingenieros pueden construir un prototipo del mecanismo del gozne en el que es posible variar to
dos estos factores dentro de ciertos rangos. U na vez que se han identificado los niveles apropiados de es
tos cinco factores, puede disearse un experim ento que conste de varias com binaciones de los niveles de
los factores, y el prototipo del gozne puede probarse con estas combinaciones. Se obtendr as inform a
cin respecto de los factores que tienen u na mayor influencia sobre el esfuerzo am ortiguador del tope y,
m ediante el anlisis de esta informacin, podr m ejorarse el diseo del tope.

1-3

PRINCIPIOS BSICOS

Si quiere llevarse a cabo un experim ento como los descritos en los ejemplos 1-1 al 1-3 con la mayor efi
ciencia posible, es necesario utilizar un enfoque cientfico para planearlo. El diseo estadstico de experi
m entos se refiere al proceso para planear el experim ento de tal form a que se recaben datos adecuados
que puedan analizarse con m todos estadsticos que llevarn a conclusiones vlidas y objetivas. El enfo
que estadstico del diseo experim ental es necesario si se quieren sacar conclusiones significativas de los
datos. C uando el problem a incluye datos que estn sujetos a errores experim entales, la m etodologa esta
dstica es el nico enfoque objetivo de anlisis. Por lo tanto, cualquier problem a experim ental incluye dos

12

CAPTULO 1

INTRODUCCIN

aspectos: el diseo del experim ento y el anlisis estadstico de los datos. Estos dos aspectos se encuentran
ntim am ente relacionados porque el m todo de anlisis depende directam ente del diseo empleado.
Am bos tem as se tratan en este libro.
Los tres principios bsicos del diseo experim ental son la realizacin de rplicas, la aleatorizacin y
la formacin de bloques. Por realizacin de rplicas se entiende la repeticin del experim ento bsico. E n
el experim ento metalrgico analizado en la seccin 1 - 1 , una rplica consistira en el tratam iento de una
m uestra con el tem plado en aceite y el tratam iento de una m uestra con el tem plado en agua salada. Por lo
tanto, si se tratan cinco ejemplares en cada m edio de tem plado, se dice que se han obtenido cinco rpli
cas. La realizacin de rplicas posee dos propiedades im portantes. Prim era, perm ite al experim entador
obtener una estimacin del error experimental. E sta estimacin del error se convierte en una unidad de
m edicin bsica para determ inar si las diferencias observadas en los datos son en realidad estadsticamen
te diferentes. Segunda, si se usa la m edia m uestral (por ejemplo, ) para estim ar el efecto de un factor en
el experim ento, la realizacin de rplicas perm ite al experim entador obtener una estimacin ms precisa
de este efecto. Por ejemplo, si a 2 es la varianza de una observacin individual y hay n rplicas, la varianza
de la m edia m uestral es

L a consecuencia prctica de lo anterior es que si se hicieron n = 1 rplicas y se observ ^ = 145 (tem


plado en aceite) yy2 = 147 (templado en agua salada), probablem ente no podrn hacerse inferencias satis
factorias acerca del efecto del medio de templado; es decir, la diferencia observada podra ser resultado del
error experimental. Por otra parte, si n fue razonablem ente grande y el error experimental fue lo suficiente
m ente pequeo, y se observ j < 2, podra concluirse con una certeza razonable que el templado en agua
salada produce una dureza mayor en esta aleacin de aluminio particular que el templado en aceite.
Hay una diferencia im portante entre rplicas y mediciones repetidas. Por ejemplo, suponga que una
oblea de silicio se graba con un proceso de grabado qumico con plasm a p ara oblea nica, y que se hacen
tres mediciones de una dimensin crtica de esta oblea. Estas mediciones no son rplicas; son una form a
de mediciones repetidas y, en este caso, la variabilidad observada en las tres mediciones repetidas es reflejo
directo de la variabilidad inherente del sistema o instrum ento de medicin. Como otro ejemplo, suponga
que, como parte de un experim ento en la m anufactura de semiconductores, se procesan sim ultneam ente
cuatro obleas en un hom o de oxidacin con una velocidad del flujo de gas y un tiem po particulares y que
se hace despus una medicin del espesor del xido en cada oblea. D e nueva cuenta, la medicin de las
cuatro obleas no son rplicas sino mediciones repetidas. E n este caso reflejan las diferencias entre las
obleas y otras fuentes de variabilidad dentro de esa operacin de horneado particular. En las rplicas se
reflejan las fuentes de variabilidad tanto entre las corridas como (potencialm ente) dentro de las mismas.
La aleatorizacin es la piedra angular en la que se fundam enta el uso de los m todos estadsticos en
el diseo experimental. Por aleatorizacin se entiende que tanto la asignacin del m aterial experimental
como el orden en que se realizarn las corridas o ensayos individuales del experim ento se determ inan al
azar. U no de los requisitos de los m todos estadsticos es que las observaciones (o los errores) sean varia
bles aleatorias con distribuciones independientes. L a aleatorizacin hace p o r lo general que este supues
to sea vlido. L a aleatorizacin correcta del experim ento ayuda tam bin a sacar del prom edio los
efectos de factores extraos que pudieran estar presentes. Por ejemplo, suponga que los ejem plares del
experim ento descrito antes presentan slo ligeras diferencias en el espesor y que la efectividad del medio
de tem plado puede ser afectado por el espesor del ejemplar. Si todos los ejem plares sometidos al tem pla
do en aceite son ms gruesos que los sometidos al tem plado en agua salada, quiz se est introduciendo
un sesgo sistemtico en los resultados experimentales. E ste sesgo estorba en uno de los medios de tem pla

1-4 PAUTAS GENERALES PARA DISEAR EXPERIMENTOS

13

do y, en consecuencia, invalida los resultados obtenidos. Al hacer la asignacin aleatoria de los ejem pla
res al m edio de tem plado este problem a se aligera en parte.
Es muy comn el uso de program as de com putadora para auxiliar a los experim entadores a seleccio
n ar y construir diseos experimentales. Estos program as presentan a m enudo las corridas del diseo ex
perim ental de m anera aleatoria. Por lo general este m odo aleatorio se crea utilizando un generador de
nm eros aleatorios. Incluso con estos program as de com putadora, con frecuencia seguir siendo necesa
rio que el experim entador haga la asignacin del m aterial experim ental (como las obleas en los ejemplos
de sem iconductores mencionados antes), de los operadores, de los instrum entos o herram ientas de m edi
cin, etc., que se utilizarn en el experimento. Puede recurrirse a tablas de nm eros aleatorios para ase
gurar que las asignaciones se hacen al azar.
E n ocasiones los experim entadores se encuentran con situaciones en las que la aleatorizacin de un
aspecto del experimento es complicada. Por ejemplo, en un proceso qumico, la tem peratura puede ser
una variable muy difcil de modificar, haciendo casi imposible la aleatorizacin completa de este factor.
Existen m todos de diseo estadstico para resolver las restricciones sobre la aleatorizacin. Algunos de
estos enfoques se revisarn en captulos subsecuentes (ver en particular el captulo 13).
L a formacin de bloques es una tcnica de diseo que se utiliza para m ejorar la precisin de las com
paraciones que se hacen entre los factores de inters. M uchas veces la form acin de bloques se emplea
para reducir o eliminar la variabilidad transm itida por factores perturbadores; es decir, aquellos factores
que pueden influir en la respuesta experim ental pero en los que no hay un inters especfico. Por ejemplo,
en un experim ento de un proceso qumico pueden requerirse dos lotes de m ateria prim a para realizar to
das las corridas necesarias. Sin embargo, podra haber diferencias entre los lotes debido a la variabilidad
de un proveedor a otro y, en caso de no haber un inters especfico en este efecto, los lotes de m ateria pri
m a se consideraran un factor perturbador. En general, un bloque es un conjunto de condiciones experi
m entales relativam ente homogneas. En el ejemplo del proceso qumico, cada lote de m ateria prim a
form ara un bloque, ya que es de esperarse que la variabilidad dentro de un lote sea m enor que la variabi
lidad entre lotes. D e m anera tpica, cmo en este ejemplo, cada nivel del factor perturbador pasa a ser un
bloque. Entonces el experim entador divide las observaciones del diseo estadstico en grupos que se co
rren en cada bloque. En varias partes del texto se estudia en detalle la form acin de bloques, incluyendo
los captulos 4,5, 7, 8 ,9 ,1 1 y 13. E n el captulo 2, seccin 2-5.1, se presenta un ejem plo sencillo para ilus
trar la estructura bsica de la formacin de bloques.
Los tres principios bsicos del diseo experimental, la aleatorizacin, la realizacin de rplicas y la
form acin de bloques son parte de cada uno de los experimentos. Se ilustrarn y resaltarn repetidam en
te a lo largo de este libro.

1-4

PAUTAS GENERALES PARA DISEAR EXPERIMENTOS

Para aplicar el enfoque estadstico en el diseo y anlisis de un experim ento, es necesario que todos los
que participan en el mismo tengan desde el principio una idea clara de qu es exactam ente lo que va a es
tudiarse, cmo van a colectarse los datos, y al m enos una com prensin cualitativa de la form a en que van a
analizarse estos datos. E n la tabla 1-1 se m uestra un esquem a general del procedim iento recom endado. A
continuacin se presenta una breve explicacin de este esquem a y se elaboran algunos de los puntos cla
ve. Para mayores detalles, ver Colem an y M ontgomery [27], as como las referencias al final del libro.
Tambin es til el m aterial com plem entario para este captulo.
1. Identificacin y enunciacin del problema. Este punto podra parecer muy obvio, pero es comn que
en la prctica no sea sencillo darse cuenta de que existe un problem a que requiere experimentacin, y

14

CAPTULO 1 INTRODUCCIN
Tabla 1-1

Pautas generales para disear un experimento

1. Identificacin y exposicin del problema.


2. Eleccin de los factores, los niveles y los rangos.
3. Seleccin de la variable de respuesta.
4. Eleccin del diseo experimental.
5. Realizacin del experimento.
6 . Anlisis estadstico de los datos.
7. Conclusiones y recomendaciones.

] al experimento

Planeacin previa

En la prctica, los pasos 2 y 3 suelen hacerse simultneamente o en el orden inverso.

tam poco es fcil desarrollar una enunciacin clara, con la que todos estn de acuerdo, de este problema.
Es necesario desarrollar todas las ideas acerca de los objetivos del experim ento. G eneralm ente, es im por
tante solicitar aportaciones de todas las reas involucradas: ingeniera, aseguram iento de calidad, m anu
factura, m ercadotecnia, administracin, el cliente y el personal de operacin (el cual por lo general
conoce a fondo el proceso y al que con dem asiada frecuencia se ignora). P or esta razn, se recom ienda un
enfoque de equipo para disear experimentos.
E n la mayora de los casos es conveniente hacer una lista de los problem as o las preguntas especficas
que van a abordarse en el experim ento. U na enunciacin clara del problem a contribuye sustancialm ente
a m enudo para alcanzar una m ejor com prensin de los fenmenos bajo estudio y la solucin final del p ro
blema. Thmbin es im portante tener presente el objetivo global; por ejemplo, se trata de un proceso o
sistema nuevo (en cuyo caso el objetivo inicial posiblem ente ser la caracterizacin o tam izado de los fac
tores) o se trata de un sistema m aduro que se conoce con profundidad razonable y que se ha caracterizado
con anterioridad (en cuyo caso el objetivo puede ser la optimizacin)? E n un experim ento puede haber
muchos objetivos posibles, incluyendo la confirmacin (el sistema se com porta de la misma m anera aho
ra que en el pasado?), el descubrimiento (qu ocurre si se exploran nuevos m ateriales, variables, condi
ciones de operacin, etc.?) y la estabilidad (bajo qu condiciones las Variables de respuesta de inters
sufren una degradacin seria?). Obviam ente, las cuestiones especficas que habrn de abordarse en el ex
perim ento se relacionan de m anera directa con los objetivos globales. Con frecuencia en esta etapa de la
form ulacin del problem a muchos ingenieros y cientficos se percatan de que no es posible que un experi
m ento comprensivo extenso responda las cuestiones clave y de que un enfoque secuencial en el que se uti
lice una serie de experim entos ms pequeos es una estrategia ms adecuada.
2. Eleccin de los factores, los niveles y los rangos. (Como se indica en la tabla 1-1, los pasos 2 y 3 m u
chas veces se hacen sim ultneam ente o en orden inverso.) Cuando se consideran los factores que pueden
influir en el desempeo de un proceso o sistema, el experim entador suele descubrir que estos factores
pueden clasificarse como factores potenciales del diseo o bien como factores perturbadores. Los facto
res potenciales del diseo son aquellos que el experim entador posiblem ente quiera hacer variar en el ex
perim ento. Es frecuente encontrar que hay muchos factores potenciales del diseo, por lo que es
conveniente contar con alguna clasificacin adicional de los mismos. Algunas clasificaciones tiles son
factores del diseo, factores que se mantienen constantes y factores a los que se permite variar. Los facto
res del diseo son los que se seleccionan realm ente para estudiarlos en el experim ento. Los factores que
se m antienen constantes son variables que pueden tener cierto efecto sobre la respuesta, pero que para
los fines del experim ento en curso no son de inters, por lo que se m antendrn fijos en un nivel especfico.
Por ejemplo, en un experim ento de grabado qumico en la industria de los sem iconductores puede haber
un efecto, que es nico, de la herram ienta especfica para el grabado qumico con plasma que se utiliza en
el experim ento. Sin embargo, sera muy difcil variar este factor en un experim ento, por lo que el experi
m entador puede decidir llevar a cabo todas las corridas experimentales en un grabador qumico particu
lar (idealm ente tpico). D e este modo, este factor se m antiene constante. Como un ejemplo de factores

1-4 PAUTAS GENERALES PARA DISEAR EXPERIMENTOS

15

a los que se perm ite variar, las unidades experim entales o los m ateriales a los que se aplican los factores
del diseo no son hom ogneos por lo general, no obstante lo cual con frecuencia se ignora esta variabili
dad de una unidad a otra y se confa en la aleatorizacin para com pensar cualquier efecto del m aterial o la
unidad experimental. M uchas veces se trabajar con el supuesto de que los efectos de los factores que se
m antienen constantes y de los factores a los que se perm ite variar son relativam ente pequeos.
Por otra parte, los factores perturbadores pueden tener efectos considerables que deben tomarse en
consideracin, a pesar de que no haya inters en ellos en el contexto del experimento en curso. Los factores
perturbadores suelen clasificarse como factores controlables, no controlables o de ruido. U n factor pertur
bador controlable es aquel cuyos niveles pueden ser ajustados por el experimentador. Por ejemplo, el expe
rim entador puede seleccionar lotes diferentes de m ateria prim a o diversos das de la semana para conducir
el experimento. L a estructura bsica de la formacin de bloques, com entada en la seccin anterior, suele ser
til para trabajar con factores perturbadores controlables. Si un factor perturbador no es controlable en el
experimento, pero puede medirse, muchas veces puede usarse el procedim iento de anlisis denominado
anlisis de covarianza para compensar este efecto. Por ejemplo, la hum edad relativa en el medio ambiente
del proceso puede afectar el desempeo del proceso, y si la hum edad no puede controlarse, probablem ente
podr medirse y tratarse como una covariable. Cuando un factor que vara de m anera natural y no controla
ble en el proceso puede controlarse para los fines de un experimento, con frecuencia se le llama factor de
ruido. E n tales situaciones, es comn que el objetivo sea encontrar los ajustes de los factores controlables
del diseo que minimicen la variabilidad transm itida por los factores de ruido. E n ocasiones a esto se le lla
m a el estudio de robustez del proceso o el problema de robustez del diseo. L a formacin de bloques, el
anlisis de covarianza y los estudios de robustez del proceso se comentan ms adelante.
U na vez que el experimentador ha seleccionado los factores del diseo, debe elegir los rangos en los
que har variar estos factores, as como los niveles especficos con los que se realizarn las corridas. Tam
bin deber pensarse cmo van a controlarse estos factores en los valores deseados y cmo van a medirse.
Por ejemplo, en el experimento de la soldadura lquida, el ingeniero ha definido 12 variables que pueden
afectar la ocurrencia de defectos de soldadura. El ingeniero tam bin tendr que tom ar una decisin en
cuanto a la regin de inters p ara cada variable (es decir, el rango en el que se h ar variar cada factor) y
en cuanto al nm ero de niveles de cada variable que usar. Para ello se requiere del conocimiento del proce
so. Este conocimiento del proceso suele ser una combinacin de experiencia prctica y conocimientos teri
cos. Es im portante investigar todos los factores que pueden ser de im portancia y no dejarse influir
demasiado por la experiencia pasada, en particular cuando uno se encuentra en las fases iniciales de la expe
rimentacin o cuando el proceso no est del todo maduro.
Cuando el objetivo del experimento es el tamizado de los factores o caracterizacin del proceso, por lo
general es mejor m antener reducido el nm ero de niveles de los factores. En general, dos niveles funcionan
bastante bien en los estudios de tamizado de factores. Elegir la regin de inters tambin es importante. En el
tamizado de factores, la regin de inters deber ser relativamente grande; es decir, el rango en el que se ha
cen variar los factores deber ser amplio. Conforme se sepa ms acerca de las variables que son importantes y
de los niveles que producen los mejores resultados, la regin de inters se har por lo general ms estrecha.
3. Seleccin de la variable de respuesta. Para seleccionar la variable de respuesta, el experimentador de
ber tener la certeza de que esta variable proporciona en realidad informacin til acerca del proceso bajo
estudio. En la mayora de los casos, el prom edio o la desviacin estndar (o ambos) de la caracterstica m e
dida ser la variable de respuesta. No son la excepcin las respuestas mltiples. L a eficiencia de los instru
m entos de medicin (o error de medicin) tam bin es un factor im portante. Si la eficiencia de los
instrum entos de medicin es inadecuada, el experimentador slo detectar los efectos relativamente gran
des de los factores o quiz sean necesarias rplicas adicionales. En algunas situaciones en que la eficiencia
de los instrum entos de medicin es pobre, el experim entador puede decidir m edir varias veces cada unidad

16

CAPTULO 1

INTRODUCCIN

experimental y usar el promedio de las mediciones repetidas como respuesta observada. Suele ser de impor
tancia determinante identificar los aspectos relacionados con la definicin de las respuestas de inters y cmo
van a medirse antes de llevar a cabo el experimento. En ocasiones se emplean experimentos diseados para
estudiar y mejorar el desempeo de los sistemas de medicin. Para un ejemplo, ver el captulo 12.
Se reitera lo crucial que es exponer todos los puntos de vista y la inform acin del proceso en los pasos
1 al 3 anteriores. Se hace referencia a esto como planeacin previa al experimento. Colem an y M ontgo
m ery [27] proporcionan hojas de trabajo que pueden ser tiles en la planeacin previa al experimento.
V ase tam bin la inform acin com plem entaria del texto para ms detalles y un ejemplo del uso de estas
hojas de trabajo. E n muchas situaciones, no es posible que una sola persona posea todos los conocimien
tos requeridos para hacer esto adecuadam ente. Por lo tanto, se hace una amplia recom endacin para el
trabajo en equipo durante la planeacin del experimento. L a mayor parte del xito gravitar en tom o a
qu tan bien se haya hecho la planeacin previa del experimento.
4. Eleccin del diseo experimental. Si las actividades de planeacin previas al experim ento se realizan
como es debido, este paso es relativam ente sencillo. L a eleccin del diseo implica la consideracin del
tam ao de la m uestra (nm ero de rplicas), la seleccin de un orden de corridas adecuado para los ensa
yos experimentales y la determ inacin de si entran en juego o no la form acin de bloques u otras restric
ciones sobre la aleatorizacin. E n este libro se revisan algunos de los tipos ms im portantes de diseos
experimentales, y puede usarse en ltim a instancia como un catlogo para seleccionar el diseo experi
m ental apropiado para una amplia variedad de problemas.
Existen tam bin varios paquetes interactivos de software de estadstica que soportan esta fase del di
seo experimental. El experim entador puede introducir la inform acin del nm ero de factores, los nive
les y los rangos, y estos program as presentarn a la consideracin del experim entador una seleccin de
diseos o recom endarn un diseo particular. (Nosotros preferim os ver varias alternativas en lugar de
confiar en la recom endacin de la com putadora en la mayora de los casos.) Estos program as proporcio
nan tam bin por lo general una hoja de trabajo (con el orden aleatorizado de las corridas) que se usar en
la conduccin del experimento.
Al seleccionar el diseo, es im portante tener en m ente los objetivos experimentales. E n muchos ex
perim entos de ingeniera se sabe de antem ano que algunos de los niveles de los factores producirn valo
res diferentes de la respuesta. E n consecuencia, el inters se centra en identificar qu factores causan esta
diferencia y en estim ar la magnitud del cambio de la respuesta. En otras situaciones podra haber ms in
ters en verificar la uniformidad. Por ejemplo, pueden com pararse dos condiciones de produccin A y B,
donde A es el estndar y B es una alternativa con una eficiencia de costos mayor. El experim entador esta
r interesado entonces en dem ostrar que, por ejemplo, no hay ninguna diferencia en el rendim iento entre
las dos condiciones.
5. Realizacin del experimento. Cuando se lleva a cabo el experimento es vital m onitorear con atencin el
proceso a fin de asegurarse de que todo se est haciendo conforme a la planeacin. Los errores en el proce
dimiento experimental en esta etapa destruirn por lo general la validez experimental. Poner en un prim er
plano la planeacin es crucial para el xito. Es fcil subestimar los aspectos de logstica y planeacin cuando
se corre un experimento diseado en un ambiente complejo de m anufactura o de investigacin y desarrollo.
Colem an y M ontgomery [27] sugieren que antes de llevar a cabo el experim ento, es conveniente en
m uchas ocasiones realizar algunas corridas piloto o de prueba. Estas corridas proporcionan inform a
cin acerca de la consistencia del m aterial experim ental, u na com probacin del sistem a de m edicin,
una idea aproxim ada del error experim ental y la oportunidad de poner en prctica la tcnica experi
m ental global. E sto ofrece tam bin u n a oportunidad para revisar, de ser necesario, las decisiones tom a
das en los pasos 1 al 4.

1-5 BREVE HISTORIA DEL DISEO ESTADSTICO

17

6. Anlisis estadstico de los datos. D ebern usarse m todos estadsticos para analizar los datos a fin de
que los resultados y las conclusiones sean objetivos y no de carcter apreciativo. Si el experim ento se ha
diseado correctam ente y si se ha llevado a cabo de acuerdo con el diseo, los m todos estadsticos nece
sarios no deben ser complicados. Existen varios paquetes de software excelentes diseados para auxiliar
en el anlisis de datos, y muchos de los program as usados en el paso 4 para seleccionar el diseo cuentan
con una interfase directa para el anlisis estadstico. Con frecuencia se encuentra que los m todos grfi
cos simples desem pean un papel im portante en el anlisis e interpretacin de datos. D ebido a que m u
chas de las preguntas que el experim entador quiere responder pueden insertarse en el m arco de la prueba
de hiptesis, los procedim ientos para probar hiptesis y estim ar intervalos de confianza son muy tiles en
el anlisis de datos de un experim ento diseado. Muchas veces es muy til tam bin presentar los resulta
dos de varios experimentos en trm inos de un modelo emprico, es decir, m ediante una ecuacin derivada
de los datos que expresa la relacin entre la respuesta y los factores im portantes del diseo. El anlisis re
sidual y la verificacin de la adecuacin del modelo son tam bin tcnicas de anlisis im portantes. Ms
adelante se revisarn en detalle estos temas.
Recuerde que los m todos estadsticos no pueden dem ostrar que un factor (o factores) posee un
efecto particular, slo proporcionan pautas generales en cuanto a la confiabilidad y la validez de los resul
tados. Aplicados en form a correcta, los m todos estadsticos no perm iten la dem ostracin experim ental
de nada, pero s sirven para m edir el erro r posible en una conclusin o asignar un nivel de confianza a un
enunciado. L a ventaja principal de los m todos estadsticos es que agregan objetividad al proceso de
tom a de decisiones. Las tcnicas estadsticas, aunadas a una buena ingeniera o conocim iento del proceso
y el sentido comn, llevarn por lo general a conclusiones slidas.
7. Conclusiones y recomendaciones. U na vez que se han analizado los datos, el experimentador debe sacar
conclusiones prcticas acerca de los resultados y recom endar un curso de accin. Los mtodos grficos sue
len ser tiles en esta etapa, en particular para presentar los resultados. Tmbin debern realizarse corridas
de seguimiento o pruebas de confirmacin para validar las conclusiones del experimento.
A lo largo del proceso completo es im portante tener presente que la experim entacin es una parte
esencial del proceso de aprendizaje, en la que se form ulan hiptesis tentativas acerca de un sistema, se
realizan experimentos para investigar estas hiptesis y se form ulan nuevas hiptesis con base en los resul
tados, y as sucesivamente. Esto sugiere que la experim entacin es iterativa. Por lo general es un gran
error disear un solo experim ento comprensivo y extenso al principio de un estudio. U n experim ento exi
toso requiere conocer los factores im portantes, los rangos en los que debern hacerse variar estos facto
res, el nm ero apropiado de niveles que debern usarse y las unidades de m edicin apropiadas para estas
variables. E n general, no se conocen las respuestas precisas de estas cuestiones, pero se aprende acerca de
ellas sobre la marcha. A m edida que avanza un program a experimental, es com n abandonar algunas va
riables de entrada e incorporar otras, modificar la regin de exploracin de algunos factores o incorporar
nuevas variables de respuesta. Por consiguiente, generalm ente la experim entacin se hace en form a secuencial y, como regla general, no deber invertirse ms de 25% de los recursos disponibles en el prim er
experimento. Con esto se asegurar que se contar con los recursos suficientes para realizar las corridas
de confirmacin y que se alcanzar en ltim a instancia el objetivo final del experimento.

1-5

BREVE HISTORIA DEL DISEO ESTADSTICO

H a habido cuatro eras del desarrollo m oderno del diseo experimental estadstico. La era agrcola fue
encabezada por el trabajo pionero de Sir R onald A. Fisher en los aos 1920 y principios de la dcada de
1930. E n este periodo, Fisher fue el responsable de las estadsticas y el anlisis de datos en la Estacin

18

CAPTULO 1

INTRODUCCIN

A grcola Experim ental de R otham sted en las cercanas de Londres, Inglaterra. Fisher se percat de que
las fallas en la form a en que se llevaba a cabo el experim ento que generaba los datos obstaculizaban con
frecuencia el anlisis de los datos de los sistemas (en este caso sistemas agrcolas). M ediante la interac
cin con mltiples cientficos e investigadores de diversos campos, Fisher desarroll las ideas que lleva
ron a los tres principios bsicos del diseo experim ental que se revisan en la seccin 1-3: la aleatorizacin,
la realizacin de rplicas y la form acin de bloques. Fisher incorpor de m anera sistem tica pl pensa
m iento y los principios estadsticos en el diseo de las investigaciones experim entales, incluyendo el con
cepto de diseo factorial y el anlisis de varianza. Sus libros [44a, b] tuvieron profunda influencia en el uso
de la estadstica, particularm ente en la agricultura y las ciencias biolgicas relacionadas. P ara una exce
lente biografa de Fisher, ver Box [21].
Si bien es cierto que la aplicacin del diseo estadstico en ambientes industriales se inici en la dca
da de 1930, el catalizador de la segunda era, o era industrial, fue el desarrollo de la m etodologa de super
ficies de respuesta (M SR) por parte de Box y Wilson [20]. Estos autores se percataron y explotaron el
hecho de que muchos experim entos industriales son fundam entalm ente diferentes de sus contrapartes
agrcolas en dos sentidos: 1 ) la variable de respuesta puede observarse por lo general (casi) de inm ediato,
y 2 ) el experim entador puede obtener pronto inform acin crucial de un pequeo grupo de corridas que
puede usarse para planear el siguiente experim ento. Box [12f] denom ina inmediatez y secuencialidad a es
tas dos caractersticas de los experim entos industriales. En los 30 aos siguientes, la M SR y otras tcnicas
de diseo se generalizaron en las industrias qumica y de proceso, sobre todo en el trabajo de investiga
cin y desarrollo. George Box fue el lder intelectual de este movimiento. Sin embargo, la aplicacin del
diseo estadstico a nivel de plantas o procesos de m anufactura todava no estaba muy generalizada.
Algunas de las razones de ello incluyen la capacitacin inadecuada de ingenieros y otros especialistas en
procesos en los conceptos y los m todos estadsticos bsicos, as como la falta de recursos de com putacin
y software de estadstica que fueran fciles de usar para apoyar la aplicacin de experim entos diseados
estadsticam ente.
El inters creciente de la industria occidental en l m ejoram iento de calidad que empez a fines de la
dcada de 1970 anunci la tercera era del diseo estadstico. El trabajo de Genichi Tkguchi (Ikguchi y Wu
[109], Kackar [62] y lguchi [108a, b]) tuvo un impacto significativo en el aum ento del inters y el uso de
los experim entos diseados. Taguchi propugnaba por el uso de experim entos diseados para lo que deno
m in el diseo param trico robusto, es decir,
1.

H acer procesos insensibles a los factores am bientales o de o tra ndole que son difciles de con
trolar.
2. Fabricar productos insensibles a la variacin transm itida por los componentes.
3. Encontrar los niveles de las variables del proceso que obliguen a la m edia a un valor deseado
m ientras que al mismo tiem po se reduzca la variabilidad en to m o a este valor.
Taguchi propuso diseos factoriales altam ente fraccionados y otros arreglos ortogonales junto con algu
nos m todos estadsticos nuevos para resolver estos problemas. L a m etodologa resultante gener m u
chas discusiones y controversias. Parte de la controversia surgi porque en Occidente la m etodologa de
Tguchi fue defendida al principio (y sobre todo) por empresarios, y no se haba hecho la revisin escruta
d ora adecuada de la ciencia estadstica fundam ental. Para fines de la dcada de 1980, los resultados de
esta revisin indicaron que aun cuando los conceptos y los objetivos enfocados en la ingeniera de Tguchi
tenan bases slidas, existan problem as sustanciales con su estrategia experim ental y sus m todos para el
anlisis de los datos. Para detalles especficos de estas cuestiones, ver Box [12d], Box, Bisgaard y Fung
[14], H u n ter [59a, b], Myers y M ontgom ery [85a] y Pignatiello y Ram berg [94]. G ran parte de estas preo-

1-6 RESUMEN: USO DE TCNICAS ESTADSTICAS EN LA EXPERIMENTACIN

19

cupaciones se resum en tam bin en el amplio panel de discusin del nm ero de mayo de 1992 de Techno*
metrics (ver Nair, et al. [8 6 ]).
H ubo al m enos tres resultados positivos de la controversia desatada por Taguchi. Prim ero, el uso de
los experim entos diseados se hizo ms generalizado en las industrias con piezas discretas, incluyendo la
industria de m anufacturas autom otrices y aeroespaciales, de electrnica y sem iconductores, y muchas
otras, que anteriorm ente hacan poco uso de esta tcnica. Segundo, se inici la cuarta era del diseo esta
dstico. E sta era h a incluido un renovado inters general tanto por parte de investigadores como de profe
sionales en ejercicio en el diseo estadstico y el desarrollo de varios enfoques nuevos y tiles para los
problem as experim entales en el m undo industrial, incluyendo alternativas a los m todos tcnicos de Tguchi que perm iten que sus conceptos de ingeniera se lleven a la prctica de m anera eficaz y eficiente.
Algunas de estas alternativas se revisarn e ilustrarn en captulos subsecuentes, en particular en el cap
tulo 11. Tercero, la educacin formal en diseo experimental estadstico se est haciendo parte de los p ro
gramas de ingeniera en las universidades, tanto a nivel de licenciatura como de posgrado. La integracin
exitosa de una buena prctica del diseo experim ental en la ingeniera y las ciencias es un factor clave en
la competitividad industrial futura.

1-6

RESUMEN: USO DE TCNICAS ESTADSTICAS EN LA


EXPERIMENTACIN

G ran p arte de la investigacin en la ingeniera, las ciencias y la industria es em prica y hace un uso extensi
vo de la experimentacin. Los m todos estadsticos pueden increm entar en gran m edida la eficiencia de
estos experim entos y con frecuencia pueden fortalecer las conclusiones as obtenidas. El uso correcto de
las tcnicas estadsticas en la experim entacin requiere que el experim entador tenga presentes los puntos
siguientes:
1. Uso de conocimientos no estadsticos del problema. Los experim entadores suelen poseer amplios co
nocim ientos de sus respectivos campos. Por ejemplo, un ingeniero civil que trabaja en un problem a de hi
drologa cuenta de m anera tpica con considerable experiencia prctica y capacitacin acadmica formal
en esta rea. E n algunos campos existe un cuerpo enorm e de teora fsica en el cual indagar para explicar
las relaciones entre los factores y las respuestas. Este tipo de conocimientos no estadsticos es invaluable
para elegir los factores, determ inar los niveles de los factores, decidir cuntas rplicas correr, interpretar
los resultados del anlisis, etc. El uso de la estadstica no es sustituto de la reflexin sobre el problema.
2. Mantener el diseo y el anlisis tan simple como sea posible. Es necesario no exagerar en el uso de
tcnicas estadsticas complejas y sofisticadas. Los m todos de diseo y anlisis relativam ente simples son
siem pre los mejores. E n este punto cabe hacer hincapi nuevam ente en el paso 4 del procedim iento reco
m endado en la seccin 1-4, S un diseo se hace de m anera cuidadosa y correcta, el anlisis casi siempre
ser relativam ente directo. Sin embargo, si el diseo se estropea grandem ente por ineptitud, no es posible
que incluso la estadstica ms compleja y elegante salve la situacin.
3. Tener presente la diferencia entre significacin prctica y significacin estadstica. D ebido justam en
te a que dos condiciones experim entales producen respuestas m edias que son estadsticam ente diferen
tes, no existe ninguna seguridad de que esta diferencia sea de la magnitud suficiente como para tener
algn valor prctico. Por ejemplo, un ingeniero puede determ inar que una modificacin en el sistema de
inyeccin de combustible de u n automvil puede producir un m ejoram iento prom edio real en el rendi
m iento del combustible de 0.1 mi/gal. ste es un resultado estadsticam ente significativo. Sin embargo, si

20

CAPTULO 1

INTRODUCCIN

el costo de la modificacin es de $ 1 0 0 0 , la diferencia de 0 .1 mi/gal probablem ente ser muy pequea para
poseer algn valor prctico.
4. Los experimentos son generalmente iterativos. R ecuerde que en la m ayora de las situaciones no es
conveniente disear un experim ento dem asiado comprensivo al principio de un estudio. U n diseo exito
so requiere conocer los factores im portantes, los rangos en los que estos factores se harn variar, el nm e
ro apropiado de niveles para cada factor y los m todos y las unidades de m edicin adecuados para cada
factor y respuesta. E n general, ningn experim entador est en posicin de responder estas cuestiones al
principio del experimento, sino que las respuestas aparecen sobre la marcha. Esto habla en favor del en
foque iterativo o secuencial analizado anteriorm ente. D esde luego, hay situaciones en las que un experi
m ento comprensivo es totalm ente apropiado pero, como regla general, la mayora de los experimentos
debern ser iterativos. Por consiguiente, no deber invertirse ms de 25% de los recursos para la experi
m entacin (corridas, presupuesto, tiem po, etc.) en el experim ento inicial. Con frecuencia estos esfuerzos
iniciales constituyen slo experiencias de aprendizaje, y es necesario contar con recursos suficientes para
alcanzar los objetivos finales del experimento.

Experimentos______
comparativos simples

E n este captulo se examinan los experim entos para com parar dos condiciones (llamadas en ocasiones
tratam ientos), a las cuales es comn denom inar experim entos com parativos simples. Se empieza con el
ejem plo de un experim ento que se realiza para determ inar si dos formulaciones diferentes de un produc
to producen resultados equivalentes. E l estudio lleva a revisar varios conceptos bsicos de la estadstica,
como variables aleatorias, distribuciones de probabilidad, m uestras aleatorias, distribuciones de muestreo y pruebas de hiptesis.

2*1

INTRODUCCIN

L a fuerza de la tensin de adhesin del mortero de cemento portland es una caracterstica importante del
producto. Un ingeniero est interesado en comparar la fuerza de una formulacin modificada en la que se han
agregado emulsiones de ltex de polmeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reunido 1 0 observaciones de la fuerza de la formulacin modificada y otras 1 0 observacio
nes de la formulacin sin modificar. Los datos se m uestran en la tabla 2-1. Podra hacerse referencia a las dos
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones.
En la figura 2-1 se grafican los datos de este experimento. A esta representacin se le llama diagram a
de puntos. D el examen visual de estos datos se obtiene la im presin inm ediata de que la fuerza del m orte
ro sin modificar es mayor que la fuerza del m ortero modificado. E sta im presin se confirma al com parar
las fuerzas de la tensin de adhesin prom edio,yl = 16.76 kgf/cm 2 para el m ortero modificado y y 2 = 17.92
kgf/cm 2 para el m ortero sin modificar. Las fuerzas de la tensin de adhesin prom edio de estas dos m ues
tras difieren en lo que parece ser una cantidad no trivial. Sin embargo, no es evidente que esta diferencia
sea de la m agnitud suficiente para implicar que las dos formulaciones son en realidad diferentes. Quizs
esta diferencia observada en las fuerzas prom edio sea el resultado de fluctuaciones del m uestreo y las dos
formulaciones sean idnticas en realidad. Posiblemente otras dos m uestras produzcan el resultado con
trario, con la fuerza del m ortero modificado excediendo la de la form ulacin sin modificar.
Puede usarse una tcnica de la inferencia estadstica llam ada prueba de hiptesis (algunos autores
prefieren el trm ino prueba de significacin) para auxiliar al experim entador en la com paracin de estas

21

22

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

Tabla 2-1 Datos de la fuerza de la tensin de


adhesin del experimento de la
formulacin del cemento portland

Mortero
modificado

Mortero sin
modificar

yy
16.85
16.40
17.21
16.35
16.52
17.04
16.96
17.15
16.59
16.57

y*
17.50
17.63
18.25
18.00
17.86
17.75
18.22
17.90
17.96
18.15

J
1
2

3
4
5
6

7
8

9
10

dos formulaciones. La prueba de hiptesis perm ite que la com paracin de las dos formulaciones se haga
en trm inos objetivos, con el conocimiento de los riesgos asociados si se llega a una conclusin equivoca
da. A ntes de presentar los procedim ientos de la prueba de hiptesis en experim entos comparativos sim
ples, se har una breve revisin de algunos conceptos elem entales de la estadstica.

2-2

CONCEPTOS ESTADSTICOS BSICOS

A cada una de las observaciones del experim ento del cem ento portland citado anteriorm ente se le llama
ra u n a corrida. Observe que las corridas individuales difieren, por lo que existen fluctuaciones, o ruido,
en los resultados. Es com n llam ar a este ruido el error experimental o sim plem ente el error. Se trata de
un error estadstico, lo cual significa que se origina p o r la variacin que no est bajo control y que gene
ralm ente es inevitable. L a presencia del erro r o ruido implica que la variable de respuesta, la fuerza de la
tensin de adhesin, es una variable aleatoria. U na variable aleatoria puede ser discreta o continua. Si el
conjunto de todos los valores posibles de la variable aleatoria es finito o contablem ente infinito, entonces
la variable aleatoria es discreta, m ientras que si el conjunto de todos los valores posibles de la variable
aleatoria es un intervalo, entonces la variable aleatoria es continua.

Descripcin grfica de la variabilidad


Es frecuente usar m todos grficos simples como ayuda para analizar los datos de un experimento. El
diagrama de puntos, ilustrado en la figura 2 - 1 , es un recurso muy til para representar un cuerpo reduci
do de datos (digamos hasta unas 20 observaciones). El diagram a de puntos le perm ite al experim entador
ver de inm ediato la localizacin o tendencia central de las observaciones y su dispersin. Por ejemplo, en
el experim ento de la fuerza de tensin de adhesin del cemento portland, el diagram a de puntos revela

o
15

16

OQoqjft Peo
,18

17

19

20

Fuerza

(kgf/cm2)
l - 16.76

Figura 2-1

p2 17.92

- Mortero modificado
o = Mortero sin modificar

Diagrama de puntos de los datos de la fuerza de la tensin de adhesin de la tabla 2-1.

2-2 CONCEPTOS ESTADSTICOS BSICOS

.1

0.15 -

30 -

0.10

20

0.05

10

23

g0

,S

0.00

T T m
65

70

75

80

i
85

Recuperacin de metal (rendimiento)

Figura 2-2 Histograma de 200 observaciones de la recuperacin de metal (rendimiento) en


un proceso de fundicin.

que probablem ente las dos formulaciones difieran en la fuerza prom edio, pero que ambas producen
aproxim adam ente la misma variacin en la fuerza.
C uando los datos son muy num erosos, es difcil distinguir las observaciones graficadas en un diagra
m a de puntos, y en tal caso sera preferible un histograma. E n la figura 2-2 se presenta el histogram a de
200 observaciones de la recuperacin de m etal (o rendim iento) en un proceso de fundicin. El histogra
m a m uestra la tendencia central, la dispersin y la form a general de la distribucin de los datos. R ecuerde
que un histogram a se construye dividiendo el eje horizontal en intervalos (generalm ente de longitud
igual) y trazando un rectngulo sobre el intervaloy-simo con el rea del rectngulo proporcional a n, el
nm ero de observaciones incluidas en ese intervalo.
E l diagram a de caja (o diagram a de c^ja y bigotes) es una m anera muy til de representar grfica
m ente los datos. E n un diagram a de caja se m uestra el mnimo, el mximo, los cuartiles inferior y superior
(el percentil 25 y el percentil 75, respectivam ente) y la m ediana (el percentil 50) en una caja rectangular
alineada horizontal o verticalmente. L a caja se extiende del cuartil inferior al cuartil superior y se traza
u na lnea por la m ediana que atraviesa la caja. Se trazan dos lneas (o bigotes) que se extienden de los ex
trem os de la caja hasta (de m anera tpica) los valores mnimo y mximo. (Existen diversas variantes de los
diagramas de caja que tienen reglas diferentes para denotar los puntos m ustrales extremos. Ver M ontgo
m ery y Runger [83d] para ms detalles.)
E n la figura 2-3 se m uestran los diagram as de caja de las dos m uestras de la fuerza de la tensin de
adhesin en el experim ento del m ortero de cem ento portland. E n esta representacin se revela con toda
claridad la diferencia en la fuerza prom edio entre las dos formulaciones. Indica asimismo que ambas for
m ulaciones producen distribuciones de la fuerza razonablem ente simtricas con una variabilidad o dis
persin similar.
Los diagramas de puntos, los histogram as y los diagramas de caja son tiles para resum ir la inform a
cin de una m uestra de datos. Para describir con mayor detalle las observaciones que podran presentarse
en una m uestra, se usa el concepto de distribucin de probabilidad.
Distribuciones de probabilidad

La estructura de la probabilidad de una variable aleatoria, por ejemplo y, se describe mediante su distri
bucin de probabilidad. Cuando y es discreta, es comn hacer referencia a su distribucin de probabili-

24

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES


Diagramas de caja y bigotes

18.4

-S

16.4
16
Modificado
Sin modificar
Formulacin del mortero

Figura 2-3 Diagramas de caja del experimento de la fuerza de la ten


sin de adhesin del cemento portland.

dad, p or ejemplo p(y), como la funcin de probabilidad de y. Cuando y es continua, es com n hacer
referencia a su distribucin de probabilidad, p or ejem plo/(y), como la funcin de densidad de probabili
dad de y.
E n la figura 2-4 se ilustran dos distribuciones de probabilidad hipotticas, una discreta y la otra conti
nua. Observe que en la distribucin de probabilidad discreta es la altura de la funcinp(y) la que repre
senta la probabilidad, m ientras que en el caso continuo, es el rea bajo la curva f(y) asociada con un

P(y nyj) mp(yj)

a.

J2

^3

y*

3*5

ye

?7

ya

*9

*1 1

y io

y i3

y 12

>14

a) Una distribucin discreta

b) Una distribucin continua


Figura 2-4

Distribuciones de probabilidad discreta y continua.

25

2-2 CONCEPTOS ESTADSTICOS BSICOS

intervalo dado la que representa la probabilidad. U n resum en cuantitativo de las propiedades de las dis
tribuciones de probabilidad sera el siguiente:
0 < p(yj ) <
P ( y = y) = p(y j )

y discreta:

todos los valores d e y


todos los valores de y

2 fW-i

todos los
valores de y

y continua:

o * f (y)
P{a<y<b)= f B
b f(y)dy
.J (y )d y = i

Media, varianza y valores esperados


L a m edia, fi, de una distribucin de probabilidad es una m edida de su tendencia central o localizacin.
M atem ticam ente, la m edia se define como

/* =

y f ( y ) dy

y continua

^yp(y)

y discreta

(2-1)

toda y

L a m edia tam bin puede expresarse en trm inos del valor esperado o valor prom edio a la larga de la va
riable aleatoria y como
/
fi = (>-) =

yf(y)dy

^yp(y)

y continua
y discreta

(2-2)

toda y

donde E denota el operador del valor esperado.


L a variabilidad o dispersin de una distribucin de probabilidad puede m edirse con la varianza, la
cual se define como

o2=

/ : ( y - n ) 2f ( y ) d y

y continua

Y j { y - f i f p{y)

y discreta

(2-3)

toda y

Observe que la varianza puede expresarse exclusivamente en trm inos del valor esperado debido a que
a 2 = [(> > - n f ]

(2-4)

Por ltim o, el uso de la varianza es tan frecuente que resulta conveniente definir un operador de la va
rian za V tal que
V ( y ) = E \ ( y - n ) l ]= o 2

(2-5)

26

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

Los conceptos de valor esperado y varianza se usan constantem ente a lo largo de este libro, y puede
ser til revisar varios resultados elem entales relacionados con estos operadores. Si_y es una variable alea
toria con m edia fi y varianza o2 y c es una constante, entonces
1.
2.

E{c)=c
E(y) =

3.
4.

E(cy) = cE( y ) = cfi


V(c)= 0

5.

V (y)= a2

6.

K(cy) = c 2F (y ) =

c 2o 2

Si
hay dos variables aleatorias, por ejem plo,y 1c o n E ^ ) = fi1y V(y}) = a \ yy 2con E (y2) p 2 y F(y2) =
c 2, se tiene

7.

JE(y1+ y 2) = ( y 1)+(^2) = /Ul+/i2

Es posible dem ostrar que


/ (3;i+ 3 ;2) = ^ ( > 'i ) + ^ ( 3'2 ) + 2 C o v (^ , y 2)
donde
C o v (^ , y 2 ) = [ ( ^ - / / x)(y 2 - f i 2 )]

( 2 -6 )

es la covarianza de las variables aleatorias .yj y y 2- L a covarianza es una m edida de la asociacin lineal en
tre J i y y 2 - Ms especficamente, puede dem ostrarse que si y 1 y y 2 son independientes , 1 entonces
Cov(y,, y 2) = 0. Tmbin puede dem ostrarse que
r ( y i - y 2) = v ( y 1) + v ( y 2) - 2 C o v ( y 1, y 2 )
Si y i y yi son independientes, se tiene
10.

V ( y 1 y 1) = V ( y 1) + V ( y 2) =

11.

E ( y 1 -y2) = E ( y 1) - E ( y 2) ~ n 1 -/2

o + a 2

Sin em bargo, observe que, en general,


12U J

sin importar si y 1 y y 2 son independientes o no.

2'3

MUESTREO Y DISTRIBUCIONES DE MUESTREO

Muestras aleatorias, media muestral y varianza muestral


El objetivo de la inferencia estadstica es sacar conclusiones acerca de una poblacin utilizando una
m uestra de la misma. La mayora de los m todos que se estudiarn aqu incluyen el supuesto de que se
1 Observe que el recproco no es necesariamente verdadero; es decir, puede tenerse Cov (y^y^) = 0 y no obstante esto no implica que
las variables sean independientes. Para un ejemplo, ver Hines y Montgomery ([55] pp. 128-129).

2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO

27

usan m uestras aleatorias. Es decir, si la poblacin contiene N elem entos y va a seleccionarse una m uestra
d e n de ellos, y si cada una de lasM /(N -H )!n ! m uestras posibles tiene una probabilidad igual de ser esco
gida, entonces al procedim iento em pleado se le llama m uestreo aleatorio. E n la prctica, en ocasiones es
difcil obtener m uestras aleatorias, para lo cual pueden ser tiles las tablas de nm eros aleatorios, como
la tabla X I del apndice.
E n la inferencia estadstica se utilizan profusam ente cantidades calculadas a partir de las observacio
nes de la m uestra. U n estadstico se dene como cualquier funcin de las observaciones de una m uestra
que no contiene parm etros desconocidos. Por ejemplo, suponga q u e^ 1}y2>,y n representa una m uestra.
Entonces la m edia m uestral

y= ^

(2-7)

y la varianza m uestral

S2 =

e*

- ? ) 2

------------

n-1

(2-8)

son estadsticos. Estas cantidades son m edidas de la tendencia central y la dispersin de la m uestra, res
pectivamente. E n ocasiones se usa 5 = V s 2", llam ada la desviacin estn d ar m uestral, como m edida de
dispersin. Los ingenieros suelen preferir el uso de la desviacin estndar p ara m edir la dispersin debi
do a que se expresa en las mismas unidades que la variable de inters y.

Propiedades de la media y la varianza mustrales


L a m edia m uestraly es un estim ador puntual de la m edia poblacional/i, y la varianza m uestral S 2 es un es
tim ador puntual de la varianza poblacional a2. E n general, un estim ador de un parm etro desconocido es
un estadstico que corresponde con dicho parm etro. Observe que un estim ador puntual es una variable
aleatoria. Al valor num rico particular de un estim ador, calculado a partir de los datos m ustrales, se le
llam a una estimacin. Por ejemplo, suponga que quiere estim arse la m edia y la varianza de la resistencia a
la ru p tu ra de un tipo particular de fibra textil. Se prueba una m uestra aleatoria de n = 25 ejem plares de
prueba de la fibra y se registra la resistencia de cada uno de ellos. L a m edia y la varianza m ustrales se cal
culan de acuerdo con las ecuaciones 2-7 y 2-8, respectivamente, obtenindose)' = 18.6 y S2 = 1.20. Por lo
tanto, la estimacin de p. es = 18.6 y la estimacin de o2 es S 2 = 1.20.
U n buen estim ador puntual debe ten er varias propiedades. D os de las m s im portantes son las si
guientes:
1.

2.

El estim ador puntual deber ser insesgado. Es decir, el parm etro que se est estim ando deber
ser el prom edio o valor esperado a la larga del estim ador puntual. A un cuando la ausencia de ses
go es deseable, esta propiedad p o r s sola no siem pre hace que un estim ador sea adecuado.
U n estim ador insesgado deber ten er la varianza m nim a. E sta propiedad establece que el esti
m ador puntual de varianza m nim a tiene una varianza que es m enor que la varianza de cualquier
otro estim ador del parm etro en cuestin.

28

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

Es sencillo dem ostrar que y y S2 son estim adores insesgados de fi y 2, respectivam ente. Considere
prim ero . Al utilizar las propiedades del valor esperado, se tiene

/ n

2 y,
B J)= E

h t *

= M

porque el valor esperado de cada observacin^, es /i. P o rlo tanto, y es un estim ador insesgado de,.
Considere ahora la varianza m uestral 52. Se tiene

( y ~ y ) 2

E ( S 2) ^ E

n 1

2 (y.- y
L"l

n-1
1

n 1

E(SS)

donde S S = 2"=1 (y,. - y ) 2 es la sum a de cuadrados corregida de las observaciones y. Entonces

O) ( y - y ) 2

(5 5 ) =

(2-9)

L (= i

=
=

y2i~ nf
2

( f i 2 + o 2) - n i f i 2 + o 2 I n)

(2-10)

= {n-l)o
P or lo tanto,
1

E ( S 2) = ------ E(SS)
n- 1
= O

y se observa que 5 2 es un estim ador insesgado de o2.

2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO

29

Grados de libertad

A la cantidad n - 1 de la ecuacin 2-10 se le llama el nmero de grados de libertad de la suma de cuadra


dos SS. Se trata de un resultado muy general; es decir, si y es una variable aleatoria con varianza a2 y
55 = S (y l - ) 2 tiene v grados de libertad, entonces

El nmero de grados de libertad de una suma de cuadrados es igual al nmero de elementos independien
tes en dicha suma de cuadrados. Por ejemplo, 55 =
- y )2 en la ecuacin 2-9 consiste en la suma de
los cuadrados de los n elementos yv - y, y 2 ,..., yn . No todos estos elementos son independientes
porque 2 "=1( yt - ) = O, de hecho, slo n - 1 de ellos son independientes, lo cual implica que SS tiene n -1
grados de libertad.
La distribucin normal y otras distribuciones de muestreo

En muchas ocasiones la distribucin de probabilidad de un estadstico particular puede determinarse si se


conoce la distribucin de probabilidad de la poblacin de la que se tom la muestra. A la distribucin de
probabilidad de un estadstico se le llama la distribucin de muestreo. A continuacin se revisan breve
mente varias distribuciones de muestreo tiles.
Una de las distribuciones de muestreo ms importantes es la distribucin normal. Siy es una variable
aleatoria normal, la distribucin de probabilidad de y es
/ ( y ) = ^ e _cl/2,f(j'~',/ffj2

(jv 2 jr

a><y<of>

(2-12)

donde - < u < es la media de la distribucin y o2 > 0 es la varianza. En la figura 2-5 se ilustra la distri
bucin normal.
Debido a que las corridas mustrales que difieren como resultado del error experimental a menudo
se encuentran descritas adecuadamente en la distribucin normal, sta desempea un papel fundamental
en el anlisis de los datos de experimentos diseados. Tkmbin es posible definir muchas distribuciones
de muestreo importantes en trminos de variables aleatorias normales. Con frecuencia se usa la notacin
y ~ N(/i, 2) para denotar que y sigue una distribucin normal con media y varianza 2.
Un caso especial importante de la distribucin normal es la distribucin normal estndar; es decir,
p - 0 y a2 = 1. Se observa que si y ~ N(ji, o2), la variable aleatoria
z =^ -

Figura 2-5

La distribucin normal.

(2-13)

30

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

sigue la distribucin norm al estndar, denotada z ~ N ( 0 ,1). A la operacin ilustrada en la ecuacin 2-13
suele llam rsele la estandarizacin de la variable aleatoria norm al y. E n la tabla I del apndice se presen
ta la distribucin norm al estndar acumulada.
E n m uchas tcnicas estadsticas se supone que la variable aleatoria sigue una distribucin norm al. El
teorem a del lmite central es con frecuencia una justificacin de la norm alidad aproximada.

TEOREMA 2 - 1 ..................................................................................................................................
El teo re m a del lm ite ce n tral
S i^ i,^ , ...,yn es una sucesin de n variables aleatorias independientes que tienen una distribucin idntica
con E(y) = fi y V(y) = a2 (ambas finitas) y x = y 1 + y 2 + ... + y, entonces
x nu
Zn = - 1
11na2

tien e u n a d istribucin N ( 0 , 1) aproxim ada en el sentido de que, si F(z) es la funcin de la d istrib u


cin de z y 3>(z) es la funcin de la distribucin de la variable aleatoria N ( 0 ,1 ), entonces lm [F(z)/

(z)] = 1.

E ste resultado establece en esencia que la sum a de n variables aleatorias independientes que tienen una
distribucin idntica sigue una distribucin aproxim adam ente norm al. E n muchos casos esta aproxima
cin es adecuada para valores muy pequeos de n, digamos n < 1 0 , m ientras que en otros casos se necesi
ta un valor grande de n, digamos n > 100. Frecuentem ente se considera que el error de un experimento
surge de una m anera aditiva de varias fuentes independientes; p o r consiguiente, la distribucin norm al se
convierte en un m odelo recom endable para el error experim ental combinado.
U n a im portante distribucin de m uestreo que puede definirse en trm inos de variables aleatorias
norm ales es la distribucin y? o ji-cuadrada. Si z1}z2, --., zk son variables aleatorias que tienen una distri
bucin norm al e independiente con m edia 0 y varianza 1, cuya abreviatura es N ID (0 ,1), entonces la varia
ble aleatoria
X = z l + z l - \ I-z \
sigue la distribucin ji-cuadrada con k grados de libertad. L a funcin de densidad de la distribucin
ji-cuadrada es
f ( x ) = ----- ^ j r - x (k,2)- 1e - 112

2r(|)

x> 0

(2-14)

E n la figura 2-6 se ilustran varias distribuciones ji-cuadrada. L a distribucin es asimtrica, o sesgada,


con m edia y varianza
fi = k
a 2 = 2k
respectivam ente. E n la tabla III del apndice se presentan los puntos porcentuales de la distribucin
ji-cuadrada.

2-3 MUESTREO Y DISTRIBUCIONES DE MUESTREO

y 2,

31

Como un ejemplo de una variable aleatoria que sigue la distribucin ji-cuadrada, suponga que y x,
y es una muestra aleatoria de una distribucin N(/, o2). Entonces

f r - * - ? --------- M

Es decir, SS/a2 sigue una distribucin ji-cuadrada con n - 1 grados de libertad.


Muchas de las tcnicas utilizadas en este libro requieren el clculo y la manipulacin de sumas de
cuadrados. El resultado dado en la ecuacin 2-15 es de suma importancia y aparece en mltiples ocasio
nes; cuando una suma de cuadrados de variables aleatorias normales se divide por a2 sigue la distribucin
ji-cuadrada.
Al examinar la ecuacin 2-8, se observa que la varianza muestral puede escribirse como
52=

(2-16)

n -1

Si las observaciones de la muestra son NID(//, a2), entonces la distribucin de S2es [<r7(n Por lo
tanto, la distribucin de muestreo de la varianza muestral es una constante multiplicada por la distribu
cin ji-cuadrada si la poblacin tiene una distribucin normal.
Si z y x l son variables aleatorias independientes normal estndar y ji-cuadrada, respectivamente, la
variable aleatoria
t* = - f T t t
VZ/*

<2-17>

sigue la distribucin t con k grados de libertad, denotada th La funcin de densidad de t es


/ ( f ) = r | ^ + 1 ) / 2 J ------- w

r T ( ) f c / 2 ) [ ( / 2/) f c ) + l] (*+1)/2

-oo<f<oo

(2-18)
^

y la media y la varianza de t son ft = 0 y o2 = k/(k - 2) para k > 2, respectivamente. En la figura 2-7 se ilus
tran varias distribuciones t. Observe que si k = <, la distribucin t se convierte en la distribucin normal

32

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Figura 2-7 Varias distribuciones t.

estndar. E n la tabla II del apndice se presentan los puntos porcentuales de la distribucin t. S i^ j,^ , -,
y es una m uestra aleatoria de una distribucin NQt, o2), entonces la cantidad

se distribuye como t con n - 1 grados de libertad.


L a ltim a distribucin de m uestreo que considerarem os es la distribucin F. S x l y x l son dos varia
bles aleatorias ji-cuadrada independientes con u y v grados de libertad, respectivam ente, entonces el co
ciente
V2 / u

r- mb

( 2 -2 0 )

sigue la distribucin F con u grados de libertad en el numerador y v grados de libertad en el denominador.


Si x es una variable aleatoria F con u grados de libertad en el num erador y v grados de libertad en el deno
m inador, entonces la distribucin de probabilidad de x es

(2-21)

u - 4 , i> = 10
----- u 4, v - 30

- -

0.6

. . . . u - 10, v - 10
------ il = 10, v - 3 0

<D

IB
3 0.6

Figura 2-8 Varias distribuciones F.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

33

En la figura 2-8 se ilustran varias distribuciones F. Esta distribucin es muy importante en el anlisis esta
dstico de experimentos diseados. En la tabla IV del apndice se presentan los puntos porcentuales de la
distribucin F.
Como un ejemplo de un estadstico que sigue una distribucin F, suponga que se tienen dos poblacio
nes normales independientes con varianza comn o2. Siynj)12j. . ylBi es una muestra aleatoria de ob
servaciones de la primera poblacin y $iy2i,y 22>>y2Hl es una muestra aleatoria de n2observaciones de la
segunda, entonces
(2 -22 )

1
2

donde S,2 y S i son las dos varianzas mustrales. Este resultado se sigue directamente de las ecuaciones
2-15 y 2-20.
2-4

INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS,


DISEOS ALEATORIZADOS

Estamos preparados ahora para volver al problema del mortero de cemento portland de la seccin 2-1.
Recuerde que se estaban investigando dos formulaciones diferentes para determinar si difieren en la
fuerza de la tensin de adhesin. En esta seccin se examina cmo pueden analizarse los datos de este ex
perimento comparativo simple utilizando procedimientos de prueba de hiptesis e intervalos de confian
za para comparar las medias de dos tratamientos.
A lo largo de esta seccin se supone que se usa un diseo experimental completamente aleatorizado.
En este diseo, los datos se consideran como si fueran una muestra aleatoria de una distribucin normal.
2-4.1

Prueba de hiptesis

Se retoma ahora el experimento del cemento portland introducido en la seccin 2-1. Recuerde que el in
ters se encuentra en comparar la fuerza de dos formulaciones diferentes: una del mortero sin modificar y
una del mortero modificado. En general, estas dos formulaciones pueden considerarse como dos niveles
del factor formulaciones. Sea queyn,>12, ..., yln represente las n i observaciones del primer nivel del
factor y que y 21, y 22, ..., y 2l> represente las n2 observaciones del segundo nivel del factor. Se supone que
las muestras se sacan al azar de dos poblaciones normales independientes. En la figura 2-9 se ilustra la
situacin.

Muestra 1: y 1
Nivel 1 del factor

Muest r a

2- yi v ya ....

Nivel 2 del factor

Figura 2-9 La situacin del muestreo para la prueba t de dos muestras.

34

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

Un modelo de los datos


Con frecuencia los resultados de un experim ento se describen con un modelo. U n m odelo estadstico sim
ple que describe los datos de un experim ento como el que acaba de describirse es
i = 1,2
yt = i+ e t

= 1 , 2 , . . ., n

(2-23)

dondey es la observacin;-sim a del nivel i del factor, fi es la m edia de la respuesta para el nivel t'-simo
del factor, y ees una variable aleatoria norm al asociada con la observacin ;-sima. Se supone que las e
son N ID (0, o \ ), i = 1,2. Se acostum bra hacer referencia a ,ycomo el com ponente del erro r aleatorio del
m odelo. Puesto que las medias/i y son constantes, se observa directam ente a partir del modelo que las
y son NID(m a \ ), i 1,2, como se acaba de suponer arriba. P ara ms inform acin acerca de los modelos
de los datos, referirse al m aterial suplem entario del texto.
Hiptesis estadsticas

U n a hiptesis estadstica es un enunciado o afirmacin ya sea acerca de los parm etros de una distribu
cin de probabilidad o de los parm etros de un modelo. La hiptesis refleja alguna conjetura acerca de la
situacin del problem a. Por ejemplo, en el experim ento del cem ento portland, puede pensarse que las
fuerzas de la tensin de adhesin prom edio de las dos formulaciones del m ortero son iguales. Esto puede
enunciarse form alm ente como
f0 Pl ~ t* 2

donde fit es la fuerza de la tensin de adhesin prom edio del m ortero modificado y 2 es la fuerza de ten
sin de enlace prom edio del m ortero sin modificar. Al enunciado H 0:f41 = fi2 se Ie llama la hiptesis nula y
a
* n 2se le llama la hiptesis alternativa. A la hiptesis alternativa que se especifica aqu se le llama
hiptesis alternativa de dos colas porque serla verdadera si tj < fi2 0 si i > iPara probar una hiptesis se proyecta un procedim iento para tom ar u na m uestra aleatoria, calcular
un estadstico de prueba apropiado p ara despus rechazar o no estar en posicin de rechazar la hiptesis
nula H 0. Parte de este procedim iento consiste en especificar el conjunto de valores del estadstico de
prueba que llevan al rechazo de H 0. A este conjunto de valores se le llama la regin crtica o regin de re
chazo de la prueba.
P ueden com eterse dos tipos de errores cuando se prueban hiptesis. Si la hiptesis nula se rechaza
cuando es verdadera, h a ocurrido un erro r tipo I. Si la hiptesis nula no se rechaza cuando es falsa, se ha
com etido un error tipo II. Las probabilidades de estos dos errores se expresan con smbolos especiales:
a = P ( error tipo I) = P ( rechazar H : \ H 0 es verdadera)
= / (error tipo II) = P ( dejar de rechazar H 0 \ H 0 es falsa)
E n ocasiones es ms conveniente trabajar con la potencia de la prueba, donde
Potencia = 1 - / 9 = P ( rechazar H a \ H 0 es falsa)
E l procedim iento general en la prueba de hiptesis es especificar un valor de la probabilidad a del error
tipo I, llam ada con frecuencia el nivel de significacin de la prueba, y despus disear el procedim iento
de prueba de tal m odo que la probabilidad/? del error tipo II tenga un valor convenientem ente pequeo.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

35

La prueba t de dos muestras


Considere que puede suponerse que las varianzas de las fuerzas de la tensin de adhesin fueron idnti
cas para am bas formulaciones del m ortero. Entonces el estadstico de prueba que deber usarse para
com parar las m edias de dos tratam ientos en el diseo com pletam ente aleatorizado es

(2-24)
S ..K

d o ndey 1y y 2son las m edias m ustrales, n l y n 2 son los tam aos de las m uestras, S 2p es una estimacin de la
varianza comn a \ = o \ = o 2 calculada a partir de
5 2

= ( - l ) ^ + (2 - l ) S ,
nl + n 1 - 2

(2-25)

y S f y 5 j son las dos varianzas m ustrales individuales. Para determ inar si deber rechazarse H 0:p1 = p 2,
se com parara f0 con la distribucin t con
+ n 2 - 2 grados de libertad. Si |0| > t a2ri+ri_2, donde
t a /2 n i +2_ 2 es el punto porcentual a/2 superior de la distribucin t con n l + n2 - 2 grados de libertad, en
tonces se rechazara H 0 y se concluira que las fuerzas prom edio de las dos formulaciones del m ortero de
cem ento portland difieren. A este procedim iento de prueba se le llama generalm ente la p rueba t de dos
m uestras.
E ste procedim iento puede justificarse de la siguiente m anera. Si el m uestreo se est haciendo de dis
tribuciones norm ales independientes, entonces la distribucin d e ^ - y 2 esN\i1~ p 2, 2(l/n 1 + l/n 2)]. Por
lo tanto, si se conociera a 2, y si H 0:u = p 2 fuera verdadera, la distribucin de

z=

r f^ r
<7 1
V"l

( 2 ' 2 6 )

n 2

sera JV(0,1). Sin embargo, al sustituir a con Sp en la ecuacin 2-26, la distribucin de Z 0 cambia de la nor
m al estndar a la distribucin t con n 1 + n 2- 2 grados de libertad. A hora bien, si H a es verdadera, 0 de la
ecuacin 2-24 se distribuye como t H+ n j _ 2 y, por consiguiente, se esperara que 100(1 - ) por ciento de los
valores de t0 estn entre t a/2 +n_2 y t a/2 +n_2. U na m uestra que produjera un valor de t0 que estuviera
fuera de estos lmites sera inusual si la hiptesis nula fuera verdadera y es evidencia de que H 0 deber re
chazarse. Por lo tanto, la distribucin t con
+ n 2 - 2 grados de libertad es la distribucin de referencia
apropiada para el estadstico de prueba 0. Es decir, describe el com portam iento de 0 cuando la hiptesis
nula es verdadera. Observe que a es la probabilidad del error tipo I de la prueba.
E n algunos problem as quiz quiera rechazarse H 0 nicam ente si una de las m edias es mayor que la
otra. Por lo tanto, se especificara una hiptesis alternativa de una coaH 1:p1 > fi2y H 0 slo se rechazara
si h > ^a,n1+n2- 2 Si se desea rechazar H 0 slo si /u1 es m enor que fi2, entonces la hiptesis alternativa es
< fi 2 , y H 0 se rechazara si t0 < - 0>1+ni_2.
P ara ilustrar el procedim iento, considere los datos del cem ento portland de la tabla 2-1. Para estos
datos, se encuentra que
Mortero modificado
ft = 16.76 kgf / cm2

Mortero sin modificar


y 2 = 17.92 kgf / cm2

S? = 0.100

S = 0.061

51=0.316

S2 = 0.247

! = 10

n2 = 10

36

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

Puesto que las desviaciones estndar m ustrales son razonablem ente similares, no es im procedente con
cluir que las desviaciones estndar (o las varianzas) poblacionales son iguales. Por lo tanto, puede usarse
la ecuacin 2-24 para probar las hiptesis

H 1: h x * / 2
Adems, n 1 + n 2- 2 = 10 + 10 - 2 = 18, y si se elige a = 0.05, entonces H 0:l = fx2 se rechazara si el valor
num rico del estadstico de prueba t0 > ta02S lg = 2.101, o si t0 < - t 0025 lg = -2.101. Estos lmites de la re
gin crtica se ilustran en la distribucin de referencia (f con 18 grados de libertad) de la figura 2 - 1 0 .
A l utilizar la ecuacin 2-25 se encuentra que
(* 1 -

1)

# + ("l -

-I-

1 )^ 2

_ 9(0.100)+9(0.061)

10 + 1 0 - 2
= 0.081
S p = 0.284
y el estadstico de prueba es

?1 ~ ? 2

KXn2

P\i

16.76-17.92
" 0.284
= -9.13
Puesto que f0 = -9.13 < - o . 0 2 5 , 1 = -2.101, se rechazara H 0y se concluira que las fuerzas de la tensin de
adhesin prom edio de las dos formulaciones del m ortero de cem ento portland son diferentes.

*0
Figura 2-10

^0.025, 18

La distribucin 1 con 18 grados de libertad con la regin crtica

2 ,101 .

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

37

El uso de valores P en la prueba de hiptesis


U na m anera de reportar los resultados de una prueba de hiptesis es estableciendo que la hiptesis nula
fue rechazada o no para un valor de a o nivel de significacin especfico. P or ejemplo, en el experim ento
del m ortero de cemento portland anterior puede decirse que H u:/u1 = u2 se rechaz con el nivel de signifi
cacin 0.05. E sta enunciacin de las conclusiones es con frecuencia inadecuada porque no le ofrece al res
ponsable de la tom a de decisiones idea alguna de si el valor calculado del estadstico de prueba apenas
rebas la regin de rechazo o si se adentr bastante en la misma. Adems, al darse los resultados de esta
m anera se les impone a otros usuarios de la informacin el nivel de significacin predefinido. Este enfo
que puede ser insatisfactorio porque algunos responsables de la tom a de decisiones podran sentirse inc
modos con los riesgos que implica el valor a = 0.05.
Para evitar estas dificultades, en la prctica se ha adoptado extensivamente el enfoque del valor P. El
valor P es la probabilidad de que el estadstico de prueba asuma un valor que sea al m enos tan extremo
como el valor observado del estadstico cuando la hiptesis nula H 0 es verdadera. Por lo tanto, un valor P
transm ite m ucha inform acin acerca del peso de la evidencia en contra de H 0y, por consiguiente, el res
ponsable de la tom a de decisiones puede llegar a una conclusin con cualquier nivel de significacin espe
cificado. E n trm inos ms formales, el valor P se define como el nivel de significacin m enor que llevara
a rechazar la hiptesis nula H 0.
Se acostum bra decir que el estadstico de prueba (y los datos) es significativo cuando se rechaza la hi
ptesis nula; por lo tanto, el valor P puede considerarse como el m enor nivel a en el que los datos son sig
nificativos. U na vez que se conoce el valor P, el responsable de la tom a de decisiones puede determ inar la
m edida en que los datos son significativos sin que el analista de los datos im ponga form alm ente un nivel
de significacin preseleccionado.
No siempre es sencillo calcular el valor P exacto de una prueba. Sin embargo la mayora de los progra
mas de com putacin m odernos para realizar anlisis estadsticos reportan valores P, y pueden obtenerse
tam bin en algunas calculadoras porttiles. A continuacin se indicar cmo obtener una aproximacin
del valor P para el experim ento del m ortero de cem ento portland. Por la tabla II del apndice, para una
distribucin t con 18 grados de libertad, la probabilidad m enor en el rea de la cola es 0.0005, para la cual
*0.0005, is = 3.922. A hora bien, |01 = 9.13 > 3.922, de donde, ya que la hiptesis alternativa es de dos colas,
se sabe que el valor P debe ser m enor que 2(0.0005) = 0.001. Algunas calculadoras porttiles tienen la ca
pacidad para calcular valores P. U na de ellas es la HP-48. Utilizando esta calculadora se obtiene el valor P
para el valor t0 = -9.13 del experim ento de la formulacin del m ortero de cem ento portland como
P = 3.68 x IO"8. Por lo tanto, la hiptesis n\Ar H 0.fj. = x2 se rechazara con cualquier nivel de significacin
a > 3.68 x IO"8.
Solucin por computadora
Hay muchos paquetes de software de estadstica que cuentan con la capacidad para probar hiptesis esta
dsticas. E n la tabla 2-2 se presenta la salida del procedim iento para la prueba t de dos m uestras de Minitab aplicado al experim ento de la formulacin del m ortero de cem ento portland. Observe que la salida
incluye algunos estadsticos concisos acerca de las dos m uestras (la abreviatura SE M ean [SE m edia]
se refiere al error estndar de la media, s / 4 ) , as como alguna inform acin sobre los intervalos de con
fianza para la diferencia en las dos medias (los cuales se revisan en las secciones 2-4.3 y 2-6). El program a
tam bin prueba la hiptesis de inters, perm itiendo que el analista especifique la naturaleza de la hipte
sis alternativa (not = [no = ] significa H 1:pi1 ^ fi2) Y Ia eleccin de a (a = 0.05 en este caso).
L a salida incluye el valor calculado de t0, el valor .P (llamado el nivel de significacin) y la decisin que
debera tom arse dado el valor especificado de a. Observe que el valor calculado del estadstico t difiere li
geram ente del valor que se calcul m anualm ente aqu y que el valor P que se reporta es P = 0.0000. Mu-

38
la b ia 2-2

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

Prueba t de dos muestras usando Minitab para el experimento del mortero de cemento pordand
Prueba t de dos muestras e intervalo de confianza

Two s am pl e T for M o d i f i e d vs Unm od


Modified
Unmod

N
10
10

Mean
16 . 7 7 4
1 7. 92 2

St Dev
0 . 309
0 . 248

SE Mea n
0. 0 9 8
0. 0 7 8

-0.885)
95% Cl for mu M o d i f i e d - mu Unmod: ( - 1 . 4 1 1 ,
t -Te st mu M o d i f i e d = mu U n m o d (vs not = ) : T = - 9 . 1 6
P = 0 . 0 0 0 0 DF = 18
B ot h use Po ol ed St De v = 0 . 2 8 0

chos paquetes de software no reportarn un valor P real m enor que 0.0001 y en su lugar presentan un
valor p o r om isin. ste es el caso aqu.

Verificacin de los supuestos en la prueba t

Para utilizar el procedim iento de la prueba t se establecen los supuestos de que ambas m uestras se tom an
de poblaciones independientes que pueden describirse con una distribucin norm al, que las desviaciones
estndar o las varianzas de ambas poblaciones son iguales, y que las observaciones son variables aleato
rias independientes. El supuesto de independencia es crtico, pero si el orden de las corridas est aleatorizado (y, de ser apropiado, se seleccionan al azar otras unidades y m ateriales experim entales), este
supuesto p or lo general se satisfar. Los supuestos de la igualdad de las varianzas y la norm alidad son fci
les de verificar utilizando una grfica de probabilidad norm al.
E n general, la graficacin de probabilidades es una tcnica para determ inar si los datos m ustrales se
ajustan a una distribucin hipotetizada con base en un examen visual subjetivo de los datos. El procedi
m iento general es muy simple y puede realizarse rpidam ente con la m ayora de los paquetes de software
de estadstica. E n el m aterial suplem entario del texto se analiza la construccin m anual de las grficas de
probabilidad normal.
Para construir una grfica de probabilidad, prim ero se ordenan de m enor a mayor las observaciones
de la m uestra. Es decir, la m uestra y l3y 2, ,y se ordena como;y(1),_y(2),
donde_y(1) es la observacin
m enor, y iT) es la segunda observacin m enor, y as sucesivamente, cony(n) la mayor. Las observaciones o r
d e n a d a s ^ se grafican entonces contra sus respectivas frecuencias acumuladas observadas (j - 0.5)/. La
escala de la frecuencia acum ulada se ha dispuesto de tal m odo que si la distribucin hipotetizada describe
de m anera adecuada los datos, los puntos grafcados estarn aproxim adam ente sobre una lnea recta; si
los puntos grafcados m uestran una desviacin significativa de u na recta, el m odelo hipotetizado no es
apropiado. G eneralm ente, determ inar si los datos grafcados pertenecen o no a una recta es una decisin
subjetiva.
P ara ilustrar el procedim iento, suponga que quiere verificarse el supuesto de que la fuerza de la ten
sin de adhesin en el experim ento de la form ulacin del m ortero de cem ento portland sigue una distri
bucin normal. Inicialm ente slo se consideran las observaciones de la form ulacin del m ortero sin
modificar. E n la figura 2-1 la se ilustra u na grfica de probabilidad norm al generada por com putadora. L a
m ayora de las grficas de probabilidad norm al m uestran 100(/ - 0.5)/ en la escala vertical izquierda (y en
ocasiones se m uestra 100[1 - (j - 0.5)/] en la escala vertical derecha), con el valor de la variable graficado
en la escala horizontal. Algunas grficas de probabilidad norm al convierten la frecuencia acumulada en
un valor z norm alizado. U na lnea recta, elegida de m anera subjetiva, se ha trazado en medio de los pun-

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

39

a) Mortero sin modificar

b) Mortero modificado

Figura 2-11 Grficas de probabilidad normal de la fuerza de la tensin de


adhesin en el experimento del cemento portland.

tos graficados. Al trazar la lnea recta, uno deber guiarse ms por los puntos de la parte m edia de la grfi
ca que por los puntos extremos. U na buena regla em prica es trazar la recta aproxim adam ente entre los
puntos de los cuartiles 25 y 75. As se determ in la recta de la figura 2 -lla . P ara evaluar la proximidad
de los puntos a la lnea recta, imagine un lpiz grueso colocado sobre la recta. Si este lpiz imaginario cu
bre todos los puntos, entonces una distribucin norm al describe de m anera adecuada los datos. Puesto
que los puntos de la figura 2 - 1 la pasaran la prueba del lpiz grueso, se concluye que la distribucin nor
mal es un m odelo apropiado para la fuerza de la tensin de adhesin del m ortero sin modificar. E n la fi
gura 2 -llft se presenta la grfica de probabilidad norm al para las 1 0 observaciones de la fuerza de la
tensin de adhesin del m ortero modificado. D e nueva cuenta, se concluira que es razonable el supuesto
de una distribucin normal.
Es posible obtener una estimacin de la m edia y la desviacin estndar directam ente de la grfica de
probabilidad normal. L a m edia se estim a como el percentil 50 de la grfica de probabilidad y la desviacin
estndar se estima como la diferencia entre los percentiles 84 y 50. Esto significa que el supuesto de la
igualdad de las varianzas poblacionales en el experim ento del cem ento portland puede verificarse com pa
rando las pendientes de las dos rectas de las figuras 2-1 l a y 2-l i . Am bas rectas tienen pendientes muy si

40

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

milares, por lo que el supuesto de la igualdad de las varianzas es razonable. Si se viola este supuesto,
deber usarse la versin de la prueba t que se describe en la seccin 2-4.4. E n el m aterial suplem entario
del texto hay ms inform acin acerca de la verificacin de los supuestos de la prueba t.
Cuando ocurren violaciones im portantes de los supuestos, se afectar el desempeo de la prueba f.
E n general, las violaciones de pequeas a m oderadas no son motivo de preocupacin particular, pero no
deber ignorarse cualquier falla del supuesto de independencia, as como los indicios claros de que no se
satisface el supuesto de norm alidad. Tanto el nivel de significacin de la prueba como la capacidad para
d etectar diferencias entre las medias sern afectados adversam ente por el incum plim iento de estos su
puestos. U n recurso para resolver este problem a son las transform aciones. E ste tem a se analiza con m a
yor detalle en el captulo 3. Tambin es posible utilizar procedim ientos no param tricos para la prueba de
hiptesis cuando las observaciones provienen de poblaciones no norm ales. Referirse a M ontgomery y
R unger [83d] para ms detalles.

U na justificacin alternativa de la prueba t

La prueba t de dos m uestras que acaba de presentarse depende en teora del supuesto fundam ental de
que las dos poblaciones de las que se seleccionaron las m uestras al azar son normales. Aun cuando el su
puesto de norm alidad es necesario p ara desarrollar form alm ente el procedim iento de prueba, como ya
se mencion, las desviaciones m oderadas de la norm alidad no afectarn seriam ente los resultados. Puede
argum entarse (por ejemplo, ver Box, H u n ter y H u n ter [18]) que el uso de un diseo aleatorizado
perm ite probar hiptesis sin ningn supuesto respecto de la forma de la distribucin. En resumen, el razo
nam iento es el siguiente. Si los tratam ientos no tienen ningn efecto, todas las [20!/(10! 10!)] = 184,756
formas posibles en que podran ocurrir las 20 observaciones son igualm ente posibles. Hay un valor de f0
para cada uno de estos 184,756 posibles arreglos. Si el valor de t0 que se obtiene en realidad de los datos es
inusualm ente grande o inusualm ente pequeo con referencia al conjunto de los 184,756 valores posibles,
es una indicacin de que //, ^ fi2A este tipo de procedim iento se le llam a prueba de aleatorizacin. Puede dem ostrarse que la prueba
t es una buena aproximacin de la prueba de aleatorizacin. Por lo tanto, se usarn aqu pruebas t (y otros
procedim ientos que pueden considerarse aproximaciones de pruebas de aleatorizacin) sin prestar de
m asiada atencin al supuesto de norm alidad. sta es una de las razones p o r las que un procedim iento
simple, como las grficas de probabilidad norm al, es adecuado para verificar el supuesto de norm alidad.

2-4.2

Eleccin del tamao de la muestra

L a eleccin de un tam ao de la m uestra apropiado es uno de los aspectos m s im portantes de cualquier


problem a de diseo experimental. La eleccin del tam ao de la m uestra y la probabilidad del error tipo
II guardan una estrecha relacin. Suponga que se estn probando las hiptesis
H \ n i = / 2
y que las m edias no son iguales, por lo que = jux- f i 2- Puesto que H 0:fi1 = jx2no es verdadera, la preocupa
cin principal es com eter la equivocacin de no rechazar H 0. L a probabilidad del error tipo II depende de
la verdadera diferencia en las medias . A una grfica de contra para un tam ao particular de la m ues
tra se le llam a la curva de operacin caracterstica, o curva OC, de la prueba. El error tam bin es una
funcin del tam ao de la m uestra. E n general, para un valor dado de , el erro r se reduce cuando el ta
m ao de la m uestra se increm enta. Es decir, es ms fcil detectar una diferencia especificada en las m e
dias para tam aos grandes de la m uestra que para los tam aos pequeos.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

41

E n la figura 2-12 se m uestra un juego de curvas de operacin caracterstica para las hiptesis
H 0: l = 2
H 1: 1 * 2
para el caso en que las dos varianzas poblacionales a 2 y o \ son desconocidas pero iguales ( o \ = o \ = o 1 )
y para un nivel de significacin de a = 0.05. Las curvas tam bin parten del supuesto de que los tam aos de
las m uestras de las dos poblaciones son iguales; es decir, n 1 = n2 = rt. El parm etro del eje horizontal de la
figura 2 - 1 2 es
d=-

2o

2a

La divisin de | | por 2o perm ite al experim entador usar el mismo juego de curvas, independientem ente
del valor de la varianza (la diferencia en las m edias se expresa en unidades de desviacin estndar). Por
o tra parte, el tam ao de la m uestra usado para construir las curvas es en realidad n* = 2n - 1 ,
Al examinar estas curvas, se observa lo siguiente:
1.

Entre ms grande sea la diferencia en las medias,/ij - 2, menor ser la probabilidad del error tipo II
para un tamao de la muestra y un valor de a dados. Es decir, para un tamao de la muestra y un valor
de a especificados, la prueba detectar con mayor facilidad las diferencias grandes que las pequeas.
Cuando el tamao de la muestra se hace ms grande, la probabilidad del error tipo II se hace ms pe
quea para una diferencia en las medias y un valor de a dados. Es decir, para detectar ima diferencia
<5especificada, puede aumentarse la potencia de la prueba incrementando el tamao de la muestra.

Las curvas de operacin caracterstica son con frecuencia tiles para seleccionar el tam ao de la
m uestra que debe usarse en un experim ento. Por ejemplo, considere el problem a del m ortero de cemento
portland com entado antes. Suponga que si las dos formulaciones difieren en la fuerza prom edio hasta en
0.5 kgf/cm2, sera deseable detectarlo con una probabilidad alta. Por lo tanto, puesto que l - 2 =

Figura 2-12 Curvas de operacin caracterstica para la prueba t de dos


colas con a = 0.05. (Reproducida con permiso de Operating Characte
ristics Curves for the Common Statistical Tsts of Significance, C.L. Fe
rris, F.E. Grubbs y C.L. Weaver, Annals o f Mathematical Statistics.)

42

CAPTULO 2

EXPERIMENTOS COMPARATIVOS SIMPLES

0.5 kgfycm2 es la diferencia crtica en las m edias que quiere detectarse, se encuentra que d, el parm etro
del eje horizontal de la curva de operacin caracterstica de la figura 2 - 1 2 , es

0 .5 _ 0.25
2a
a

2a

D esafortunadam ente, d incluye al parm etro desconocido a. Sin embargo, suponga que con base en la ex
periencia previa se piensa que es altam ente im probable que la desviacin estndar de cualquiera de las
observaciones de la fuerza exceda 0.25 kgtycm2. Entonces al usar a = 0.25 en la expresin anterior para d
se obtiene d = 1. Si quiere rechazarse la hiptesis nula 95% de las veces cuando fi1- 2 = 0.5, entonces =
0.05, y en la figura 2-12 co n = 0.05 y d = 1 se obtiene n* = 16, aproxim adam ente. Por lo tanto, puesto
que n* = 2n - 1 , el tam ao de la m uestra requerido es

y se usaran los tam aos de las m uestras ^ = n 2 = n = 9.


E n el ejemplo que se ha venido considerando, el experim entador utiliz en realidad un tam ao de la
m uestra de 10. Quizs el experim entador decidi increm entar ligeram ente el tam ao de la m uestra a fin
de prevenir la posibilidad de que la estim acin previa de la desviacin estndar com n o haya sido dem a
siado conservadora y quiz fuera un poco mayor que 0.25.
Las curvas de operacin caracterstica desem pean con frecuencia un papel im portante en la elec
cin del tam ao de la m uestra en los problem as de diseo experimental. Su utilizacin a este respecto se
revisa en captulos subsecuentes. Para un anlisis de los usos de las curvas de operacin caracterstica en
otros experim entos comparativos simples similares a la prueba t de dos m uestras, vase M ontgomery y
R unger [83d].

2-4.3

Intervalos de confianza

A un cuando la prueba de hiptesis es un procedim iento til, en ocasiones no cuenta la historia completa.
M uchas veces es preferible proporcionar un intervalo dentro del cual cabra esperar que estara incluido
el valor del parm etro o los parm etros en cuestin. A las declaraciones de estos intervalos se les llam a in
tervalos de confianza. E n muchos experim entos de ingeniera e industriales, el experim entador sabe de
antem ano que las m edias y fi2difieren; p o r consiguiente, la prueba de la hiptesis
= /2 es de escaso
inters. Por lo general el experim entador estara ms interesado en un intervalo de confianza para la dife
rencia en las m edias /u - fiv
P ara definir un intervalo de confianza, suponga que 6 es un parm etro desconocido. P ara obtener
una estim acin del intervalo de 6, es necesario encontrar dos estadsticos L y U tales que la declaracin de
probabilidad
P(L<9<U )= l - a

(2-27)

LzQ <U

(2-28)

sea verdadera. Al intervalo

se le llam a intervalo de confianza de 100(1 - a ) por ciento para el parm etro 6. L a interpretacin de este
intervalo es que si, en m uestreos aleatorios repetidos, se construye gran nm ero de estos intervalos, 1 0 0 ( 1
- a ) por ciento de ellos contendrn el verdadero valor de 6, A los estadsticos L y Us e les llam a los lmites

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

43

de confianza inferior y superior, respectivamente, y a 1 - a se le llama el coeficiente de confianza. Si ce =


0.05, a la ecuacin 2-28 se le llama intervalo de confianza de 95% para 6. Observe que los intervalos de
confianza tienen una interpretacin de frecuencia; es decir, no se sabe si la declaracin es verdadera para
esta muestra especfica, pero s se sabe que el mtodo usado para generar el intervalo de confianza produ
ce declaraciones correctas en 100(1 - ) por ciento de las veces.
Suponga que quiere encontrarse un intervalo de confianza de 100(1 - a) por ciento para la verdadera
diferencia de las medias -f 2 en el problema del cemento portland. El intervalo puede deducirse de la
siguiente manera. El estadstico

se distribuye como t n +n^ 2. Por lo tanto,

P -t

yi - y 2 - ( /

(2-29)
Al comparar las ecuaciones 2-29 y 2-27, se observa que

(2-30)
es un intervalo de confianza de 100(1 - a) por ciento para - fi2.
La estimacin real del intervalo de confianza de 95% para la diferencia en la fuerza de la tensin de
adhesin promedio de las formulaciones del mortero de cemento portland se encuentra haciendo la si'
guente sustitucin en la ecuacin 2-30:
16.76-17.92- (2.101)0.284V+
< 16.76- 17.92+(2101)0.284A/^ H
-1.16-0.27< /1- ju2 -1.16+0.27
1A3<
ju2 -0.89
Por lo tanto, el intervalo de confianza de 95% estimado para la diferencia en las medias se extiende de
-1.43 kgf/cm2a -0.89 kgf/cm2. Expresado en otros trminos, el intervalo de confianza e s ^ -f 2 = -1.16
kgt'cm2 0.27 kgf/cm2, o la diferencia en las fuerzas promedio es -1.16 kgf/cm2, y la precisin de esta esti
= 0 no est incluida en este intervalo, los datos no
macin es de 0.27 kgf/cm2. Observe que como fa
apoyan la hiptesis de que/*! = fi2con el nivel de significacin de 5%. Es probable que la fuerza media de
la formulacin sin modificar exceda la fuerza media de la formulacin modificada. Observe que en la ta-

44

CAPiULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

bla 2-2 M initab tam bin report este intervalo de confianza cuando se llev a cabo el procedim iento de la
prueba de hiptesis.

2-4.4

Caso en que o \

o\

Si se est probando
H 0 '/i H 2

y no hay bases para suponer que las varianzas a \ y a \ son iguales, entonces es necesario hacer ligeras m o
dificaciones en la prueba t de dos m uestras. E n este caso el estadstico de prueba es
t,o

x -yt

(2-31)

E ste estadstico no se distribuye exactam ente como t. No obstante, t es u na buena aproximacin de la dis
tribucin de t0 si se usa

V=

(S2 / i ) 2 { ( S / n 2f
nl 1
n 2 1

(2-32)

p ara los grados de libertad. U na indicacin clara de la desigualdad de las varianzas en una grfica de pro
babilidad norm al sera una situacin que requerira esta versin de la prueba t. E l lector no deber encon
trar problem as para desarrollar una ecuacin para encontrar ese intervalo de confianza para la diferencia
en las m edias en el caso de varianzas desiguales.

2-4.5

Caso en que se conocen o \ y a \

Si las varianzas de ambas poblaciones se conocen, entonces las hiptesis


H a '- H i - P z
H l'H l *

1*2

pueden probarse utilizando el estadstico


7

_ _ Z lZ Z 2 _

(2-33)

Si ambas poblaciones son norm ales, o si los tam aos de las m uestras son lo suficientem ente grandes para
aplicar el teorem a del lmite central, la distribucin de Z 0 es N ( 0 ,1 ) si la hiptesis nula es verdadera. Por
lo tanto, la regin crtica se encontrara utilizando la distribucin norm al en lugar de la distribucin t.
Especficam ente, H se rechazara si | Z 01 > Z a/2, donde Z al es el punto porcentual a l l superior de la dis
tribucin norm al estndar.

2-4 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS ALEATORIZADOS

45

A diferencia de la prueba t de las secciones anteriores, en la prueba de las m edias con varianzas cono
cidas no se requiere el supuesto de que el m uestreo se haga de poblaciones norm ales. Puede aplicarse el
teorem a del lmite central para justificar una distribucin norm al aproxim ada para la diferencia en las
medias m ustrales
- y 2.
El intervalo de confianza de 100(1 - a ) p o r ciento p a ra c i - f t 2 cuando las varianzas se conocen es

[af
%

\ tii

oT
~ t*i

n2

[a,

oT

\ nx

n2

_34)

Como ya se seal, el intervalo de confianza es con frecuencia un com plem ento til del procedim iento de
prueba de hiptesis.

2-4.6

Comparacin de una sola media con un valor especificado

Algunos experim entos incluyen la com paracin de la m edia fi de una sola poblacin con un valor especifi
cado, p o r ejemplo fi0. Las hiptesis son
H 0 : fi fi 0
f t * ft o
Si la poblacin es norm al con varianza conocida, o si la poblacin no es norm al pero el tam ao de la m ues
tra es lo suficientemente grande para aplicar el teorem a del lmite central, entonces la hiptesis puede
probarse utilizando una aplicacin directa de la distribucin norm al. El estadstico de prueba es

z*

- ^

(M 5)

Si H 0:fi = fi 0 es verdadera, entonces la distribucin de Z 0 es N ( 0 , 1). Por lo tanto, la regla de decisin para
H 0:fi = fi 0 es rechazar la hiptesis nula si | Z 0 > Z a/2. El valor de la m edia fi 0 especificado en la hiptesis
nula se determ ina por lo general m ediante una de las tres formas siguientes. Puede ser resultado de evi
dencia, conocimientos o experim entacin previos. Puede ser resultado de alguna teora o m odelo que
describe la situacin bajo estudio. Por ltim o, puede ser resultado de especificaciones contractuales.
El intervalo de confianza de 100(1 - a ) por ciento para la verdadera m edia poblacional es
y ~ z an o / S s f i < y + Z ano l V

(2-36)

EJEMPLO 2 - 1 ....................................................................................................................................
U n proveedor ofrece lotes de tela a un fabricante de textiles. El fabricante desea saber si la resistencia a la
ru p tu ra prom edio excede 200 psi. D e ser as, el fabricante aceptar el lote. L a experiencia pasada indica
que un valor razonable para la varianza de la resistencia a la ruptura es lOO(psi)2. Las hiptesis que debe
rn probarse son
H 0\fi = 200
H i . f i > 200
Observe que se trata de una hiptesis alternativa de una cola. Por lo tanto, el lote se aceptara slo si la hi
ptesis nula H 0:fi = 200 pudiera rechazarse (es decir, si Z 0 > Z a).

46

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Se seleccionan cuatro ejem plares aleatoriam ente, y la resistencia a la ruptura prom edio observada es
_y = 214 psi. El valor del estadstico de prueba es
1 ^ ,2 1 4 -2 0 0
0

ff/V

10/V 4

Si se especifica un error tipo I de a = 0.05, en la tabla I del apndice se encuentra que Z a = Z 005 = 1.645.
Por lo tanto, H 0 se rechaza y se concluye que la resistencia a la ruptura prom edio del lote excede 200 psi.

Cuando no se conoce la varianza de la poblacin, es necesario establecer el supuesto adicional de que


la poblacin sigue una distribucin norm al, aunque las desviaciones m oderadas de la norm alidad no afec
tarn seriam ente los resultados.
P ara probar H 0:p = p 0 en el caso de la varianza desconocida, se usa la varianza m uestral S 2 para esti
m ar o2. A l sustituir a con S en la ecuacin 2-35, se obtiene el estadstico de prueba

< 2 - 3 7 )

L a hiptesis nula H 0 : u = p. 0 se rechazara si |0| > taa n_lt donde ta/ _ 1 denota el punto porcentual a/2
superior de la distribucin t con n - 1 grados de libertad. El intervalo de confianza de 100(1 - a ) por ciento
es en este caso
y -K n .n -iS lJ ^ H ^ y + t^ ^ S lJ

2-4.7

(2-38)

Resumen

E n las tablas 2-3 y 2-4 se resum en los procedim ientos de prueba estudiados aqu para las m edias m ustra
les. Se m uestran las regiones crticas para hiptesis alternativa tanto de una como de dos colas.

la b ia 2-3

Hiptesis
H a:u = u B
0

Pruebas para medias con varianza conocida

Estadstico de prueba Criterios de rechazo

H 0-tt = > 0
Hl\p< 0

-fio
a lJ

= l

l ~?1

Zo<-Za

V1
H o:Pi= A*i
H 1 :1 > 2

\ 7 \~> 7all
0
<

f f n ^ i
u
H-i-i
Hvx<2

_7

n2
_

2-5 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS DE COMPARACIONES PAREADAS

la b ia 2-4

47

Pruebas para medias de distribuciones normales,


varianza desconocida

Hiptesis

Estadstico de prueba Criterios de rechazo

H0:fi - f i 0
Uol> *.

Hi t* * Mo
H0:fi = f0
Hx\fi < fi0

'o < -.^ 1

# o-f* = Mo
> Mo
si <7? = <7?

#o'Mi = M2
* m2

Hm

K "-Pi

rr^r
V1 2
= n 1+ fi2 - 2

Si ( , *

^ o :Mi M2
H,:mi < M2

l'.l> ^0/2,1)

< j

-J>2
n,

# o ;Mi =M2
H^M! > M2

S
v =

2-5

2*5.1

!h__ n 2
( S j l r h f | (S /n 2f
n2- 1
i \ 1

INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS,


DISEOS DE COMPARACIONES PAREADAS
El problema de las comparaciones pareadas

E n algunos experim entos comparativos simples puede conseguirse un m ejoram iento significativo de la
precisin haciendo comparaciones de observaciones pareadas del m aterial experim ental. P or ejemplo,
considere una m quina para probar la dureza que presiona una barra con u n a punta afilada sobre un
ejem plar de prueba de m etal con una fuerza conocida. Al m edir la profundidad de la depresin producida
p or la punta, se determ ina la dureza del ejem plar de prueba. E n esta m quina pueden instalarse dos pun
tas diferentes y aun cuando la precisin (la variabilidad) de las m ediciones hechas con las dos puntas pa
rece ser la misma, se sospecha que una de las puntas produce diferentes lecturas de la dureza que la otra.
Sera posible realizar un experim ento de la siguiente m anera. Podran seleccionarse al azar varios
ejem plares de prueba del m etal (por ejemplo, 20). L a m itad de estos ejem plares de prueba podran pro
barse con la punta 1 y la otra m itad con la punta 2. L a asignacin exacta de los ejem plares a las puntas se
determ inara de m anera aleatoria. Puesto que se tra ta de un diseo com pletam ente aleatorizado, la dure
za prom edio de las dos m uestras podra com pararse utilizando la prueba t descrita en la seccin 2-4.
Al reflexionar un poco al respecto, se descubrira una seria desventaja del diseo com pletam ente
aleatorizado en este problem a. Suponga que los ejem plares de prueba del m etal se cortaron de barras di

48

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

ferentes que se fabricaron a tem peraturas diferentes o que no fueran exactam ente hom ogneos en cual
quier otra form a que pudiera afectar la dureza. E sta falta de hom ogeneidad entre los ejemplares
contribuir a la variabilidad de las m ediciones de la dureza y tender a inflar el error experimental, ha
ciendo ms difcil detectar una diferencia real entre las puntas.
Para protegerse de esta posibilidad, considere un diseo experim ental alternativo. Suponga que cada
ejem plar de prueba tiene el tam ao suficiente para que puedan hacerse en l dos determ inaciones de la
dureza. E ste diseo alternativo consistira en dividir cada ejem plar de prueba en dos secciones, para des
pus asignar de m anera aleatoria una punta a una m itad de cada ejem plar de prueba y la otra punta a la
otra mitad. El orden en que se prueban las puntas en un ejem plar de prueba particular se seleccionara al
azar. El experim ento, cuando se llev a cabo de acuerdo con este diseo con 10 ejem plares de prueba,
produjo los datos (codificados) que se m uestran en la tabla 2-5.
U n modelo estadstico que describe los datos de este experim ento puede expresarse como

( 2 ' 3 9 )

d o n d e e s la observacin de la dureza para la punta i en el ejem plar de prueba j, fi es la verdadera dureza


prom edio de la punta i-sima, /?, es un efecto sobre la dureza debido al ejem plar de pruebay'-simo, y Sy es
el erro r experim ental aleatorio con m edia cero y varianza a ] . Es decir, a \ es la varianza de las mediciones
de la dureza hechas con la punta 1 y a \ es la varianza de las m ediciones de la dureza hechas con la punta 2.
Observe que si se calcula la diferencia pareada y-sima
dj = yj - y 2j

= 1 , 2 , . . . , 10

(2-40)

el valor esperado de esta diferencia es


d ~ E (dj )
= E ( y v - y 2j)

= E (yn ) - E (y 2] )
=

fil + j - ( p 2 + j )

= l~

Es decir, pueden hacerse inferencias acerca de la diferencia en las lecturas de la dureza prom edio de las
dos puntas n i ~ n 2 haciendo inferencias acerca de la m edia de las diferencias fxd. Observe que el efecto adi-

Tabla 2-5

Datos del experimento de


la prueba de la dureza

E jem plar de prueba P unta 1 Punta 2


1
2
3
4
5
6
7
8
9
10

7
3
3
4
8
3
2
9
5
4

6
3
5
3
8
2
4
9
4
5

2-5 INFERENCIAS ACERCA DE LAS DIFERENCIAS EN LAS MEDIAS, DISEOS DE COMPARACIONES PAREADAS

49

tivo de las fi de los ejem plares de prueba se cancela cuando las observaciones estn pareadas de esta m a
nera.
P robar
= fi 2 es equivalente a probar
H 0 :fid = 0
HH d

* 0

El estadstico de prueba para esta hiptesis es


d
tn =
0 S jJ

(2-41)

donde
(2-42)
n j -1

es la m edia m uestral de las diferencias y


1/2

(d j-d f
;=1

1/ *

-i

\ /=i

n -1

1/2

(2-43)

n-1

es la desviacin estndar m uestral de las diferencias. H a: p = 0 se rechazara si 11 0\ > tan _l. D ebido a
que las observaciones de los niveles del factor estn pareadas en cada unidad experim ental, a este p ro
cedim iento suele llamrsele prueba t pareada.
Por los datos de la tabla 2-5, se encuentra
d1= 7 - 6 = l
d6 = 3 - 2 = 1
d2 = 3 - 3 = 0

d1 = 2 -4 = -2

, = 3 - 5 = - 2

da = 9 - 9 = 0

= 4-3= 1

d9 = 5 - 4 = 1

d5 = 8 - 8 = 0

d 10 = 4 - 5 = - 1

Por lo tanto,
d =- Y

dj = ( - l ) = -0 .1 0

i / fl

2*; 2,

1/2

1 3 -if(-l)2

10-1

n-1

= 1.20

Suponga que se elige a = 0.05. Entonces, para tom ar una decisin se calculara t0y H 0se rechazara si |f0|
> 10.025, 9 = 2.262.
El valor calculado del estadstico de prueba t pareada es

s jj
-

0.10

" 1.20 i M
= -0 .2 6

50

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

h
Figura 2-13 La distribucin de referencia (t con 9 grados de libertad)
para el problema de la prueba de la dureza.

y como I01 = 0.26 > t 0 025>9 = 2.262, la hiptesis H 0:fid = 0 no puede rechazarse. Es decir, no hay evidencia
que indique que las dos puntas producen lecturas de la dureza diferentes. E n la figura 2-13 se m uestra la
distribucin de t 0 con 9 grados de libertad, la distribucin de referencia para esta prueba, con el valor de t0
indicado en relacin con la regin crtica.
E n la tabla 2-6 se m uestra la salida de com putadora del procedim iento para la prueba t p areada de
M initab para este problem a. Observe que el valor P para esta prueba es P = 0.80, lo cual implica que no
puede rechazarse la hiptesis nula con ningn nivel de significacin razonable.

2-5.2

Ventajas del diseo de comparaciones pareadas

A l diseo que se utiliz en realidad p ara este experim ento se le llama diseo de com paraciones pareadas,
el cual ilustra el principio de la form acin de bloques com entado en la seccin 1-3. D e hecho, es un caso
especial de un tipo de diseo ms general llam ado diseo de bloques aleatorizados. El trm ino bloque se
refiere a u n a unidad experim ental relativam ente hom ognea (en el caso tra ta d o aqu, los ejem plares
de prueba del m etal son los bloques), y el bloque representa una restriccin sobre la aleatorizacin com
p leta debido a que las combinaciones de los tratam ientos slo se aleatorizan dentro del bloque. E n el ca
ptulo 4 se examina este tipo de diseos. E n dicho captulo el m odelo m atem tico del diseo, la ecuacin
2-39, se escribe en una form a ligeram ente diferente.

Tabla 2-6

Resultados de Minitab de la prueba t pareada para el ejemplo de la prueba de la dureza


Prueba t pareada e intervalo de confianza

P a i r e d T for Tip 1 - Tip 2


Tip 1
Tip 2
Di f f e r e n c e

N
10
10
10

Mean
4. 8 0 0
4.900
-0.100

St D e v
2.39 4
2. 2 3 4
1 .197

95% Cl for m e a n d i f f e r e n c e : ( - 0 . 9 5 6 , 0. 756)


t- Test of m e a n d i f f e r e n c e = 0 (vs not = 0):
T-Value = -0.26
P - V a l u e = 0 . 79 8

SE Mean
0 . 75 7
0 . 70 6
0 . 37 9

2-6 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES

51

A ntes de dejar este experim ento, es necesario destacar varios puntos. Observe que, aun cuando se
han hecho 2n = 2(10) = 20 observaciones, se cuenta nicam ente con n - 1 = 9 grados de libertad para el
estadstico t. (Se sabe que conform e se increm entan los grados de libertad para t, la prueba se hace ms
sensible.) Al hacer la formacin de bloques o pareo, se han perdido en realidad n - 1 grados de libertad,
pero se espera haber ganado un m ejor conocim iento de la situacin al elim inar una fuente adicional de
variabilidad (la diferencia entre los ejem plares de prueba). Puede obtenerse u na indicacin de la calidad
de la inform acin producida por el diseo pareado com parando la desviacin estndar Sd de las diferen
cias con la desviacin estndar com binada Sp que habra resultado si el experim ento se hubiera conducido
de m anera com pletam ente aleatorizada y se hubieran obtenido los datos de la tabla 2-5. Al utilizar los da
tos de la tabla 2-5 como dos m uestras independientes, la desviacin estndar com binada que se calcula
con la ecuacin 2-25 es Sp = 2.32. Al com parar este valor con Sd = 1.20, se observa que la form acin de
bloques o pareo ha reducido la estim acin de la variabilidad en cerca de 50%. E sta inform acin tam bin
puede expresarse en trm inos de un intervalo de confianza p a r a /^ - f i 2- U tilizando los datos pareados, un
intervalo de confianza de 95% para p l - p 2 es
d

^ 0 .0 2 5 , 9

^ 4

/ V

-0.10(2.262)(1.20)/V l

0. 10 + 0.86

R ecprocam ente, al utilizar el anlisis com binado o independiente, un intervalo de confianza de 95%
para f t - fi 2 es
o
Vi

3^2 ^0.0 2 5 ,1 8

Vn\

r
+

n2

4 .8 0 - 4 .9 0 (2 1 0 1 )(2 3 2 )V +
-0 .1 0 2.18
El intervalo de confianza basado en el anlisis pareado tiene una anchura sensiblem ente m enor que el in
tervalo de confianza del anlisis independiente. Esto ilustra la propiedad de reduccin del ruido de la for
m acin de bloques.
L a form acin de bloques no es siem pre la m ejor estrategia de diseo. Si la variabilidad dentro de los
bloques es la misma que la variabilidad entre los bloques, la varianza de - y 2 ser la misma independien
tem ente del diseo que se use. D e hecho, la formacin de bloques en esta situacin sera una eleccin de
diseo pobre porque la formacin de bloques produce la prdida de n - 1 grados de libertad y llevar en
realidad a un intervalo de confianza con una anchura mayor para P i ~ n 2. En el captulo 4 se ofrece una re
visin ms am plia de la form acin de bloques.

2-6

INFERENCIAS ACERCA DE LAS VARIANZAS


DE DISTRIBUCIONES NORMALES

E n muchos experimentos, el inters se encuentra en las posibles diferencias en la respuesta m edia de dos
tratam ientos. Sin embargo, en algunos experim entos es la com paracin de la variabilidad en los datos lo
que es im portante. E n la industria de alim entos y bebidas, por ejemplo, es im portante que la variabilidad
del equipo de llenado sea pequea para que todos los em paques estn cerca del peso neto nom inal o el

52

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

volum en del contenido neto nominal. E n los laboratorios qumicos, tal vez quiera com pararse la variabili
dad de dos m todos de anlisis. A continuacin se examinan brevem ente las pruebas de hiptesis y los in
tervalos de confianza para las varianzas de distribuciones norm ales. A diferencia de las pruebas para las
medias, los procedim ientos para las pruebas de varianzas son bastante m s sensibles al supuesto de nor
malidad. E n el apndice 2A de Davies [36] hay un buen anlisis del supuesto de norm alidad.
Suponga que quiere probarse la hiptesis de que la varianza de una poblacin norm al es igual a una
constante, p or ejemplo, a \ . Expresado en trm inos formales, quiere probarse
rr , 2
2
~ a
H ^.a 1 * a 2

(2-44)

El estadstico de prueba para la ecuacin 2-44 es

ai

ai

(2 45'

donde 55 = S'L jfy, - y ) 2 es la suma de cuadrados corregida de las observaciones mustrales. L a distribu
cin de referencia apropiada para %2 es la distribucin ji-cuadrada con n - 1 grados de libertad. L a hipte
sis nula se rechaza s i / \ > xln.x-i osiXo < x l (ai2),r- u d0nsx 2
an,n-1y x l (am,^ i son los puntos porcentua
les a l 2 superior y 1 - ( a l 2) inferior de la distribucin ji-cuadrada con n - 1 grados de libertad,
respectivam ente. En la tabla 2-7 se presentan las regiones crticas para las hiptesis alternativas de una
cola. El intervalo de confianza de 100(1 - a ) por ciento para o2 es
( h - 1)52
2 (rc-l)52
v2 }
<c/ < \ ------

(2-46)

^l-(a/2),n-l

Xal2,n~l

Considere ahora la prueba de la igualdad de las varianzas de dos poblaciones norm ales. Si se tom an
m uestras aleatorias independientes de tam ao n 1y n 2de las poblaciones 1 y 2, respectivam ente, el estads
tico de prueba para
H o: a i = i
2

'1

(2-47)

es el cociente de las varianzas m ustrales


^o=f-

(2-48)

L a distribucin de referencia apropiada para F 0 es la distribucin F con n x- 1 grados de libertad en el nu


m erador y n 2 - 1 grados de libertad en el denom inador. L a hiptesis nula se rechazara si jF0 > Fajln
t
o si F0 < F ^ (al2) ni
donde Fal2 n
y F ^ ^ ^ ^ denotan los puntos porcentuales a l l superior
y 1 - (a2) inferior de la distribucin F con n x - 1 y n 2 - 1 grados de libertad. E n la tabla IV del apndice
slo aparecen los puntos porcentuales p ara la cola superior de F; sin embargo, los puntos de las colas su
perior e inferior se relacionan por

2-6 INFERENCIAS ACERCA DE LAS VARIANZAS DE DISTRIBUCIONES NORMALES


Tabla 2-7

H iptesis

53

Pruebas para las varianzas de distribuciones normales_______

Estadstico de prueba

Criterios de rechazo

H 0:o2 = o l

Xq^ Xa/2jt-l
X ^ Xl-all,n-l

H{.a1 5* a\
H0:a2 = a 20

{n -V 2
Xo ^ X\
aj/i
1

H^.o2 < al
H0a2 = o l

x l > x l s -1

H y 1 > al

^ >
F< F
^

H:a = a\

fcr lS f

H ,-.o l* a\

n
fe?

H 0:a = a

l,nL
1

Ht\al < a\
F0 > xa,n~
F l/2-l

it
h?

H0:al = a \
H{.al > a\

E n el captulo 3, seccin 3-4,3, se analizan los procedim ientos de prueba para ms de dos varianzas. Se re
visar tam bin el uso de la varianza o la desviacin estndar como variable de respuesta en situaciones ex
perim entales ms generales.

EJEMPLO 2 - 2 ....................................................................................................................................
U n ingeniero qumico investiga la variabilidad inherente de dos tipos de equipo de prueba que pueden
usarse p ara m onitorear la produccin de un proceso. El ingeniero sospecha que el equipo antiguo, tipo 1,
tiene una varianza mayor que la del equipo nuevo. Por lo tanto, quiere probar las hiptesis
Ho'-i =

H i-ol > o \
Se tom an dos m uestras aleatorias de Wj = 12 y n 2 = 10 observaciones, y las varianzas m ustrales son 5, =
j2 10.8. El estadstico de prueba es
14.5 y Sj
^
0

= 145
10.8

'

E n la tabla IV del apndice se encuentra que Foas n 9 = 3.10, por lo que no puede rechazarse la hiptesis
nula. Es decir, se ha encontrado evidencia estadstica insuficiente para concluir que la varianza del equipo
antiguo sea mayor que la varianza del equipo nuevo.
E l intervalo de confianza de 100(1 - a ) por ciento para el cociente de las varianzas poblacionales
a l / a \ es

54

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

P ara ilustrar el uso de la ecuacin 2-50, el intervalo de confianza de 95% p ara el cociente de las varianzas
a l / a \ del ejemplo 2-2 es, utilizando F mi
= 3.59 y FM1W = l/fo.025,11,9 = 1/3.92 = 0.255,

o\

0.34 < ^ - < ; 4.81

2-7
2-1.

2-2.

2-3.

2-4.

2-5.

PROBLEMAS

-------------------------------------------------------------------------------------------

Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi. La experiencia pasada in
dica que la desviacin estndar de la resistencia a la ruptura es a = 3 psi. Se prueba una muestra aleatoria de
cuatro ejemplares de prueba, y los resultados son y x = 145, y2 = 153, y3 = 150 y y4 = 147.
a) Enunciar las hiptesis que el lector considere que deberan probarse en este experimento.
b) Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega?
c) Encontrar el valor P para la prueba del inciso b.
d) Construir un intervalo de confianza de 95% para la resistencia a la ruptura promedio.
Supuestamente, la viscosidad de un detergente lquido debe promediar 800 centistokes a 25C. Se colecta
una muestra aleatoria de 16 lotes del detergente, y la viscosidad promedio es 812. Suponga que se sabe que la
desviacin estndar de la viscosidad es a = 25 centistokes.
a) Enunciar las hiptesis que debern probarse.
b) Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega?
c) Cul es el valor P para la prueba?
d) Encontrar un intervalo de confianza de 95% para la media.
Los dimetros de las flechas de acero producidas en cierto proceso de manufactura debern tener un prome
dio de 0.255 pulgadas. Se sabe que el dimetro tiene una desviacin estndar de a = 0.0001 pulgadas. Una
muestra aleatoria de 10 flechas tiene un dimetro promedio de 0,2545 pulgadas,
a) Establecer las hiptesis apropiadas para la media fi.
b) Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega?
c) Encontrar el valor P para esta prueba,
d) Construir un intervalo de confianza de 95% para el dimetro promedio de las flechas.
Una variable aleatoria con una distribucin normal tiene una media desconocida^ y varianza a2 = 9. Encon
trar el tamao de la muestra que se necesita para construir un intervalo de confianza de 95% para la media,
cuya anchura total sea de 1.0.
La vida de anaquel de una bebida carbonatada es motivo de inters. Se seleccionan 10 botellas al azar y se
prueban, obtenindose los siguientes resultados:
Das
108
124
124
106
115

138
163
159
134
139

a) Quiere demostrarse que la vida media de anaquel excede los 120 das. Establecer las hiptesis apropia
das para investigar esta afirmacin.
b) Probar estas hiptesis utilizando a 0.01. A qu conclusiones se llega?

2-7 PROBLEMAS

2-6,

2-7.

c) Encontrar el valor P para la prueba del inciso b.


d) Construir un intervalo de confianza de 99% para la vida media de anaquel.
Considere los datos de la vida de anaquel del problema 2-5. La vida de anaquel puede describirse o mode
larse adecuadamente con una distribucin normal? Qu efecto tendra la violacin de este supuesto sobre
el procedimiento de prueba usado para resolver el problema 2-5?
El tiempo para reparar un instrumento electrnico es una variable aleatoria medida en horas que sigue una
distribucin normal. El tiempo de reparacin de 16 de estos instrumentos elegidos al azar es el siguiente:

159
224
222
149

2-8.
2-9.

280
379
362
260

Horas
101
179
168
485

212
264
250
170

a) Quiere saberse si el empo de reparacin promedio excede 225 horas. Establecer las hiptesis apropia
das para investigar esta cuestin.
b) Probar las hiptesis que se formularon en el inciso a. A qu conclusiones se llega? Utilizar a = 0.05.
c) Encontrar el valor P para la prueba.
d) Construir un intervalo de confianza de 95% para el tiempo de reparacin promedio.
Considere nuevamente los datos del tiempo de reparacin del problema 2-7. En opinin del lector, el tiem
po de reparacin puede modelarse de manera adecuada con una distribucin normal?
Se utilizan dos mquinas para llenar botellas de plstico con un volumen neto de 16.0 onzas. Puede suponer
se que el proceso de llenado es normal, con desviaciones estndar de a, = 0.015 y o2 = 0.018. El departamen
to de ingeniera de calidad sospecha que ambas mquinas llenan el mismo volumen neto, sin importar si este
volumen es 16.0 onzas o no. Se realiza un experimento tomando una muestra aleatoria de la produccin de
cada mquina.

Mquina 1
16.03
16.04
16.05
16.05
16.02

a)
b)
c)
d)
2-10.

55

16.01
15.96
15.98
16.02
15.99

Mquina 2
16.02
15.97
15.96
16.01
15.99

16.03
16.04
16.02
16.01
16.00

Enunciar las hiptesis que debern probarse en este experimento.


Probar estas hiptesis utilizando a = 0.05. A qu conclusiones se llega?
Encontrar el valor P para esta prueba.
Encontrar un intervalo de confianza de 95% para la diferencia en el volumen de llenado promedio de las
dos mquinas.
Un fabricante de calculadoras electrnicas puede usar dos tipos de plstico. La resistencia a la ruptura de
este plstico es importante. Se sabe que al = a 2 = 1.0 psi. De muestras aleatorias den1= 10yn2= 12se obtie
ne , = 162.5 y y2 = 155.0. La compaa no emplear el plstico 1 a menos que su resistencia a la ruptura ex
ceda la del plstico 2 por al menos 10 psi. Con base en la informacin muestral, deber usarse el plstico 1?
Para responder esta pregunta se deben establecer y probar las hiptesis apropiadas utilizando a = 0.01.
Construir un intervalo de confianza de 99% para la verdadera diferencia media en la resistencia a la ruptura.

56
2-11.

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

A continuacin se presenta el tiempo de combustin de dos cohetes qumicos con formulaciones diferentes.
Los ingenieros de diseo se interesan tanto en la media como en la varianza del tiempo de combustin.

65
81
57
66
82

2-12.

2-13.

2-14.

Tipo 1
82
67
59
75
70

Tipo 2
64
71
83
59
65

56
69
74
82
79

a) Probar la hiptesis de que las dos varianzas son iguales. Utilizar a 0.05.
b) Utilizando los resultados del inciso a, probar la hiptesis de que los tiempos de combustin promedio
son iguales. Utilizar a = 0.05. Cul es el valor P para esta prueba?
c) Comentar el papel del supuesto de normalidad en este problema. Verificar el supuesto de normalidad
para ambos tipos de cohetes,
En un artculo de Solid State Technology, Diseo ortogonal para optimizacin de procesos y su aplicacin en
el grabado qumico con plasma de G.Z. Yin y D.W. Jillie, se describe un experimento para determinar el
efecto de la velocidad del flujo de C2F6 sobre la uniformidad del grabado en una oblea de silicio usada en la
fabricacin de circuitos integrados. Los datos de la velocidad del flujo son los siguientes:

Observacin de la uniformidad

Flujo de
CJFfi

125
200

2.7
4.6

4.6
3.4

2.6
2.9

3.0
3.5

3.2
4.1

6
3.8
5.1

a) La velocidad del flujo de C2F6 afecta la uniformidad del grabado promedio? Utilizar a = 0.05.
b) Cul es el valor P para la prueba del inciso a?
c) La velocidad del flujo de Q F 6afecta la variabilidad de una oblea a otra en la uniformidad del grabado?
Utilizar a = 0.05.
d) Trazar diagramas de caja que ayuden a interpretar los datos de este experimento.
Se instala un nuevo dispositivo de filtrado en una unidad qumica. Antes de instalarlo, de una muestra alea
toria se obtuvo la siguiente informacin sobre el porcentaje de impurezas: y 1 = 12.5, S? = 101.17 y n 1 = 8.
Despus de instalarlo, de una muestra aleatoria se obtuvo y 2 = 10.2, S22 = 94,73, n 2 = 9.
a) Puede concluirse que las dos varianzas son iguales? Utilizar a = 0.05.
b) El dispositivo de filtrado ha reducido de manera significativa el porcentaje de impurezas? Utilizar a =
0.05.
Se hacen 20 observaciones de la uniformidad del grabado en obleas de silicio durante un experimento de eva
luacin de un grabador de plasma. Los datos son los siguientes:
5.34
6.00
5.97
5.25

6.65
7.55
7.35
6.35

4.76
5.54
5.44
4.61

5.98
5.62
4.39
6.00

7.25
6.21
4.98
5.32

a) Construir una estimacin con un intervalo de confianza de 95% de a2.


b) Probar la hiptesis de que a 2 = 1.0. Utilizar a = 0.05. A qu conclusiones se llega?

2-7 PROBLEMAS

2-15.

c) Comentar el supuesto de normalidad y su papel en este problema.


d) Verificar la normalidad construyendo una grfica de probabilidad normal. A qu conclusiones se
llega?
Doce inspectores midieron el dimetro de un cojinete de bolas, utilizando cada uno dos tipos diferentes de
calibradores. Los resultados fueron

Inspector
1
2
3
4
5
6
7
8
9
10
11
12

2-16.

57

Calibrador 1
0.265
0.265
0.266
0.267
0.267
0.265
0.267
0.267
0.265
0.268
0.268
0.265

Calibrador 2
0.264
0.265
0.264
0.266
0.267
0.268
0.264
0.265
0.265
0.267
0.268
0.269

a) Existe una diferencia significativa entre las medias de la poblacin de mediciones de las que se seleccio
naron las dos muestras? Utilizar a = 0.05.
b) Encontrar el valor P para la prueba del inciso a.
c) Construir un intervalo de confianza de 95 % para la diferencia en las med iciones de los dimetros prome
dio para los dos tipos de calibradores.
En un artculo de Journal of Strain Analysis (vol. 18, no. 2) se comparan varios procedimientos para predecir
la resistencia al corte de vigas de placas de acero. Los datos para nueve vigas en la forma del cociente de la
carga predicha y la observada para dos de estos procedimientos, los mtodos Karlsruhe y Lehigh, son los si
guientes

Viga
Sl/1
S2/1
S3/1
S4/1
S5/1
S2/1
S2/2
S2/3
S2/4

Mtodo Karlsruhe
1.186
1.151
1.322
1.339
1.200
1.402
1.365
1.537
1.559

Mtodo Lehigh
1.061
0.992
1.063
1.062
1.065
1.178
1.037
1.086
1.052

a) Existe alguna evidencia que apoye la afirmacin de que hay una diferencia en el desempeo promedio
entre los dos mtodos? Utilizar a = 0.05.
b) Cul es el valor P para la prueba del inciso al
c) Construir un intervalo de confianza de 95 % para la diferencia en la carga promedio predicha y la obser
vada.
d) Investigar el supuesto de normalidad en ambas muestras.
e) Investigar el supuesto de normalidad para la diferencia en los cocientes para los dos mtodos.
f) Comentar el papel del supuesto de normalidad en la prueba t pareada.

58
2-17.

CAPTULO 2 EXPERIMENTOS COMPARATIVOS SIMPLES

Se estudia la temperatura de deflexin bajo carga de dos formulaciones diferentes de un tubo de plstico
ABS. Dos muestras de 12 observaciones cada una, se preparan utilizando cada formulacin y las temperatu
ras de deflexin (en F) se presentan abajo:

206
188
205
187

2-18.
2-19.

Formulacin 1
192
193
207
210
185
194
189
178

198
188
189
203

a) Construir las grficas de probabilidad normal para ambas muestras. Estas grficas apoyan los supuestos
de normalidad y de la igualdad de la varianza de ambas muestras?
b) Los datos apoyan la afirmacin de que la temperatura promedio de deflexin bajo carga de la formula
cin 1 excede la de la formulacin 2? Utilizar a = 0.05.
c) Cul es el valor P para la prueba del inciso al
Referirse a los datos del problema 2-17. Los datos apoyan la afirmacin de que la temperatura promedio de
deflexin bajo carga de la formulacin 1 excede la de la formulacin 2 en al menos 3F?
En la fabricacin de semiconductores es comn el uso del grabado qumico hmedo para eliminar el silicio
de la parte posterior de las obleas antes de la metalizacin. La rapidez del grabado es una caracterstica im
portante de este proceso. Se estn evaluando dos soluciones de grabado diferentes. Se grabaron ocho obleas
seleccionadas al azar en cada solucin, y las cifras de la rapidez del grabado observada (en milsimas de pulgada/min) se muestran abajo
Solucin 1
9.9
10.6
9.4
10.3
10.0
9.3
10.3
9.8

2-20.

Formulacin 2
177
176
197
185
206
200
201
197

Solucin 2
10.2
10.6
10.0
10.2
10.4
10.7
10.5
10.3

a) Los datos indican que la afirmacin de que ambas soluciones tienen la misma rapidez de grabado pro
medio es verdadera? Utilizar a = 0.05 y suponer la igualdad de las varianzas.
b) Encontrar un intervalo de confianza de 95 % para la diferencia en la rapidez de grabado promedio.
c) Usar grficas de probabilidad normal para investigar la adecuacin de los supuestos de normalidad e
igualdad de las varianzas.
Se estn comparando dos populares analgsicos con base en la rapidez de absorcin del cuerpo. Especfica
mente, se afirma que la tableta 1 se absorbe con el doble de rapidez que la tableta 2. Suponer que a y a\ se
conocen. Desarrollar un estadstico de prueba para
H 0.2fix

2-21.

Suponga que se est probando


H2
Hi'-Hi * Pi

2-22.

donde of y a\ se conocen. Los recursos para hacer el muestreo son limitados, por lo que n + n2 = N. Cmo
debern asignarse las N observaciones entre las dos poblaciones para obtener la prueba con la potencia ms
alta?
Desarrollar la ecuacin 2-46 para un intervalo de confianza de 100(1 - a) por ciento para la varianza de una
distribucin normal.

2-7 PROBLEMAS

2-23.
2-24.

2-25.

59

Desarrollar la ecuacin 2-50 para un intervalo de confianza de 100(1 - a) por ciento para el cociente of / a\,
donde of y a\ son las varianzas de dos distribuciones normales.
Desarrollar una ecuacin para encontrar un intervalo de confianza de 100(1 - a) por ciento para la diferen
cia en las medias de dos distribuciones normales donde *a\. Aplicar la ecuacin desarrollada a los datos
del experimento del cemento portland, y encontrar un intervalo de confianza de 95%.
Construir un conjunto de datos para los que el estadstico de prueba t pareada sea muy grande, pero para el
cual el estadstico de prueba t de dos muestras o combinada usual sea pequeo. En general, describir cmo se
crearon los datos. Le da esto al lector alguna idea respecto de cmo funciona la prueba t pareada?

Experimentos con un solo


factor: el anlisis de varianza

E n el captulo 2 se analizaron los m todos para com parar dos condiciones o tratam ientos. Por ejemplo, el
experim ento de la fuerza de la tensin de adhesin del cem ento portland incluy dos formulaciones dife
rentes del m ortero. O tra form a de describir este experim ento es como un experim ento con un solo factor,
con dos niveles del factor, donde el factor es la formulacin del m ortero y los dos niveles son los dos m to
dos diferentes para hacer la formulacin. Muchos experimentos de este tipo involucran ms de dos nive
les del factor. E n este captulo se presentan los m todos para el diseo y el anlisis de los experimentos
con un solo factor con a niveles del mismo (o a tratam ientos). Se supondr que el experim ento se ha aleatorizado com pletam ente.

3-1

UN EJEMPLO

U n ingeniero de desarrollo de productos tiene inters en investigar la resistencia a la tensin de una fibra
sinttica nueva que se usar para hacer tela de camisas para caballero. El ingeniero sabe por experiencia
previa que la resistencia a la tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de
m ateriales de la fibra. Adems, sospecha que al aum entar el contenido de algodn se increm entar la re
sistencia, al menos en un principio. Sabe asimismo que el contenido de algodn deber variar entre 10 y
40 p o r ciento p ara que el producto final tenga o tras caractersticas de calidad que se desean (com o la
capacidad de ser som etido a un tratam iento de planchado perm anente). E l ingeniero decide probar ejem
plares en cinco niveles del peso porcentual del algodn: 15,20,25,30 y 35 p o r ciento. lm b in decide pro
b ar cinco ejem plares en cada nivel del contenido de algodn.
Se trata de un ejem plo de un experim ento con un solo factor con a = 5 niveles del fa cto ry = 5 rpli
cas. Las 25 corridas debern realizarse de m anera aleatoria. P ara ilustrar cmo puede aleatorizarse el orden de las corridas, suponga que las corridas se num eran de la siguiente manera:

60

3-1 UN EJEMPLO

Peso
porcentual
del algodn
15
20
25
30
35

Nmero de corrida experimental


4
1
2
3
8
9
6
7
11
12
13
14
19
16
17
18
23
24
21
22

61

5
10
15
20
25

A hora se selecciona un nm ero aleatorio entre 1 y 25. Suponga que este nm ero es 8. Entonces la observacin nm ero 8 (20% de algodn) se corre prim ero. Este proceso se repetira hasta que las 25 observaciones tengan asignada una posicin en la secuencia de prueba.1 M uchos paquetes de software de
com putadora para ayudar a los experim entadores a seleccionar y construir un diseo, aleatorizan el o r
den de las corridas utilizando nm eros aleatorios de esta m anera.
Suponga que la secuencia de prueba obtenida es

Secuencia de prueba
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Nmero de corrida
8
18
10
23
17
5
14
6
15
20
9
4
12
7
1
24
21
11
2
13
22
16
25
19
3

Peso porcentual del algodn


20
30
20
35
30
15
25
20
25
30
20
15
25
20
15
35
35
25
15
25
35
30
35
30
15

E sta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras
desconocidaslas cuales quiz varen fuera de control durante el experim ento contam inen los resulta
dos. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original
no aleatorizado (es decir, prim ero se prueban los cinco ejem plares con 15% de algodn, despus se prue1 La nica restriccin sobre la aleatorizacin en este caso, es que si se saca de nuevo el mismo nmero (es decir, 8), se descarta. Se tra
ta de una restriccin secundaria y se ignora.

62

CAPTULO 3

Tbla 3-1

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Datos (en lb/pulgadaz) del experimento de la resistencia a la tensin

Peso porcentual
del algodn
15
20
25
30
35

1
7
12
14
19
7

2
7
17
18
25
10

Observaciones
3
15
12
18
22
11

4
11
18
19
19
15

5
9
18
19
23
11

Total
49
77
88
108
54
376

Promedio
9.8
15.4
17.6
21.6
10.8
15.04

ban los cinco ejem plares con 20% de algodn, etc.). Si la m quina em pleada para probar la resistencia a la
tensin presenta un efecto de calentam iento tal que entre ms tiem po est funcionando sean m enores las
lecturas de la resistencia a la tensin observadas, el efecto del calentam iento contam inar potencialm en
te los datos de la resistencia a la tensin y destruir la validez del experimento.
Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determ inado. E n la tabla 3-1
se m uestran las observaciones que obtiene para la resistencia a la tensin.
Siempre es una buena idea examinar grficamente los datos experimentales. E n la figura 3-1 se m ues
tran los diagramas de caja para la resistencia a la tensin con cada nivel del peso porcentual de algodn, y
en la figura 3-2 se ilustra un diagrama de dispersin de la resistencia a la tensin contra el peso porcen
tual del algodn. E n la figura 3-2, los puntos rellenos son las observaciones individuales y los crculos hue
cos son los prom edios de la resistencia a la tensin observada. Am bas grficas indican que la resistencia a
la tensin se increm enta cuando el contenido de algodn se increm enta, hasta cerca de 30% de algodn.
Despus de 30% de algodn, hay un m arcado descenso de la resistencia a la tensin. No hay evidencia s
lida que sugiera que la variabilidad de la resistencia a la tensin alrededor del prom edio dependa del peso
porcentual del algodn. Con base en este anlisis grfico simple, se tienen firmes sospechas de que 1) el
contenido de algodn afecta la resistencia a la tensin y 2) alrededor de 30% de algodn produce la resis
tencia mxima.
Suponga que se quiere ser ms objetivo en el anlisis de los datos. Especficamente, imagine que
quieren probarse las diferencias entre las resistencias a la tensin prom edio con todos los niveles a = 5 del

Figura 3-1 Diagramas de caja de la resistencia a la tensin


contra el peso porcentual del algodn.

3-2 EL ANLISIS DE VARIANZA

63

Peso Dorcerrtual del algodn

Figura 3-2 Diagrama de dispersin de la resistencia


a la tensin contra el peso porcentual del algodn.

peso porcentual del algodn. Por lo tanto, el inters se centra en probar la igualdad de las cinco medias. Pu
diera parecer que este problem a se resolvera realizando una prueba t p ara todos los pares de m edias
posibles. Sin em bargo, no es sta la m ejor solucin de este problem a, porque llevara a una distorsin con
siderable en el erro r tipo I. Por ejemplo, suponga que quiere probarse la igualdad de las cinco medias
usando com paraciones por pares. Hay 10 pares posibles, y si la probabilidad de aceptar correctam ente la
hiptesis nula en cada prueba individual es de 1 - a = 0.95, la probabilidad de aceptar correctam ente la
hiptesis nula en las 10 pruebas es de (0.95)10 = 0.60 si las pruebas son independientes. P or lo tanto, ha
ocurrido un increm ento sustancial en el erro r tipo I.
E l procedim iento correcto para probar la igualdad de varias m edias es el anlisis de varianza. Sin
embargo, el anlisis de varianza tiene un rango de aplicaciones m ucho ms amplio que el problem a ante
rior. Probablem ente sea la tcnica ms til en el campo de la inferencia estadstica.

3*2

EL ANLISIS DE VARIANZA

Suponga que se tienen a tratam ientos o niveles diferentes de un solo factor que quieren com pararse. La
respuesta observada de cada uno de los a tratam ientos es una variable aleatoria. Los datos apareceran
como en la tabla 3-2. U na entrada de la tabla 3-2 (por ejemplo, y) representa la observacin;-sim a to-

Tabla 3-2

Datos tpicos de un experimento de u n solo factor

Tratamiento
(nivel)

Tbtales Promedios

Observaciones

1
2

yn
ya

y i2

y*

y&

y-i

>i.
y 2.

yi

y.i

h.
y..

?..

64

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

m ada bajo el nivel del factor o tratamiento i. H abr, en general, n observaciones bajo el tratam iento -simo. Observe que la tabla 3-2 es el caso general de los datos del experim ento de la resistencia a la tensin
de la tabla 3-1.

Modelos para los datos


Se encontrar til describir las observaciones de un experim ento con un modelo. U na m anera de escribir
este m odelo es
yi=M +

e,

1, 2,..., a
, ?
7 = 1,2,...,

(3 '1)

donde y es la observacin i;-sima, /u, es la m edia del nivel del factor o tratam iento i-simo, y es un com
ponente del error aleatorio que incorpora todas las dems fuentes de variabilidad del experimento, inclu
yendo las mediciones, la variabilidad que surge de factores no controlados, las diferencias entre las
unidades experim entales (como los m ateriales de prueba, etc.) a las que se aplican los tratam ientos, y el
ruido de fondo general en el proceso (ya sean la variabilidad con el tiem po, los efectos de variables am
bientales, etc.). Es conveniente considerar que los errores tienen m edia cero, de tal m odo que(y,j) = p.
A la ecuacin 3-1 se le llama el modelo de las medias. U na form a alternativa de escribir un modelo de
los datos es definiendo
fi i = H + T i ,

1= 1 , 2 , . . . ,

de tal m odo que la ecuacin 3-1 se convierte en


y.. = f i + z i + e i

i = 1,

) = 1, 2,..., n

<3-2>

E n esta form a del m odelo,// es un parm etro com n a todos los tratam ientos al que se llama la media glo
bal, y T, es un parm etro nico del tratam iento i-simo al que se le llama el efecto del tratamiento i-simo.
A la ecuacin 3-2 se le llam a por lo general el modelo de los efectos.
Tanto el m odelo de las m edias como el de los efectos son modelos estadsticos lineales; es decir, la va
riable de respuestayj es una funcin lineal de los parm etros del m odelo. A un cuando ambas formas del
m odelo son tiles, el modelo de los efectos se encuentra con mayor frecuencia en la literatura del diseo
experim ental. Tiene cierto atractivo intuitivo por cuanto fi es una constante y los efectos de los tratam ien
tos t representan desviaciones de esta constante cuando se aplican los tratam ientos especficos.
A la ecuacin 3-2 (o a la 3-1) se le llama tam bin el modelo del anlisis de varianza simple o de un
solo factor (o direccin), porque nicam ente se investiga un factor. A dems, ser un requisito que el ex
perim ento se lleve a cabo en orden aleatorio para que el am biente en el que se apliquen los tratam ientos
(llamados con frecuencia unidades experimentales) sea lo ms uniform e posible. Por lo tanto, el diseo
experim ental es un diseo completamente aleatorizado. Los objetivos sern probar las hiptesis apropia
das acerca de las m edias de los tratam ientos y estimarlas. Para probar las hiptesis, se supone que los
errores del m odelo son variables aleatorias que siguen una distribucin norm al e independiente con m e
dia cero y varianza a2. Se supone asimismo que la varianza o2 es constante p ara todos los niveles del factor.
Esto implica que las observaciones
y ~ N ( / i + r o 2)
y que las observaciones son m utuam ente independientes.

3'3 ANUSIS DEL MODELO CON EFECTOS FIJOS

65

Factor fijo o aleatorio?


E l m odelo estadstico (ecuacin 3-2) describe dos situaciones diferentes con respecto a los efectos de los
tratam ientos. Prim era, los a tratam ientos pudieron ser elegidos expresam ente por el experim entador. E n
esta situacin quieren probarse hiptesis acerca de las m edias de los tratam ientos, y las conclusiones se
aplicarn nicam ente a los niveles del factor considerados en el anlisis. Las conclusiones no pueden ex
tenderse a tratam ientos similares que no fueron considerados explcitamente. Tkmbin se podra querer
estim ar los parm etros del m odelo (a, t , o2). A ste se le llama el modelo con efectos fos. D e m anera al
ternativa, los a tratam ientos podran ser u na m uestra aleatoria de una poblacin ms grande de trata
mientos. E n esta situacin sera deseable poder extender las conclusiones (las cuales se basan en la
m uestra de los tratam ientos) a la totalidad de los tratam ientos de la poblacin, sea que se hayan conside
rado explcitamente en el anlisis o no. A qu las t son variables aleatorias, y el conocim iento de las r, p ar
ticulares que se investigaron es relativam ente intil. Ms bien, se prueban hiptesis acerca de la
variabilidad de las r, y se intenta estim ar su variabilidad. A ste se le llama el modelo con efectos aleatorios
o modelo de los com ponentes de la varianza. L a revisin de experim entos con factores aleatorios se pos
pondr hasta el captulo 12.

3-3

ANLISIS DEL MODELO CON EFECTOS FIJOS

E n esta seccin se desarrolla el anlisis de varianza de un solo factor para el m odelo con efectos fijos. R e
cuerde que y, representa el total de las observaciones bajo el tratam iento i-simo. Sea que y, represente el
prom edio de las observaciones bajo el tratam iento t-simo. D e m anera similar, sea que y represente el
gran total de todas las observaciones y que represente el gran prom edio de todas las observaciones.
Expresado simblicamente,
n
y L =

y
j

y l n

' =1

y = 2 S ^
;=i =\

' =!>

(3-3)

y .= y J N

donde N = an es el nm ero total de observaciones. Se nota que el subndice p unto implica la operacin
sum a sobre el subndice que reemplaza.
El inters se encuentra en probar la igualdad de las a m edias de los tratam ientos; es decir, E(y) = /i +
t, = ju, i = 1, 2,
a. Las hiptesis apropiadas son
Ho'-y = i 2 =
= Ha
* fij
para al menos un par (i, j )
E n el m odelo de los efectos, la m edia/t; del tratam iento i-simo se descom pone en dos com ponentes tales
que fi = u + T,. Por lo general, se considera como una m edia global, de tal m odo que
a
----- = f*
a
E sta definicin implica que

S . , -
1-1

66

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Es decir, los efectos del tratam iento o factor pueden considerarse como desviaciones de la m edia global.2
P or consiguiente, una form a equivalente de escribir las hiptesis anteriores es en trm inos de los efectos
de los tratam ientos r, por ejemplo
i f 0: r , = r 2 = . . . r a = 0
H 1:r * 0

para al menos una i

P or lo tanto, se habla de probar la igualdad de las m edias de los tratam ientos o de probar que los efectos
de los tratam ientos (las r,) son cero. E l procedim iento apropiado para probar la igualdad de las m edias de
los a tratam ientos es el anlisis de varianza.

3-3.1

Descomposicin de la suma de cuadrados total

E l nom bre anlisis de varianza se deriva de la particin de la variabilidad total en sus partes com ponen
tes. L a suma de cuadrados total corregida

;-l i- 1

(y ,-* )1

se usa como una m edida de la variabilidad global de los datos. Intuitivam ente, esto es razonable porque,
si S S Ttuviera que dividirse por el nm ero apropiado de grados de libertad (en este caso, a n - 1 = N - 1), se
obtendra la varianza m uestral de lasy. L a varianza m uestral es, desde luego, una m edida estndar de va
riabilidad.
Observe que la sum a de cuadrados total corregida S S T se puede escribir como

SS

ov- jd-

/ - i j= i

-i j - i

[a-j+ov-o2

(3-4)

o
2

i=l ;=1

(y* - - y = " S

'=1

& - y. ) 2 + X S

1 J- 1

~ <- ) 2

(3-5)

(=i j=i
Sin embargo, el trm ino del producto cruzado de la ecuacin 3-5 es cero, ya que
n
2 ( y o - ? / . ) = y>- - ", = y, - n (yL t n ) = 0
Se tiene, por lo tanto,

S (y* " - y =
1=1 j-1

1=1

(- - y...)2+ i-1
S
7*1

(y*- i. )2

(3-6)

L a ecuacin 3-6 establece que puede hacerse la particin de la variabilidad total de los datos, m edida por
la sum a de cuadrados total corregida, en una suma de cuadrados de las diferencias entre los prom edios de
los tratam ientos y el gran prom edio, m s una sum a de cuadrados de las diferencias de las observaciones
dentro de los tratam ientos y el prom edio de los tratam ientos. Entonces, la diferencia entre los prom edios
2 Para ms informacin sobre este tema, referirse al material suplementario del texto del captulo 3.

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

67

de los tratam ientos observados y el gran prom edio es una m edida de las diferencias entre las m edias de
los tratam ientos, m ientras que las diferencias de las observaciones dentro de un tratam iento y el prom e
dio del tratam iento, pueden deberse nicam ente al error aleatorio. P or lo tanto, la ecuacin 3-6 puede es
cribirse simblicamente como
SST = SS,Tratamientos +SSE
donde a SS1Vi0imieiltos se le llam a la sum a de cuadrados debida a los tratam ientos (es decir, entre los trata
m ientos), y a SSE se le llama la suma de cuadrados debida al error (es decir, dentro de los tratam ientos).
H ay a = N observaciones en total; p or lo tanto, S S Ttiene N - 1 grados de libertad. H aya niveles del fac
to r (y m edias de a tratam ientos), de donde
tiene a - 1 grados de libertad. Por ltimo, dentro de
cualquier tratam iento hay n rplicas que proporcionan n - 1 grados de libertad con los cuales estim ar el
error experim ental. Puesto que hay a tratam ientos, se tienen a(n - 1 ) = a n - a = N - a grados de libertad
p ara el error.
Es til examinar explcitamente los dos trm inos del lado derecho de la identidad fundam ental del
anlisis de varianza (ecuacin 3-6). Considere la sum a de cuadrados del error
a

-i |_;=1

t= l j = l

E n esta form a es fcil ver que el trm ino entre corchetes, si se divide por n - 1 , es la varianza m uestral del
tratam iento z'-simo, o
n

A hora pueden com binarse a varianzas m ustrales para obtener una sola estim acin de la varianza pobla
cional com n de la siguiente manera:
a

( n - l ) S + ( n - l ) S + ... + ( n - l ) S 2a

(N -a )
Por lo tanto, SSE/ ( N - a ) es una estim acin com binada de la varianza comn dentro de cada uno de los a
tratam ientos.
D e m anera similar, si no hubiera diferencias entre las m edias de los a tratam ientos, podra usarse la
variacin de los prom edios de los tratam ientos y el gran prom edio para estim ar o2. Especficam ente
2

(y ,-y

-) 2

Tratamientos

a- 1

a 1

es una estimacin de o2 si las m edias de los tratam ientos son iguales. L a razn de esto puede verse de m a
nera intuitiva de la siguiente m anera. La cantidad 2 =1(, - y ) 1 (a - 1 ) estim a o2/, la varianza de los pro-

68

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

medios de los tratam ientos, de donde


~ y ) 2l(a - 1 ) debe estim ar o2 si no hay diferencias en las
m edias de los tratam ientos.
Se observa que la identidad del anlisis de varianza (ecuacin 3-6) nos proporciona dos estimaciones
de o 2: una basada en la variabilidad inherente dentro de los tratam ientos y una basada en la variabilidad
entre los tratam ientos. Si no hay diferencias en las medias de los tratam ientos, estas dos estimaciones de
bern ser muy similares, y si no lo son, se sospecha que la diferencia observada puede ser causada por di
ferencias en las m edias de los tratam ientos. A un cuando se ha usado un razonam iento intuitivo para
desarrollar este resultado, puede adoptarse un enfoque un tanto ms formal.
A las cantidades
55,
a - 1

M S k =-

SSE
N - a

se les llama cuadrados medios. Se exam inarn ahora los valores esperados de estos cuadrados medios.
C onsidere
SSE
E(M S

)= E \
N - a )

N - a

2 2 (y* -yi.) 2
L=i /=i

1
:N - a

2 2 ( ^ - y . y i . + , 2)
i=i j=i

1
'N -a

1
:N - a '

2 2
i=i ;=i
a n

^ + 1

* g

2i=i 2i * 2*

Al sustituir el m odelo (ecuacin 3-1) en esta ecuacin se obtiene


1

E (M S e ) =

N - a

2 2 ( M ^ l + e 9r - - 2 2 A. +r( + e '
n .=1 \ j =1
il j-1

Entonces, al elevar al cuadrado y tom ar el valor esperado de la cantidad entre corchetes, se observa que
los trm inos que incluyen a e ? y ef son reem plazados por a 2 y na2, respectivam ente, debido a que E(et/) =
0. Adem s, todos los productos cruzados que incluyen a tienen valor esperado cero. Por lo tanto, des
pus de elevar al cuadrado y tom ar el valor esperado, la ltim a ecuacin se convierte en
E {M S e ) =
N - a

N fi2 + 2

+ N o 2 N / x 2 2

=i

E (M S e ) = a 2

Ti2 ~ a 2

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

69

Aplicando un enfoque similar puede dem ostrarse tam bin que3

E ( M S Tn^

n rf
= a 2+ ^ - r

Por lo tanto, como se argum ent heursticam ente, M S E = SSE/ ( N - a) estim a o 2 y, si no hay diferencias en
las m edias de los tratam ientos (lo cual implica que r = 0), MSXrataimentos = 55 ltatamienios/(a - 1 ) tam bin esti
m a o 2. Sin embargo, observe que si las m edias de los tratam ientos difieren, el valor esperado del cuadrado
m edio de los tratam ientos es mayor que 2.
Parece claro que es posible realizar u na prueba de la hiptesis de que no hay diferencias en las medias
de los tratam ientos com parando
y M SE. Se considera ahora cmo puede hacerse esta com pa
racin.

3-3.2

Anlisis estadstico

Se investiga ahora cmo puede llevarse a cabo una prueba form al de la hiptesis de que no hay diferen
cias en las m edias de los tratam ientos (H 0\fi1 = fi 2 = =
o de m anera equivalente, H 0:r1 = r 2 = *t =
0). Puesto que se ha supuesto que los errores ey siguen una distribucin norm al e independiente con m e
dia cero y varianza o2, las observaciones^ tienen una distribucin norm al e independiente con m edia// +
t, y varianza o2. Por lo tanto, SS T es una suma de cuadrados de variables aleatorias con una distribucin
norm al; por consiguiente, puede dem ostrarse que SSjJo 2 tiene una distribucin ji-cuadrada con TV- 1 gra
dos de libertad. Adems, puede dem ostrarse que SS J 1 es una variable ji-cuadrada con N - a grados de li
bertad y que SS^ . ^ ^ Jo 2 es una variable ji-cuadrada con a - 1 grados de libertad si la hiptesis nula H 0:t
= 0 es verdadera. Sin embargo, las tres sumas de cuadrados no son necesariam ente independientes, ya
que la sum a de SS-naumientos y SSE es SS-p El siguiente teorem a, que es una form a especial de un teorem a
atribuido a William Cochran, es til para establecer la independencia de SSE y 5Suatami(;ntos.

TEOREMA 3 - 1 ..................................................................................................................................
Teorema de Cochran
Sea Z, igual a NID(0, 1) para i = 1, 2,
2

v y
z

= q 1 + q 2 + ... + q s

1
donde s < v, y Q, tiene v, grados de libertad (* = 1 ,2,..., s). Entonces Q u Q2, ..., Qs son variables aleatorias
ji-cuadrada independientes con Vj,
..., vs grados de libertad, respectivam ente, si y slo si
v = v 1+ v 2 + . . . + v J

Puesto que los grados de libertad de 5SWatamientos y SSE suman TV-1, el nm ero total de grados de liber
tad, el teorem a de Cochran implica que
y SSe/o2 son variables aleatorias ji-cuadrada con
3 Referirse al material suplementario del texto del captulo 3.

7O

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Tabla 3-3

Tabla de anlisis de varianza para el modelo con un solo factor y efectos Ajos
Suma de
cuadrados

F uente de variacin

G rados de
libertad

C uadrado
medio

F0

M*

E n tre los tratam ientos

-^ ^ T r a ta m ie n to s

a-1

mse

=i

E rror (dentro de los


tratam ientos)

SSE = SST S ^T ratam ientos

N -a

Tbtal

ssr

(y - ..f

N -1

m se

1 ; = i

una distribucin independiente. P or lo tanto, si la hiptesis nula de que no hay diferencias en las medias
de los tratam ientos es verdadera, el cociente
SS Tratamientos / ( 1) ASTratamientos
17 _
(3-7)
-Tn
SSE! ( N - a )
se distribuye como F con a - 1 y TV- a grados de libertad. L a ecuacin 3-7 es el estadstico de prueba para
la hiptesis de que no hay diferencias en las medias de los tratam ientos.
Por los cuadrados medios esperados se observa que, en general, M SE es un estim ador insesgado de o2.
Asimismo, bajo la hiptesis nula, MS^atamentoses un estim ador insesgado de a 2. Sin embargo, si la hiptesis
nula es falsa, el valor esperado de ^ - ^ , , ,,, 5 es mayor que a2. Por lo tanto, bajo la hiptesis alternativa, el
valor esperado del num erador del estadstico de prueba (ecuacin 3-7) es mayor que el valor esperado del
denom inador, y H 0 deber rechazarse para valores del estadstico de prueba que son muy grandes. Esto
implica una regin crtica de una sola cola superior. Por lo tanto, H 0 deber rechazarse y concluirse que
hay diferencias en las m edias de los tratam ientos si
1F

> rFa ,a - ltN -a

d o n d eF 0 se calcula con la ecuacin 3-7. D e m anera alternativa, podra usarse el enfoque del v alo ri 3 para
tom ar una decisin.
Es posible obtener frmulas para calcular estas sumas de cuadrados reescribiendo y simplificando las
definiciones de SS Tr ^ ,,n<y SS T en la ecuacin 3-6. Se obtiene as

^-22>N
=i

(3-8)

1=1

SST

=~ y

y2 - * y'
N

(3-9)

L a sum a de cuadrados del error se obtiene por sustraccin como


SS E SST

S S TauBeatgs

(3-10)

El procedim iento de prueba se resum e en la tabla 3-3. Se le conoce como tab la del anlisis de varianza.

EJEMPLO 3 - 1 ....................................................................................................................................
El experimento de la resistencia a la tensin
Para ilustrar el anlisis de varianza, se retom a al ejem plo que empez a com entarse en la seccin 3-1. R e
cuerde que al ingeniero de desarrollo de productos le interesa determ inar si el peso porcentual del algo-

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS

71

dn en una fibra sinttica afecta la resistencia a la tensin, y ha llevado a cabo un experim ento
com pletam ente aleatorizado con cinco niveles del peso porcentual del algodn y cinco rplicas. P or con
veniencia, a continuacin se repiten los datos de la tabla 3-1:
pes0
del algodn

Resistencia a la tensin observada


______________
(lb/pulg2)
2
3
4
5
7
15
11
9
17
12
18
18
19
19
18
18
25
22
19
23
11
10
11
15

1
7
12
14
19
7

15
20
25
30
35

Tbtales

Promedios

y,

y.

49
77
88
108
54

9.8
15.4
17.6
21.6
10.8

X. = 376

.. = 15*04

Se usar el anlisis de varianza p ara probar H.fa = f a = i = t = s contra la hiptesis alternativa


/^algunas m edias son diferentes. Las sumas de cuadrados requeridas se calculan como sigue:
5

I1 /=1

iV

= (7 )2 + ( 7 ) 2 +(15)2 + - +(15)2 + ( l l ) 2 - (3^

SS Tratamientos = l V

n =1

y i.

= 636.96

ir

jv

= \ [(49)2 + + ( 5 4 ) 2] - i

= 475.76

SSE - SST - SSrmamiemgs


= 636.96 - 475.76=161.20
G eneralm ente estos clculos se realizaran en una com putadora, utilizando paquetes de software con la
capacidad de analizar datos de experim entos diseados.
E n la tabla 3-4 se resum e el anlisis de varianza. Observe que el cuadrado m edio entre los tratam ien
tos (118.94) es varias veces mayor que el cuadrado m edio dentro de los tratam ientos o cuadrado m edio
del erro r (8.06). Esto indica que no es posible que las m edias de los tratam ientos sean iguales. E n trm i
nos m s formales, puede calcularse el cociente F, F 0 = 118.94/8.06 = 14.76, y com parar este valor con un
punto porcentual apropiado de la cola superior de la distribucin FA 20. Suponga que el experim entador
h a seleccionado a = 0.05. E n la tabla IV del apndice se encuentra que F 005 4 20 = 2.87. Puesto que F 0 =
14.76 > 2.87, se rechaza H 0 y se concluye que las medias de los tratam ientos difieren; es decir, el peso por
centual del algodn en la fibra afecta de m anera significativa la resistencia a la tensin media. Tambin

Tabla 3-4 Anlisis de varianza de los datos de la resistencia a la tensin____________________________________ _____


F u en te de variacin

Peso porcentual del algodn


Error
Tbtal

S um a d e
c u a d ra d o s

G rad o s d e
lib ertad

C u ad rad o
m ed io

475.76
161.20
636.96

4
20
24

118.94
8.06

F0

V alor F

F0= 14.76

<0.01

72

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

O.B

4|
*0.01,4,20
*0.05. 4, 20

,i_i__ 1__ i__ i_-i__ L


12
y 16
F0
Fa = 14.76

20

Figura 3-3 La distribucin de referencia (Ft 2o) para el estadstico de


prueba F en el ejemplo 3-1.

podra calcularse un valor i 5para este estadstico de prueba. E n la figura 3-3 se m uestra la distribucin de
referencia (F420) para el estadstico de prueba ,F0. Evidentem ente, el valor P es muy pequeo en este caso.
Puesto que F 0.oi,4, 20 = 4.43 y F 0 > 4.43, puede concluirse que un lmite superior del valor P es 0.01; es decir,
P < 0.01 (el valor P exacto es P = 9.11 x IO*6).

Clculos manuales

Posiblemente el lector haya notado que la suma de cuadrados se defini en trm inos de prom edios; es de
cir, por la ecuacin 3-6,
a
SS.Tratamientos
( y .~ y . . ) 2

2
[=1

pero las frmulas de clculo se desarrollaron utilizando los totales. Por ejemplo, para calcular 55llatamientos,
se usara la ecuacin 3-9:

L a razn principal de esto es por conveniencia; adems, los totales y, yy estn m enos sujetos al error de
redondeo que los prom edios y y y
E n general, no deber prestarse dem asiada atencin a los clculos, ya que se cuenta con una amplia
variedad de program as de com putadora p ara realizarlos. Estos program as de com putadora son tam bin
tiles para realizar muchos otros anlisis asociados con el diseo experim ental (como el anlisis residual y
la verificacin de la adecuacin del m odelo). En muchos casos, estos program as tam bin ayudarn al ex
perim entador a establecer el diseo.
C uando es necesario realizar los clculos m anualm ente, en ocasiones es til codificar las observacio
nes. E sto se ilustra en el ejemplo siguiente.

EJEMPLO 3-2
Codificacin de observaciones
Los clculos del anlisis de varianza pueden hacerse con frecuencia de m anera m s precisa o simplificada
codificando las observaciones. Por ejemplo, considere los datos de la resistencia a la tensin del ejemplo

3-3 ANLISIS DEL MODELO CON EFECTOS FIJOS


Tabla 3-5

Datos codicados de la resistencia a la tensin del ejemplo 3-2

Peso
porcentual
del algodn
15
20
25
30
35

73

'
*

-8
-3
-1
4
-8

^8
2
3
10
-5

Observaciones

3
4
0
-3
3
7
-4

-4
3
4
4
0

Tbtales
y.

^6

^26
2
13
33
-21

3
4
8
-4

3-1. Suponga que se resta 15 de cada observacin. Los datos codificados se m uestran en la tabla 3-5. Es
sencillo verificar que
2

S S ,- ( - 8 ) ! + (-8)! + + (-4 )
ninunucnis
. - <-*>'

636.96
^

= 47576

SSE = 161.20
Al com parar estas sumas de cuadrados con las que se obtuvieron en el ejem plo 3-1, se observa que al res
tar u n a constante de los datos originales las sumas de cuadrados no se modifican.
Suponga ahora que cada una de las observaciones del ejemplo 3-1 se m ultiplica por 2. Es sencillo veri
ficar que las sumas de cuadrados de los datos transform ados son S S T = 2547.84,5 1S1YltaiI1CIltos = 1903.04 y
SSE = 644.80. Estas sumas de cuadrados parecen diferir considerablem ente de las que se obtuvieron en el
ejem plo 3-1. Sin embargo, si se dividen por 4 (es decir, 22), los resultados son idnticos. Por ejemplo, para
la sum a de cuadrados de los tratam ientos, 1903.04/4 = 475.76. Asimismo, para los datos codificados, el
cociente F es F = (1903.04/4)/(644.80/20) = 14.76, que es idntico al cociente F de los datos originales.
P or lo tanto, los anlisis de varianza son equivalentes.

Pruebas de aleatorizacin y anlisis de varianza


E n el desarrollo del anlisis de varianza con la prueba F, se ha utilizado el supuesto de que los errores
aleatorios son variables aleatorias que siguen una distribucin norm al e independiente. Ikm bin es po
sible justificar la prueba F como la aproximacin de una prueba de aleatorizacin. Para ilustrar esto, su
ponga que se tienen cinco observaciones de cada uno de dos tratam ientos y que quiere probarse la
igualdad de las m edias de los tratam ientos. Los datos apareceran as:
Tratamiento 1

Tratamiento 2

yn

y 2i

ya

y2

J>23

yu

y is

y-25

Podra usarse el anlisis de varianza con la prueba F para probar H 0.fi1 = pt2. D e m anera alternativa, po
dra recurrirse a un enfoque un tanto diferente. Suponga que se consideran todas las formas posibles de

74

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

asignar los 10 nm eros de la m uestra anterior a los dos tratam ientos. Hay 10!/5!5! = 252 arreglos posibles
de las 10 observaciones. Si no hay ninguna diferencia en las m edias de los tratam ientos, los 252 arreglos
son igualm ente posibles. P ara cada uno de los 252 arreglos, se calcula el valor del estadstico F usando la
ecuacin 3-7. A la distribucin de estos valores F se le llama distribucin de aleatorizacin, y un valor
grande de F indica que los datos no son consistentes con la hiptesis H 0:1 = f i 2. P or ejemplo, si el valor de
F que se observ realm ente fue excedido slo por 5 de los valores de la distribucin de aleatorizacin, esto
correspondera con el rechazo de H 0:fi1 = p 2 con un nivel de significacin de a = 5/252 = 0,0198 (o
1.98%). Observe que no es necesario ningn supuesto de norm alidad en este enfoque.
L a dificultad con este enfoque es que, incluso en problem as relativam ente pequeos, los clculos re
queridos hacen inviable la enum eracin de la distribucin de aleatorizacin exacta. Sin embargo, num e
rosos estudios han dem ostrado que la distribucin F comn de la teora norm al es una buena
aproximacin de la distribucin de aleatorizacin exacta. Por lo tanto, incluso sin el supuesto de norm ali
dad, la prueba F puede considerarse como una aproximacin de la prueba de aleatorizacin. Para ms de
talles sobre las pruebas de aleatorizacin en el anlisis de varianza, ver Box, H unter y H unter [18].

3 -3 .3

E stim acin de los p arm etro s del m odelo

Se presentan ahora los estim adores de los parm etros del m odelo con un solo factor
yiS = p + z +ij
y los intervalos de confianza para las m edias de los tratam ientos. Ms adelante se dem ostrar que estim a
dores razonables de la m edia global y de los efectos de los tratam ientos estn dados por
^ = *
_
i i = yi. - y . .

(3-11)
i = 1, 2 , . . . , a

Estos estim adores poseen un considerable atractivo intuitivo; observe que la m edia global se estim a con
el gran prom edio de las observaciones y que el efecto de cualquier tratam iento no es sino la diferencia en
tre el prom edio del tratam iento y el gran prom edio.
Es posible determ inar con facilidad una estim acin del intervalo de confianza de la m edia del trata
m iento z'-simo. L a m edia del tratam iento z'-simo es
ir,.
U n estim ador puntual de/<sera/i, = m + t = , . A hora bien, si se supone que los errores siguen una dis
tribucin norm al, cada, es una NID(w o2/). Por lo tanto, si 2 fuera conocida, podra usarse la distribu
cin norm al para definir el intervalo de confianza. Al utilizar M SE como estim ador de a 2, el intervalo de
confianza se basara en la distribucin t. Por lo tanto, un intervalo de confianza de 100(1 y a) por ciento
p ara la m edia fi del tratam iento z'-simo es
[m s 7
y i.

^ a !2 ,N - a ^

[M s7

i y i.

K li.N - a y

(3 "1 2 )

U n intervalo de confianza de 100(1 - a ) por ciento para la diferencia en las m edias de dos tratam ientos
cualesquiera, por ejemplo
- p, sera
2M S e
y l - y. - Kn.N-a J

y i. - y.

2M S e

O13)

3-3 A N LISIS DEL MODELO CON EFECTOS FIJOS

75

EJEMPLO 3 - 3 ............................................................................. ......................................................


Utilizando los datos del ejemplo 3-1 pueden encontrarse las estimaciones de la m edia global y de los efec
tos de los tratam ientos como fi = 376/25 = 15.04 y
*i = . = 9.80-15.04 = -5 .2 4
f 2 = 2 y = 15.4015.04 = +0.36
t 3 = 3V y = 17.6015.04 = 2.56
t 4 = y 4 - y = 21.6015.04 = +6.56
f 5 = y s. - ?.. = 10.80-15.04 = -4 .2 4
U n intervalo de confianza de 95% para la m edia del tratam iento 4 (30% de algodn) se calcula con la
ecuacin 3-12 como
2 1 .6 0 - 2 . 0 8 6 ^ y ^ < / < 4 < 21.60+2.086
o
2 1 .6 0 - 2.65< 4 < 2 1 .6 0 + Z 6 5
Por lo tanto, el intervalo de confianza de 95% deseado es 18.95 < /4 < 24.25.

Intervalos de confianza simultneos


Las expresiones para los intervalos de confianza dados en las ecuaciones 3-12 y 3-13 son intervalos de con
fianza uno a la vez. Es decir, el nivel de confianza 1 - a slo se aplica a una estim acin particular. Sin em
bargo, en muchos problems, el experim entador tal vez quiera calcular varios intervalos de confianza,
uno para cada una de varias m edias o diferencias entre medias. Si hay inters en r de estos intervalos de
confianza de 100(1 - a ) por ciento, la probabilidad de que los r intervalos sean correctos simultneamen
te es al m enos 1 - r a . A la probabilidad ra se le llama con frecuencia ndice de error en el modo del experi
mento o coeficiente de confianza global. E l nm ero de intervalos r no tiene que ser muy grande antes de
que el conjunto de intervalos de confianza se vuelva relativam ente falto de informacin. Por ejemplo, si
hay r = 5 intervalos y a = 0.05 (una eleccin tpica), el nivel de confianza sim ultneo para el conjunto de
los cinco intervalos de confianza es de al m enos 0.75, y si r = 10 y a = 0.05, el nivel de confianza sim ult
neo es de al m enos 0.50.
U n enfoque para asegurarse de que el nivel de confianza sim ultneo no sea dem asiado pequeo es
sustituir a l2 con al(2r) en las ecuaciones 3-12 y 3-13 del intervalo de confianza uno a lavez. A ste se le lla
m a el mtodo de Bonferroni, y le perm ite al experim entador construir un conjunto de r intervalos de con
fianza simultneos para las m edias de los tratam ientos o las diferencias en las m edias de los tratam ientos
p ara los que el nivel de confianza global es de al m enos 100(1 - a ) p o r ciento. Cuando r no es muy grande,
ste es un m todo muy atinado que produce intervalos de confianza razonablem ente cortos. Para ms in
formacin, referirse al m aterial suplem entario del texto del captulo 3.

3-3-4

D a to s n o balanceados

E n algunos experim entos con un solo factor, puede ser diferente el nm ero de observaciones que se h a
cen dentro de cada tratam iento. Se dice entonces que el diseo es no balanceado. Sigue siendo posible
aplicar el anlisis de varianza descrito arriba, pero deben hacerse ligeras modificaciones en las frmulas

76

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR; EL ANLISIS DE VARIANZA

de las sumas de cuadrados. Sea que se hagan n observaciones bajo el tratam iento i (i = 1 ,2 ,..., a) y que
N = 2 =!, . Las frmulas para calcular m anualm ente SST y 55Tratamientos quedan como
(3 1 4 )

i=i

ly

= 7
i-1

- ~
ni

(3-15)

YV

No se requieren ms cambios en el anlisis de varianza.


Hay dos ventajas al elegir un diseo balanceado. Prim era, el estadstico de prueba es relativam ente
insensible a las desviaciones pequeas del supuesto de la igualdad de las varianzas de los a tratam ientos
cuando los tam aos de las m uestras son iguales. No es ste el caso cuando los tam aos de las m uestras son
diferentes. Segunda, la potencia de la prueba se maximiza cuando las m uestras tienen el mismo tam ao.

3-4

VERIFICACIN DE LA ADECUACIN DEL MODELO

La descomposicin de la variabilidad presente en las observaciones m ediante la identidad del anlisis de


varianza (ecuacin 3-6) es una relacin puram ente algebraica. Sin embargo, el uso de la particin para
probar form alm ente que no hay diferencias en las m edias de los tratam ientos requiere que se satisfagan
ciertos supuestos. Especficam ente, estos supuestos son que el modelo
y 9 = n + r + e
describe de m anera adecuada las observaciones, y que los errores siguen u na distribucin norm al e inde
pendiente con m edia cero y varianza o2 constante pero desconocida. Si estos supuestos se satisfacen, el
procedim iento del anlisis de varianza es una prueba exacta de la hiptesis de que no hay diferencias en
las m edias de los tratam ientos.
Sin embargo, es com n que en la prctica estos supuestos no se satisfagan exactamente. Por consi
guiente, en general no es prudente confiar en el anlisis de varianza hasta haber verificado estos supues
tos. Las violaciones de los supuestos bsicos y la adecuacin del m odelo pueden investigarse con facilidad
m ediante el examen de los residuales. El residual de la observacin j-sim a en el tratamiento /-simo se
define como
e'j = ya - y a

(3-16)

donde y :j es una estimacin de la observacin _y correspondiente que se obtiene como sigue:


%
= ?..+(?,-?)
= yL

(3-17)

L a ecuacin 3-17 da el resultado intuitivam ente claro de que la estimacin de cualquier observacin en el
tratam iento i-simo no es sino el prom edio del tratam iento correspondiente.
E l examen de los residuales deber ser una parte autom tica de cualquier anlisis de varianza. Si el
m odelo es adecuado, los residuales debern estar sin estructura; es decir, no debern contener patrones
obvios. A travs de un estudio de los residuales, pueden descubrirse muchos tipos de inadecuaciones del
m odelo y violaciones de los supuestos subyacentes. E n esta seccin se indica cmo puede hacerse con fa
cilidad la verificacin de diagnstico del m odelo m ediante el anlisis grfico de los residuales y cmo re
solver varias anorm alidades que ocurren comnm ente.

3-4 VERIFICACIN DE LA ADECUACIN DEL MODELO

3-4.1

77

El supuesto de normalidad

L a verificacin del supuesto de norm alidad podra hacerse grafcando un histogram a de los residuales. Si
se satisface el supuesto de NID (0, o2) para los errores, esta grfica deber aparecer como una m uestra de
una distribucin norm al con centro en cero. D esafortunadam ente, cuando se trabaja con m uestras pe
queas, suelen ocurrir fluctuaciones significativas, por lo que la aparicin de u na desviacin m oderada de
la norm alidad no implica necesariam ente una violacin seria de los supuestos. Las desviaciones m arcadas
de la norm alidad son potencialm ente serias y requieren anlisis adicional.
U n procedim iento en extremo til es construir una grfica de probabilidad norm al de los residuales.
R ecuerde que en el captulo 2 se utiliz u na grfica de probabilidad norm al de los datos originales para
verificar el supuesto de norm alidad cuando se us la prueba t. E n el anlisis de varianza, por lo general es
ms eficaz (y directo) hacer lo mismo con los residuales. Si la distribucin fundam ental de los errores es
norm al, esta grfica tendr la apariencia de una lnea recta. Para visualizar la lnea recta, deber prestarse
ms atencin a los valores centrales de la grfica que a los valores extremos.
E n la tabla 3-6 se m uestran los datos originales y los residuales de los datos de la resistencia a la ten
sin del ejemplo 3-1. La grfica de probabilidad norm al se m uestra en la figura 3-4. La im presin general
que surge al examinar esta representacin es que la distribucin de los errores puede tener un ligero ses
go, con la cola derecha siendo ms larga que la izquierda. L a tendencia de la grfica de probabilidad nor
mal a curvarse hacia abajo ligeram ente del lado izquierdo, implica que la cola izquierda de la distribucin
de los errores sea un tanto ms delgada de lo que se anticipara con una distribucin norm al; es decir, los
residuales negativos no son tan grandes (en valor absoluto) como se esperaba. Sin embargo, esta grfica
no m uestra una desviacin m arcada de la distribucin normal.
E n general, las desviaciones m oderadas de la norm alidad no son motivo de gran preocupacin en el
anlisis de varianza de efectos fijos (recuerde el anlisis de las pruebas de aleatorizacin de la seccin 3-3.2).
U na distribucin de los errores que tiene colas considerablemente ms gruesas o delgadas que la distribu
cin norm al es motivo de mayor preocupacin que im a distribucin sesgada. Puesto que la prueba F slo se
afecta ligeramente, se dice que el anlisis de varianza (y los procedimientos relacionados como las compa
raciones mltiples) es robusto con respecto al supuesto de normalidad. Las desviaciones de la normalidad
hacen por lo general que tanto el verdadero nivel de significacin como la verdadera potencia difieran lige
ram ente de los valores anunciados, con la potencia siendo generalm ente ms baja. El modelo de los efectos
aleatorios que se revisar en el captulo 12 se afecta en form a ms severa por la no normalidad.
Tabla 3-6

Datos y residuales del ejemplo 3-1

porcentual
del algodn

___________________ Observaciones (j)


2
1
3

-2.8
7 (19)

5.2
15 (25)

1.6
17 (14)
0.4
18 (13)
3.4
25 (5)

-3.4
(1)
0.4
18 (20)

19

30

-2.8
7 (15)
-3.4
12 (8)
-3.6
14 (18)
-2.6
19 (22)

22

0.4
(2)

19

1.2
(12)
2.6
(11)
1.4
(7)
-2.6
(24)

-0.8
(6)
2.6
(3)
1.4
(9)
1.4
(10)

21.6

35

-3.8
7 (17)

0.8
10 (21)

11

0.2
(4)

4.2
15 (16)

0.2
11 (23)

10.8

15
20
25

12

11
18

9
19
19
23

%=%
9.8
15.4
17.6

Los residuales se indican en el recuadro de cada celda. Los nmeros entre parntesis indican el orden en que se recolectaron los datos.

78

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Residual

Figura 3-4

Grfica de probabilidad normal de los residuales del ejemplo 3-1.

U n a anom ala muy com n que suele ponerse de manifiesto en las grficas de probabilidad norm al es
un residual que es m ucho ms grande que cualquier otro. A un residual as se le llama con frecuencia pun
to atipico. L a presencia de uno o ms puntos atpicos puede introducir serias distorsiones en el anlisis de
varianza, por lo que cuando se localiza un punto atipico potencial, se requiere una investigacin atenta.
E n muchas ocasiones, la causa del punto atipico es un error en los clculos o un error al codificar o copiar
los datos. Si no es sta la causa, las circunstancias experim entales que rodean esta corrida particular de
ben estudiarse con atencin. Si la respuesta atipica ocurre en un valor particularm ente deseable (alta re
sistencia, costo bajo, etc.), el punto atipico puede ser ms informativo que el resto de los datos. D eber
tenerse cuidado de no rechazar o descartar una observacin atipica a m enos que se tengan razones no es
tadsticas de peso para hacerlo. E n el peor de los casos, puede term inarse con dos anlisis; uno con el pun
to atipico y uno sin l.
Existen varios procedim ientos estadsticos formales para detectar puntos atpicos (por ejemplo, ver
B am etty Lewis [8], John y Prescott [60] y Stefansky [107]). Puede hacerse una verificacin aproxim ada de
los puntos atpicos examinando los residuales estandarizados

3-4 VERIFICACIN DE L \ ADECUACIN DEL MODELO

79

Si los errores son N (0, o2), los residuales estandarizados debern ser aproxim adam ente norm ales con
m edia cero y varianza unitaria. Por lo tanto, cerca de 68% de los residuales estandarizados debern estar
incluidos dentro de los lmites 1, cerca de 95% de ellos debern estar incluidos dentro de 2 y virtual
m ente todos ellos debern estar incluidos dentro de 3. U n residual mayor que 3 o 4 desviaciones estn
dar a partir de cero es un punto atipico potencial.
P ara los datos de la resistencia a la tensin del ejem plo 3-1, la grfica de probabilidad norm al no pro
duce indicio alguno de puntos atpicos. Adems, el residual estandarizado mayor es

e*

5'2 - 5'2

13 " J m T e ~ V 0 6

2.84

el cual no deber ser motivo de preocupacin.

3-4.2

Grfica de los residuales en secuencia en el tiempo

La graficacin de los residuales en el orden tem poral de la recoleccin de los datos es til para detectar
correlaciones entre los residuales. U na tendencia a tener corridas de residuales positivos y negativos indi
ca una correlacin positiva. Esto implicara que el supuesto de independencia de los errores ha sido viola
do. Se trata de un problem a potencialm ente serio y cuya solucin es difcil, p o r lo que de ser posible es
im portante evitar el problem a cuando se colecten los datos. L a aleatorizacin adecuada del experim ento
es un paso im portante para conseguir la independencia.
E n ocasiones las habilidades del experim entador (o los sujetos) pueden cam biar conforme el experi
m ento avanza, o el proceso bajo estudio puede vagar sin rum bo o volverse m s errtico. Esto producir
con frecuencia un cambio en la varianza del error con el tiempo. E sta condicin suele llevar a una grfica
de los residuales contra el tiem po que m uestra una dispersin mayor en uno de sus extremos que en el
otro. U n a varianza no constante es un problem a potencialm ente serio. E n las secciones 3-4.3 y 3-4.4 se
abundar sobre el tema.
E n la tabla 3-6 se m uestran los residuales y la secuencia en el tiem po de la recoleccin de los datos
para el experim ento de la resistencia a la tensin. E n la figura 3-5 se presenta una grfica de estos residuae
5
4
3
2

i
15
i o
8
-i

10

15

20

Tiempo

-2

-3

-i
~5

-6
Figura 3-5

Grfica de los residuales contra el tiempo.

25

80

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

les contra el tiempo. No hay razn p ara sospechar cualquier violacin de los supuestos de independencia
o de una varianza constante.

3-4.3

Grfica de los residuales contra los valores ajustados

Si el m odelo es correcto y se satisfacen los supuestos, los residuales debern estar sin estructura; en p ar
ticular, no debern estar relacionados con ninguna otra variable, incluyendo la respuesta predicha. U na
verificacin simple es graficar los residuales contra los valores ajustados y tj. (Para el m odelo de un experi
m ento con un solo factor, recuerde que yt = y , el prom edio del tratam iento z-simo.) E sta grfica no de
ber m ostrar ningn patrn obvio. E n la figura 3-6 se grafican los residuales contra los valores ajustados
para los datos de la resistencia a la tensin del ejemplo 3-1. No es evidente ninguna estructura inusual.
U n defecto que sale a relucir en ocasiones en esta grfica es una varianza no constante. E n ocasiones la
varianza de las observaciones se increm enta cuando la magnitud de la observacin se incrementa. ste sera
el caso si el error o ruido de fondo del experimento fuera un porcentaje constante de la m agnitud de la ob
servacin. (Esto ocurre com nm ente con muchos instrumentos de medicin; el error es un porcentaje de la
escala de medicin.) Si ste fuera el caso, los residuales se haran mayores conforme y,-, se hiciera ms gran
de, y la grfica de los residuales c o n tra ^ se vera como un em budo o un m egfono con la boca hacia afuera.
U na varianza no constante tam bin surge en los casos en que los datos siguen una distribucin no normal,
sesgada, porque en las distribuciones sesgadas la varianza tiende a ser una funcin de la media.
Si se viola el supuesto de la hom ogeneidad de las varianzas, la prueba F slo resulta afectada ligera
m ente en el m odelo balanceado (el mismo tam ao de la m uestra en todos los tratam ientos) con efectos fi
jos. Sin embargo, en diseos no balanceados o en casos en que una de las varianzas es considerablem ente
m s grande que las dems, el problem a es ms grave. Especficam ente, si los niveles del factor que tienen
las varianzas mayores corresponden tam bin con los tam aos de las m uestras ms pequeos, el ndice de
erro r tipo I real es mayor que lo previsto (o los intervalos de confianza tienen niveles de confianza reales
m s bajos que los que fueron especificados). Recprocam ente, si los niveles del factor con las varianzas
mayores tienen tam bin los tam aos de las m uestras mayores, los niveles de significacin son m ucho m e
nores que lo anticipado (los niveles de confianza son ms altos). sta es u na buena razn para escoger ta
m aos de las m uestras iguales siem pre que sea posible. Para los m odelos con efectos aleatorios, las
6
5
4

3
2

3 o
s
= -i

J ________ LS______ 1___


5

10

15

1 #
20

25

2
-3

-5 -6

Figura 3-6

Grfica de los residuales contra los valores ajustados.

3-4 VERIFICACIN DE LA ADECUACIN DEL MODELO

81

varianzas del error diferentes pueden introducir alteraciones significativas en las inferencias sobre los
com ponentes de la varianza, incluso cuando se usan diseos balanceados.
El enfoque usual para abordar el problem a de una varianza no constante que ocurre por las razones
expuestas antes consiste en aplicar una transform acin p ara estabilizar la varianza para correr despus
el anlisis de varianza en los datos transform ados. E n este enfoque, deber tenerse presente que las con
clusiones del anlisis de varianza se aplican a las poblaciones transformadas.
Se han dedicado considerables esfuerzos de investigacin a la seleccin de una transform acin ade
cuada. Si los experim entadores conocen la distribucin terica de las observaciones, pueden hacer uso de
esta inform acin para elegir la transform acin. Por ejemplo, si las observaciones siguen la distribucin de
Poisson, se usarla la transform acin de la raz cuadrada y* = J y ~ o y'j = J l + y. Si los datos siguen la
distribucin lognormal, la transform acin logartm ica y* = log es adecuada. Para datos binomiales ex
presados como fracciones, la transform acin arcsen >>* = arcsen^y es til. C uando no hay una transfor
m acin obvia, el experim entador realizar por lo general la bsqueda emprica de una transform acin
que iguale la varianza independientem ente del valor de la media. Al final de esta seccin se ofrecen algu
nos consejos al respecto. E n los experim entos factoriales, los cuales se introducen en el captulo 5, otro
enfoque es seleccionar una transform acin que minimice el cuadrado m edio de las interacciones, siendo
el resultado un experim ento cuya interpretacin es ms sencilla. E n el captulo 14 se revisan con mayor
detalle los m todos para seleccionar analticam ente la form a de la transform acin. Las transform aciones
que se hacen para la desigualdad de la varianza afectan tam bin la form a de la distribucin del error. En
la m ayora de los casos, la transform acin hace que la distribucin del error est ms cerca de la distribu
cin norm al. Para ms detalles sobre las transform aciones, referirse a B artlett [7], B oxy Cox [15], Dolby
[38] y D rap er y H unter {39].
Pruebas estadsticas para la igualdad de la varianza
Aun cuando es frecuente el uso de las grficas residuales para diagnosticar la desigualdad de la varianza,
se han propuesto tam bin varias pruebas estadsticas. Estas pruebas pueden considerarse como pruebas
formales de las hiptesis
H 0' a i

= a 2

=l

H 1 : el enunciado anterior no es verdadero para al m enos una o f


U n procedim iento muy utilizado es la prueba de B artlett. El procedim iento incluye el clculo de un
estadstico cuya distribucin de m uestreo est aproximada muy de cerca p o r la distribucin ji-cuadrada
con a - 1 grados de libertad cuando las a m uestras aleatorias son de poblaciones norm ales independien
tes. El estadstico de prueba es
= 2.3026
c
donde
q = ( N - a ) log10 S -
c = 1+

(n,- - 1 ) logI0 S f

3 (a -l)

n 2

'

_____________

N -a

y S f es la varianza m uestral de la poblacin i-sima.

(3-19)

82

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR; EL ANLISIS DE VARIANZA

La cantidad q es grande cuando la diferencia entre las varianzas m ustrales S f es considerablem ente
grande, y es igual a cero cuando todas las S? son iguales. Por lo tanto, H 0 deber rechazarse para los valo
res de x l que sean muy grandes; es decir, se rechaza H 0 slo cuando
Xo "> Xa,a- 1

donde x l , a~i es el punto porcentual a superior de la distribucin ji-cuadrada con a - 1 grados de libertad.
Tkmbin podra usarse el enfoque del valor P para tom ar una decisin.
L a prueba de B artlett es muy sensible al supuesto de norm alidad. Por consiguiente, cuando la validez
de este supuesto est en duda, no deber usarse la prueba de Bartlett.

EJEMPLO 3 - 4 ......... ................................................................. ........................................................


Ya que el supuesto de norm alidad no est en entredicho, la prueba de B artlett puede aplicarse a los datos
de la resistencia a la tensin del experim ento del peso porcentual de algodn del ejem plo 3-1. Se calculan
prim ero las varianzas m ustrales de cada tratam iento y se encuentra que S f - 11.2, S 2 =9. 8, S 3 = 4.3, ,S42
= 6 .8 y
= 8.2. Entonces
4(11.2)+4(9.8)+4(4.3)+ 4(6.8)+4(8.2) _

2
p

20

- 8-06

q = 201og10(8 .0 6 )-4 [lo g 10 11.2+log ,0 9.8+log 10 4.3+ log 10 6 . 8 + lo g 10 8.2]= 0.45


c = l + - - - 1=
3(4) U 20/

1 .1 0

y el estadstico de prueba es
X = 2 . 3 0 2 6 ^ ^ = 0 . 9 3

(1.10)

P uesto que x l os 4 = 9.49, no puede rechazarse la hiptesis nula y se concluye que las cinco varianzas son
iguales. Se trata de la misma conclusin a la que se lleg al analizar la grfica de los residuales contra los
valores ajustados.

D ebido a que la prueba de B artlett es sensible al supuesto de norm alidad, puede haber situaciones en
las que sera til un procedim iento alternativo. A nderson y M cLean [2] presentan una atinada revisin de
algunas pruebas estadsticas de la igualdad de la varianza. L a prueba de Levene modificada (ver Levene
[72] y Conover, Johnson y Johnson [31]) es un procedim iento muy til que es robusto en cuanto a las des
viaciones de la norm alidad. Para probar la hiptesis de que las varianzas son iguales en todos los trata
mientos, la prueba de Levene m odificada utiliza la desviacin absoluta de las observaciones y de cada
tratam iento de la m ediana de los tratam ientos, por ejemplo J .. Sea que estas desviaciones se denoten por

"

Iy"

[y = 1, 2,..., n

L a prueba de Levene modificada evala entonces si la m edia de estas desviaciones es igual o no para to
dos los tratam ientos. Cuando las desviaciones m edias son iguales, las varianzas de las observaciones de

3-4 VERIFICACIN DE LA ADECUACIN DEL MODELO


Tabla 3-7

83

Datos de la descarga pico

Mtodo de
estimacin
1
2
3
4
Mtodo de
estimacin
1
2
3
4

0.34
0.91
6.31
17.15

0.12
2.94
8.37
11.82

Observaciones
1.23
0.70
2.14
2.36
9.75
6.09
10.95
17.20

1.75
2.86
9.82
14.35

0.12
4.55
7.24
16.82

y.

y,

s,

0.71
2.63
7.93
14.72

0.520
2.610
7.805
15.59

0.66
1.09
1.66
2.77

Desviaciones d
,para la prueba de Levene modificada
1.23
0.40
0.18
0.40
0.71
0.18
1.94
0.47
0.25
0.25
1.70
0.33
2.015
0.565
0.565
1.945
1.715
1.495
1.24
1.23
1.56
3.77
4.64
1.61

todos los tratam ientos sern iguales. El estadstico de prueba para la prueba de Levene es simplemente el
estadstico F ANO VA usual para probar la igualdad de las medias que se aplica a las desviaciones absolutas.

EJEMPLO 3 - 5 ....................................................................................................................................
U n ingeniero civil est interesado en determ inar si cuatro m todos diferentes para estim ar la frecuencia
de las inundaciones producen estimaciones equivalentes de la descarga pico cuando se aplican a la misma
cuenca. C ada procedim iento se usa seis veces en la cuenca, y los datos de las descargas resultantes (en
pies cbicos por segundo) se m uestran en la parte superior de la tabla 3-7. El anlisis de varianza de los
datos, el cual se resum e en la tabla 3-8, implica que hay una diferencia en las estim aciones de la descarga
pico prom edio obtenidas en los cuatro procedim ientos. La grfica de los residuales contra los valores
ajustados, la cual se m uestra en la figura 3-7, es preocupante porque la form a de em budo con la boca ha
cia afuera indica que no se satisface el supuesto de una varianza constante.
Se aplicar la prueba de Levene m odificada a los datos de la descarga pico. La parte superior de la ta
bla 3-7 contiene las medianas de los tratam ientos J y la parte inferior contiene las desviaciones dy alrede
dor de las medianas. La prueba de Levene consiste en realizar un anlisis de varianza estndar en las dr
El estadstico de p ru e b a /7que resulta en este caso e s F 0 = 4.55, para el cual el valor P es P 0.0137. P orlo
tanto, la prueba de Levene rechaza la hiptesis nula de que las varianzas son iguales, coincidiendo en
esencia con el diagnstico que se hizo a partir del examen visual de la figura 3-7. Los datos de la descarga
pico son un buen candidato para una transform acin de datos.

Seleccin emprica de una transformacin


Se seal ya que si los experim entadores conocieran la relacin entre la varianza de las observaciones y la
m edia, podran usar esta inform acin como gua para la seleccin de la form a de la transform acin. Se

Tabla 3-8

Fuente de
variacin
Mtodos
Error
Tbtal

Anlisis de varianza de los datos de la descarga pico

Suma de
cuadrados
708.3471
62.0811
770.4282

Grados de
libertad
3
20
23

Cuadrado
medio
236.1157
3.1041

F0
76.07

Valor P
<0.001

84

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA


4
3
2

iT1 o
-1

:;
t

-2
-3

-i
10

15

20

hFigura 3-7 Grfica de los residuales contra y~ para el


ejemplo 3-5.

desarrolla ahora este punto y se presenta un m todo para seleccionar em pricam ente la form a de la trans
form acin requerida de los datos.
S ea (y ) = i la m edia de y, y suponga que la desviacin estndar de y es proporcional a una potencia
de la m edia de y tal que
ay * a
Q uiere encontrarse una transform acin dey que produzca una varianza constante. Suponga que la trans
form acin es una potencia de los datos originales, por ejemplo
f = yx

(3-20)

Puede dem ostrarse entonces que


ar

(3-21)

Evidentem ente, si se hace X = 1 - a, la varianza de los datos transform ados y* es constante.


E n la tabla 3-9 se resum en varias de las transform aciones comunes analizadas anteriorm ente. O bser
ve que k = 0 implica la transform acin logartmica. Estas transform aciones se enlistan en el orden de
fuerza creciente. Por fuerza de una transform acin se entiende la cantidad de curvatura que induce. U na
transform acin suave aplicada a datos que se extienden en un rango estrecho tiene escaso efecto sobre el

la b ia 3-9

Transformaciones para estabilizar la varianza

Relacin entre

a constante
oy p w
y a

A= 1 - a

0
1/2
1
3/2
2

1
1/2
0
-1/2
-1

Transformacin
Sin transformacin
Raz cuadrada
Log
Raz cuadrada recproca
Recproco

Com entario
D atos (nm eros) de Poisson

3-4 VERIFICACIN DE LA ADECUACIN DEL MODELO

85

1.5 _

1.0

0.5

co

TO

-0.5

_L
1

log,.
Figura 3-8 Grfica de log S contra log y, para los datos de
la descarga pico del ejemplo 3-5.

anlisis, m ientras que una transform acin fuerte aplicada en un rango amplio puede tener resultados dra
mticos. Con frecuencia las transform aciones tienen escaso efecto a m enos que el cociente y mJ y mfn sea
m ayor que 2 o 3.
E n muchas situaciones de diseo experim ental en las que se usan rplicas, a puede estim arse em pri
cam ente a partir de los datos. Puesto que la combinacin i-simo de los tratam ientos o y / i = d/u%
donde 6 es una constante de proporcionalidad, pueden tom arse logaritmos para obtener
log a y = log 0 + a log n

(3-22)

Por lo tanto, una grfica de log a y contra log//, sera una lnea recta con pendiente a. Puesto que no se co
nocen a y fi, pueden sustituirse estimaciones razonables de ellos en la ecuacin 3-22 y usar la pendiente
del ajuste de la lnea recta resultante como estimacin de a. D e m anera tpica, se usara la desviacin es
tndar Sj y el prom edio , del tratam iento i-simo (o, en trm inos ms generales, la combinacin /-sima
de los tratam ientos o conjunto de condiciones experim entales) para estim ar a y y r
P ara investigar la posibilidad de usar una transform acin para estabilizar la varianza en los datos de
la descarga pico del ejemplo 3-5, en la figura 3-8 se grafica log S contra log,. La pendiente de la recta que
pasa por estos cuatro puntos est cerca de 1/2 y, p o r la tabla 3-9, esto implica que la transform acin de la
raz cuadrada puede ser apropiada. E l anlisis de varianza de los datos transform ados^* = Vy se presenta
en la tabla 3-10, y en la figura 3-9 se m uestra una grfica de los residuales contra la respuesta predicha.
E sta grfica residual m uestra una m ejora sensible en com paracin con la figura 3-7, por lo que se conclu-

Tabla 3-10

Anlisis de varianza de los datos transformados de la descarga pico, y* = V

F uente de
variacin

Suma de
cuadrados

G rados de
libertad

M todos
E rro r
Total

32.6842
2.6884
35.3726

3
19
22

Cuadrado
medio
10.8947
0.1415

F0

Valor P

76.99

<0.001

86

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Figura 3-9 Grfica de los residuales de los datos transfor


mados contra y ' para los datos de la descarga pico del ejem
plo 3-5.

ye que la transform acin de la raz cuadrada ha sido til. Observe que en la tabla 3-10 se han reducido los
grados de libertad del error en 1 para tom ar en consideracin el uso de los datos para estim ar el parm e
tro de la transform acin a.
E n la prctica, muchos experim entadores seleccionan la form a de la transform acin probando varias
alternativas y observando el efecto de cada transform acin en la grfica de los residuales contra la res
puesta predicha. Entonces se selecciona la transformacin que produjo la grfica residual ms satisfactoria.

3-4-4

Grficas de los residuales contra otras variables

Si se han recolectado datos de cualesquiera otras variables que posiblem ente pudieran afectar la respues
ta, los residuales debern graficarse contra estas variables. Por ejemplo, en el experim ento de la resisten
cia a la tensin del ejemplo 3-1, la resistencia puede ser afectada de m anera significativa p o r el espesor de
la fibra, por lo que los residuales debern graficarse contra el espesor de la fibra. Si se usaron diferentes
m quinas de prueba para recolectar los datos, los residuales debern graficarse contra las mquinas. Los
patrones en tales grficas residuales im plican que la variable afecta la respuesta. Esto sugiere que la varia
ble debera controlarse con mayor atencin en experim entos futuros o que debera incluirse en el anlisis.

3-5

INTERPRETACIN PRCTICA DE LOS RESULTADOS

Despus de realizar el experim ento, llevar a cabo el anlisis estadstico e investigar los supuestos funda
m entales, el experim entador est listo para sacar conclusiones prcticas acerca del problem a bajo estu
dio. M uchas veces esto es relativam ente fcil, y ciertam ente en los experim entos sencillos que se han
considerado hasta este punto, esto podra hacerse de m anera un tanto informal, tal vez m ediante la ins
peccin de las representaciones grficas, como los diagramas de caja y el diagram a de dispersin de las fi
guras 3-1 y 3*2. Sin embargo, en algunos casos es necesario aplicar tcnicas ms formales. E n esta seccin
se presentarn algunas de ellas.

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

3-5.1

87

Un modelo de regresin

Los factores que intervienen en un experim ento pueden ser cuantitativos o cualitativos. U n factor cuan
titativo es aquel cuyos niveles pueden asociarse con puntos en una escala num rica, como la tem peratura,
la presin o el tiempo. Los factores cualitativos, por otra parte, son aquellos cuyos niveles no pueden o r
denarse por magnitud. Los operadores, los lotes de m ateria prim a y los cambios de tum o son factores
cualitativos tpicos, ya que no existe ninguna razn para ordenarlos bajo algn criterio numrico particular.
E n lo que se refiere al diseo inicial y al anlisis del experimento, ambos tipos de factores se tratan de
m anera idntica. El experim entador est interesado en determ inar las diferencias, en caso de haberlas,
en tre los niveles de los factores. Si el factor es cualitativo, como los operadores, no tiene sentido conside
ra r la respuesta de una corrida subsecuente en un nivel interm edio del factor. Sin embargo, con un factor
cuantitativo como el tiem po, el experim entador tiene inters p or lo general en el rango com pleto de los
valores usados, particularm ente la respuesta de una corrida subsecuente con un nivel interm edio del fac
tor. Es decir, si se usan los niveles 1.0,2.0 y 3.0 en el experimento, tal vez quiera predecir la respuesta de
2.5 horas. Por lo tanto, el experim entador tiene con frecuencia inters en desarrollar una ecuacin de in
terpolacin para la variable de respuesta del experim ento. E sta ecuacin es un modelo em prico del p ro
ceso que se h a estudiado.
Al enfoque general para ajustar m odelos empricos se le llama anlisis de regresin, el cual se analiza
en detalle en el captulo 10. Vase tam bin el material suplementario del texto para este captulo. E n esta
seccin se ilustra brevemente la tcnica utilizando los datos de la resistencia a la tensin del ejemplo 3-1.
E n la figura 3-10 se presenta el diagram a de dispersin de la resistencia a la tensine contra el peso
porcentual del algodn* en la tela para el experim ento del ejem plo 3-1. Los crculos huecos de la grfica
son las resistencias de tensin prom edio para cada valor a: del peso porcentual del algodn. A partir del
examen del diagram a de dispersin, es evidente que la relacin entre la resistencia a la tensin y el peso

Figura 3-10 Diagrama de dispersin para los datos


de la resistencia a la tensin del ejemplo 3-1.

88

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

porcentual del algodn no es lineal. Como una prim era aproximacin, podra intentarse ajustar un mode
lo cuadrtico para los datos, por ejemplo
y = 0+. x + ^ + e
d o n d e a,i y i son parm etros desconocidos que debern estim arse y e es un trm ino del error aleatorio.
El m todo que se usa con mayor frecuencia para estim ar los parm etros en un m odelo como ste es el m
todo de mnimos cuadrados. ste consiste en elegir estimaciones de las tales que minimicen la suma de
cuadrados de los errores (las e). El ajuste de mnimos cuadrados en el ejem plo que se considera aqu es
j>=-3 9 .9 8 8 6 + 4 .5 9 6 * -0.0886*2
(Si el lector no est familiarizado con los m todos de regresin, vea el captulo 10 y el m aterial suplem en
tario del texto para este captulo.)
E n la figura 3-10 se m uestra este m odelo cuadrtico. No parece muy satisfactorio, ya que subestima
de m anera drstica las respuestas p a ra * = 30% de algodn y sobrestim a las respuestas p a r a * = 25%.
Quiz pueda lograrse un m ejoram iento agregando un trm ino cbico en*. El ajuste con el modelo cbico
resultante es
y = 62.6114- 9.0114*+0.4814*2 - 0.0076*3
Este ajuste cbico se ilustra tam bin en la figura 3-10. El modelo cbico parece m ejor que el cuadrtico
porque proporciona un ajuste m ejor para * = 25 y * = 30% de algodn.
E n general, sera preferible hacer el ajuste con el polinomio de orden m enor que describa adecuada
m ente el sistema o proceso. E n este ejemplo, el polinomio cbico parece un m ejor ajuste que el cuadrti
co, por lo que la complejidad adicional del modelo cbico se justifica. Sin embargo, seleccionar el orden
del polinomio de aproximacin no siem pre es fcil, y es relativam ente sencillo excederse en el ajuste, es
decir, agregar polinomios de orden superior que no m ejoran en realidad el ajuste pero que increm entan
la com plejidad del modelo y con frecuencia dem eritan su utilidad como predictor o ecuacin de interpo
lacin.
E n este ejemplo, el m odelo emprico podra usarse para predecir la resistencia a la tensin m edia
para los valores del peso porcentual del algodn dentro de la regin de experimentacin. E n otros casos,
el m odelo emprico podra usarse para la optimizacin del proceso, es decir, p ara encontrar los niveles de
las variables del diseo que dan como resultado los m ejores valores de la respuesta. Ms adelante se ana
lizarn e ilustrarn en detalle estos problemas.

3 '5 .2

C o m p araciones en tre las m edias de los tratam ien to s

Suponga que al hacer el anlisis de varianza en el m odelo con efectos fijos se rechaza la hiptesis nula. Por
lo tanto, hay diferencias entre las m edias de los tratam ientos, pero no se especifica exactam ente cules
m edias difieren. E n ocasiones pueden ser de utilidad en esta situacin las com paraciones y los anlisis
adicionales entre grupos de las medias de los tratam ientos. L a m edia del tratam iento z'-simo se define
como = fi + r y /, se estim a cony,. Las comparaciones entre las m edias de los tratam ientos se hacen ya
sea en trm inos de los totales de los tratam ientos {y,} o bien de los prom edios de los tratam ientos {y, }. Es
com n llam ar a los procedim ientos p ara hacer estas comparaciones mtodos de comparaciones mlti
ples. E n varias de las secciones siguientes se analizan los m todos para hacer com paraciones entre las m e
dias de los tratam ientos individuales o de grupos de estas medias.

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

3-5.3

89

Comparaciones grficas de medias

Es muy sencillo desarrollar un procedim iento grfico para la com paracin de las m edias despus de un
anlisis de varianza. Suponga que el factor de inters tiene a niveles y quej^ ,y 2.,
son l s prom edios
de los tratam ientos. Si se conoce a, el prom edio de cualquier tratam iento tendra una desviacin estndar
<r/V. Por consiguiente, si todas las m edias de los niveles del factor son idnticas, las m edias mustrales
observadas^, se com portaran como un conjunto de observaciones tom adas al azar de una distribucin
norm al con m edia y desviacin estndar o/Vn. Visualice una distribucin norm al con la capacidad de ser
deslizada sobre un eje abajo del cual estn graficadasy, ,y2) - , a.- Si todas las medias de los tratam ientos
son iguales, deber haber una posicin de esta distribucin que haga evidente que los valoresy se sacaron
de la misma distribucin. Si no es ste el caso, los valoresy que no parecen haberse sacado de esta distri
____
bucin se asocian con los niveles del factor que producen respuestas m edias diferentes.
L a nica falla en esta lgica es que o es desconocida. Sin embargo, puede sustituirse o con yjMS del
anlisis de varianza y usar una distribucin t con un factor de escalacin yMSE / n en lugar de la distribu
cin norm al. E n la figura 3-11 se m uestra este arreglo para los datos de la resistencia a la tensin del ejem
plo 3-1.
Para trazar la distribucin t de la figura 3-11, sim plemente se multiplica el valor de la abscisa t por el
factor de escalacin
y/MSE / n = J&.06 / 5 = 1.27
y se grafica contra la ordenada de t en ese punto. D ada la gran similitud entre la distribucin t y la normal,
excepto porque la prim era es un poco m s plana cerca del centro y tiene colas ms largas, por lo general
este trazo se construye fcilmente a ojo. Si quiere obtenerse mayor precisin, en Box, H unter y H unter
[18] se incluye una tabla de los valores de las abscisas t y las ordenadas correspondientes. L a distribucin
p uede tener un origen arbitrario, aun cuando por lo general es m ejor uno que est en la regin de los valo
res
que van a com pararse. E n la figura 3-11, el origen es 15 lb/pulg2.
Visualice ahora el desplazam iento de la distribucin t de la figura 3-11 sobre el eje horizontal y exami
ne las cinco m edias graficadas en la figura. Observe que no hay ninguna posicin de la distribucin tal que
los cinco prom edios puedan considerarse como observaciones tpicas seleccionadas al azar de la distribu
cin. E sto implica que las cinco m edias no son iguales; por lo tanto, la figura es una representacin grfica
de los resultados del anlisis de varianza. La figura indica que 30% de algodn produce resistencias a la
tensin m ucho ms altas que 20 o 25 p o r ciento de algodn (las cuales son aproxim adam ente iguales), y
que 15 o 35 por ciento de algodn (las cuales son aproxim adam ente iguales) produciran resistencias a la
tensin an ms bajas.

Resistencia a la tensin promedio


(Ih/pulg2)

Figura 3-11 Promedio de la resistencia a la tensin del experimento del peso


porcentual del algodn en relacin con una distribucin / con un factor de es
calacin
/ n = v/8.06/ 5 = 127.

90

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

E ste procedim iento simple es una tcnica aproxim ada pero eficaz en muchos problem as de com para
ciones mltiples. Sin embargo, existen m todos ms formales. A continuacin se presenta una breve revi
sin de algunos de estos procedim ientos.

3-5.4

Contrastes

M uchos m todos de com paraciones mltiples utilizan el concepto de contraste. Considere el problem a
de la prueba de la fibra sinttica del ejem plo 3-1. Puesto que se rechaz la hiptesis nula, se sabe que algu
nos pesos porcentuales del algodn producen resistencias a la tensin diferentes que otros, pero, cules
son los que causan en realidad esta diferencia? Al principio del experim ento podra sospecharse que los
niveles 4 y 5 del peso porcentual del algodn (30 y 35 por ciento) producen la misma resistencia a la ten
sin, lo cual implicara que la hiptesis por probar sera
H 0 4 5
H ^.fi 4 * / u 5
o, de m anera equivalente,
H a. 4

[i 5 0

(3-23)

Hi - i- s
Si desde el principio del experim ento se hubiera sospechado que el promedio de los niveles ms bajos del
peso porcentual del algodn (1 y 2) no difera del promedio de los niveles m s altos del peso porcentual
del algodn (4 y 5), entonces la hiptesis habra sido
H o '- i + i - * + 5

O
H o - i+ i- i- s =

(3-24)

H l- l+ 2 ~ ^ s =
E n general, un contraste es una com binacin lineal de parm etros de la form a
a

donde las constantes de los contrastes c I? c2, ..., ca sum an cero; es decir, 2 =1c; = 0. Las dos hiptesis ante
riores pueden expresarse en trm inos de contrastes:
a

(3-25)

# 1 = 2 c f *
1*1
Las constantes de los contrastes para las hiptesis de la ecuacin 3-23 son Cj = c2 = c 3 0, c4 = + 1 y c5 =
-1 , m ientras que para las hiptesis de la ecuacin 3-24 son c 1 c2 = + 1, c3 = 0, y c4 = c5 = -1.

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

91

Las pruebas de hiptesis que incluyen contrastes pueden hacerse de dos m aneras bsicas. n el pri
m er m todo se utiliza la prueba t. El contraste de inters se escribe en trm inos de los totales de los trata
mientos, obtenindose
C = c y,
1=1

L a varianza de C es
a
V (C ) = n a 2^ c f

(3-26)

1=1

cuando los tam aos de las m uestras de cada tratam iento son iguales. Si la hiptesis nula de la ecuacin
3-25 es verdadera, el cociente

na2

cf

tiene la distribucin N ( 0 , 1). Entonces se sustituira la varianza desconocida o2 con su estimacin, el error
cuadrtico m edio MSE, y se utilizara el estadstico

2 c,y,_
< . = - = S = -----

(3-27)

M 5 J cf
=1
p ara probar las hiptesis de la ecuacin 3-25. L a hiptesis nula se rechazara si 11 01 de la ecuacin 3-27 ex
cede tal2 Ai-aE n el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado de u n a variable aleatoria t con v
grados de libertad es una variable aleatoria F con un grado de libertad en el num erador y v grados de li
bertad en el denom inador. Por lo tanto, puede obtenerse
\ 2

.
(3-28)

n M S c f
1=1

como un estadstico F para probar la ecuacin 3-25. L a hiptesis nula se rechazara si F 0 > Fa1N^ . Este es
tadstico de prueba de la ecuacin 3-28 puede escribirse como
M SC SSC 1
F =
m se

m se

donde la sum a de cuadrados de los contrastes con un solo grado de libertad es

92

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

In te rv a lo de confianza p a ra u n c o n tra ste

E n lugar de probar hiptesis acerca de un contraste, puede ser ms til construir un intervalo de confian
za. Entonces el contraste suele expresarse en trminos de los prom edios de los tratam ientos y. Suponga
que el contraste de inters es
o
r = 2 ^
=1
Al sustituir las m edias de los tratam ientos con los prom edios de los tratam ientos se obtiene
C = 2 c ,*

2 a
2

n 1=1
cuando los tam aos de las m uestras son iguales. Si se usa.MSE para estim ar o2, el intervalo de confianza de
100(1 - a ) p or ciento para el contraste 'Z%lcn es

- w

.. J

o,,

c ,?1.

c?

( o )

Evidentem ente, si este intervalo de confianza incluye al cero, no podra rechazarse la hiptesis nula en la
ecuacin 3-25.
C o n tra ste estandarizado

Cuando hay inters en ms de un contraste, con frecuencia es til evaluarlos en la misma escala. U na for
m a de hacer esto es estandarizando el contraste para que su varianza sea o2. Si el contraste 2 mlc;^ s e
expresa en trminos de los totales de los tratam ientos como Z =1c. y , al dividirlo por ^/nZ=1cf se obtendr
un contraste estandarizado con varianza o2. Entonces el contraste estandarizado es en realidad

donde

c; = f

c'

T am aos de las m u e stras desiguales

C uando los tam aos de las m uestras de cada tratam iento son diferentes, se introducen modificaciones
m enores en los resultados anteriores. Prim ero, observe que la definicin de un contraste requiere ahora
que

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

93

Otros cambios requeridos son directos. Por ejemplo, el estadstico t de la ecuacin 3-27 queda como
, <w.
MSe

ncf

y la sum a de cuadrados de los contrastes de la ecuacin 3-29 queda como

fe
SSC =

3 -5 .5

C o n trastes ortogonales

U n caso especial til del procedim iento de la seccin 3-5.4 es el de los contrastes ortogonales. Dos con
trastes con coeficientes {c,} y {d,} son ortogonales si

o, para un diseo no balanceado, si

P ara a tratam ientos, el conjunto de a - 1 contrastes ortogonales hace la particin de la suma de cuadrados
debida a los tratam ientos en a - 1 com ponentes independientes con un solo grado de libertad. Por lo tan
to, las pruebas que se realizan en los contrastes ortogonales son independientes.
Existen varias m aneras de elegir los coeficientes de los contrastes ortogonales para un conjunto de
tratam ientos. E n general, algn elem ento en la naturaleza del experim ento deber sugerir las com para
ciones que son de inters. Por ejemplo, si hay a = 3 tratam ientos, donde el tratam iento 1 es de control y
donde los niveles del factor en los tratam ientos 2 y 3 son de inters para el experim entador, los contrastes
ortogonales apropiados podran ser los siguientes:

Tiratamiento
1 (control)
2 (nivel 1)
3 (nivel 2)

Coeficientes de los
contrastes ortogonales
-2
0
1
-1
1
1

Observe que el contraste 1 con c, = - 2 , 1,1 com para el efecto prom edio del factor con el control, m ientras
que el contraste 2 con d = 0, -1 , 1 com para los dos niveles del factor de inters.
E n general, el m todo de contrastes (o de contrastes ortogonales) es til para lo que se llama compa
raciones preplaneadas. Es decir, los contrastes se especifican antes de llevar a cabo el experim ento y de
examinar los datos. La razn de esto es que, si las comparaciones se seleccionan despus de examinar los

94

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

datos, la mayora de los experim entadores construiran pruebas que corresponderan con las diferencias
grandes observadas en las medias. Estas diferencias grandes podran ser el resultado de la presencia de
efectos reales o podran ser el resultado del error aleatorio. Si los experim entadores se inclinan consisten
tem ente a escoger las diferencias ms grandes para hacer las comparaciones, inflarn el error tipo I de la
prueba porque es probable que, en un porcentaje inusualm ente elevado de las comparaciones selecciona
das, las diferencias observadas sern el resultado del error. Al examen de los datos para seleccionar las
com paraciones de inters potencial se le llama con frecuencia curioseo o sondeo de datos. El m todo de
Scheff para todas las comparaciones, el cual se com enta en la seccin siguiente, perm ite el curioseo o
sondeo de datos.

EJEMPLO 3 - 6 ....................................................................................................................................
Considere los datos del ejemplo 3-1. H ay cinco m edias de los tratam ientos y cuatro grados de libertad en
tre estos tratam ientos. Suponga que antes de correr el experim ento se especific la siguiente serie de
com paraciones entre las medias de los tratam ientos (y sus contrastes asociados):
Hiptesis

Contraste

Q =
= /t* + f*s

Ho-Pl ~ 3
HqAuz = K + fi 3 +

-y 4 .+ ys.

c 2 = yi.

+ fi 5

+ y 3. -y * , -y* .

^3 = ^1.
y 3.
C4 = -y ^ + 4y%- y 3. - y 4. - y s_

Observe que los coeficientes de los contrastes son ortogonales. U tilizando los datos de la tabla 3-4, se en
cuentra que los valores num ricos de los contrastes y de las sumas de cuadrados son los siguientes:
C1 =

-1(108)+ 1(54) = 54

S S C = ^ 1 = 2 9 1 . 6 0

C 2 = +1(49)

+ 1 (8 8 )-1 (1 0 8 )-1 (5 4 ) = - 2 5

(-25
5 5 Cj = v
' = 31.25
1
5(4)

C3 = + l ( 4 9 )

-1 (8 8 )

S S C} =

=-39

C4 = -1 (4 9 ) -4-4(77) 1( 88) -1(108) -1 ( 5 4 ) = 9

Tabla 3-11 Anlisis de varianza de los datos de la resistencia a la tensin


Suma de
Grados de
Fuente de
libertad
cuadrados
variacin
4
Peso porcentual del algodn
475.76
contrastes ortogonales
1
(291.60)
1
C2 :jut + /i 3 =fi, + fi 5
(31.25)
1
(152.10)
= ^3
1
C4-Afi2 = ^ + ^ + ^ + ,5
(0.81)
20
161.20
Error
24
Total
636.96

= 152.10

S S Ct = ^ = 0 . 8 1

Cuadrado
medio
118.94
291.60
31.25
152.10
0.81
8.06

14.76

Valor P
<0.001

36.18
3.88
18.87
0.10

<0.001
0.06
<0.001
0.76

fb

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

95

Estas sumas de cuadrados de los contrastes hacen la particin com pleta de la sum a de cuadrados de los
tratam ientos. Las pruebas de estos contrastes ortogonales se incorporan por lo general en el anlisis de
varianza, como se m uestra en la tabla 3-11. Por los valores P se concluye que hay diferencias significativas
entre los niveles 4 y 5 y 1 y 3 del peso porcentual del algodn, pero que el promedio de los niveles 1 y 3 no
difiere del prom edio de los niveles 4 y 5 con el nivel a = 0.05, y que el nivel 2 no difiere del prom edio de los
otros cuatro niveles.

3'5.6

Mtodo de Scheff para comparar todos los contrastes

E n muchas situaciones, los experim entadores pueden no conocer de antem ano cules son los contrastes
que quieren com parar, o pueden tener inters en ms de a - 1 posibles comparaciones. E n muchos experi
m entos de exploracin, las com paraciones de inters slo se descubren despus del examen prelim inar de
los datos. Scheff [98a] ha propuesto un m todo para com parar todos y cada uno de los contrastes posi
bles entre las m edias de los tratam ientos. E n el m todo de Scheff, el error tipo I es a lo sumo a para cual
quiera de las com paraciones posibles.
Suponga que se ha determ inado un conjunto de m contrastes
r = cxPi+ c 2 Pi + " + caut

u = l,2 ,...,m

(3-31)

en las m edias de los tratam ientos de inters. El contraste correspondiente de los prom edios de los trata
m ientos y es
cu= ^

+ ^

2.

+ --*+cai>a

u=l,

(3-32)

y el error estndar de este contraste es


(e l/* ,)

(3-33)

donde n es el nm ero de observaciones en el tratam iento i-simo. Puede dem ostrarse que el valor crtico
contra el que deber com pararse Cu es
S a,u = S cJ ( a - l ) F aia_liN_a

(3-34)

Para probar la hiptesis de que el contraste Fu difiere de m anera significativa de cero, se com para C con
el valor crtico. Si | Cu | > Sa u, se rechaza la hiptesis de que el contraste r es igual a cero.
E l procedim iento de Scheff puede usarse tam bin para form ar intervalos de confianza p ara todos
los contrastes posibles entre las medias de los tratam ientos. Los intervalos resultantes, por ejem plo Cu SaM < r < Cu + Sau, son intervalos de confianza simultneos por cuanto la probabilidad de que todos
ellos sean verdaderos sim ultneam ente es al m enos 1 - a.
P ara ilustrar el procedim iento, considere los datos del ejemplo 3-1 y suponga que los contrastes de in
ters son
Ti = P i + H 3 - t * 4 - s
y

T2 = i ~
Los valores num ricos de estos contrastes son
c i = +5v - y*. - y 5.
= 9 .8 0 + 1 7 .6 0 -2 1 .6 0 -1 0 .8 0
= 5.00

96

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

y
C 2

= A - 4
= 9.8 0 -2 1 .6 0
= -11.80

y los errores estndar se encuentran con la ecuacin 3-33 como


-

M S e 2 (Ca /,-) = V8.06(l + l + l + l ) / 5 = 2.54


**l
y

Sc2 =

= V8-06(l + l ) / 5 = 1.80

Por la ecuacin 3-34, los valores crticos de 1% son


So.ou =

= 2.5474(443) = 10.69

5'o.ou = 5 C2 ^ a - l ) F 0MU_lM_a = 1.80V 4(43) = 7.58


Puesto que |C \ < S00i,i, se concluye que el contraste I \ = p 1 + ^ - /4- j u 5 es igual a cero; es decir, no
existe evidencia slida para concluir que las m edias de los tratam ientos 1 y 3 como grupo difieren de las
m edias de los tratam ientos 4 y 5 como grupo. Sin embargo, como | C 2 1 > S 0 012, se concluye que el contras
te r 2 = /j,1 -u 4 no es igual a cero; es decir, las resistencias m edias de los tratam ientos 1 y 4 difieren signifi
cativamente.
E n muchas situaciones prcticas, querrn com pararse slo pares de m edias. Frecuentem ente, es po
sible determ inar cules son las medias que difieren probando las diferencias entre todos los pares de m e
dias de los tratam ientos. Por lo tanto, el inters se encuentra en los contrastes de la form a T =
para
toda i * j . A un cuando el m todo de Scheff podra aplicarse fcilmente a este problem a, no es el procedi
m iento ms sensible para tales comparaciones. Se pasa ahora a la consideracin de los m todos diseados
especficamente p ara las comparaciones por pares entre todas las a medias poblacionales.

3-5.7

Comparacin de pares de medias de tratamientos

Suponga que el inters se encuentra en com parar todos los pares de a medias de tratam ientos y que las hi
ptesis nulas que quieren probarse son
para toda i ^ j. A continuacin se presentan cuatro m
todos para hacer estas comparaciones.
Prueba de Tukey

Suponga que, despus de un anlisis de varianza en el que se ha rechazado la hiptesis nula de la igualdad
de las m edias de los tratam ientos, quieren probarse todas las com paraciones de las m edias por pares:
H a\ f i i = n j
Hy-i ^ H
para toda i * j . TUkey [ l l l d ] propuso un procedim iento para probar hiptesis para las que el nivel de sig
nificacin global es exactam ente a cuando los tam aos de las m uestras son iguales y es a lo sumo a cuando

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

97

los tam aos de las m uestras no son iguales. Este procedim iento puede usarse tam bin p ara contraer los
intervalos de confianza p ara las diferencias en todos los pares de medias. P ara estos intervalos, el nivel de
confianza sim ultneo es de 100(1 - a ) por ciento cuando los tam aos de las m uestras son iguales y de al
m enos 100(1 - a) por ciento cuando los tam aos de las m uestras no son iguales. Se trata de un procedi
m iento excelente para curiosear sobre los datos cuando el inters se centra en pares de medias.
El procedim iento de Ttikey hace uso de la distribucin del estadstico del rango studentizado
y

I1
I.1*

y ma

yMSE / n
dondeyml y y ^ son las m edias m ustrales mayor y m enor, respectivam ente, sacadas de un grupo dep m e
dias mustrales. L a tabla V III del apndice contiene los valores de qa(p,f), los puntos porcentuales a su
periores de q , donde / es el nm ero de grados de libertad asociados con M SE. Para tam aos de las
m uestras iguales, la prueba de Tukey declara que dos m edias son significativamente diferentes si el valor
absoluto de sus diferencias m ustrales excede
(3-35)

Ta = q M , f K

D e m anera equivalente, podra construirse una serie de intervalos de confianza de 100(1 - a ) por ciento
p ara todos los pares de m edias de la siguiente m anera:
M SC
y

+ ? a(a> / ) y - ^ >

1 * i-

(3-36)

Cuando los tam aos de las m uestras no son iguales, las ecuaciones 3-35 y 3-36 quedan como
T = ? * ( ,/)
V2

' 1
1X
M S, +
nu

(3-37)

+ ~ N</ < , . - fij < y L - y. + qa^ f ) J M S i ' +


n ns
n t nn
respectivam ente. A la versin para tam aos de las m uestras diferentes se le llam a en ocasiones el procedi

miento Tbkey-Kramer.

EJEMPLO 3 - 7 ....................................................................................................................................
P ara ilustrar la prueba de Tukey, se usan los datos del experim ento del peso porcentual del algodn del
ejemplo 3-1. Con a = 0.05 y/ = 20 grados de libertad p ara el error, en la tabla V III del apndice se obtie
ne qom(5, 20) = 4.23. Por lo tanto, por la ecuacin 3-35,
r 5 = q 0.0S(5, 2 0 ) J ^ = 4 . 2 3 ^ = 5.37

98

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR; EL ANLISIS DE VARIANZA

*1.

ys-

y2

y3-

y*-

9.8

10.8

15.4

17.6

21.6

Figura 3-12

Resultados de la prueba de lkey.

Por lo tanto, cualquier p ar de prom edios de los tratam ientos que difieran en valor absoluto por ms de
5.37 im plicara que el p ar correspondiente de m edias poblacionales son significativamente diferentes.
Los cinco prom edios de los tratam ientos son

= 9-8

y 2, = 15.4

y* = 17.6

5v=21.6

5. =

1 0 .8

y las diferencias en los prom edios son


t - 2 = 9 .8 -1 5 .4 =

- 5.6*

i - 3. = 9 .8 -1 7 .6 =

- 7 .8 *

- ? 4 . = 9 .8 -2 1 .6 = -1 1 .8 *
- 5. = 9 .8 -1 0 .8 =

- 1 .0

Ji. - -i. ~ 15.417.6 = - 2 . 2


2 - y A = 1 5 .4 -2 1 .6 = - 6 . 2 *
2 -

= 1 5 .4 -1 0 .8 =

4.6

J i - y * . = 1 7 .6 - 2 1 .6 = - 4 . 0
, . - s. = 1 7 .6 -1 0 .8 =
4 -

= 2 1 .6 -1 0 .8 =

6.8*
10.8*

Los valores m arcados con asterisco indican pares de m edias que son significativamente diferentes. Suele
ser til trazar una grfica, como la de la figura 3-12, donde se subraya a los pares de m edias que no difie
ren significativamente. E sta grfica da una indicacin de que las medias de los tratam ientos form an tres
grupos: fi 1 y /i5, fi 2 y
y /i4. Sin embargo, la pertenencia a estos grupos no es del todo clara.

Cuando se utiliza cualquiera de los procedim ientos para probar las m edias por pares, ocasionalmen
te se encuentra que la prueba F global del anlisis de varianza es significativa, pero la com paracin de las
medias por pares falla para revelar cualquier diferencia significativa. E sta situacin ocurre porque la
prueba F considera sim ultneam ente todos los contrastes posibles en los que intervienen las m edias de
los tratam ientos, no slo las com paraciones por pares. Es decir, en los datos a la m ano, quiz no todos los
contrastes significativos sean de la form a fi Algunos paquetes de software de com putadora presentan com paraciones por pares con intervalos de
confianza. Para el procedim iento de Tkey, estos intervalos se calcularan con la ecuacin 3-36 o la 3-38,
dependiendo de si los tam aos de las m uestras son iguales o no.
La deduccin del intervalo de confianza de Tlikey de la ecuacin 3-36 p ara tam aos de las m uestras
iguales es directa. Para el estadstico del rango studentizado q se tiene

99

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

Si mx(y, -fi) - min (y,. - / *,) es m enor o igual que qa(a,f)yMSE / n, debe ser verdadero que | (y, -ju,) - (y fi) I < qa(a, f ) ^ j M S j J n p ara cada p ar de medias. Por lo tanto,

Al reordenar esta expresin para aislar i, ~fi entre las desigualdades se llegar al conjunto de intervalos
de confianza sim ultneos de 100(1 - a ) por ciento dado en la ecuacin 3-38.
1 mtodo de la diferencia significativa mnima (LSD) de Fisher
E n este procedim iento se utiliza el estadstico F para probar

H 0\fi = n

L - j.
M S C f

(3-39)

+l }

\ni

n ,

Suponiendo u na hiptesis alternativa de dos colas, los pares de m edias fi y n se declararan significativa
m ente diferentes si |y, -y \ > tatl N^ M S E(1 / n + 1 / n} ). A la cantidad
1
1
LSD - t al2 ,N--i\MSE --- \*-n, n] t

(3-40)

se le llam a diferencia significativa mnima. Si el diseo es balanceado, n 1 = n 2 = = = , y


LSD

pM S
l al2,N-aV

(3-41)

Para usar el procedim iento LSD de Fisher, sim plemente se com para la diferencia observada entre
cada p ar de prom edios con la LSD correspondiente. Si |, -y \ > LSD, se concluye que las m edias poblacionales //, y fi difieren.

EJEMPLO 3-8 ..............................................................................................................................


Para ilustrar el procedimiento, si se usan los datos del experimento del ejemplo 3-1, la LSD con a = 0.05 es

Por lo tanto, cualquier par de prom edios de los tratam ientos que difiera del valor absoluto por ms de
3.75 implicara que el p ar correspondiente de m edias poblacionales es significativamente diferente. Las
diferencias en los prom edios son
P t - P z = 9 .8 -1 5 .4 = - 5 .6 *
y - y } = 9 .8 -1 7 .6 =

- 7 .8 *

9 .8 -2 1 .6 = 11.8*
>5. = 9 .8 -1 0 .8 =

- 1 .0

2. - 3. = 1 5 .4 -1 7 .6 = - 2 . 2
2. - 4. = 1 5 .4 -2 1 .6 = - 6 . 2 *
2. - 5. = 1 5 .4 -1 0 .8 =
3 -

4.6*

= 1 7 .6 - 2 1 .6 = - 4 . 0 *

3. - 5. = 17.610.8=

6.8*

4 - 5 = 2 1 .6 - 1 0 .8 =

10.8*

100

CAPTULO 3

y,.

*5-

9.8

10.8

Figura 3-13

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

y*.
15.4

17.6

21.6

Resultados del procedimiento LSD.

Los valores m arcados con asterisco indican pares de m edias que son significativamente diferentes.
E n la figura 3-13 se resum en los resultados. Evidentem ente, los nicos pares de m edias que no difieren
significativamente son I y 5 y 2 y 3 , y el tratam iento 4 produce una resistencia a la tensin significativa
m ente m ayor que los otros tratam ientos.

Observe que el riesgo global a puede inflarse de m anera considerable al utilizar este m todo. Espec
ficamente, cuando a se hace ms grande, el error tipo I del experim ento (el cociente del nm ero de expe
rim entos en los que se com ete al m enos un error tipo Iy el nm ero total de experim entos) se hace grande.
Prueba del rango mltiple de Duncan

U n procedim iento muy utilizado para com parar todos los pares de medias es la prueba del rango m ltiple
desarrollada p or D uncan [41]. Para aplicar la prueba del rango m ltiple de D uncan cuando los tam aos
de las m uestras son iguales, los a prom edios de los tratam ientos se arreglan en orden ascendente, y el
erro r estndar de cada prom edio se determ ina como
(3-42)
Para tam aos de las m uestras desiguales, se sustituye n en la ecuacin 3-42 con la m edia arm nica nh del
{,}, donde
a

(3-43)

Observe que si = n 2 = = na, n h = n. E n la tabla de D uncan de los rangos significativos (tabla VII
del apndice) se obtienen los valores ra(p,f) p arap = 2,3,..., a, donde a es el nivel de significacin y / e s el
nm ero de grados de libertad del error. Estos rangos se convierten en un conjunto de a - 1 rangos mni
mos de significacin (por ejemplo, Rp) para p = 2, 3, ..., a calculando
Rp = ra (P>f ) S L

(3-44)

Entonces, se prueban las diferencias observadas entre las medias, em pezando con la ms grande contra la
m enor, la cual se com parara con el rango mnimo de significacin R a. D espus se calcula la diferencia de
la m ayor y la segunda m enor y se com para con el rango mnimo de significacin R a_1. Estas com paracio
nes se continan hasta que todas las medias se han com parado con la m edia mayor. Por ltimo, se calcula
la diferencia entre la segunda m edia mayor y la m enor y se com para con el rango mnimo de significacin
R a_ j. E ste proceso se contina hasta que se han considerado las diferencias entre todos los a(a - 1)/2 p a
res de m edias posibles. Si una diferencia observada es mayor que el rango de significacin m nim a corres
pondiente, se concluye que el p ar de medias en cuestin es significativamente diferente. P ara evitar

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

101

contradicciones, ninguna de las diferencias entre un par de m edias se considera significativa si las dos m e
dias en cuestin se localizan entre otras dos medias que no difieren significativamente.

EJEMPLO 3 - 9 ....................................................................................................................................
La prueba del rango m ltiple de D uncan puede aplicarse al experim ento del ejem plo 3-1. R ecuerde que
M S e = 8.06, N = 25, n 5, y hay 20 grados de libertad del error. Al arreglar los prom edios de los tra ta
m ientos en orden ascendente, se tiene
7 l = 9-8
J>5. = 10-8
y 2 . = 15-4
? ,.= 1 7 .6
4. = 21.6
E l erro r estndar de cada prom edio es 5- = V8.06/5 = 1.27. En el conjunto de rangos significativos de la
tabla V II del apndice para 20 grados de libertad y a 0.05, se obtiene r005(27 20) = 2.95, r005(3, 20) =
3.10, /005(4, 20) = 3.18 y r00S(5, 20) = 3.25. Por lo tanto, los rangos de significacin mnim a son
R 2 = r 0 05 (2, 20)5^ = (2.95)(1.27) = 3.75
R 3 = r0 o; (3, 20)5- = (3L10)(1.27) = 3.94
R< = r 005(4, 20)5,, = ( l8 )(1 .2 7 )= 4.04
R 5 = r a(5, 20)5- = (3.25)(1.27)= 4.13
Los resultados de las com paraciones seran
4
4
4
4
3
3
3
2
2
5

vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.
vs.

1
5
2
3
1
5
2
1
5
1

21.6
21.6
21.6
21.6
17.6
17.6
17.6
15.4
15.4
10.8

9.8
10.8
15.4
17.6
9.8
10.8
15.4
9.8
10.8
9.8

= 11.8 >
= 10.8 >
6.2 >
= 4.0 >
= 7.8 >
= 6.8 >
- 2.2 <
=
5.6 >
= 4.6 >
= 1.0 <

4.13
4.04
3.94
3.75
4.04
3.95
3.75
3.94
3.75
3.75

(Rs)
(i?4)
(/?3)
(R2)
(4)
CR 3)
(2)
(.R3)
(2)
(R2)

Por el anlisis se observa que hay diferencias significativas entre todos los pares de m edias con excepcin
de la 3 y la 2 y la 5 y la 1. E n la figura 3-14 se m uestra una grfica en la que esas m edias que no son significa
tivam ente diferentes aparecen subrayadas. Observe que en este ejemplo la prueba del rango m ltiple de
D uncan y el m todo LSD llevan a conclusiones idnticas.

?1.
9.8

10.8

Figura 3-14

>2.

^3-

>4-

16.4

17.6

21.6

Resultados de la prueba de rango mltiple de Duncan.

102

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

E n la prueba del rango m ltiple de D uncan se requiere una diferencia observada ms grande para de
tectar pares significativamente diferentes de medias, cuando el nm ero de m edias incluidas en el grupo
aum enta. D e esta forma, en el ejem plo anterior R 2 = 3.75 (dos m edias) m ientras que R 3 = 3.94 (tres m e
dias). Para dos medias, el valor crtico R 2 ser exactam ente igual al valor LSD de la prueba t. Los valores
ra(p ,f) de la tabla V II del apndice se eligen de tal m odo que se obtenga un nivel de proteccin especifi
cado. Es decir, cuando se com paran dos medias que estn p pasos aparte, el nivel de proteccin es
(1 - a f " *, donde a es el nivel de significacin especificado para dos m edias adyacentes. Por lo tanto, el n
dice de erro r de reportar al m enos una diferencia significativa incorrecta entre dos m edias es 1 - (1 - f -1,
cuando el tam ao del grupo esp . Por ejemplo, si a = 0.05, entonces 1 - (1 - 0.05)1 = 0.05 es el nivel de sig
nificacin p ara com parar el p ar de medias adyacentes, 1 - (1 - 0.05)2 = 0.10 es el nivel de significacin
para m edias que estn un paso aparte, y as sucesivamente.
E n general, si el nivel de proteccin es a, las pruebas de las m edias tienen un nivel de significacin
que es m ayor o igual que a. Por consiguiente, el procedim iento de D uncan tiene una gran potencia; es de
cir, es muy eficaz p ara detectar diferencias entre m edias cuando existen diferencias reales. Por esta razn,
la prueba del rango m ltiple de D uncan es muy popular.
La prueba de Newman-Keuls

E sta prueba fue creada por Newman [90]. D ebido a que un inters renovado en la prueba de Newman fue
generado p or Keuls [64], al procedim iento se le llam a la prueba de Newman-Keuls. Operacionalm ente, el
procedim iento es similar a la prueba del rango m ltiple de Duncan, salvo porque las diferencias crticas
entre las m edias se calculan en una form a un tanto diferente. Especficam ente, se calcula una serie de va
lores crticos
K = < l P ,f)S -y ,
P = % % ..,a
(3-45)
donde qa(p ,f) es el punto porcentual a superior del rango studentizado para grupos de m edias de tam ao
p y co n /g ra d o s de libertad del error. U na vez que se calculan los valores Kp con la ecuacin 3-45, los pares
de m edias extremos en los grupos de tam aop se com paran conK p exactam ente igual que en la prueba del
rango m ltiple de Duncan.
Qu mtodo de comparacin por pares debe usarse?

Ciertam ente, im a pregunta lgica en este punto es qu m todo de com paracin por pares debe usarse.
D esafortunadam ente, no hay una respuesta precisa p ara esta pregunta, y los especialistas en estadstica
estn con frecuencia en desacuerdo en cuanto a la utilidad de los diferentes procedim ientos. C arm er y
Swanson [24] han realizado estudios de simulacin M ontecarlo con varios procedim ientos de com para
ciones mltiples, incluyendo algunos que no se han considerado aqu. Estos autores reportan que el m
todo de la diferencia significativa m nim a es una prueba muy eficaz para detectar diferencias reales en las
medias si se aplica slo despus de que la prueba F en el anlisis de varianza sea significativa en 5%. R e
portan asimismo un buen desem peo en la deteccin de diferencias reales con la prueba del rango m lti
ple de Duncan. Esto no es motivo de sorpresa, ya que estos dos m todos son los ms poderosos de los que
se han com entado aqu. Sin embargo, estos m todos no incluyen el ndice de erro r en el m odo del experi
m ento. D ebido a que el m todo de Tukey efecta un control sobre el ndice de erro r global, m uchos expe
rim entadores prefieren su uso.
L a prueba de Newman-Keuls es ms conservadora que la prueba del rango m ltiple de D uncan por
cuanto a que el ndice de erro r tipo I es menor. Especficam ente, el erro r tipo I del experim ento es a para
todas las pruebas que incluyen el mismo nm ero de medias. Por consiguiente, debido a que a es por lo ge
neral bajo, la potencia de la prueba de Newman-Keuls casi siem pre es m enor que la de la prueba del ran
go m ltiple de Duncan. Para dem ostrar que el procedim iento de Newman-Keuls lleva a una prueba con
m enor potencia que la prueba del rango m ltiple de Duncan, se observa p or una com paracin de las ta-

3-5 INTERPRETACIN PRCTICA DE LOS RESULTADOS

103

blas V II y V ili del apndice que parap > 2 se tiene qa(p f) > ra(p,f). Es decir, es ms difcil declarar que
u n par de m edias es significativamente diferente al utilizar la prueba de Newman-Keuls que cuando se
usa el procedimiento de Duncan. Esto se ilustra a continuacin para el caso en que a = 0.01, a = 8 y f = 20:
P
rom(p> 20)
qam(p, 20)

3
4.22
4.64

2
4.02
4.02

5
4.40
5.29

4
4.33
5.02

6
4.47
5.51

7
4.53
5.69

8
4.58
5.84

Como se seal antes, existen otros procedim ientos de com paraciones mltiples. Algunos artculos
que describen estos m todos son los de M iller [78], O Neill y W etherill [91] y Nelson [89]. Tkmbin se re
com ienda el libro de Miller [77].

3 -5.8

Comparacin de medias de tratamientos con un control

E n m uchos experim entos, uno de los tratam ientos es un control, y el analista se interesa en com parar
cada una de las medias de los a - 1 tratam ientos restantes con el control. Por lo tanto, slo es necesario h a
cer a - 1 comparaciones. U n procedim iento para hacer estas com paraciones ha sido desarrollado por
D u nnett [42]. Suponga que el tratam iento a es el control y que quieren probarse las hiptesis

para i = 1 ,2 ,..., a - 1 . El procedim iento de D unnett es una m odificacin de la prueba t comn. Para cada
hiptesis se calculan las diferencias observadas en las m edias m ustrales
= i,
L a hiptesis nula

H 0:p =

fia

2 , .. .,

-i

se rechaza utilizando un ndice

Iyt. - 5U>

1.

f \ l M S E

de error tipo I si

(3-46)

donde la constante da(a - 1, f ) se da en la tabla IX del apndice. (Pueden hacerse pruebas tanto de una
como de dos colas.) Observe que a es el nivel de significacin conjunto asociado con las a - 1 pruebas.

EJEMPLO 3 - 1 0 ..................................................................................................................................
P ara ilustrar la prueba de D unnett, considere el experimento del ejem plo 3-1, asum iendo que el trata
m iento 5 es el control. E n este ejemplo, a = 5, a - 1 = 4 , / = 2 0 y n ( = n = 5. Con el nivel de 5%, en la tabla
IX del apndice se encuentra que d0.05(4, 20) = 2,65. Por lo tanto, la diferencia crtica es
. < 4 , 2 0 > ^ - 2 6 ^ I f >

= 4.76

(Observe que se trata de una simplificacin de la ecuacin 3-46 que resulta de un diseo balanceado.) Por
lo tanto, cualquier m edia de los tratam ientos que difiera del control por ms de 4.76 se declarara signifi
cativam ente diferente. Las diferencias observadas son
1
2
3
4

vs.
vs.
vs.
vs.

5:
- s
5: y 2 s
5: 3_ - 5'
5: 4 - 5

= 9.8 - 10.8= -1.0


= 15.4 - 10.8= 4.6
= 17.6 - 10.8= 6.8
= 21.6 - 10.8= 10.8

104

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Slo las d iferen cias^ - 5 y - y 5 indican alguna diferencia significativa cuando se com paran con el con
trol; p or lo tanto, se concluye que fi3 * fi y /4 *
Cuando se hace la com paracin de los tratam ientos con un control, una buena idea es usar ms obser
vaciones para el tratam iento de control (por ejemplo, na) que para los dems tratam ientos (por ejemplo,
n), suponiendo un nm ero igual de observaciones p ara los a - 1 tratam ientos restantes. El cociente n j n
deber elegirse de tal m odo que sea aproxim adam ente igual a la raz cuadrada del nm ero total de trata
mientos. Es decir, se elige n j n = Va?

3-6

MUESTRA DE SALIDA DE COMPUTADORA

Hay una gran cantidad de program as de com putadora para apoyar el diseo experim ental y la realizacin
de anlisis de varianza. E n la figura 3-15 se m uestra la salida de uno de estos program as, Design-Expert,
utilizando los datos del experimento con un solo factor del ejemplo 3-1. La suma de cuadrados correspondien
te al Modelo (Model) es la S'-S'llatamientos usual de un diseo con un solo factor. Esa fuente se identifica adi
cionalm ente como A . Cuando hay ms de un factor en el experim ento, la suma de cuadrados (Sum of
Squares) del m odelo se descom pondr en varias fuentes (A , B , etc.). Observe que el resum en del anlisis
de varianza de la parte superior de la salida de com putadora contiene las sumas de cuadrados, los grados de
libertad (D F , degrees of freedom ), los cuadrados m edios (M ean Square) y el estadstico de p ru e b aF 0
(F Value) acostumbrados. L a colum na Prob > F es el valor P (de hecho, el lmite superior del valor P,
ya que a las probabilidades m enores que 0.0001 se les asigna el valor por omisin 0.0001).
Adem s del anlisis de varianza bsico, el program a presenta inform acin adicional til. L a cantidad
R cuadrada (R -Squared) se define como
R 2 = SS m,mo = 475.76 = 0.746923
^ T o ta l

6 3 6 9 6

y se interpreta en trm inos generales como la proporcin de la variabilidad en los datos explicada por el
m odelo del anlisis de varianza. Por lo tanto, en los datos para probar la resistencia de la fibra sinttica, el
factor peso porcentual del algodn explica cerca de 74.69% de la variabilidad en la resistencia a la ten
sin. Evidentem ente, debe tenerse 0 < 2 i 1, siendo ms deseables los valores ms grandes. E n la salida
se presentan tam bin otros estadsticos en R 2. R 2 ajustada (Adj R -Squared) es una variante del esta
dstico R 2 comn que refleja el nm ero de factores presentes en el modelo. Puede ser un estadstico til
en experim entos ms complejos en los que intervienen varios factores en el diseo, cuando quiere eva
luarse el im pacto de aum entar o disminuir el nm ero de trm inos del modelo. Desviacin estndar
(Std. Dev.) es la raz cuadrada del cuadrado m edio del error, V8.060 = 2.839, y C.V. es el coeficiente
de variacin, definido como (J M S E / )100. El coeficiente de variacin m ide la variabilidad no explicada
o residual de los datos como un porcentaje de la m edia (M ean) de la variable de respuesta. PRESS
son las siglas de Prediction Error Sum o f Squares (sum a de cuadrados del error de prediccin) y es una m e
dida de la adecuacin con que es posible que el m odelo del experimento predecir las respuestas en un
nuevo experimento. Son deseables valores pequeos de PRESS. Alternativam ente, puede calcularse una
R 2 para predicciones con base en PRESS (ms adelante se indicar cmo hacer esto). E sta i?pred (Pred
R-Squared) para el problem a tratado aqu es 0.6046, el cual no es irrazonable, considerando que el m o
delo explica cerca de 75% de la variabilidad del experim ento en curso. El estadstico Prediccin adecua
da (A deq Precision) se calcula dividiendo la diferencia entre la respuesta predicha mxima y la
respuesta predicha m nim a p or la desviacin estndar prom edio de todas las respuestas predichas. Son
deseables valores grandes de esta cantidad, y los valores que exceden cuatro indican por lo general que el
m odelo tendr un desem peo razonable en la prediccin.

Utilice el mouse para posicionarse en una celda y su definicin.

Response: Strength in psi


A N O V A for Selected Factorial Model
Analysis of variance table [Partial s u m of squares]
Source
Model

>4

Residual
L a c k o f Fit
Pure Error

Cor Total

S u m of
Squares
475.76

DF
4

475.76

161.20

20

0.000

161.20

20

636.96

24

Mean
Square
118.94

F
Value
14.76

Prob > F
<0.0001

118.94

14.76

<0.0001

significativo

8.06
8.06

Elvalor F del Modelo de 14.76 implica que el modelo es significativo. Slo hay una probabilidad de
0.01% de que un "Valor F del Modelo" de esta magnitud pudiera ocurrir debido a ruido.
Los valores de "Prob > P menores que 0.0500 indican que lostrminos del modelo son significativos.
En este caso A son trminos significativos del modelo.
Los valores mayores que 0.1000 indican que los trminos del modelo no son significativos.
Si hay muchos trminos del modelo no significativos (sin contar los que se necesitan para apoyar
lajerarquizacin), la reduccin del modelo puede mejorarlo.
Std. Dev.
Mean
C.V.
PRESS

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precisin

2.84
15.04
18.88
251.88

0.7469
0.6963
0.6046
9.294

La
R cuadrada predicha
de 0.6046 concuerda razonablemente con la
R cuadrada ajustada" de
0.6963. Una diferencia mayor que 0.20 entre la Tt cuadrada predicha" y la"R cuadrada ajustada"
indica un posible problema con el modelo y/o los datos.
"Precisin adecuada" mide ia relacin de la seal a mido. Es deseable una relacin mayor que 4.
La relacin de 9.294 indica una seal adecuada para usar este modelo para navegar el espacio
del diseo.
Treatment Means (Adjusted, If Necessary)
Standard
Estimated
Error
Mean
1.27
9.80
1-15
1.27
15.40
2-20
1,27
17.60
3-2S
1.27
21.60
4-30
1.27
10.80
5-35
Treatment
1 vs 2
1 vs 3
1 vs 4
1 vs 5
2 vs 3
2 vs 4
2 vs 5
3 vs 4
3 vs 5
4 vs 5

Mean
Difference
-5.60
-7.80
-11.80
-1.00
-2.20
-6.20
4.60
-4.00
6.80
10.80

DF
1
1
1
1
1
1
1
1
1
1

Standard
Error
1.80
1.80
1.80
1.80
1.80
1.80
1.80
1.80
1.80
1.80

t for H0
CoeffsO
-3.12
4.34
-6.57
-0.56
-1.23
-3.45
2.56
-2.23
3.79
6.01

Prob > |t
0.0054
0.0003
<0.0001
0.5838
0.2347
0.0025
0.0186
0.0375
0.0012
<0.0001

Los valores de "Prob > |t|"menores que 0.0500 indican que la diferencia en las medias
dos tratamientos es significativa.
Los valores de "Prob > |t|"mayores que 0.1000 indican que ladiferencia en las medias de los
dos tratamientos no es significativa.
Figura 3-15

Salida de computadora de Design-Expert para el ejemplo 3-1.

106

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Diagnostic Case Statistics


Standard Actual Predicted
Value
Order
Value
1
7.00
9.80
7.00
2
9.80
15.00
3
9.80
4
11.00
9.80
5
9.00
9.80
12.00
6
15.40
7
17.00
15.40
12.00
8
15.40
18.00
9
15.40
10
18.00
15.40
11
14.00
17.60
12
18.00
17.60
13
18.00
17.60
19.00
14
17.60
19.00
15
17.60
16
19.00
21.60
17
25.00
21.60
18
22.00
21.60
19
19.00
21.60
23.00
20
21.60
7.00
10.80
21
10.00
10.80
22
23
11.00
10.80
15.00
24
10.80
11.00
10.80
25

Residual
-2.80
-2.80
5.20
1.20
-0.80
-3.40
1.60
-3.40
2.60
2.60
-3.60
0.40
0.40
1.40
1.40
-2.60
3.40
0.40
-2.60
1.40
-3.80
-0.80
0.20
4.20
0.20

Leverage
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200
0.200

Student Cook's
Residual Distance Outlier t
0.061
-1.103
-1.109
0.061
-1.109
-1.103
0.210
2.245
2.048
0.463
0.473
0.011
-0.315
0.005
-0.308
0.090
-1.339
-1.368
0.020
0.630
0.620
0.090
-1.368
-1.339
1.024
0.052
1.025
0.052
1.024
1.025
0.100
-1.457
-1.418
0.158
0.001
0.154
0.001
0.154
0.158
0.015
0.542
0.551
0.015
0.542
0.551
0.052
-1.024
-1.025
0.090
1.339
1.368
0.001
0.158
0.154
0.052
-1.025
-1.024
0.015
0.542
0.551
0.112
-1.496
-1.548
0.005
-0.315
-0.308
0.000
0.077
0.079
1.654
0.137
1.735
0.000
0.077
0.079

Proceder con las grficas de diagnstico (el icono siguiente en progresin). Asegurarse de examinar:
1) La grfica de probabilidad normal de los residuales studentizados para verificar la normalidad
de los residuales.
2) Los residuales studentizados contra los valores predichos para verificarla constante del error.
3) Los puntos atpicos tcontra el orden de las corridas para buscar puntos atpicos,
es decir, valores influyentes o importantes
4) La grfica de Box-Cox para lastransformaciones de potencia.
Si todos los estadsticos del modelo y las grficas de diagnstico estn correctos, finalizarcon el icono
Model Graphs (Grficas del Modelo).
Figura 3-15

(Continuacin.)

Se hace la estim acin de las m edias (Estim ated M ean) de los tratam ientos y se m uestra el error estn d ar (Standard E rro r) (o desviacin estndar m uestral de la m edia de cada tratam iento, ~MSE In ).
Las diferencias entre pares de medias (M ean D ifference) de los tratam ientos se investigan utilizando el
m todo LSD de Fisher descrito en la seccin 3-5.7.
El program a de com putadora tam bin calcula y despliega los residuales, segn se definen en la ecua
cin 3-16. E l program a producir tam bin todas las grficas de los residuales que se com entaron en la sec
cin 3-4. E n la salida se m uestran asimismo varios diagnsticos residuales ms. Algunos de ellos se
revisarn ms adelante.
Por ltim o, observe que el program a de com putadora incluye tam bin algunas guas para hacer la in
terpretacin. E sta inform acin aconsejable es muy comn en m uchos paquetes de estadstica para
com putadoras personales. Al leer estas guas, recuerde que estn escritas en trm inos muy generales, y
quiz no se ajusten exactam ente a los requerim ientos de redaccin del reporte de un experim entador p ar
ticular. E sta salida aconsejable puede ser elim inada por el usuario.

3-7 DETERMINACIN DEL TA M A O DE LA MUESTRA

3*7

107

D E T E R M IN A C I N D E L T A M A O D E L A M U E S T R A

E n cualquier problem a de diseo experimental, una decisin crtica es la eleccin del tam ao de la m ues
tra; es decir, determ inar el nm ero de rplicas que deben correrse. E n general, si el experim entador tiene
inters en detectar efectos pequeos, se necesitan ms rplicas que cuando el experim entador se interesa
en detectar efectos grandes. E n esta seccin se analizan varios enfoques para determ inar el tam ao de la
m uestra. Aun cuando la revisin se centra en un diseo con un solo factor, la mayora de los m todos pue
den usarse en situaciones experim entales ms complejas.

3-7 .1

C u rv as de o p eraci n caracterstica

Recuerde que una curva de operacin caracterstica es una grfica de la probabilidad del error tipo 11 de
una prueba estadstica para un tam ao de la m uestra particular contra un parm etro que refleja la m edi
da en que la hiptesis nula es falsa. El experim entador puede usar estas curvas como gua en la seleccin
del nm ero de rplicas para que el diseo sea sensible a diferencias potenciales im portantes en los trata
mientos.
Se considera la probabilidad del error tipo II del m odelo con efectos fijos p ara el caso en que se usa el
mismo tam ao de las m uestras en cada tratam iento, por ejemplo
= 1 - P{R echazar H a \ H 0 es falsa}
= 1-

{ f0 >

es falsa}

Para evaluar el enunciado de probabilidad de la ecuacin 3-47, es necesario conocer cul es la distribu
cin del estadstico de prueba ,F0 si la hiptesis nula es falsa. Puede dem ostrarse que, si H 0es falsa, el esta
dstico F0 = M S TtxamitmJ M S E se distribuye como una variable aleatoria F no central con a - 1 y N - a
grados de libertad y parm etro de no centralidad . Si <5 = 0, la distribucin F no central se convierte en la
distribucin F (central) comn.
Las curvas de operacin caracterstica que se presentan en la parte V del apndice se usan para eva
luar el enunciado de probabilidad de la ecuacin 3-47. E n estas curvas se grafica la probabilidad del error
tipo II () contra un parm etro <5, donde

O2 =

M 2
aa

(3-48)

L a cantidad <I>2 est relacionada con el parm etro de no centralidad . Se cuenta con curvas para a = 0.05
y a = 0.01 y un rango de grados de libertad para el num erador y el denom inador.
Al usar las curvas de operacin caracterstica, el experim entador debe especificar el parm etro <I>.
Con frecuencia es difcil hacer esto en la prctica. U na m anera de determ inar > es elegir los valores reales
de las m edias de los tratam ientos para los que querra rechazarse la hiptesis nula con una alta probabili
dad. Por lo tanto, sip lt fi2, p a son las medias de los tratam ientos especificadas, la t de la ecuacin 3-48
se encuentra como r, = p , - p , d o n d ep = ( l/a ) 2 =1 = p, es el prom edio de las m edias de los tratam ientos
individuales. Se requiere asimismo una estimacin de o2. E n ocasiones se cuenta con este valor por expe
riencia previa, un experim ento anterior o una prueba prelim inar (como se sugiri en el captulo 1), o por
u na estim acin discrecional. Cuando no se tiene la seguridad acerca del valor de o 2, los tam aos de las
m uestras podran determ inarse para un rango de valores posibles de a2, a fin de estudiar el efecto de este
parm etro sobre el tam ao de la m uestra requerido, antes de hacer la eleccin final.

108

CAPTULO 3

EXPERIMENTOS CO N U N SOLO FACTOR: EL ANLISIS DE VARIANZA

EJEMPLO 3-11
Considere el experim ento de la resistencia a la tensin descrito en el ejemplo 3-1. Suponga que el experi
m entador est interesado en rechazar la hiptesis nula con una probabilidad de al m enos 0.90 si las m e
dias de los cinco tratam ientos son
//!= 1 1

,m2= 1 2

,3=15

Planea utilizar a = 0.01. E n este caso, puesto que

,4 = 1 8

/*5=19

= 75, se tiene J = (1/5)75 = 15 y

r 1 = fi 1 - fi = 1 1 -1 5 = - 4
t 2 = f i 2 ~ f i = 1 2 -1 5 = - 3

r ,=

= 1 5 -1 5 =

= 4 i = 1 8 -1 5 =

Tj = f i 5 - m = 1 9 -1 5 =

Por lo tanto,
= 50. Suponga que el experim entador piensa que la desviacin estndar de la resistencia a la tensin con cualquier nivel particular del peso porcentual del algodn no ser m ayor que cr=3
psi. Entonces, al utilizar la ecuacin 3-48, se tiene
5

Se usa la curva de operacin caracterstica para a - l = 5 - l = 4 con AT- o = a(n - 1) = 5(n - 1 ) grados de
libertad del error y a = 0.01 (ver la parte V del apndice). Como prim era conjetura para el tam ao de la
m uestra requerido, se prueba con n = 4 rplicas. Esto produce <3>2 = 1.11(4) = 4.44,0 = 2.11 y 5(3) = 15
grados de libertad del error. Por consiguiente, en la parte V se encuentra que =0.30. Por lo tanto, la p o
tencia de la prueba es aproxim adam ente 1 - = 1 - 0.30 = 0.70, que es m enor que el 0.90 requerido, por
lo que se concluye que n = 4 rplicas no son suficientes. Procediendo de m anera similar, puede construir
se la siguiente tabla:
n
4
5
6

4.44
5.55
6.66

$
2.11
2.36
2.58

a(n - 1)
15
20
25

0.30
0.15
0.04

Potencia (1 - )
0.70
0.85
0.96

Por lo tanto, deben realizarse al m enos n i6 rplicas para ootener una prueba con la potencia requerida.
El nico problem a con este enfoque para usar las curvas de operacin caracterstica es que por lo general
es difcil seleccionar el conjunto de las medias de los tratam ientos en el que se basar la decisin del tam a
o de la m uestra. U n enfoque alternativo es seleccionar un tam ao de la m uestra tal que si la diferencia
entre las m edias de dos tratam ientos cualesquiera excede un valor especificado, la hiptesis nula deber
rechazarse. Si la diferencia entre las medias de dos tratam ientos cualesquiera es tan grande como A pue
de dem ostrarse que el valor mnimo de O2 es
(3-49)

3-7 DETERMINACIN DEL TA M A O DE LA MUESTRA

109

Puesto que ste es un valor mnimo de O2, el tam ao de la m uestra correspondiente que se obtiene de la
curva de operacin caracterstica es un valor conservador; es decir, proporciona una potencia al menos
tan grande como la que especific el experim entador.
Para ilustrar este enfoque, suponga que en el experim ento de la resistencia a la tensin del ejemplo
3-1, el experim entador quisiera rechazar la hiptesis nula con una probabilidad de al m enos 0.90 si las m e
dias de dos tratam ientos cualesquiera difieren hasta en 10 psi. Entonces, suponiendo que <7 = 3 psi, se en
cuentra que el valor mnimo de <I>2 es
<j>2 =

w(10)2
2(5X3*)

= l.llw

y, p or el anlisis del ejemplo 3-11, se concluye que se necesitan n = 6 rplicas para obtener la sensibilidad
deseada cuando a = 0.01.

3'7.2

Especificacin de un incremento de la desviacin estndar

E ste enfoque es til en ocasiones p ara elegir el tam ao de la m uestra. Si las m edias de los tratam ientos no
difieren, la desviacin estndar de u na observacin elegida al azar es a. Sin embargo, si las medias de los
tratam ientos son diferentes, la desviacin estndar de u n a observacin elegida al azar es

H e *?/
Si se escoge un porcentaje P para el increm ento de la desviacin estndar de una observacin, ms all del
cual quiera rechazarse la hiptesis de que las medias de todos los tratam ientos son iguales, esto es equiva
lente a escoger

<72 +

2 r '2 / a
= 1 + 0.01P

-1

(P = por ciento)

I.
= V (1+ 0.01P )2 - 1

de donde

<&=

%1>la
i=i___
- = V(1 + 0.01P )2 - l ( V )
a ! Vw

(3-50)

Por lo tanto, p ara un valor especificado de P, 4> puede calcularse con la ecuacin 3-50 y despus usar las
curvas de operacin caracterstica de la parte V del apndice para determ inar el tam ao de la m uestra re
querido.

110

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Por ejemplo, en el experim ento de la resistencia a la tensin del ejem plo 3-1, suponga que se desea
detectar un increm ento de la desviacin estndar de 20% con una probabilidad de al m enos 0.90 y a 0.05. Entonces
5>= V(2)r - ( V ^ ) = 0.66V^
L a referencia a las curvas de operacin caracterstica indica que se necesita n - 9 para obtener la sensibi
lidad deseada,

3-7.3

Mtodo para estimar el intervalo de confianza

E n este enfoque se supone que el experim entador quiere expresar los resultados finales en trm inos de
intervalos de confianza y que est dispuesto a especificar por anticipado cul es el ancho que desea para
estos intervalos de confianza. Por ejemplo, suponga que en el experim ento de la resistencia a la tensin
del ejemplo 3-1 se quiere que un intervalo de confianza de 95% para la diferencia en la resistencia a la
tensin m edia de dos pesos porcentuales del algodn cualesquiera sea 5 psi y una estim acin previa de a
es 3. Entonces, al utilizar la ecuacin 3-13, se encuentra que la precisin del intervalo de confianza es

-W -V

Sn

Suponga que se prueba con n = 5 rplicas. Entonces, al usar o2 = 32 = 9 como una estim acin de M SE, la
precisin del intervalo de confianza es
2 .0 8 6 ^ p = 196

que es ms preciso que el requerim iento. Al probar Con n = 4 se obtiene


2132

= 4.52

Al probar con n = 3 se obtiene


2 . 2 2 8 ^ P = 5.46
Evidentem ente, n = 4 es el tam ao de la m uestra m enor que llevar a la precisin deseada.
E l nivel de significacin consignado en el ejemplo anterior se aplica a un solo intervalo de confianza.
Sin embargo, puede usarse el mismo enfoque general si el experim entador desea especificar de antem ano
un conjunto de intervalos de confianza acerca del cual se hace un enunciado de confianza sim ultneo o
conjunto (ver los com entarios acerca de los intervalos de confianza sim ultneos de la seccin 3-3.3). A de
ms, los intervalos de confianza podran construirse con respecto a contrastes ms generales en las m e
dias de los tratam ientos, que la com paracin por pares ilustrada antes.

3-8

IDENTIFICACIN DE EFECTOS DE DISPERSIN

Nos hem os enfocado aqu en el uso del anlisis de varianza y de otros m todos relacionados p ara determ i
n ar los niveles del factor que resultan en diferencias entre las m edias de los tratam ientos o los niveles del
factor. Se acostum bra referirse a estos efectos como efectos de localizacin. Cuando ocurri la desigual-

3-8 IDENTIFICACIN DE EFECTOS DE DISPERSIN

Tabla 3-12

111

Datos del experimento de fundicin

Algoritmo para
controlar la
proporcin

Observaciones
4

1
2
3
4

4.93(0.05)
4.85(0.04)
4.83(0.09)
4.89(0.03)

4.86(0.04)
4.91(0.02)
4.88(0.13)
4.77(0.04)

4.75(0.05)
4.79(0.03)
4.90(0.11)
4.94(0.05)

4.95(0.06)
4.85(0.05)
4.75(0.15)
4.86(0.05)

4.79(0.03)
4.75(0.03)
4.82(0.08)
4,79(0.03)

4.88(0.05)
4.85(0.02)
4.90(0.12)
4.76(0.02)

dad de la varianza con los diferentes niveles del factor, se utilizaron transform aciones para estabilizar la
varianza y m ejorar as las inferencias hechas sobre los efectos de localizacin. Sin embargo, en algunos
problem as el inters se centra en descubrir si los diferentes niveles del factor afectan la variabilidad; es
decir, el inters est en descubrir efectos de dispersin potenciales. Esto ocurrir siem pre que la desvia
cin estndar, la varianza o cualquier otra m edida de la variabilidad se use como variable de respuesta.
Para ilustrar estos conceptos, considere los datos de la tabla 3-12, los cuales se obtuvieron de un expe
rim ento diseado en una fundicin de aluminio. El aluminio se produce com binando alm ina con otros
ingredientes en u na celda de reaccin y aplicando calor al hacer pasar una co m en te elctrica a travs de
la celda. L a alm ina se agrega de m anera continua a la celda para m antener la proporcin apropiada de la
m isma con respecto a los otros ingredientes. En este experim ento se investigaron cuatro algoritmos para
controlar la proporcin. Las variables de respuesta estudiadas se relacionaron con el voltaje de la celda.
Especficam ente, un sensor registra el voltaje de la celda varias veces cada segundo, produciendo miles de
mediciones del voltaje durante cada corrida del experim ento. Los ingenieros del proceso decidieron usar
como variables de respuesta el voltaje prom edio y la desviacin estndar del voltaje de la celda (indicado
entre parntesis) en la corrida experim ental. E l voltaje prom edio es im portante porque afecta la tem pe
ratu ra de la celda, y la desviacin estndar del voltaje (llam ada "ruido del crisol por los ingenieros del
proceso) es im portante porque afecta la eficiencia global de la celda.
Se llev a cabo un anlisis de varianza para determ inar si los diferentes algoritm os para controlar la
proporcin afectan el voltaje prom edio de la celda. ste revel que el algoritmo para controlar la propor
cin no tuvo ningn efecto de localizacin; es decir, al cam biar los algoritmos para controlar la propor
cin no hubo ningn cambio en el voltaje prom edio de la celda. (Referirse al problem a 3-28.)
Para investigar los efectos de dispersin, lo m ejor suele ser utilizar
log(s)

log(s2)

como variable de respuesta, ya que la transform acin logartm ica es eficaz p ara estabilizar la variabilidad
en la distribucin de la desviacin estndar m uestral. Puesto que todas las desviaciones estndar del vol
taje del crisol son m enores que la unidad, se usar
y = -ln ()
como la variable de respuesta. E n la tabla 3-13 se presenta el anlisis de varianza para esta respuesta, el
logaritmo natural del ruido del crisol. Observe que la eleccin de un algoritmo para controlar la pro
porcin afecta el ruido del crisol; es decir, el algoritmo para controlar la proporcin tiene un efecto de disTabla 3-13

Anlisis de varianza del logaritmo natural del ruido del crisol

Fuente de variacin
Algoritmo para controlar la proporcin
Error
Ibtal

Suma de
cuadrados
6.166
1.872
8.038

Grados de
libertad
3
20
23

Cuadrado
medio
2.055
0.094

F0
21.96

Valor P
<0.001

112

2 .0 0

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

3 .0 0

4 .0 0

Ruido del crisol logartmico promedio [1n (s|J

Figura 3-16 Ruido del crisol logartmico promedio [-ln()] de


cuatro algoritmos para controlar la proporcin en relacin con una
distribucin t escalada con factor de escalamiento J M S E / n =
VO.094 / 6 = 0.125.

persin. Las pruebas estndares de la adecuacin del modelo, incluyendo las grficas de probabilidad
norm al de los residuales, indican que no hay problem as con la validez del experim ento. (R eferirse al pro
blem a 3-29.)
E n la figura 3-16 se grafica el logaritmo prom edio del ruido del crisol de cada algoritmo para controlar
la proporcin y se presenta tam bin una distribucin t escalada que se usa como distribucin de referencia
para discriminar entre los algoritmos de la proporcin. Esta grfica revela con toda claridad que el algorit
mo 3 p ara controlar la proporcin produce ms ruido del crisol o una desviacin estndar del voltaje de la
celda mayor que los otros algoritmos. No parece haber gran diferencia entre los algoritmos 1, 2 y 4.

3-9

EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

Se ha ofrecido un desarrollo intuitivo o heurstico del anlisis de varianza. Sin embargo, es posible p re
sentar un desarrollo ms formal. E l m todo ser de utilidad m s adelante para entender los fundam entos
del anlisis estadstico de diseos m s complejos. Llam ada la prueba general de significacin de la regre
sin, el procedim iento consiste en esencia en encontrar la reduccin en la sum a de cuadrados total para
ajustar el m odelo con todos los parm etros incluidos y la reduccin en la sum a de cuadrados cuando el
m odelo se restringe a la hiptesis nula. La diferencia entre estas dos sumas de cuadrados es la sum a de
cuadrados de los tratam ientos con la que puede realizarse la prueba de la hiptesis nula. El procedim ien
to requiere los estim adores de mnimos cuadrados de los parm etros en el m odelo del anlisis de varian
za. Se dieron ya (en la seccin 3-3.3) las estimaciones de estos parm etros; sin embargo, ahora se presenta
un desarrollo formal.

3 '9 .1

E stim aci n de m nim os cuadrados de los p arm etro s del m odelo

Se desarrollan ahora los estim adores de los parm etros en el m odelo con un solo factor
y = f i + T i + j

utilizando el m todo de mnimos cuadrados. Para encontrar los estim adores de mnimos cuadrados de/ y
r prim ero se form a la suma de cuadrados de los errores

L= 4 =
(y * - /* - * /)1
=1 /=!
1=1 i=l

(3' 51)

3-9 EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

113

y se eligen despus los valores de fi y t, por ejemplo / i y f ,, que minimicen L . Los valores adecuados seran
las soluciones de las a + 1 ecuaciones simultneas
dL
dfi Mi
dL
dT

= 0

= 0

i = 1 ,2 ,..., a

Al derivar la ecuacin 3-51 con respecto a fi y

y al igualar con cero se obtiene

- 22 ( y # - A - * / )
;=i j=i

y
n

-2X
( y i
i=i

= l,2 ,...,a

de la que, despus de simplificar, se obtiene


Nfi+ntj^ + n t 2 + \-nxa = y
n fr+ n 1
rifi

= yL
+ n 2

= y2

np.

(3-52)

+ n ta = ^

A las a + 1 ecuaciones (ecuacin 3-52) con a + 1 incgnitas se les llam a las ecuaciones norm ales de
m nimos cuadrados. Observe que si se suman la ltimas a ecuaciones norm ales, se obtiene la prim era
ecuacin normal. Por lo tanto, las ecuaciones normales no son linealmente independientes, y no existe una
solucin nica p ara fi,
..., t a. E sta dificultad puede superarse m ediante varios mtodos. Puesto que los
efectos de los tratam ientos se han definido como desviaciones de la m edia global, parece razonable apli
car la restriccin
2 * - =

(353)

Utilizando esta restriccin, se obtiene como solucin de las ecuaciones norm ales
^ = I i = y.-y..

(3-54)
i = i , 2 ,...,a

Evidentem ente, esta solucin no es nica y depende de la restriccin (ecuacin 3-53) que se ha elegi
do. Al principio esto puede parecer desafortunado porque dos experim entadores diferentes podran ana
lizar los mismos datos y obtener resultados diferentes si aplican restricciones diferentes. Sin embargo,
ciertas (unciones del parm etro del m odelo son estim adas de m anera nica, independientem ente de la
restriccin. Algunos ejemplos son r, - r, que se estim ara con r i - t j = yL - y ., y la m edia del tratam ien
to i-simo fi = fi + r que se estim arla con fi = p + = yL.
Puesto que el inters se encuentra generalm ente en las diferencias entre los efectos de los tratam ien
tos y no en sus valores reales, no produce preocupacin alguna que r, no pueda estim arse de m anera ni-

114

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

ca. E n general, cualquier funcin de los parm etros del m odelo que sea una combinacin lineal del
m iem bro del lado izquierdo de las ecuaciones norm ales (ecuaciones 3-52) puede estim arse de m anera
nica. A las funciones que se estim an de m anera nica independientem ente de la restriccin que se use se
les llam a funciones estim ables. P ara ms informacin, ver el m aterial suplem entario del texto de este ca
ptulo. Nos encontram os listos para usar estas estimaciones de los parm etros en un desarrollo general
del anlisis de varianza.

3-9.2

Prueba general de significacin de la regresin

U n a parte fundam ental de este procedim iento es escribir las ecuaciones norm ales del modelo. Estas
ecuaciones siem pre podrn obtenerse form ando la funcin de mnimos cuadrados y derivndola con res
pecto a cada parm etro desconocido, como se hizo en la seccin 3-9.1. Sin embargo, se cuenta con un m
todo m s sencillo. Las reglas siguientes perm iten escribir directam ente las ecuaciones norm ales del
m odelo de cualquier diseo experimental:
REGLA 1. Hay una ecuacin norm al p ara cada parm etro del m odelo que va a estimarse.
REGLA 2. El m iem bro derecho de cualquier ecuacin norm al es slo la sum a de todas las observa
ciones que contienen el parm etro asociado con esa ecuacin norm al particular.
Para ilustrar esta regla, considere el m odelo con un solo factor. L a prim era ecuacin norm al
corresponde al p arm etro ^ ; por lo tanto, el m iem bro derecho es y , ya que todas las observacio
nes incluyen a fi.
REG LA 3. El m iem bro izquierdo de cualquier ecuacin norm al es la sum a de todos los parm etros
del modelo, donde cada parm etro est multiplicado por el nm ero de veces que aparece en el
total del m iem bro derecho. Los parm etros se escriben con un acento circunflejo (") para indicar
que son estimadores y no los verdaderos valores de los parm etros.
Por ejemplo, considere la prim era ecuacin norm al en un experim ento con un solo factor. D e acuer
do con las reglas anteriores, sta sera
N fl+ n t1 + n t2 + h n r0 = y
porque fi aparece en las N observaciones, slo aparece en las n observaciones hechas bajo el prim er tra
tam iento, r2 aparece slo en las n observaciones tom adas bajo el segundo tratam iento, etc. Por la ecua
cin 3-52 se verifica que la ecuacin presentada arriba es correcta. L a segunda ecuacin norm al
correspondera a Tj y es
n fi+ m 1 = yt
porque slo las observaciones del prim er tratam iento contienen a t 1 (esto da>>i como m iem bro derecho),
fi y Ti aparecen exactam ente n veces e n ^ L, y todas las dem s aparecen cero veces. E n general, el m iem
bro izquierdo de cualquier ecuacin norm al es el valor esperado del m iem bro derecho.
A hora bien, considere encontrar la reduccin en la suma de cuadrados ajustando un m odelo particu
lar a los datos. Al ajustar un m odelo a los datos se explica parte de la variabilidad; es decir, la variabili
dad no explicada se reduce en cierta cantidad. L a reduccin en la variabilidad no explicada es siem pre la
suma de las estimaciones de los parm etros, cada una de ellas m ultiplicada por el segundo m iem bro de la

3-9 EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

115

ecuacin norm al que corresponde al parm etro especfico. P or ejemplo, en un experim ento con un solo
factor, la reduccin debida al ajuste del m odelo com pleto y = p + r, + e es
R (p, x) = py +!>!_ + t 2yz + + t ayIL
a
= w . + 2j
i=i

(3-55)

L a notacin RQi, r) significa la reduccin en la suma de cuadrados a partir del ajuste del m odelo que con
tiene a / y {r,}. A R (p, r) se le llam a en ocasiones la sum a de cuadrados de regresin del m odelo com
pleto yj ~ p +
+ ,j. El nm ero de grados de libertad asociado con una reduccin en la suma de
cuadrados, tal como R(/i, r), siem pre es igual al nm ero de ecuaciones norm ales linealm ente indepen
dientes. El resto de la variabilidad no explicada por el m odelo se encuentra con

= i=i ;=i ~R(**)

(3-56)

E sta cantidad se usa en el denom inador del estadstico de prueba de H 0:rx ~ r 2 = -= r = 0.


A continuacin se ilustra la prueba general de significacin de la regresin p ara un experim ento con
un solo factor y se dem uestra que produce el anlisis de varianza de un solo factor comn. El m odelo es
yv = ju + t + ,j, y las ecuaciones norm ales se encuentran con las reglas anteriores como
N p + n 1 + n 2 + \-nta = y
n fi+ n i
rtfi

=yL
+ n 2

= y2

nfi

+ n ta = ya

C om pare estas ecuaciones norm ales con las que se obtuvieron en la ecuacin 3-52.
Al aplicar la restriccin 2=1t j = 0, los estim adores de p y r, son
fr - ..

i i = yi. - ,

i = l ,2 , .. ., a

L a reduccin en la suma de cuadrados debida al ajuste de este m odelo com pleto se encuentra con la ecua
cin 3-55 como
R (p ,

t)

= fiy + 2 i i y ,
i-l
a

=(. +S
)y..

( h - y . ) y L

i-i

=77+ 2
iy

i=1

1-1

Vl

116

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

que tiene a grados de libertad porque haya ecuaciones norm ales linealraente independientes. L a suma de
cuadrados del error es, por la ecuacin 3-56,

y tiene N - a grados de libertad.


Para encontrar la suma de cuadrados que resulta de los efectos de los tratam ientos (el {t}), se consi
dera que el m odelo se restringe a la hiptesis nula; es decir, r, = 0 para toda i. El modelo reducido esy v =
fi + Eg. Hay una sola ecuacin norm al para este modelo:
N = y

y el estim ador d e// es jX y . Por lo tanto, la reduccin en la suma de cuadrados que resulta de ajustar el
m odelo reducido que slo contiene a // es

Puesto que hay una sola ecuacin norm al p ara este m odelo reducido, R (/i) tiene un grado de libertad. La
suma de cuadrados debida al {r,}, dado que// ya est incluida en el modelo, es la diferencia e n tre R{/i, z) y
R(/), que es
R (r \fi)= R (n , x ) - R ( n )
= i?(Modelo Completo) - ^(M odelo Reducido)

con a - 1 grados de libertad, que por la ecuacin 3-9 se identifica como SSuraamientos- Estableciendo el su
puesto de norm alidad usual, el estadstico apropiado para probar H 0:
= r 2 = *-- = r = 0 es
i i( T |/ / ) / ( f l - l )
a

i=i j=i
que se distribuye como Fa_ltN_ bajo la hiptesis nula. Se trata, desde luego, del estadstico de prueba para
el anlisis de varianza de un solo factor.

3-10
3-10.1

MTODOS NO PARAMTRICOS EN EL ANLISIS DE VARIANZA


La prueba de Kruskal-Wallis

E n situaciones en las que el supuesto de norm alidad no est justificado, el experim entador quiz quiera
usar un procedim iento alternativo del anlisis de varianza con la prueba F que no dependa de este su-

3-10 MTODOS NO PARAMTRICOS EN EL ANLISIS DE VARIANZA

117

puesto. Kruskal y Wallis [68] han desarrollado este procedim iento. La prueba de Kruskal-Wallis se usa
para probar la hiptesis nula de que los a tratam ientos son idnticos contra la hiptesis alternativa de que
algunos de los tratam ientos generan observaciones que son mayores que otras. Debido a que el procedi
miento est diseado para ser sensible al probar las diferencias en las medias, en ocasiones es conveniente
considerar la prueba de Kruskal-Wallis como una prueba de la igualdad de las medias de los tratamientos.
La prueba de Kruskal-Wallis es una alternativa no param trica del anlisis de varianza usual.
Para realizar la prueba de Kruskal-Wallis, prim ero se hace la clasificacin en rangos de lasy,yobserva
ciones en orden ascendente y cada observacin se reem plaza con su rango, por ejemplo R, asignndole a
la observacin m enor el rango 1. E n el caso de em pates (observaciones que tienen el mismo valor), se
asigna el rango prom edio a cada una de las observaciones em patadas. Sea R la sum a de los rangos del tra
tam iento i-simo. El estadstico de prueba es
Rf

N (N + 1 )2

n.

(3-57)

donde n es el nm ero de observaciones del tratam iento -esimo, N es el nm ero total de observaciones y
a n

S =
N - 1 2i = i 2j = i* ! -

N (N + 1 )2

(3-58)

Observe que S es slo la varianza de los rangos. Si no hay em pates, S2 = N (N + 1)/12, y el estadstico de
prueba se simplifica a

i"

%
-X N + l)
w

(3-59)

Cuando el nm ero de em pates es m oderado, habr pequeas diferencias entre las ecuaciones 3-57 y 3-59,
y puede usarse la form a ms simple (ecuacin 3-59). Si las n son razonablem ente grandes, por ejemplo
n > 5, H se distribuye aproxim adam ente como x t-i bajo la hiptesis nula. Por lo tanto, si

la hiptesis nula se rechaza. Tambin podra usarse el enfoque del valor P.

EJEMPLO 3 - 1 2 ..................................................................................................................................
E n la tabla 3-14 se m uestran los datos del ejemplo 3-1 y sus rangos correspondientes. Puesto que hay un
nm ero bastante grande de em pates, la ecuacin 3-57 se usa como el estadstico de prueba. Por la ecua
cin 3-58 se encuentra
a

S2=

2 2 K N - 1 ,<
'=i j=i
24

5497.79-

= 53.03

N ( N + l)2
4

25(26)2

118

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Tabla 3-14

Datos y rangos para el experimento de la resistencia a la tensin del ejemplo 3-1


Peso porcentual del algodn

20

15

yy
i
7
15

11
9

R,

Ry
2.0
2.0

yy
12

12.5
7.0
4.0
27.5

12

17
18
18

25

30

R,
11.0

yy
9.5
14.0
9.5
16.5
16.5

14
18
18
19
19

16.5
16.5
20.5
20.5
85.0

66.0

y 4/
19
25
22
19
23

35

Rq

ya

20.5
25.0
23.0
20.5
24.0
113.0

R,
2.0

10
11

5.0
7.0
12.5
7.0
33.5

15

11

y el estadstico de prueba es
R?

1
53.03

N (N + l)2
4

5245.0-

25(26)2

= 19.25
Puesto que H > %20 m 4,4 = 13.28, se rechazara la hiptesis nula y se concluira que los tratam ientos difie
ren. (El valor P p ara H 19.25 es P = 0.0002.) Se trata de la misma conclusin obtenida por el anlisis de
varianza usual con la prueba F.
3 -1 0 .2

C o m en tario s generales sobre la tran sfo rm aci n de rangos

Al procedim iento utilizado en la seccin anterior de reem plazar las observaciones con sus rangos se le lla
m a la transform acin de rangos. Es una tcnica muy poderosa y til. Si se aplicara la prueba F comn a
los rangos en lugar de a los datos originales, se obtendra
P
0

H i j a - 1)
(N -l-H )l(N -a )

como el estadstico de prueba (ver Conover [20], p. 337). Observe que cuando el estadstico H de Kruskal-Wallis se increm enta o decrem enta, F0 tam bin se increm enta o decrem enta, por lo que la prueba de
Kruskal-Wallis es equivalente a aplicar el anlisis de varianza comn a los rangos.
La transform acin de rangos tiene una am plia aplicabilidad en los problem as de diseo experim ental
para los que no existe ninguna alternativa no param trica p ara el anlisis de varianza. Esto incluye m u
chos de los diseos de captulos subsecuentes de este libro. Si los datos estn en rangos y se aplica la p ru e
b a F comn, el resultado es un procedim iento aproxim ado que tiene buenas propiedades estadsticas (ver
Conover e Im n [30a, b]). Cuando existe preocupacin acerca del supuesto de norm alidad o por el efecto
de puntos atpicos o valores absurdos, se recom ienda que el anlisis de varianza com n se realice tanto
en los datos originales como en los rangos. Cuando ambos procedim ientos producen resultados similares,
probablem ente los supuestos del anlisis de varianza se satisfacen razonablem ente, y el anlisis estndar
es satisfactorio. Cuando los dos procedim ientos difieren, deber darse preferencia a la transform acin de
rangos, ya que es menos posible que sea distorsionada por una condicin de no norm alidad o la presencia
de observaciones inusuales. E n tales casos, tal vez el experim entador quiera investigar el uso de transfer-

3-11 PROBLEMAS

119

m adones para la falta de norm alidad y examinar los datos y el procedim iento experim ental a fin de deter
m inar si hay puntos atpicos y por qu han ocurrido.

3-11
3-1.

PROBLEMAS

------------------------------------------------------------------------------------------

Se estudia la resistencia a la tensin del cem ento portland. P ueden usarse econm icam ente cuatro diferentes
tcnicas de mezclado. Se han colectado los siguientes datos:
Resistencia a la tensin (lb/pulg2)

Tcnica de mezclado

1
2
3
4

3-2.

3-3.

3-4.

3000
3300
2900
2700

3129
3200
2800
2600

2890
3150
3050
2765

2865
2975
2985
2600

o) P robar la hiptesis de que las tcnicas de m ezclado afectan la resistencia del cem ento. U tilizar a = 0.05.
b) C onstruir una representacin grfica como se describi en la seccin 3-5.3 p ara com parar las resistencias
a la tensin prom edio de las cuatro tcnicas de mezclado. A qu conclusiones se llega?
c) U sar el m todo LSD de F isher con a = 0.05 p ara hacer com paraciones entre pares de medias.
d) C onstruir una grfica de probabilidad norm al de los residuales. Q u conclusiones se sacaran acerca de
la validez del supuesto de norm alidad?
e) G raficar los residuales contra la resistencia a la tensin predicha. C om entar la grfica.
f) H acer un diagram a de dispersin de los resultados como ayuda p ara la interpretacin de los resultados
de este experim ento.
a) Resolver de nuevo el inciso b del problem a 3-1 utilizando la pru eb a del rango m ltiple de D uncan con a
= 0.05. Hay alguna diferencia en las conclusiones?
b) Resolver de nuevo el inciso b del problem a 3-1 utilizando la pru eb a de Tikey con a = 0.05. Se llega a las
mismas conclusiones con la prueba de Hikey que las obtenidas con el procedim iento grfico y/o con la
prueba del rango m ltiple de D uncan?
c) Explicar la diferencia entre los procedim ientos de D uncan y de I\ikey.
Considere nuevam ente el problem a 3-1. E ncontrar un intervalo de confianza de 95% p ara la resistencia a la
tensin m edia del cem ento portland que produce cada un a de las cuatro tcnicas de mezclado. E ncontrar
tam bin un intervalo de confianza de 95% para la diferencia en las m edias de las tcnicas 1 y 3. Sirve esto de
ayuda para interp retar los resultados del experim ento?
Se llev a cabo un experim ento a fin de determ inar si cuatro tem peraturas de coccin especficas afectan la
densidad de cierto tipo de ladrillo. E l experim ento produjo los siguientes datos:
Tem peratura

Densidad

100

21.8

125
150
175

21.7
21.9
21.9

21.9
21.4

21.7
21.5

21.6

21.8

21.8
21.8

21.6

21.7

21.7

21.4
21.5

21.4

a) La tem peratura de coccin afecta la densidad de los ladrillos? U tilizar a = 0.05.


b) Es apropiado com parar las medias utilizando la prueba del rango m ltiple de D uncan (por ejem plo) en
este experim ento?
A nalizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza?
d) C onstruir una representacin grfica de los tratam ientos com o se describi en la seccin 3-5.3. E sta
grfica resum e adecuadam ente los resultados del anlisis de varianza del inciso a l
c)

120
3-5.

3-6.

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR; EL ANLISIS DE VARIANZA

Resolver de nuevo el inciso d del problem a 3-4 utilizando el m todo LSD de Fisher. A qu conclusiones se
llega? Explicar en detalle cmo se modific la tcnica para tom ar en cuenta los tam aos de las m uestras desi
guales.
U n fabricante de televisores est interesado en el efecto de cuatro tipos diferentes de recubrimientos para cines
copios de color sobre la conductividad de un cinescopio. Se obtienen los siguientes datos de la conductividad:

Tipo de recubrim iento

1
2
3
4

Conductividad
143
152
134
129

141
149
136
127

150
137
132
132

146
143
127
129

a) H ay alguna diferencia en la conductividad debida al tipo de recubrim iento? U tilizar a = 0.05.


b) E stim ar la m edia global y los efectos de los tratam ientos.
c) Calcular la estim acin de un intervalo de confianza de 95% p ara la m edia del tipo de recubrim iento 4.

3-7.
3-8.

Calcular la estim acin de un intervalo de confianza de 99% p ara la diferencia m edia en tre los tipos de re
cubrim iento 1 y 4.
d) Probar todos los pares de m edias utilizando el m todo LSD de Fisher con a = 0.05.
e) U sai el m todo grfico com entado en la seccin 3-5.3 p ara com parar las medias. Cul es el tipo de recu
brim iento que produce la conductividad ms alta?
f) Suponiendo que el recubrim iento tipo 4 es el que se est usando actualm ente, qu se recom endara al
fabricante? Q uiere minimizarse la conductividad.
Considere nuevam ente el experim ento del problem a 3-6. A nalizar los residuales y sacar conclusiones acerca
de la adecuacin del modelo,
E n un artculo de ACIMaterials Journal (vol. 84, pp. 213-216) se describen varios experim entos p ara investi
gar el varillado del concreto para elim inar el aire atrapado. Se us un cilindro de 3 x 6 pulgadas; y el nm ero
de veces que esta b arra se utiliz es la variable del diseo. L a resistencia a la com presin resultante de la
m uestra de concreto es la respuesta. Los datos se m uestran en la tabla siguiente:

Nivel de varillado

10
15

20
25

Resistencia a la compresin
1530
1610
1560
1500

1530
1650
1730
1490

1440
1500
1530
1510

a) Hay alguna diferencia en la resistencia a la com presin debida al nivel de varillado? U tilizar a = 0.05.
b) E ncontrar el valor P p ara el estadstico F del inciso a.
c ) A nalizar los residuales de este experimento. Q u conclusiones pueden sacarse acerca de los supuestos
fundam entales del m odelo?

d) C onstruir una representacin grfica para com parar las m edias de los tratam ientos, com o se describi
3-9.

en la seccin 3-5.3.
E n un artculo de. Environment International (vol. 18, no. 4) se describe un experim ento en el que se investig
la cantidad de radn liberado en las duchas. Se us agua enriquecida con radn en el experim ento, y se p ro
baron seis dim etros diferentes de los orificios de las regaderas. Los datos del experim ento se m uestran en la
siguiente tabla:

3-11 PROBLEMAS

D im etro de
los orificios

121

R adn liberado (% ) .
80
75
74
67
62
60

0.37
0.51
0.71

1.02
1.40
1.99

83
75
73
72
62
61

83
79
76
74
67
64

85
79
77
74
69

66

a)
b)
c)
d)

3-10.

El tam ao de los orificios afecta el porcentaje prom edio del radn liberado? U tilizar a = 0.05.
E ncontrar el valor P para el estadstico F del inciso a.
A nalizar los residuales de este experimento.
E ncontrar un intervalo de confianza de 95% p ara el porcentaje prom edio de radn liberado cuando el
dim etro de los orificios es 1.40.
e) C onstruir una representacin grfica p ara com parar las m edias de los tratam ientos, como se describi
en la seccin 3-5.3. Q u conclusiones pueden sacarse?
Se d eterm in el tie m p o de re sp u e sta en m ilisegundos p ara tre s d iferen tes tip o s de circu ito s q ue p o
d ran u sarse en u n m ecanism o de desconexin au to m tica. L os resu ltad o s se m u e stran en la sig u ien te
tabla:

Tipo de circuito

1
2
3

Tiempo de respuesta
9

20
6

12
21

10

23

17
16

15
30
7

a) P robar la hiptesis de que los tres tipos de circuitos tienen el mismo tiem po de respuesta. U tilizar
a = 0 .01 .
b ) U sar la prueba de Tukey para com parar pares de m edias de los tratam ientos. U tilizar a = 0.01.
c)

3-11.

U sar el procedim iento grfico de la seccin 3-5.3 p ara com parar las m edias de los tratam ientos, Q u
conclusiones pueden sacarse? Cmo se com paran con las conclusiones del inciso b ?
d) C onstruir un conjunto de contrastes ortogonales, suponiendo que al principio del experim ento se sospe
chaba que el tiem po de respuesta del circuito tipo 2 era diferente del de los otros dos.
e ) Si el lector fuera el ingeniero de diseo y quisiera m inim izar el tiem po de respuesta, qu tipo de circuito
seleccionara?
f) A nalizar los residuales de este experim ento. Se satisfacen los supuestos del anlisis d e varianza b
sico?
Se estudia la vida efectiva de los fluidos aislantes en un a carga acelerada de 35 kV. Se han obtenido datos de
una prueba para cuatro tipos de fluidos. Los resultados fueron los siguientes:

Tipo de fluido

1
2
3
4

V ida (en horas) con 35 kV de carga


17.6
16.9
21.4
19.3

18.9
15.3
23.6

21.1

16.3
18.6
19.4
16.9

17.4
17.1
18.5
17.5

20.1

21.6

19.5
20.5
18.3

20.3
22.3
19.8

122

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

a) H ay algn indicio de que los fluidos difieran? U tilizar a = 0.05.


b) Cul fluido seleccionara el lector, dado que el objetivo es conseguir la vida efectiva ms larga?
3-12.

c) A nalizar los residuales de este experimento. Se satisfacen los supuestos del anlisis de varianza bsico?
Se estudian cuatro diferentes tipos de diseos de un circuito digital de com putadora p ara com parar la canti
dad de ruido presente. Se obtienen los siguientes datos:

D iseo del circuito

1
2

Ruido observado

20

19
80
47
95

3
4

61
26
46

19
73
25
83

30
56
35
78

80
50
97

a) La cantidad de ruido presente es la misma p ara los cuatro diseos? U tilizar a = 0.05.
b) A nalizar los residuales de este experim ento. Se satisfacen los supuestos del anlisis de varianza?
3-13.

c) Q u diseo del circuito se seleccionara p ara usarlo? El ruido bajo es mejor.


Se pide a cuatro qumicos que determ inen el porcentaje de alcohol metlico en cierto com puesto qumico.
Cada qumico hace tres determ inaciones, y los resultados son los siguientes:

Qumico

1
2
3
4

Porcentaje de alcohol metlico


84.99
85.15
84.72
84.20

84,04
85.13
84.48
84.10

84.38
84.88
85.16
84.55

a) Los qumicos difieren significativamente? U tilizar a = 0.05.


b ) A nalizar los residuales de este experimento.
c)
3-14.

Si el qumico 2 es un em pleado nuevo, construir un conjunto razonable de contrastes ortogonales que


podra haberse usado al principio del experim ento.
Se som eten a estudio tres m arcas de bateras. Se sospecha que las vidas (en sem anas) de las tres m arcas son
diferentes. Se prueban cinco bateras de cada m arca con los resultados siguientes:

Semanas de vida
M arca 1

M arca 2

100

76
80
75
84
82

96
92
96
92

M arca 3
108

100
96
98

100

a) Las vidas de estas tres m arcas son diferentes?


b ) A nalizar los residuales de este experimento.
c)

C onstruir la estim acin de un intervalo de confianza de 95% p ara la vida m edia de la b atera m arca 2.
Construir la estim acin del intervalo de confianza de 99% p ara la diferencia m edia en tre las vidas de las
bateras m arcas 2 y 3.

3-11 PROBLEMAS

3-15.

123

d) Qu marca seleccionara el lector para usarla? Si el fabricante reemplazara sin cargo cualquier batera
que dure menos de 85 semanas, qu porcentaje esperara reemplazar la compaa?
Se estn investigando cuatro catalizadores que pueden afectar la concentracin de un componente en una
mezcla lquida de tres componentes. Se obtienen las siguientes concentraciones:

Catalizador

3-16.

58.2
57.2
58.4
55.8
54.9

56.3
54.5
57.0
55.3

50.1
54.2
55.4

a) Los cuatro catalizadores tienen el mismo efecto sobre la concentracin?


b) Analizar los residuales de este experimento.
c) Construir la estimacin de un intervalo de confianza de 99% para la respuesta media del catalizador 1.
Se llev a cabo un experimento para investigar la eficacia de cinco materiales aislantes. Se probaron cuatro
muestras de cada material con un nivel elevado de voltaje para acelerar el tiempo de falla. Los tiempos de fa
lla (en minutos) se muestran abajo:

Material
1
2
3
4
5

3-17.

4
52.9
49.9
50.0
51.7

110
1
880
495
7

Tiempo de falla (minutos)


157
194
2
4
1256
5276
7040
5307
5
29

178
18
4355
10,050
2

a) Los cinco materiales tienen el mismo efecto sobre el tiempo de falla?


b) Graficar los residuales contra la respuesta predicha. Construir una grfica de probabilidad normal de los
residuales. Qu informacin transmiten estas grficas?
c) Con base en la respuesta del inciso b, realizar otro anlisis de los datos del tiempo de falla y sacar las con
clusiones apropiadas.
Un fabricante de semiconductores ha desarrollado tres mtodos diferentes para reducir el conteo de partcu
las en las obleas. Los tres mtodos se prueban en cinco obleas y se obtiene el conteo de partculas despus del
tratamiento. Los datos se muestran abajo:

Mtodo
1
2
3

31
62
53

10
40
27

Conteo
21
24
120

4
30
97

1
35
68

a) Todos los mtodos tienen el mismo efecto sobre el conteo promedio de partculas?
b) Graficar los residuales contra la respuesta predicha. Construir una grfica de probabilidad normal de los
residuales. Hay motivo de preocupacin potencial acerca de la validez de los supuestos?
c) Con base en la respuesta del inciso b, realizar otro anlisis de los datos del conteo de partculas y sacar las
conclusiones apropiadas.

124
3-18.

3-19.
3-20.

3-21.

3-22.

3-23.

3-24,

3-25.

3-26.

3-27.

3-28.

3-29.

3-30.

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Considere la prueba de la igualdad de las medias de dos poblaciones normales, donde las varianzas son des
conocidas pero se suponen iguales. El procedimiento de prueba apropiado es la prueba t agrupada o combi
nada. Demostrar que la prueba t combinada es equivalente al anlisis de varianza de un solo factor.
Demostrar que la varianza de la combinacin lineal 2 ^ ^ , es a2T.=1nc2.
En un experimento con efectos fijos, suponga que hay n observaciones para cada uno de cuatro tratamientos.
Sean
los componentes con un solo grado de libertad de los contrastes ortogonales. Demostrar que
5Snatiniientos =
+ g.
Utilizar la prueba de Bartlett para determinar si el supuesto de la igualdad de las varianzas se satisface en el
problema 3-14. Utilizar a = 0.05. Se lleg a la misma conclusin respecto de la igualdad de las varianzas con
el examen de las grficas de los residuales?
Utilizar la prueba de Levene modificada para determinar si el supuesto de las varianzas iguales se satisface
en el problema 3-14. Utilizar a = 0.05. Se lleg a la misma conclusin respecto de la igualdad de las varian
zas con el examen de las grficas de los residuales?
Referirse al problema 3-10. Si quiere detectarse una diferencia mxima en los tiempos de respuesta prome
dio de 10 milisegundos con una probabilidad de al menos 0.90, qu tamao de la muestra deber usarse?
Cmo se obtendra una estimacin preliminar de a2?
Referirse al problema 3-14.
a) Si quiere detectarse una diferencia mxima en la vida de las bateras de 10 horas con una probabilidad de
al menos 0.90, qu tamao de la muestra deber usarse? Comentar cmo se obtendra una estimacin
preliminar de a2 para responder esta pregunta,
b) Si la diferencia entre las marcas es lo suficientemente grande para que la desviacin estndar de una ob
servacin se incremente en 25%, qu tamao de la muestra deber usarse si quiere detectarse esto con
una probabilidad de al menos 0.90?
Considere el experimento del problema 3-14, Si quiere construirse un intervalo de confianza de 95% para la
diferencia en las vidas medias de dos bateras que tenga una precisin de 2 semanas, cuntas bateras de
cada marca deben probarse?
Suponga que cuatro poblaciones normales tienen medias^! = 50, n 2 = 60,//3 = 50 y = 60. Cuntas obser
vaciones debern hacerse en cada poblacin para que la probabilidad de rechazar la hiptesis nula de la
igualdad de las medias poblacionales sea al menos 0.90? Suponer que a = 0.05 y que una estimacin razona
ble de la varianza de error es a2 = 25.
Referirse al problema 3-26.
a) En qu forma cambiara la respuesta si una estimacin razonable de la varianza del error experimental
fuera a2 = 36?
b) En qu forma cambiara la respuesta si una estimacin razonable de la varianza del error experimental
fuera a1 = 49?
c) Puede sacarse alguna conclusin acerca de la sensibilidad de la respuesta dada en esta situacin
particular acerca de cmo afecta la estimacin de a la decisin referente al tamao de la muestra?
d) Puede hacerse alguna recomendacin acerca de cmo debera usarse este enfoque general para elegir n
en la prctica?
Referirse al experimento de la fundicin de aluminio descrito en la seccin 3-8. Verificar que los mtodos
para controlar la proporcin de almina no afectan el voltaje promedio de la celda. Construir una grfica de
probabilidad normal de los residuales. Graficar los residuales contra los valores predichos. Existe algn in
dicio de que se violan algunos de los supuestos fundamentales?
Referirse al experimento de la fundicin de aluminio de la seccin 3-8. Verificar el anlisis de varianza del
ruido del crisol que se resume en la tabla 3-13. Examinar las grficas de los residuales usuales y comentar la
validez del experimento.
Se investigaron cuatro diferentes velocidades de alimentacin en un experimento con una mquina CNC que
produce una pieza que se usa en la unidad de potencia auxiliar de un avin. El ingeniero de manufactura a
cargo del experimento sabe que una dimensin crtica de la pieza de inters puede ser afectada por la veloci
dad de alimentacin. Sin embargo, la experiencia previa indica que es probable que slo estn presentes

3-11 PROBLEMAS

125

efectos de dispersin. Es decir, al cambiarse la velocidad de alimentacin no se afecta la dimensin prome


dio, pero podra afectarse la variabilidad dimensional. El ingeniero realiza cinco corridas de produccin con
cada velocidad de alimentacin y obtiene la desviacin estndar de la dimensin crtica (en 10~3mm). Los da
tos se muestran abajo. Suponer que todas las corridas se hicieron en orden aleatorio.
Velocidad de alimentacin
(pulgadas/minuto)
10
12
14
16

3-31.

3-32.
3-33.
3-34.
3-35.

1
0.09
0.06
0.11
0.19

Corrida de produccin
3
2
4
0.10
0.08
0.13
0.12
0.09
0.07
0.08
0.08
0.05
0.15
0.13
0.20

5
0.07
0.12
0.06
0.11

a) La velocidad de alimentacin tiene algn efecto sobre la desviacin estndar de esta dimensin crtica?
b) Usar los residuales de este experimento para investigar la adecuacin del modelo. Hay algn problema
con la validez experimental?
Considere los datos del problema 3-10.
a) Escribir las ecuaciones normales de mnimos cuadrados para este problema y resolverlas para /i y x, uti
lizando la restriccin usual (Z ^ , = 0). Estimar t] - r2.
b) Resolver las ecuaciones del inciso a utilizando la restriccin 3 = 0. Los estimadores r y p, son los mis
mos que se encontraron en el inciso a? Por qu? Estimar ahora - t2y comparar la respuesta con la del
inciso a. Qu afirmacin puede hacerse respecto de estimar los contrastes en las r(?
c) Estimar fi + t 1; 2 t, - r 2- t 3, y fi +
+ t 2utilizando las dos soluciones de las ecuaciones normales. Com
parar los resultados obtenidos en cada caso.
Aplicar la prueba general de significacin de la regresin en el experimento del ejemplo 3-1. Demostrar que
el procedimiento produce los mismos resultados que el anlisis de varianza usual.
Usar la prueba de Kruskal-Wallis en el experimento del problema 3-11. Comparar las conclusiones obtenidas
con las del anlisis de varianza usual.
Usar la prueba de Kruskal-Wallis en el experimento del problema 3-12. Los resultados son comparables con
los encontrados por el anlisis de varianza usual?
Considere el experimento del ejemplo 3-1. Suponga que la observacin mayor de la resistencia a la tensin se
registr incorrectamente como 50. Qu efecto tiene esto sobre el anlisis de varianza usual? Qu efecto
tiene sobre la prueba de Kruskal-Wallis?

Bloques aleatorizados,
cuadrados latinos y diseos
relacionados

4-1

DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

E n cualquier experim ento, la variabilidad que surge de un factor perturbador puede afectar los resulta
dos. E n general, un factor perturbador puede definirse como un factor del diseo que probablem ente
tenga un efecto sobre la respuesta, pero en el que no existe un inters especfico. E n ocasiones un factor
perturbador es desconocido y no controlable; es decir, se desconoce la existencia de ese factor e incluso
puede ten er niveles variables m ientras se est realizando el experimento. La aleatorizacin es la tcnica
de diseo que se utiliza para protegerse contra estos factores perturbadores que estn al acecho. En
otros casos, el factor perturbador es conocido pero no controlable. Si p or lo m enos puede observarse el
valor que asume el factor perturbador en cada corrida del experim ento, es posible hacer la compensacin
correspondiente en el anlisis estadstico m ediante el uso del anlisis de covarianza, una tcnica que se
revisar en el captulo 14. Cuando la fuente de variabilidad perturbadora es conocida y controlable, pue
de usarse u na tcnica de diseo llam ada formacin de bloques para elim inar de m anera sistem tica su
efecto sobre las com paraciones estadsticas entre los tratam ientos. L a form acin de bloques es una tcni
ca de diseo en extrem o im portante que se utiliza am pliam ente en la experim entacin industrial, y es la
m ateria de este captulo.
P ara ilustrar la idea general, suponga que quiere determ inarse si cuatro puntas diferentes producen o
no lecturas diferentes en una m quina para probar la dureza. U n experim ento como ste podra ser parte
de un estudio de la aptitud en la calibracin de los instrum entos. L a m quina funciona presionando la
p unta en un ejem plar de prueba de metal, y por la profundidad de la depresin resultante puede determ i
narse la dureza del ejemplar. El experim entador ha decidido obtener cuatro observaciones para cada
punta. Hay un solo facto rel tipo de puntan-, y un diseo com pletam ente aleatorizado de un solo factor
consistira en asignar al azar cada una de las 4 x 4 = 16 corridas a una unidad experimental, es decir, a un
ejem plar de prueba de metal, y observar qu resulta de la lectura de la dureza. Por lo tanto, se necesita
ran 16 ejem plares de prueba de m etal en este experim ento, uno por cada corrida del diseo.
Existe un problem a potencialm erte serio con un experim ento por com pleto aleatorizado en esta si
tuacin de diseo. Si los ejem plares de prueba de m etal difieren ligeram ente en sus durezas, como podra

126

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

Tabla 4-1

127

Diseo de bloques completos aleatorizados para el


experimento de la prueba de la dureza
Ejem plar de prueba

Tipo de punta

1
2
3
4

1
9.3
9.4
9.2
9.7

9.4
9.3
9.4
9.6

9.6
9.8
9.5

10.0

10.0

10.2

9.9
9.7

ocurrir si se tom aran de lingotes que se produjeron con tem peraturas diferentes, las unidades experim en
tales (los ejem plares de prueba) contribuirn a la variabilidad observada en los datos de la dureza. Como
resultado, el error experim ental reflejar tanto el error aleatorio como la variabilidad entre los ejem pla
res de prueba.
El objetivo sera hacer el error experimental tan pequeo como fuera posible; es decir, querra elimi
narse del error experim ental la variabilidad entre los ejem plares de prueba. U n diseo p ara lograr esto
requiere que el experim entador pruebe cada punta una vez en cada uno de los cuatro ejem plares de prue
ba. A este diseo, que se m uestra en la tabla 4-1, se le llam a diseo de bloques completos aleatorizados
(RCBD, randomized complete block design). La respuesta observada es la dureza en la escala C de Rockwell
menos 40. La palabra completos indica que cada bloque (ejemplar de prueba) contiene todos los tratamien
tos (puntas). A l utilizar este diseo, los bloques o ejem plares de prueba form an una unidad experim ental
ms hom ognea en la cual com parar las puntas. D e hecho, esta estrategia de diseo m ejora la precisin
de las comparaciones entre las puntas al eliminar la variabilidad entre los ejemplares de prueba. D entro de
un bloque, el orden en que se prueban las cuatro puntas se determ ina aleatoriam ente. Observe la simili
tud de este problem a de diseo con el de la seccin 2-5, donde se analiz la prueba t pareada. El diseo de
bloques com pletos aleatorizados es una generalizacin de ese concepto.
E l RCBD es uno de los diseos experim entales ms utilizados. Son num erosas las situaciones en las
que el RCBD es apropiado. Las unidades de equipo o m aquinaria de prueba son con frecuencia diferen
tes en sus caractersticas de operacin y seran un factor de formacin de bloques tpico. Lotes de m ateria
prim a, personas y el tiem po tam bin son fuentes de variabilidad perturbadora comunes en un experim en
to que pueden controlarse de m anera sistemtica m ediante la form acin de bloques.
La formacin de bloques tam bin puede ser til en situaciones que no incluyen necesariam ente fac
tores perturbadores. Por ejemplo, suponga que un ingeniero qumico est interesado en el efecto de la ve
locidad de alim entacin del catalizador sobre la viscosidad de un polmero. Sabe que hay varios factores,
como la fuente de la m ateria prima, la tem peratura, el operador y la pureza de la m ateria prim a, que son
muy difciles de controlar en proceso en gran escala. Por lo tanto, decide probar en bloques la velocidad
de alim entacin del catalizador, donde cada bloque consiste en alguna combinacin de estos factores no
controlables. D e hecho, est utilizando los bloques para probar la robustez de su variable de proceso (la
velocidad de alim entacin) para las condiciones que no puede controlar con facilidad. Para un anlisis
ms amplio de este punto, ver Colem an y M ontgomery [27].
4 -1 .1

A nlisis estadstico del diseo de bloques com pletos aleatorizados

Suponga que se tienen, en general, a tratam ientos que van a com pararse y b bloques. El diseo de bloques
com pletos aleatorizados se m uestra en la figura 4-1. Hay una observacin por tratam iento en cada blo
que, y el orden en que se corren los tratam ientos dentro de cada bloque se determ ina al azar. D ebido a

128

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Bloque 1

Bloque 2

?11

y 12

y 21

y 2?

ya

y 32

#
:yi
Figura 4-1

Bloque b

#
yh

El diseo de bloques completos aleatorizados.

que la nica aleatorizacin de los tratam ientos se hace dentro de los bloques, con frecuencia se dice que
los bloques representan una restriccin sobre la aleatorizacin.
El modelo estadstico del RCBD puede escribirse de varias m aneras. El tradicional es el modelo de
los efectos:
i = 1, 2 ,. . . , a
ya = n + T i + j + e ij

(4-1)

; = i, 2

donde // es la m edia global, r, es el efecto del tratam iento i-simo, j es el efecto del bloque;-sim o, y ,, es
el trm ino del error NID (0, o 2) usual. Se considerar inicialm ente que los tratam ientos y los bloques son
factores fijos. Como en el m odelo del diseo experim ental con un solo factor del captulo 3, el m odelo de
los efectos para el RCBD es un m odelo sobreespecificado. E n consecuencia, los efectos de los tratam ien
tos y los bloques se consideran por lo general como desviaciones de la m edia global, por lo que

2.=i T'=0y X
h =0
=i
Thmbin es posible usar un modelo de las m edias p ara el RCBD, por ejemplo
J7 = l, 2,..., a

donde//,:j = // + r, + j. Sin embargo, en este captulo se usar el m odelo de los efectos de la ecuacin 4-1.
E n un experim ento en el que se use el RCBD, el inters se encuentra en probar la igualdad de las m e
dias de los tratam ientos. Por lo tanto, las hiptesis de inters son
i f 0://, = / / 2 = - = //
Hy.a m enos u n a //, *
Puesto que la m edia del tratam iento i-simo es//;; = ( l/b y z bj=l(/i + t i + J) = // + r, una m anera equivalen
te de escribir las hiptesis anteriores es en trm inos de los efectos de los tratam ientos, por ejemplo
H 0:t 1 = t 2 = = Ta = 0
H x: t ; * 0 para al menos una i
Sea y, el total de observaciones hechas bajo el tratam iento i,y el total de observaciones del bloque j,y
el gran total de las observaciones y N = ab el nm ero total de observaciones. Expresado matemticamente,

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

129

2*1

i = 1 ,2 ,..., a

(4-2)

y.j = ' ,y *

j= l,2 ,.~ ,b

(4-3)

(4-4)

fl.

x =

=i y=i

/=i

y-i

D e m anera similar,^, es el prom edio de las observaciones hechas bajo el tratam iento i,y es el prom edio
de las observaciones del bloque j, es el gran prom edio de todas las observaciones. Es decir,

y.= y./b

y.i= y.ia

JN

(4-5)

L a sum a de cuadrados total corregida puede expresarse como

2=i 2j=i

(ya - y.

)2=2 2j-i

tov_y. )+(x>- y..)+(>*- y.- y+y.)i2

1=1

(4-6)

AI desarrollar el miembro del lado derecho de la ecuacin 4-6 se obtiene


a

2 2 Ov ~ )2=62 o,
= l 7 -1

i- 1

- y

)2+a2 Oo _ y. )2
J -l

+2
2 ov yi- ~ y i +.)2+22X
(- y. xy.j - y. )
/-i j=i
/=i j-i
a b

+22/-i 2j~i
a

(y - y.)o*~y.- y+ y.)

+22=i 2y-i ov- X.)(n - y, - +x.)


Mediante procedimientos algebraicos simples, pero laboriosos, se prueba que los tres productos cruzados
son cero. Por lo tanto,

2 2
(>v
j= l
/-1

y. )2= 2

= 1

O l - y. )2+a2

;= 1

O., ~y )2

+ 2 2 Ov ?/ ?.. + X. )2
= 1

(4-7)

y=i

representa una particin de la suma de cuadrados total. Al expresar simblicamente las sumas de cuadra
dos de la ecuacin 4-7, se tiene
SST = SSTratamjeilt(>J+ SSBloques + SSE

(4*8)

Puesto que hay N observaciones, SST tiene N - 1 grados de libertad. Hay a tratamientos y b bloques,
de donde SSTratamienlosy SSBloque5tienen a - 1 y b -1 grados de libertad, respectivamente. La suma de cuadra

130

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

dos del erro r es slo la sum a de cuadrados entre las celdas m enos la suma de cuadrados de los tratam ien
tos y los bloques. Hay ab celdas con a b - 1 grados de libertad entre ellas, de donde SSE tiene ab - 1 - (a - 1 )
- (b - 1 ) = (a - l)(b - 1 ) grados de libertad. Adems, la sum a de los grados de libertad del lado derecho de
la ecuacin 4-8 es igual al total del lado izquierdo; p or lo tanto, al establecer los supuestos de norm alidad
usuales para los errores, puede usarse el teorem a 3-1 para dem ostrar que <S'STratamientos/2, S S ^ ^ J o 2 y
S S ^a 2 son variables aleatorias ji-cuadrada con distribuciones independientes. C ada sum a de cuadrados
dividida p or sus grados de libertad es un cuadrado medio. Puede dem ostrarse que el valor esperado de los
cuadrados medios, si los tratam ientos y los bloques son fijos, es
r?
^^Tratamientos ) =

a \

t f
E {M Se ) = o 2
Por lo tanto, para probar la igualdad de las medias de los tratam ientos, se usara el estadstico de prueba
p

__ M -V T.:Uam.en , s

M Se

que se distribuye como Ftt_lt


si Ia hiptesis nula es verdadera. L a regin crtica es la cola superior de
la distribucin F, y H 0 se rechazara si F0 > Fa .j
Tmbin podra haber inters en com parar las m edias de los bloques porque, en caso de que la dife
rencia entre estas m edias no sea considerable, quiz no sea necesaria la formacin de bloques en experi
m entos futuros. Por los cuadrados medios esperados, aparentem ente la hiptesis H 0:j = 0 puede
probarse com parando el estadstico F0 = M SmaquJ M S e con Fa< <a-i)(b-iy Sin embargo, recuerde que la
aleatorizacin slo se ha aplicado a los tratam ientos dentro de los bloques; es decir, los bloques represen
tan una restriccin sobre la aleatorizacin. Q u efecto tiene esto sobre el estadstico F0 = M SB].
ques/M5? Existen diferentes puntos de vista p ara abordar esta cuestin. Por ejemplo, Box, H unter y H un
te r [18] sealan que la prueba F del anlisis de varianza comn puede justificarse exclusivamente con base
en la aleatorizacin,1 sin el uso directo del supuesto de norm alidad. Agregan que en la prueba para com
p arar las m edias de los bloques no puede recurrirse a dicha justificacin debido a la restriccin sobre la
aleatorizacin; pero si los errores son NID(0, o2), puede usarse el estadstico FQ = M SBoqaJ M S E para
com parar las medias de los bloques. Por otra parte, A nderson y M cLean [2] argum entan que la restric
cin sobre la aleatorizacin im pide que este estadstico sea una prueba significativa para com parar las
m edias de los bloques y que este cociente F es en realidad una prueba de la igualdad de las m edias de los
bloques ms la restriccin sobre la aleatorizacin (a la que llam an el erro r de la restriccin; ver A nderson
y M cLean [2] para detalles adicionales).
Entonces, qu se hace en la prctica? D ebido a que con frecuencia el supuesto de norm alidad es
cuestionable, c o n s id e ra r^ = M S EioquJ M S E como u n a prueba F exacta p ara la igualdad de las m edias de
los bloques no es una buena prctica general. Por esa razn, esta prueba F no se incluye en la tabla del
anlisis de varianza. Sin embargo, como un procedim iento aproximado para investigar el efecto de la va
riable formacin de bloques, examinar el cociente M SBioqilJ M S E es muy razonable. Si este cociente es muy
1 De hecho, la distribucin F de la teora normal es una aproximacin de la distribucin de aleatorizacin generada al calcular F0 a
partir de cada asignacin posible de las respuestas a los tratamientos.

131

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

Tabla 4-2

Anlisis de varianza de un diseo de bloques completos aleatorizados

Fuente de
variacin
Untamientos
Bloques

Grados de
libertad

Suma de cuadrados

Cuadrado medio

a -

Tratamientos
^Bloques

b- 1

Error

SSE

(a -l)(b -l)

Tbtal

SST

N- 1

Tratamientos
a-1
^Bloques
b- 1
SSE
0a - l ) ( b - l )

F0
M<Tratamientos
m se

grande, implica que el factor formacin de bloques tiene un efecto considerable y que la reduccin del
ruido obtenida p o r la formacin de bloques probablem ente fue til para m ejorar la precisin de la com
paracin de las m edias de los tratam ientos.
El procedim iento suele resum irse en un esquem a de anlisis de varianza, como el que se m uestra en
la tabla 4-2. E n general, los clculos se realizaran con un paquete de software de estadstica. Sin em bar
go, es posible obtener frmulas de clculo m anual de las sumas de cuadrados para los elem entos de la
ecuacin 4-7 expresndolos en trm inos de los totales de los tratam ientos y los bloques. Estas frmulas de
clculo son
(4-9)
1=1 j-i

iy
(4-10)

C5= ^

a j=i

y ' -2y

(4-u )

y la suma de cuadrados del error se obtiene por sustraccin como


SSE = SST - SSTimmentm - SSB)oqucs

(4-12)

EJEMPLO 4 - 1 ....................................................................................................................................
Considere el experim ento de la prueba de la dureza de la seccin 4-1. Hay cuatro puntas y cuatro ejem pla
res de prueba de metal. C ada punta se prueba una vez en cada ejemplar, resultando un diseo de bloques
com pletos aleatorizados. Los datos obtenidos se repiten por conveniencia en la tabla 4-3. R ecuerde que
el orden en que se probaron las puntas en un ejem plar particular se determ in al azar. Para simplificar los
Tabla 4-3

Diseo de bloques completos aleatorizados para el


experimento de la prueba de la dureza

Tipo de punta
1
2
3
4

1
9.3
9.4
9.2
9.7

Ejemplar de prueba (bloque)


2
3
9.4
9.6
9.3
9.8
9.4
9.5
9.6
10.0

4
10.0
9.9
9.7
10.2

132

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 4-4

Datos codificados del experimento de la prueba de la dureza

Tipo de punta

y,

1
2

-2
-1

1
3

5
4

3
4

3
4

-3

-2

-1
-2
-1
1

15

y-i

-4

-3

18

to
O
il

Ejem plar de prueba (bloque)

clculos, los datos originales se codifican restando 9.5 de cada observacin y multiplicando el resultado
por 10. Se obtienen as los datos de la tabla 4-4. Las sumas de cuadrados se obtienen de la siguiente manera:
4

'=1 j'-l

- 1 5 4 . 0 0 - - = 129.00
16

1 *4

ss

0 0 Tratamientos

= - Y
Z j

\y

y i-

= l [ ( 3 ) 2 + (4 )2 + ( - 2 )2 + (15)2] -
16

= 38.50

55 Bloques = i y / _ z L
a fe
N
(20)2
= i [ ( - 4 ) 2 + (3)2 + ( 9 ) 2 + (18)2 ] ~ ^ ~ = 82.50
16
E

kJ1J Tratamientos

1JJ Bloques

= 129.00- 3 8 .5 0 - 82.50= 8.00


E n la tabla 4-5 se presenta el anlisis de varianza. Utilizando a = 0.05, el valor crtico de F es F00S^9 =
3.86. Puesto que 14.44 > 3.86, se concluye que el tipo de punta afecta la lectura de la dureza media. E l va
lor P p ara la prueba tam bin es muy pequeo. Adems, al parecer los ejem plares (bloques) difieren de
m anera significativa, ya que el cuadrado medio de los bloques es grande en relacin con el error.
Es interesante observar los resultados que se habran obtenido si no se hubiera tenido conocimiento
de los diseos de bloques aleatorizados. Suponga que se usaran cuatro ejemplares, asignando al azar las
puntas a cada uno de ellos, y que resultara (por casualidad) el mismo diseo que el de la tabla 4-3. El an
lisis incorrecto de estos datos como un diseo com pletam ente aleatorizado de un solo factor se presenta
en la tabla 4-6.
Tabla 4-5

Anlisis de varianza del experimento de la prueba de la dureza

Fuente de
variacin
Tratamientos (tipo
de punta)

C uadrado
medio

F0

Valor P

12.83

14.44

0.0009

27.50
0.89

Suma de
cuadrados

G rados de
libertad

38.50
82.50

E rror

8.00

Tbtal

129.00

15

Bloques (ejemplares)

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

Tabla 4-6

133

Anlisis incorrecto del experimento de la prueba de la dureza


como un diseo completamente aleatorizado

Fuente de
variacin
Tipo de punta
E rror
Total

Suma de
cuadrados
38.50
90.50
129.00

G rados de
libertad
3

12

Cuadrado
medio
12.83
7.54

Fa
1.70

15

Puesto que -F0.05,3,i2 = 3,49, no puede rechazarse la hiptesis de la igualdad de las mediciones de la dureza
m edia de las cuatro puntas. Por lo tanto, el diseo de bloques aleatorizados reduce lo suficiente la canti
dad de ruido en los datos para que las diferencias entre las cuatro puntas sean detectadas. Esto ilustra un
punto muy im portante. Si un experim entador no recurre a la formacin de bloques cuando debera h a
berlo hecho, el efecto puede ser inflar el error experim ental a tal grado que las diferencias im portantes
entre las medias de los tratam ientos sean indtectables.

M uestra de salida de computadora


E n la figura 4-2 se m uestra la salida de com putadora condensada obtenida con Design-Expert para los da
tos de la prueba de la dureza del ejemplo 4-1. R ecuerde que en el anlisis original de la tabla 4-5 se utiliza
ron datos codificados. (Las respuestas originales se codificaron restando 9.5 y multiplicando el resultado
por 10.) El anlisis de com putadora utiliz las respuestas originales. Por consiguiente, las sumas de cua
drados de la figura 4-2 son iguales a las de la tabla 4-5 divididas entre 100 (observe que Design-Expert ha
redondeado las sumas de cuadrados con dos cifras decimales).
Los residuales se enlistan en la parte inferior de la salida de com putadora. stos se calculan como

y, como se dem ostrar ms adelante, los valores ajustados son y = y + y - y , de donde


= y j-y i. - .j+ ..

(4-13)

E n la seccin siguiente se indicar cmo se usan los residuales en la verificacin de la adecuacin del modelo.
Comparaciones mltiples
Si los tratam ientos en un RCBD son fijos, y el anlisis indica una diferencia significativa en las m edias de
los tratam ientos, al experim entador le interesarn por lo general com paraciones m ltiples para descubrir
cules son los tratam ientos cuyas medias difieren. Para ello puede utilizarse cualquiera de los procedi
m ientos de com paraciones m ltiples del captulo 3 (seccin 3-5). Simplem ente se sustituye en las frm u
las de la seccin 3-5 el nm ero de rplicas (n) en el diseo com pletam ente aleatorizado de un solo factor
con el nm ero de bloques (b). Asimismo, es necesario recordar usar el nm ero de grados de libertad del
erro r para el bloque aleatorizado [(a - )(b - 1)] en lugar de los grados de libertad del diseo com pleta
m ente aleatorizado [a(n - 1)].
E n la salida de Design-Expert de la figura 4-2 se ilustra el procedim iento LSD de Fisher. Observe que
si se usa a = 0.05, se concluira que 2 = /u3. A hora bien, puesto que_y3 <_yL <_y2. (es decir, las m edias2. y
y 3 abarcan algunas de las m edias restantes), una conclusin inm ediata sera que/*! = / 2 = fiy A dem s,/^
es diferente de las otras tres medias. Se concluye por lo tanto que la punta tipo 4 produce una dureza m e
dia que es significativamente ms alta que las lecturas de la dureza m edia de los otros tres tipos de puntas.

134

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Response: Hardness in Rockwell C


ANOVA for Selected Factorial Model
Analysis of variance table [Partial sum of squares]
Sum of
Squares

Source

3
3

0.82
0.38

Block
Model
A

0.38

Residual
Cor
Total

0,080
1.29

9
15

0.094
9.63
0.98
0.25

Std. Dev.
Mean
C.V.
PRESS

F
Value

Prob F

0.27
0.13

14.44

0.0009

0.13

14.44

0.0009

Mean
Square

DF

significant

8.889E-003

0.8280
0.7706
0.4563
15.635

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision

Treatment Means (Adjusted, If Necessary)


Estimated Standard
Error
Mean

1-A1
2-A2
3-A3
4-A4

9.57
9.60
9.45
9.88

Treatment

0.47
0.47
0.47
0.47
Mean
Difference

1 vs 2
1 vs 3
1 vs 4
2 vs 3
2 vs 4
3 vs 4

0.025
0.13
0.30
0.15
0.27
0.43

DF

Standard
Error

t for H0
CoeffsO

Prob > 111

1
1
1
1
1
1

0.067
0.067
0.067
0.067
0.067
0.067

0.38
1.87
-4.50
2.25
-4.12
-6.37

0.7163
0.0935
0.0015
0.0510
0.0026
0.0001

Diagnostics Case Statistics


Standard Actual
Predicted
Order
Value
Value

Residual

Leverage

Student
Residual

Cook's
Distance

Outlier
t

9.30
9.40
9.60
10.00
9.40
9.30
9.80
9.90
9.20
9.40
9.50
9.70
9.70
9.60
10.00
10.20

-0.050
0.025
-0.075
0.100
0.025
-0.100
0.100
-0.025
-0.025
0.150
-0.050
-0.075
0.050
-0.075
0.025
0.000

0.438
0.438
0.437
0.438
0.438
0.437
0.437
0.437
0.438
0.437
0.437
0.437
0.438
0.437
0.437
0.437

-0.707
0.354
-1.061
1.414
0.354
-1.414
1.414
-0.354
-0.354
2.121
-0.707
-1.061
0.707
-1.061
0.354
0.000

0.056
0.014
0.125
0.222
0.014
0.222
0,222
0.014
0.014
0.500
0.056
0.125
0.056
0.125
0.014
0.000

-0.686
0.336
-1.069
1.512
0.336
-1.512
1.512
-0.336
-0.336
2.828
-0.686
-1.069
0.686
-1.069
0.336
0.000

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Figura 4-2

9.35
9.38
9.67
9.90
9.38
9.40
9.70
9.93
9.22
9.25
9.55
9.78
9.65
9.68
9.97
10.20

Salida de Design-Expert (condensada) para el ejemplo 4-1.

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

Punta

Punta Punta

135

Punta

3
12
.
* ,
------------1
----------1------- -------------- 1
-----------1
--------.- I -----

Dureza promedio (codificada)

Figura 4-3 Las medias del tipo de punta en relacin con una distribucin t esca
lada con un factor de escalacin -JMSE / b = V0.89 / 4 = 0.47.

Tambin puede usarse el procedim iento grfico del captulo 3 (seccin 3-5.1) para com parar las m e
dias del tipo de punta. E n la figura 4-3 se grafican las cuatro m edias del tipo de punta del ejem plo 4-1 en
relacin con una distribucin t escalada con un factor de escalacin j M S E i b = V0.89/ 4 = 0.47. E sta gr
fica indica que las puntas 1 ,2 y 3 producen probablem ente mediciones de la dureza prom edio idnticas,
pero que la punta 4 produce una dureza m edia m ucho ms alta. Esta figura confirm a los resultados de la
prueba LSD de Fisher incluida en la salida de Design-Expert de la figura 4-2.

4-1.2

Verificacin de la adecuacin del modelo

Se ha com entado ya la im portancia de verificar la adecuacin del m odelo supuesto. E n general, deber
estarse alerta a los problem as potenciales con el supuesto de norm alidad, con la desigualdad de la varian
za por tratam iento o bloque, y con la interaccin bloque-tratam iento. Como en el diseo com pletam ente
aleatorizado, el anlisis residual es la herram ienta principal que se utiliza en estos diagnsticos de verifi
cacin. E n la parte inferior de la salida de Design-Expert de la figura 4-2 se enlistan los residuales del dise
o de bloques aleatorizados. Los residuales codificados se encontraran m ultiplicando estos residuales
p or 10. Las observaciones, los valores ajustados y los residuales de los datos codificados de la prueba de la
dureza del ejem plo 4-1 son los siguientes:

-2.00
-1.00
1.00
5.00
-1.00
-2.00
3.00
4.00
-3.00
-1.00
0.00
2.00
2.00
1.00
5.00
7.00

9,
-1.50
-1.25
1.75
4.00
-1.25
-1.00
2.00
4.25
-2.75
-2.50
0.50
2.75
1.50
1.75
4.75
7.00

e
-0.50
0.25
-0.75
1.00
0.25
-1.00
1.00
-0.25
-0.25
1.50
-0.50
-0.75
0.50
-0.75
0.25
0.00

E n la figura 4-4 se m uestra la grfica de probabilidad norm al y el diagram a de puntos de estos resi
duales. N o hay indicios m arcados de no norm alidad y tam poco hay evidencia que apunte a la posible p re
sencia de puntos atpicos. E n la figura 4-5 se m uestran las grficas de los residuales por tipo de punta o

138

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

bloque 1 en conjunto e s (y u ) = /u + r 1 + 1 = p + 5 + 2 = fj, + l . E n general, el tratam iento 1 increm enta


siempre la respuesta esperada 5 unidades sobre la sum a de la m edia global y del efecto del bloque.
Aun cuando este m odelo aditivo simple muchas veces es til, hay situaciones en las que resulta inade
cuado. Suponga, por ejemplo, que se estn com parando cuatro formulaciones de un producto qumico
utilizando seis lotes de m ateria prima; los lotes de m ateria prim a se consideran bloques. Si una im pureza
en el lote 2 afecta de m anera adversa la formulacin 2, dando como resultado un rendim iento inusual
m ente bajo, pero no afecta las dems formulaciones, ha ocurrido una interaccin entre las formulaciones
(o tratam ientos) y los lotes (o bloques). D e m anera similar, pueden ocurrir interacciones entre los trata
m ientos y los bloques cuando la respuesta se mide en la escala incorrecta. Por lo tanto, una relacin que es
m ultiplicativa en las unidades originales, por ejemplo

es lineal o aditiva en una escala logartmica, ya que, por ejemplo,


ln E (ytj ) - ln /i + ln r ; + ln )
o
(y )=/** + < + #
Aun cuando este tipo de interaccin puede eliminarse con una transform acin, no todas las interacciones
pueden tratarse con tanta facilidad. Por ejemplo, una transform acin no elim ina la interaccin form ula
cin-lote que se seal antes. El anlisis residual y otros procedim ientos de diagnstico de verificacin
pueden ser tiles para detectar la no aditividad.
Si una interaccin est presente, puede afectar seriam ente el anlisis de varianza y posiblem ente lo
invalide. E n general, la presencia de una interaccin infla el cuadrado m edio del error y puede afectar ad
versam ente la com paracin de las m edias de los tratam ientos. E n situaciones en las que ambos factores,
as como su posible interaccin, son de inters, deben usarse diseos factoriales. Estos diseos se anali
zan en detalle en los captulos 5 al 9.

Tratamientos y bloques aleatorios


A un cuando el procedim iento de prueba se h a descrito considerando los tratam ientos y los bloques como
factores fijos, se utiliza el mismo procedim iento de anlisis si los tratam ientos o los bloques (o ambos) son
aleatorios. Sin embargo, hay algunas modificaciones en la interpretacin de los resultados. Por ejemplo,
si los bloques son aleatorios, como es con m ucha frecuencia el caso, se espera que las com paraciones en
tre los tratam ientos sean las mismas a lo largo de la poblacin de bloques de la cual se seleccionaron alea
toriam ente p ara realizar el experim ento. Estn tam bin las modificaciones correspondientes en los
cuadrados medios esperados. Por ejemplo, si los bloques son variables aleatorias independientes con va
rianza comn, entonces (M S Bloqucs) = o2 + a o 2 , donde o 2 es el com ponente de la varianza de los efectos
de los bloques. E n cualquier situacin, E (M STtstimieaxos) siempre est libre de cualquier efecto de bloque, y
el estadstico de prueba para la variabilidad entre los tratam ientos siem pre es F0 = A/57tatamif.ntos/M5E.
E n situaciones en las que los bloques son aleatorios, si est presente una interaccin tratam ien
to-bloque, las pruebas p ara las m edias de los tratam ientos no estn afectadas por la interaccin. L a razn
de ello es que los cuadrados medios esperados de los tratam ientos y del erro r contienen ambos el efecto
de la interaccin; por consiguiente, la prueba de las diferencias en las m edias de los tratam ientos puede
realizarse como de costum bre com parando el cuadrado m edio de los tratam ientos con el cuadrado medio
del error. Este procedim iento no proporciona ninguna inform acin acerca de la interaccin.

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

139

Eleccin del tamao de la muestra

La eleccin del tam ao de la m uestra, o nm ero de bloques que deben correrse, es una decisin im por
tan te cuando se usa un RCBD, Al increm entar el nm ero de bloques, se increm enta el nm ero de rplicas
y el nm ero de grados de libertad del error, con lo cual se aum enta la sensibilidad del diseo. C ualquiera
de las tcnicas descritas en el captulo 3 (seccin 3-7) para seleccionar el nm ero de rplicas que deben
correrse en un experim ento com pletam ente aleatorizado con un solo factor puede aplicarse de form a di
recta al RCBD, Para el caso de un factor fijo, las curvas de operacin caracterstica de la parte V del apn
dice pueden usarse con

<&2 =

aa

(4-14)

donde h aya - 1 grados de libertad en el num erador y (a - 1)( - 1 ) grados de libertad en el denom inador.

EJEMPLO 4 - 2 .................... - .............................................................................................................


C onsidere el problem a de la prueba de la dureza del ejem plo 4-1. Suponga que quiere determ inarse el n
m ero apropiado de bloques que deben correrse si el inters se encuentra en detectar una diferencia mxi
m a real en las lecturas de la dureza m edia de 0.4 con u n a alta probabilidad, y u n a estim acin razonable
de la desviacin estndar de los errores es a = 0.1. (Estos valores se dan en las unidades originales; recuerde
que el anlisis de varianza se realiz usando datos codificados,) P or la ecuacin 3-49, el valor m nim o
de $ 2 es (escribiendo b, el nm ero de bloques, en lugar de n)
& = bD l
2ao
donde D es la diferencia mxima que quiere detectarse. Por lo tanto,

*.._*saL.iai
2(4)(0.1)
Si se usan b = 3 bloques, entonces <I> = V2.0b = V2.0(3) = 2.45, y hay (a - 1 )(b - 1 ) = 3(2) = 6 grados de li
bertad del error. L a parte V del apndice con vl = a - l 3 y a = 0.05 indica que el riesgo de este diseo
es aproxim adam ente 0.10 (potencia = 1 - = 0.90). Si se usan b = 4 bloques, O = V2.0 = V2.0(4) = 2.83,
con (a - 1 )(b - 1 ) = 3(3) = 9 grados de libertad del error, y el riesgo correspondiente es aproxim ada
m ente 0.03 (potencia = 1 - = 0,97). Tres o cuatro bloques darn como resultado un diseo con una alta
probabilidad de detectar la diferencia entre las lecturas de la dureza m edia consideradas im portantes.
D ebido a que los ejem plares de prueba (bloques) son baratos y estn en disponibilidad y el costo de la
prueba es bajo, el experim entador decide usar cuatro bloques.

Estimacin de valores faltantes

Cuando se usa el RCBD, en ocasiones falta una observacin en uno de los bloques. Esto puede ocurrir de
bido a descuido o error o por razones fuera del control del experim entador, tal como un dao inevitable a
una unidad experimental. U na observacin faltante introduce un nuevo problem a en el anlisis debido a
que los tratam ientos dejan de ser ortogonales a los bloques; es decir, no ocurren todos los tratam ientos en

140

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 4-7

Diseo de bloques completos aleatorizados para el


experimento de la prueba de dureza con un valor fallante
E jem plar de prueba (bloque)

Tipo de punta

1
2

-2
-1

5
4

3
4

-3

-1
-2
-1
1

cada uno de los bloques. Existen dos enfoques generales para el problem a de los valores faltantes. El pri
m ero es un anlisis aproxim ado, en el cual la observacin faltante se estim a y se lleva a cabo el anlisis de
varianza usual como si la observacin estim ada fuera un dato real, con los grados de libertad del error re
ducidos en 1. E ste anlisis aproximado es m ateria de esta seccin. El segundo es un anlisis exacto, el cual
se revisa en la seccin 4-1.4.
Suponga que falta la observacin y,ydel tratam iento i en el bloque j. La observacin faltante se denota
como X. Como una ilustracin, suponga que en el experim ento de la prueba de dureza del ejemplo 4-1 el
ejem plar de prueba 3 se rom pi m ientras se probaba la punta 2 y que no pudo obtenerse el dato para esa
punta. Los datos apareceran como en la tabla 4-7.
E n general, se h ar que y' represente el gran total con una observacin faltante, que y represente el
total del tratam iento con una observacin faltante, y que y'j sea el total del bloque con una observacin
faltante. Suponga que quiere estimarse la observacin faltante x de tal m odo que x tenga una participa
cin mnim a en la suma de cuadrados del error. Puesto que SSE = 2 =12 j =1(yff - y - + ) \ esto es
equivalente a elegir x p ara minimizar
a

s s E

Ivv
1

ssE=x2~l(y. +*)2- f a +*)z + (x : +*)2+R

\2

(4-15)

donde R incluye todos los trm inos en los que no interviene x. A partir de dSSE/dx~ 0, se obtiene
a y l+ W j- .
*= ,
1V ,

(4-16)

(a-l)(fc-l)

como la estimacin de la observacin faltante.


Para los datos de la tabla 4-7, se encuentra que y'2 = 1, y'3 = 6 y y' = 17. Por lo tanto, por la ecuacin
4-16,
4(1)+ 4(6)
* -* -

(3)(3,

17

_
= L22

A hora puede realizarse el anlisis de varianza comn u tiliz a n d o la = 1.22 y reduciendo los grados de li
bertad del erro r en 1. El anlisis de varianza se m uestra en la tabla 4-8. C om pare los resultados de este
anlisis aproximado con los resultados obtenidos para el conjunto de datos com pleto (tabla 4-5).

4-1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

Tabla 4-8 Anlisis de varianza aproximado del ejemplo 4-1 con un valor falcante
Suma de
Grados de
Cuadrado
Fuente de variacin
cuadrados
libertad
medio
Tipo de punta
399
3~
13.33
Ejemplares de prueba (bloques)79.53
3
26.51
Error
6.22
8
0,78
Tbtal
125.73
14

F0
17.12

141

Valor P
0.0008

Si son varias las observaciones fallantes, pueden estim arse escribiendo la suma de cuadrados del
erro r como u na funcin de los valores faltantes, derivando con respecto a cada valor faltante, igualando
los resultados con cero y resolviendo las ecuaciones resultantes. D e m anera alternativa, puede usarse la
ecuacin 4-16 de m anera iterativa para estim ar los valores faltantes. Para ilustrar el enfoque iterativo, su
ponga que faltan dos valores. Se estim a arbitrariam ente el prim er valor faltante y despus se usa este va
lor junto con los datos reales y la ecuacin 4-16 para estim ar el segundo. Entonces puede usarse la
ecuacin 4-16 p ara volver a estim ar el prim er valor faltante, y despus de esto, puede volver a estim arse el
segundo. E ste proceso se contina hasta que se obtiene la convergencia. E n cualquier problem a con valo
res faltantes, los grados de libertad del error se reducen en una unidad por cada observacin faltante.
4 '1 .4

E stim aci n de los p arm etro s del m odelo y la p ru e b a general


de significacin de la regresin

Si tanto los tratam ientos como los bloques son fijos, los parm etros del RCBD pueden estim arse por m
nimos cuadrados. R ecuerde que el m odelo estadstico lineal es
i = l, 2,..., a
y j= + ^ i + j + e a

(4-17)

7 = 1, 2,..., b

A l aplicar las reglas de la seccin 3-9.2 para encontrar las ecuaciones norm ales del m odelo de un diseo
experim ental, se obtiene

r i: b

r 2: b

+ b 2 +

+ b a + ai + ai +
+

i +

K +

i +

K + +

+ ba +

i +

h +

+ b 2

+ at = y..

\- a

+ ii

+ 12

- - +

i- a

+ *i

*2

t- a

*2

+ t

+ afo

b *=yi.

= y 2.

3*
II

f i : ab

= y.i
+ a 2

= y .2

ab = y.b

Observe que la sum a de la segunda a la (a + l)-sim a ecuaciones de la ecuacin 4-18 es la prim era
ecuacin norm al, como tam bin es el caso de las b ltim as ecuaciones. Por lo tanto, hay dos dependencias

142

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

lineales en las ecuaciones norm ales, lo cual implica que deben im ponerse dos restricciones para resolver
la ecuacin 4-18. Las restricciones usuales son
* ,= 0
;=i

i
1 =0
j=i

(4-19)

A l utilizar estas restricciones, las ecuaciones norm ales se simplifican considerablem ente. D e hecho, que
dan como
abp, = y
bj + b i = yL
afi+ aj = y

i = 1, 2,,,,, a
> = 1 ,2 ,..., 6

(4-20)

A = ?..
Ji = y i.-y ..
h = y. j ~ y .

i = 1 ,2 ,..., a
y = i . 2,..., &

(4-21)

cuya solucin es

Al utilizar la solucin de la ecuacin norm al de la ecuacin 4-21, puede encontrarse el valor estim ado o
ajustado de yi} como
= /t+ fi + J
= y_ +(y,. ~ y.. )+(*, - y. )
= y,_+yJ -y..

Este resultado se us anteriorm ente en la ecuacin 4-13 para calcular los residuales de un diseo de blo
ques aleatorizados.
L a prueba general de significacin de la regresin puede usarse p ara desarrollar el anlisis de varian
za del diseo de bloques completos aleatorizados. Al utilizar la solucin de las ecuaciones norm ales dada
po r la ecuacin 4-21, la reduccin en la sum a de cuadrados p ara ajustar el m odelo com pleto es
o

R(t, r, )= fiy

+2
i,y ,. +2 h y >
.-=i
;=i
a

= y.y.. +2 (y.- y..)yL + 2 (h ~ yj=i

1=1

a
=

ab
= v
fe

i,2
y . y . - i L

f e y, y
y + Y
b fe

ab

b
+

i,2
y . y . - L .

f e y,y>

ab

ti-y L
a
ab

con a + b - 1 grados de libertad, y la suma de cuadrados del error es


a

-i j-i
t

:= 1

j= l

i= l

v2

;= 1

= 2 2 (y ij- y .- y .j+y y
=i j-i

4'1 DISEO DE BLOQUES COMPLETOS ALEATORIZADOS

143

con (a - l)(> - 1) grados de libertad. Compare esta ltim a ecuacin con SSE en la ecuacin 4-7.
P ara probar la hiptesis H 0:r, = 0, el m odelo reducido es
yij = n + j+ ij
que es un anlisis de varianza de un solo factor. Por analoga con la ecuacin 3-5, la reduccin en la suma
de cuadrados para ajustar el m odelo reducido es

que tiene b grados de libertad. Por lo tanto, la sum a de cuadrados debida a {r,} despus de ajustar fi y
{j} es
j?(Modelo completo) /?(M odelo reducido)

expresin que se identifica como la sum a de cuadrados de los tratam ientos con a - 1 grados de libertad
(ecuacin 4-10).
L a sum a de cuadrados de los bloques se obtiene ajustando el m odelo reducido
y = t+ T ,+ e i
que tam bin es un anlisis de un solo factor. De nueva cuenta, por analoga con la ecuacin 3-5, la reduc
cin en la sum a de cuadrados para ajustar este m odelo es

con a grados de libertad. La sum a de cuadrados de los bloques {j} despus de ajustar / y {r,} es
RQS| fi, r) = R(fi, t , ) - R(/i, t )

con b - 1 grados de libertad, la cual se haba dado anteriorm ente como la ecuacin 4-11.
Se han desarrollado las sumas de cuadrados de los tratam ientos, de los bloques y del error en el dise
o de bloques completos aleatorizados utilizando la prueba general de significacin de la regresin. Aun
cuando la prueba general de significacin de la regresin no se usara ordinariam ente p ara hacer el anli
sis real de los datos en un bloque com pleto aleatorizado, en ocasiones el procedim iento resulta til en di
seos de bloques aleatorizados ms generales, como los que se revisan en la seccin 4-4.

144

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Anlisis exacto del problema del valor faltante

E n la seccin 4-1.3 se present un procedim iento aproximado p ara solucionar las observaciones faltantes
en el RCBD. E ste anlisis aproximado consiste en estim ar el valor faltante de tal m odo que se minimice el
cuadrado m edio del error. Puede dem ostrarse que el anlisis aproximado produce un cuadrado medio
sesgado de los tratam ientos en el sentido de que E (M Sltatamietltos) es m ayor que E (M Se) si la hiptesis nula
es verdadera. Por consiguiente, se reportan demasiados resultados significativos.
E l problem a del valor faltante puede analizarse exactam ente utilizando la prueba general de
significacin de la regresin. El valor faltante hace que el diseo sea no balanceado, y dado que no todos
los tratam ientos ocurren en todos los bloques, se dice que los tratam ientos y los bloques no son ortogona
les. Este m todo de anlisis tam bin se usa en tipos ms generales de diseos de bloques aleatorizados; el
tem a se analiza con mayor am plitud en la seccin 4-4. E n el problem a 4-26 se le pide al lector que realice
el anlisis exacto para un diseo de bloques completos aleatorizados con un valor faltante.

4-2

DISEO DE CUADRADO LATINO

E n la seccin 4-1 se introdujo el diseo de bloques completos aleatorizados como un diseo para reducir
el erro r residual de un experim ento al eliminar la variabilidad debida a una variable perturbadora conoci
da y controlable. Hay otros tipos de diseos que utilizan el principio de la formacin de bloques. Por
ejemplo, suponga que un experim entador estudia los efectos que tienen cinco formulaciones diferentes
de la carga propulsora utilizada en los sistemas de expulsin de la tripulacin de un avin basado en la ra
pidez de combustin. Cada formulacin se hace con un lote de m ateria prim a que slo alcanza para pro
b ar cinco formulaciones. Adems, las formulaciones son preparadas por varios operadores, y puede
haber diferencias sustanciales en las habilidades y experiencia de los operadores. Por lo tanto, al parecer
hay dos factores perturbadores que sern calculados en prom edio en el diseo: los lotes de m ateria pri
m a y los operadores. El diseo apropiado para este problem a consiste en probar cada formulacin exac
tam ente una vez con cada uno de los cinco operadores. Al diseo resultante, ilustrado en la tabla 4-9, se le
llam a diseo de cuadrado latino. Observe que el diseo es un arreglo cuadrado y que las cinco form ula
ciones (o tratam ientos) se denotan por las letras latin as^, B, C, D y E ; de ah el nom bre de cuadrado lati
no. Se observa que tanto los lotes de m ateria prim a (renglones) como los operadores (columnas) son
ortogonales a los tratam ientos.
El diseo de cuadrado latino se usa para elim inar dos fuentes de variabilidad perturbadora; es decir,
perm ite hacer la form acin de bloques sistemtica en dos direcciones. Por lo tanto, los renglones y las co
lumnas representan en realidad dos restricciones sobre la aleatorizacin. E n general, un cuadrado latino
p ara p factores, o cuadrado latino p x p , es un cuadrado con p renglones y p columnas. Cada una de las p 2

Tabla 4-9

Diseo del cuadrado latino para el problema de la carga propulsora

Lotes de m ateria
prim a

O peradores

1
2

A = 24
B = 17

C =19

D = 24

D = 26

D = 30
= 26
A = 26

= 27

3
4
5

B 20
C -2 4
D = 38

C = 18
= 22

= 31
A =30

B 20

A = 21
5 = 23
C = 29

5
=
A =
5 =
C =
0 =

24
36

21
22
31

4-2 DISEO DE CUADRADO LATINO

145

celdas resultantes contiene una de lasp letras que corresponde a los tratam ientos, y cada letra ocurre una
y slo una vez en cada rengln y columna. Algunos ejemplos de cuadrados latinos son
4x4

5X 5

6x 6

ABDC
BCAD
CDBA
DACB

ADBEC
DACBE
CBEDA
BEACD
ECDAB

ADCEBF
BAECFD
CEDFAB
DCFBEA
FBADCE
EFBADC

E l modelo estadstico de un cuadrado latino es


i = 1, 2,..., p
yik = + c ci + t j + k + eijk j = l, 2,..., p
k = l, 2,..., p

(4-22)

dondey ijk es la observacin en el rengln z-simo y la columna fc-sima para el tratamientoy-sim o, es la


m edia global, a es el efecto del rengln i-simo, t es el efecto del tratam iento y-simo, & es el efecto de la
colum na fc-sima, y Eijk es el erro r aleatorio. Observe que se trata de un modelo de los efectos. El modelo es
com pletam ente aditivo; es decir, no hay interaccin entre renglones, columnas y tratam ientos. Puesto
que hay una sola observacin en cada celda, slo se necesitan dos de los tres subndices i , j y k para denotar
u na observacin particular. Por ejemplo, con referencia al problem a de la carga propulsora de la tabla
4-9, si i = 2 y k = 3, se encuentra autom ticam ente que j = 4 (form ulacin D ), y si / = 1 y j = 3 (form ula
cin C), se encuentra que k - 3. sta es una consecuencia de que cada tratam iento aparezca una vez exac
tam ente en cada rengln y columna.
El anlisis de varianza consiste en hacer la particin de la suma de cuadrados total de las N = p 2 ob
servaciones en los com ponentes de los renglones, las columnas, los tratam ientos y el error, por ejemplo,
SST = 5 5 Rengloncs + ^ C o lu m n a s + ^ T ratam ien to s

(4-23)

con los respectivos grados de libertad


p 2-1 = p - l +p - l+ p - l+ ( p - 2 ) ( p - l)
Bajo el supuesto usual de que eijk es NID (0, o2), cada suma de cuadrados del lado derecho de la ecuacin
4-23 es, al dividir por a 2, una variable aleatoria ji-cuadrada con una distribucin independiente. El esta
dstico apropiado para probar que no hay diferencias en las m edias de los tratam ientos es
iMS
r a m Tratamientos

que se distribuye c o m o F ^ ^ . ^ . ! ) bajo la hiptesis nula. Ihm bin puede probarse la ausencia de efectos
de los renglones o la ausencia de efectos de las columnas form ando el cociente de M S ^n #ones M Sm i,,-,.
con M Se . Sin embargo, puesto que los renglones y las columnas representan restricciones sobre la aleato
rizacin, estas pruebas quiz no sean apropiadas.
E n la tabla 4-10 se presenta el procedim iento de clculo p ara el anlisis de varianza. Por las frmulas
de clculo para las sumas de cuadrados, se observa que el anlisis es una extensin simple del RCBD, con
la suma de cuadrados resultante de los renglones obtenida a partir de los totales de los renglones.

146

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Tabla 4-10

Anlisis de varianza del diseo del cuadrado latino

Fuente de
variacin

Suma de cuadrados

1A

y ,j - N

Tratamientos

^^Tratamientos

Renglones

55Renelooes= P
^ im
1y l - N

Columnas

^^Columnas

E rror

SSE(por sustraccin)

Tbtal

sst

P -i

G rados de
libertad

p- 1

y 2..

1 P

J ^Tratamientos

p-1

mse

p -1
Columnas

p- 1

p -i
SSE
(p-2)(p-l)

(p - 2 ) ( p - l )

y
ym - N

1 k

F0
MS
'"
-'Tratamiento*

Renglones

p-1

y 2..
N

/ . y .jfc

Cuadrado medi

P 2- 1

EJEMPLO 4 - 3 ....................................................................................................................................
C onsidere el problem a de la carga propulsora descrito previam ente, donde tanto los lotes de m ateria pri
m a como los operadores representan restricciones sobre la aleatorizacin. El diseo para este experi
m ento, el cual se m uestra en la tabla 4-9, es un cuadrado latino 5 x 5 . D espus de codificar los datos
restando 25 de cada observacin, se obtienen los datos de la tabla 4-11. Las sumas de cuadrados del total
de los lotes (renglones) y los operadores (columnas) se calculan de la siguiente m anera:
ssr = 2 2 2
i

(10)2
= 6 8 0 - - = 676.00
25

SS^=I y l ~ i
= | [ ( - 1 4 ) 2 + 9 2 + 5 2 + 3 2 + 7 2] - ^ = 68.00
,t2

SS Operadores = -1 V

P tT i

y..t -

y --

= |[(-1 8 )2 +182 +(4)2 +52 + 9 2] - ^ - = 150.00

Tabla 4-11

Datos codificados para el problema de la carga propulsora


O peradores

ria prima
1
2
3
4

1
A = -1
B =-8

C 7

2
B = -5

C = -1
> = 13
E= 6

D = 1
E=-3

A = 5

y..k

-18

18

3
C=
D=
E =
A =
B=

D = -1
E = 2

, 4 =2

------ 1
y4 = 11
5 = -4

-14
9
5

B = -2
C= 4

C ------ 3

D =

3
7

-6

-5

-4

6
9

10

4-2 DISEO DE CUADRADO LATINO

Tabla 4-12

147

Anlisis de varianza del experimento de la carga propulsora___________________________________________

Suma de
cuadrados
330.00
68.00
150.00
128.00
676.00

Fuente de variacin
Formulaciones
Lotes de materia prima
Operadores
Error
Total

Cuadrado
medio
82.50
17.00
37.50
10.67

Grados de
libertad
4
4
4
12
24

Los totales para los tratam ientos (las letras latinas)

Letra latina

F0
7.73

Valor P
0.0025

sol

Total del tratamiento

>.i.

18

y.2.= -24
y. = -13
ya.= 24
y.5.= 5

B
C

a.

D
E

L a suma de cuadrados que resulta de las formulaciones se calcula a partir de estos totales como

ss

1 P

Formulaciones

=-Y
^

,72
V2

J }.

jy

182 + (~ 24)* + ( - 1 3 ) 2 + 2 4 2 + 52
5

(10)2 =
25

La sum a de cuadrados del error se encuentra p or sustraccin:


SSE = SST S S ^ ts ^Operadora ^Formulaciones
= 676.00- 6 8 .0 0 -1 5 0 .0 0 - 330.00 = 128.00
El anlisis de varianza se resume en la tabla 4-12. Se concluye que hay una diferencia significativa en
la rapidez de com bustin m edia generada por las diferentes formulaciones de la carga propulsora. Tam
bin hay indicios de que hay diferencias entre los operadores, p or lo que la formacin de bloques de este
factor fue una buena precaucin. No hay evidencia slida de una diferencia entre los lotes de m ateria pri
ma, por lo que al parecer en este experim ento particular hubo una preocupacin innecesaria en esta fuen
te de variabilidad. Sin embargo, la formacin de bloques de los lotes de m ateria prim a es por lo general
una buena idea.

Como en cualquier problem a de diseo, el experim entador debera investigar la adecuacin del m o
delo inspeccionando y graficando los residuales. Para un cuadrado latino, los residuales estn dados por
eijk= yjk ~ yjk
s i y iik - L - . j . - . . k + 2y...
E l lector deber encontrar los residuales del ejemplo 4-4 y construir las grficas apropiadas.

148
Tabla 4-13

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Cuadrados latinos estndares y nmero de cuadrados latinos de varios tamaos

Tkmao
Ejemplos de
cuadrados estndares

3x3
ABC
BCA
CAB

4x4

5x5

6x6

7x7

ABCD
BCDA
CDAB
DABC

ABCDE
BAECD
CDAEB
DEBAC
ECDBA

ABCDEF
BCFADE
CFBEAD
DEABFC
EADFCB
FDECBA

ABCDEFG
BCDEFGA
CDEFGAB
DEFGABC
EFGABCD
FGABCDE
GABCDEF

P XP
ABC ,..P
BCD . . . A
CDE ... B
P A B ... ( P - l )

Nmero de cuadrados
estndares

56

9408

16,942,080

Nmero total de
cuadrados latinos

12

576

161,280

818,851,200

61,479,419,904,000

/>!(/>-1)! x
(nmero de
cuadrados estndares)

Paite de la informacin de esta tabla se encuentra en Statistical Tables for Biological, Agricultural and Medical Research, 4a, edicin, de R,A. Fishery F. Yates, Oliver & Boyd,
Edimburgo. Es poco lo que se sabe de las propiedades de los cuadrados latinos ms grandes que 7 x 7 ,

A un cuadrado latino en el que el prim er rengln y la prim era columna constan de letras escritas en
orden alfabtico se le llam a cuadrado latino estndar, que es el diseo que se utiliz en el ejemplo 4-3.
Siempre es posible obtener un cuadrado latino estndar escribiendo el prim er rengln en orden alfabti
co y escribiendo despus cada rengln sucesivo como la sucesin de letras que estn justo arriba, recorri
das un lugar a la izquierda. E n la tabla 4-13 se resum en varios hechos im portantes acerca de los cuadrados
latinos y de los cuadrados latinos estndares.
Como con cualquier diseo experimental, las observaciones del cuadrado latino debern tom arse de
m anera aleatoria. El procedim iento de aleatorizacin correcto es seleccionando al azar el cuadrado em
pleado. Como se observa en la tabla 4-13, hay un gran nm ero de cuadrados latinos de un tam ao particu
lar, p or lo que es imposible enum erar todos los cuadrados y seleccionar uno al azar. El procedim iento
usual es seleccionar un cuadrado latino de una tabla de estos diseos, como en Fisher y Yates [45], y des
pus arreglar al azar el orden de los renglones, las columnas y las letras. E sto se analiza con mayor detalle
en Fisher y Yates [45].
Ocasionalm ente, falta una observacin en un cuadrado latino. Para un cuadrado latino p x p , el valor
faltante puede estim arse con
p ( y ' , + y : , + y : k )-2y:..
y,,k

"

donde las prim as indican los totales del rengln, la colum na y el tratam iento con el valor faltante, y y' es
el gran total con el valor faltante.
Los cuadrados latinos pueden ser tiles en situaciones en las que los renglones y las columnas repre
sentan los factores que el experim entador en realidad quiere estudiar y en las que no hay restricciones so
bre la aleatorizacin. Por lo tanto, los tres factores (renglones, columnas y letras), cada uno conp niveles,
pueden investigarse en slop 2corridas. En este diseo se supone que no existe interaccin entre los facto
res. Se abundar ms adelante sobre el tem a de la interaccin.
Rplicas de cuadrados latinos
U na desventaja de los cuadrados latinos pequeos es que proporcionan un nm ero relativam ente peque
o de grados de libertad del error. Por ejemplo, un cuadrado latino 3 x 3 slo tiene dos grados de libertad
del error, un cuadrado latino 4 x 4 slo tiene seis grados de libertad del error, etc. Cuando se usan cua
drados latinos pequeos, con frecuencia es deseable hacer rplicas de los mismos para increm entar los
grados de libertad del error.

4-2 DISEO DE CUADRADO LATINO

Tabla 4-14

149

Anlisis de varianza de un cuadrado latino con rplicas, caso 1

Fuente de
variacin

Suma de cuadrados

1 t
-n py f yy 2

Tratamientos

vv

- y y2
np(

Columnas

- y y\
np

p 2

Error

Cuadrado medio
w ^T ratam ientos

p -i

Renglones

Rplicas

G rados de
libertad

p -1
U l J Renglones

- i

P- 1
J *J Colunmafl

p -1

'

Sustraccin

Total

m se

p -1

n -1

^Rplicas
n 1
SSE

<p-l)[#i(p + l ) - 3 ]

(/> -l)W + l)-3 ]

np2- 1

Existen varias m aneras de hacer rplicas de un cuadrado latino. Para ilustrar este punto, suponga que
se hacen n rplicas del cuadrado latino 5 x 5 utilizado en el ejemplo 4-3. Esto podra haberse hecho de la
m anera siguiente:
1.
2.
3.

U sando los mismos lotes y operadores en cada rplica.


U sando los mismos lotes pero operadores diferentes en cada rplica (o, de m anera equivalente,
usando los mismos operadores pero lotes diferentes).
U sando diferentes lotes y diferentes operadores.

E l anlisis de varianza depende del m todo utilizado para hacer las rplicas.
Considere el caso 1, donde en cada rplica se usan los mismos niveles de los factores para la formacin
de bloques en los renglones y las columnas. Seay ijk la observacin del rengln i, el tratam iento j, la columna
k y la rplica /. Hay en total N = np2observaciones. El anlisis de varianza se resume en la tabla 4-14.
Considere ahora el caso 2 y suponga que en cada rplica se usan nuevos lotes de m ateria prim a pero
los mismos operadores. Por lo tanto, hay ahora cinco nuevos renglones (en general,/? nuevos renglones)
Tabla 4-15

Anlisis de varianza de un cuadrado latino con rplicas, caso 2

Fuente de
variacin

Suma de cuadrados

-n pyj i yy-2s -- yt
N
i

Tratamientos

Renglones

C uadrado medio

/-i i

1 A

/=i

y 1,..

P2

y.1..

Columnas

~np Z*=i y*- N

Rplicas

7p 2 y:.i-yN1..

-A

m st.

p- 1

p-1

n ( p - 1)

-'^Renglones
n ( p - 1)

~y 2 2 yh -2
i

Grados de
libertad

p -

71 -

,
(=i

Error

Sustraccin

Tbtal

y2.,.
2222
i j k 1 y]ki- N

Columnas

p -i
Rplicas

71 1

(p - 1)(np np2- 1

SSE
(p - l) (n p -l).

MS.

150

Tabla 4-16

CAPTULO 4 BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Anlisis de varianza de un cuadrado latino con rplicas, caso 3

Fuente de
variacin

G rados de
libertad

Suma de cuadrados
-n pf e yy -~
2

Tratamientos

Renglones

Rplicas

/^

P * y --
Sustraccin

Total

2222
y&
i
k
i

m se

R
en
glon
es

n ( p - 1)
^ C o lu m n a s

n ( p - 1)

n(p-l)
^Rplicas

n -1

E rror

^^TratR
inientos

Tratam ientos

p -l

n ( p - 1)

2 2 ^- 2 ^
P j=i *=i

F0

-p Z 2 > i , - 2 -y ?
P /=! i= 1
/-I P
1 n P
n
2

Columnas

p-1

Cuadrado medio

<p -

i)M p

n 1
SSE
i)

- i]

( p - ! ) [ ( /> - 1 ) - 1 ]

np2- 1
JV

dentro de cada rplica. El anlisis de varianza se resum e en la tabla 4-15. Observe que la fuente de varia
cin de los renglones mide en realidad la variacin entre los renglones dentro de las n rplicas.
Por ltimo, considere el caso 3, donde se usan nuevos lotes de m ateria prim a y nuevos operadores en
cada rplica. A hora la variacin que resulta tanto de los renglones como de las columnas mide la varia
cin que resulta de estos factores dentro de las rplicas. El anlisis de varianza se resum e en la tabla 4-16.
Hay otros enfoques para analizar cuadrados latinos con rplicas que perm iten la presencia de algu
nas interacciones entre tratam ientos y cuadrados (referirse al problem a 4-19).
Diseos alternados y diseos balanceados para efectos residuales
Ocasionalm ente aparece un problem a en el que los periodos son uno de los factores del experim ento. En
general, hayp tratam ientos que deben probarse en p periodos utilizando np unidades experimentales. Por
ejemplo, un analista del desem peo hum ano est estudiando el efecto de dos fluidos de restitucin para
la deshidratacin en 20 sujetos. E n el prim er periodo, a la m itad de los sujetos (elegidos al azar) se le ad
m inistra el fluido A y a la otra m itad el fluido B. A l trm ino del periodo se m ide la respuesta, y se deja
transcurrir un lapso en el que se elim ina cualquier efecto fisiolgico de los fluidos. D espus el experim en
tador hace que los sujetos que tom aron el fluido,4 tom en el fluido B y aquellos que tom aron el fluido B to
m en el flu id o ^ . A este diseo se le llam a diseo alternado o entrecruzado. Se analiza como un conjunto
de 10 cuadrados latinos con dos renglones (los periodos) y dos tratam ientos (los tipos de fluido). Las dos
columnas en cada uno de los 10 cuadrados corresponden a los sujetos.
E n la figura 4-7 se m uestra la disposicin de este diseo. Observe que los renglones del cuadrado lati
no representan a los periodos y que las columnas representan a los sujetos. Los 10 sujetos que recibieron
prim ero el fluido A (1, 4, 6, 7, 9, 12, 13, 15, 17 y 19) se determ inaron al azar.
Cuadrados latinos

II
2

III

3 4
5 6
B A B A
A B A B

Sujeto

Pariodo 1
Periodo 2

A B
B A

Figura 4-7

U n diseo alternado.

IV

7 8
A B
B A

10

11 12

13 14

15 16

17 18

19 20

A B
B A

B A
A B

A
B

A B
B A

A B
B A

A B
B A

VI

VII

B
A

VIII

IX

4-3 DISEO DE CUADRADO GRECOLATINO

Tabla 4-17

151

Anlisis de varianza
del diseo alternado de la
figura 4-7
__________
G rados de
libertad

F uente de
variacin
Sujetos (columnas)
Periodos (renglones)
Fluidos (letras)
E rror
Total

19

1
1
18
39

E n la tabla 4-17 se resum e un anlisis de varianza. La suma de cuadrados de los sujetos se calcula
como la sum a de cuadrados entre los totales de los 20 sujetos corregida, la sum a de cuadrados de los p e
riodos es la sum a de cuadrados entre los renglones corregida, y la sum a de cuadrados de los fluidos se cal
cula como la suma de cuadrados entre los totales de las letras corregida. Para ms detalles del anlisis
estadstico de estos diseos, ver Cochran y Cox [26], John [61d] y A nderson y M cLean [2].
Ikm bin es posible em plear diseos tipo cuadrado latino para experim entos en los que los tratam ien
tos tienen un efecto residual; es decir, por ejemplo, si los datos del fluido B en el periodo 2 siguen reflejan
do algn efecto del flu id o ^ tom ado en el periodo 1. En C ochran y Cox [26] y John [61d] se estudian en
detalle los diseos balanceados para efectos residuales.

4-3

DISEO DE CUADRADO GRECOLATINO

Considere un cuadrado latino p x p a l cual se le superpone un segundo cuadrado latino p x p en el que


los tratam ientos se denotan con letras griegas. Si cuando se hace la superposicin los dos cuadrados tie
nen la propiedad de que cada letra griega aparece una y slo una vez con cada letra latina, se dice que los
dos cuadrados latinos son ortogonales, y al diseo obtenido se le llam a cuadrado grecolatino. E n la tabla
4-18 se m uestra un ejem plo de un cuadrado grecolatino 4 x 4 .
El diseo de cuadrado grecolatino puede usarse para controlar sistem ticam ente tres fuentes de va
riabilidad extraa, es decir, para hacer la formacin de bloques en tres direcciones. El diseo perm ite la
investigacin de cuatro factores (renglones, columnas, letras latinas y letras griegas), cada una conp nive
les en slo p 2 corridas. Existen cuadrados grecolatinos para toda p > 3, excepto p = 6.

Tabla 4-18

Diseo del cuadrado grecolatino 4 x 4

Columna
Rengln___________ 1______________ 2__________ 3

1
2
3
4

Aa
B
C
Dy

B
Ay
Da
C

Cy
D
A
Ba

D
Ca
By
A

152

CAPTULO 4

Tabla 4-19

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Anlisis de varianza de un diseo del cuadrado grecolatino

Fuente de variacin

Grados de libertad

Suma de cuadrados

i v*

y1

Tratamientos con letras latinas

SSL ~ ~ ~ 2 j ^-i - t j
P jm1
^

Tratamientos con letras griegas

SSG = ~ ^ y 2* r r
P k=i
N

Renglones

^^Rcngioncs

Columnas

^Columnas

E rror

SSE (por sustraccin)

Tbtal

SST =

1 p

^ -1

y2

y i,.,

P i=i
1 p
p X y .J

P- 1
p - 1

*r
Iy
y2

p - 1

jy

( P - 3)(P-1)
p 2- 1

ly

E l m o d e lo e s ta d stic o p a r a el d ise o d e c u a d ra d o g re c o la tin o es

i = l, 2,- -, P
7 = 1, 2,..
" P
y * = f+ d i +Ti +a>i + 'V t+ eiiktk = lt 2,. . P
.1 = 1, 2,.. > P

(4-25)

donde y ijk es la observacin del rengln i y la colum na / p ara la letra latina j y la letra griega k, 6 es el efecto
del rengln i-simo, t es el efecto del tratam iento de letra latina j, mk es el efecto del tratam iento de letra
griega k, } l es el efecto de la colum na /, y Em es un com ponente NID (0, o2) del error aleatorio. Slo son
necesarios dos de los cuatro subndices para identificar com pletam ente una observacin.
E l anlisis de varianza es muy parecido al de un cuadrado latino. Puesto que las letras griegas aparecen exactam ente una vez en cada rengln y columna, y exactam ente una vez con cada letra latina, el factor
representado por las letras griegas es ortogonal a los renglones, las columnas y los tratam ientos de letras
latinas. Por lo tanto, puede calcularse una suma de cuadrados debida al factor de las letras griegas a partir
de los totales de las letras griegas y el error experim ental se reduce adicionalm ente en esta cantidad. E n la
tabla 4-19 se ilustran los detalles de los clculos. L a hiptesis nula de la igualdad de tratam ientos de ren
glones, columnas, letras latinas y letras griegas, se probara dividiendo el cuadrado medio correspondien
te p or el cuadrado m edio del error. La regin de rechazo es la cola superior del punto de la distribucin
F p- 1,

(p -3)(p -l)'

EJEMPLO 4 - 4 ....................................................................................................................................
Suponga que en el experim ento de la carga propulsora del ejemplo 4-3 un factor adicional, los m ontajes
de prueba, podra ser im portante. Sea que haya cinco m ontajes de prueba denotados por las letras griegas
a, , y, y e. E n la tabla 4-20 se m uestra el diseo de cuadrado grecolatino 5 x 5 resultante.
Observe que, debido a que los totales de los lotes de m ateria prim a (renglones), los operadores (co
lumnas) y las formulaciones (letras latinas) son idnticos a los del ejemplo 4-3, se tiene
S S ^ = 68.00

SS

= 150.00

5 5 OIie6 = 330.00

153

4-3 DISEO DE CUADRADO GRECOLATINO

Tabla 4-20

Diseo del cuadrado grecolatino para el problema de la carga propulsora

Lotes de
materia prima
1
2
3
4
5

Aa
B
Cy
D
Ee

= -1
= -8
= -7
= 1
= -3

By
C
De
Ea
A

-18

y..i

Operadores
3
Ce = -6
D a= 5
E = 1
Ay = 1
B = -5

= -5
= -1

= 13
= 6
= 5

18

D
Ey
A&
Be
Ca

-4

4
= -1
= 2
= 2
= -2
= 4

E
Ae
Ba
C
Dy

5
= -1
=11
= -4
= -3
= 6
9

y...

-14
9
5
3
7
10= y...

Los totales de los m ontajes de prueba (las letras griegas) son


L etra griega

Total de la prueba de ensam blaje

y..i. =

y ..2. -

y.. 3. = - 3
>u = -4

y.. 5. =

10
-6

13

Por lo tanto, la suma de cuadrados debida a los m ontajes de prueba es


re

bnwmblaics

i p

/ , }\.k.
P k=1
P

y....

xj
iV

2 + ( - 6)2

+ ( - 3 ) 2 + ( - 4 ) J +132 ] - ^ - =

62.00

E n la tabla 4-21 se resum e el anlisis de varianza com pleto. Las formulaciones son diferentes significati
vam ente en 1%. Al com parar las tablas 4-21 y 4-12, se observa que al sacar la variabilidad debida a los
m ontajes de prueba, el error experim ental disminuye. Sin embargo, al disminuir el error experim ental, se
han reducido tam bin los grados de libertad de 12 (en el diseo del cuadrado latino del ejemplo 4-3) a 8 .
Por lo tanto, la estimacin del error tiene menos grados de libertad, y la prueba puede ser m enos sensible.

Tabla 4-21

Anlisis de varianza del problema de la carga propulsora

Fuente de variacin
Formulaciones
Lotes de materia prima
Operadores
Montajes de la prueba
Error
Tbtal

Suma de
cuadrados
330.00
68.00
150.00
62.00
66.00
676.00

Grados de
libertad
4
4
4
4
8
24

Cuadrado
medio
82.50

F0
10.00
17.00
37.50
15.50
8.25

Valor P
0.0033

154

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

P uede hacerse cierta am pliacin del concepto de los pares ortogonales de cuadrados latinos que for
m an un cuadrado grecolatino. U n hipercuadradop x p es un diseo en el que se superponen tres o ms
cuadrados latinos ortogonales p x p . E n general, h astap + 1 factores podran estudiarse si se dispone de
un conjunto com pleto d e p - 1 cuadrados latinos ortogonales. E n este diseo se utilizaran todos los (p +
1)(p - 1 ) = p 2 - 1 grados de libertad, por lo que se necesita una estim acin independiente de la varianza
del error. D esde luego, no debe haber interacciones entre los factores cuando se usan hipercuadrados.

4-4

DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

E n ciertos experimentos en los que se utilizan diseos de bloques aleatorizados quiz no sea posible co
rrer todas las com binaciones de los tratam ientos en cada bloque. Situaciones como sta ocurren general
m ente p o r limitaciones del aparato experim ental o de las instalaciones o p or el tam ao fsico del bloque.
Por ejemplo, en el experim ento de la prueba de la dureza (ejem plo 4-1), suponga que debido a sus dim en
siones cada ejem plar de prueba slo puede usarse para probar tres puntas. Por lo tanto, no es posible pro
bar todas las puntas en cada uno de los ejemplares. Para este tipo de problem a es posible utilizar diseos
de bloques aleatorizados en los que cada tratam iento no est presente en cada bloque. Estos diseos se
conocen como diseos de bloques incompletos aleatorizados.
Cuando las com paraciones de todos los tratam ientos son igualm ente im portantes, las combinaciones
de los tratam ientos usadas en cada bloque debern seleccionarse en una form a balanceada, es decir, de
tal m anera que cualquier p ar de tratam ientos ocurra conjuntam ente el mismo nm ero de veces que cual
quier otro par. Por lo tanto, un diseo de bloques incompletos balanceados (BIBD, balanced incomplete
block design) es un diseo de bloques incompletos en el que dos tratam ientos cualesquiera aparecen con
juntam ente el mismo nm ero de veces. Suponga que hay a tratam ientos y que cada bloque puede conte
ner exactam ente k (k < a) tratam ientos. U n diseo de bloques incom pletos balanceados puede
construirse tom ando ( ) bloques y asignando una com binacin de tratam ientos diferente a cada bloque.
Con frecuencia, sin embargo, puede obtenerse un diseo balanceado con m enos de ( I ) bloques. Tkblas de
BIBD se proporcionan en Fisher y Yates [45], Davies [36] y Cochran y Cox [26].
Como un ejemplo, suponga que un ingeniero qumico piensa que el tiem po de reaccin de un proceso
qumico es una funcin del tipo de catalizador em pleado. Se estn investigando cuatro catalizadores. El
procedim iento experim ental consiste en seleccionar un lote de m ateria prim a, cargar la planta piloto,
aplicar cada catalizador en una corrida separada de la planta piloto y observar el tiem po de reaccin. D e
bido a que las variaciones en los lotes de m ateria prim a pueden afectar el desem peo de los catalizadores,
el ingeniero decide usar los lotes de m ateria prim a como bloques. Sin embargo, cada lote es apenas lo su
ficientem ente grande para perm itir que se prueben tres catalizadores. Por lo tanto, debe usarse un diseo

Tabla 4-22

Diseo de bloques incompletos balanceados para el


experimento del catalizador
Bloque (lote de m ateria prima)
i

y.

1
2

73

3
4

73
75

74
75
75
-

218
214
216

72

71
72
75

221

224

207

218

870= x.

izador)

yj

67

68

222

4-4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

155

de bloques incom pletos aleatorizados. El diseo de bloques incom pletos balanceados para este experi
m ento, junto con las observaciones registradas, se m uestran en la tabla 4-22. El orden en que se corren los
catalizadores en cada bloque est aleatorizado.

4-4.1

Anlisis estadstico del diseo de bloques incompletos balanceados

Como de costum bre, se supone que h a y a tratam ientos y b bloques. Adems, se supone que cada bloque
contiene k tratam ientos, que cada tratam iento ocurre r veces en el diseo (o que se hacen r rplicas del
mismo), y que hay TV= ar = bk observaciones en total. Asimismo, el nm ero de veces que cada par de tra
tam ientos aparece en el mismo bloque es
a- 1
Si a - b, se dice que el diseo es simtrico.
El parm etro X debe ser un entero. Para deducir la relacin para X, considere cualquier tratam iento,
por ejem plo el tratam iento 1. Puesto que el tratam iento 1 aparece en r bloques y hay otros k - \ tratam ien
tos en cada uno de esos bloques, hay r(k - 1 ) observaciones en un bloque que contiene al tratam iento 1.
Estas r(k - 1 ) observaciones tam bin tienen que representar a los a - 1 tratam ientos restantes Aveces. Por
lo tanto, X(a - 1) = r(k - 1).
El modelo estadstico del BIBD es
y.. = + T i + j + eij

(4-26)

donde y,j es la observacin -sima en el bloquey-sim o,^ es la m edia global, r es el efecto del tratam iento
i-simo, j es el efecto del bloquey-simo, y s es el com ponente NID (0, o2) del error aleatorio. La variabi
lidad total en los datos se expresa p o r la sum a de cuadrados totales corregida:

,= 2 X ^ -1 * i

f 7)

Puede hacerse la particin de la variabilidad total en


SSj

^ ^ T r a ta m ie n to s ( a ju 5 ta d o 6 )

B lo q u e s

donde la suma de cuadrados de los tratam ientos est ^justada para separar los efectos de los tratam ientos
y de los bloques. Este ajuste es necesario porque cada tratam iento est representado en un conjunto dife
rente de r bloques. Por lo tanto, las diferencias entre los totales de los tratam ientos no ajustadosyi,,y2., -,
ya tam bin son afectadas por las diferencias entre los bloques.
L a suma de cuadrados de los bloques es
c - 28)
dondey es el total del bloquey'-simo. SSBloques tiene b - 1 grados de libertad. L a sum a de cuadrados de los
tratam ientos ajustada es

^l^Trtamictos(ajustados)

(A 29)

156
Tabla 4-23

CAPTULO 4

Anlisis de varianza del diseo de bloques incompletos balanceados

Fuente de
variacin
Tratamientos
(ajustados)
Bloques
Error
Tbtal

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

Grados de
libertad

Suma de cuadrados
*2 &

Cuadrado medio
SSTraramientoS(ajustadoR)

a-l

Xa

i V y\ J .
k
-I

b-1

SSE(por sustraccin)

N-a-b + 1

Fo

f-,

^^*^Itataiuietos(ajiifitados)

a 1
^Bloques

mse

b-1
SSE
N-a-b +1

N-1

2 2 * 4

donde Q es el total ajustado del tratam iento i-simo, el cual se calcula como
n

1 6
- 2 n y,
k =i

i = l, 2,..., a

(4-30)

con nj = 1 si el tratam iento i aparece en el bloque j y nj = 0 en caso contrario. Los totales de los tratam ien
tos ajustados siem pre sum arn cero. 5S-Qalaimntos(ajU5tad[,lj) tiene a - l grados de libertad. L a sum a de cuadra
dos del erro r se calcula por sustraccin como
SSg

SSj

^^Tratamientostajlistados)

(4-31)

^^Bloqucs

y tiene N - a - b + 1 grados de libertad.


E l estadstico apropiado p ara probar la igualdad de los efectos de los tratam ientos es
M S Tratamietos(ajustados)
,

E n la tabla 4-23 se resum e el anlisis de varianza.

EJEMPLO 4 - 5 ....................................................................................................................................
Considere los datos de la tabla 4-22 para el experim ento del catalizador. Se trata de un BIBD con a = 4,
b A ,k = 3 ,r = 3,A = 2 y N = 12. El anlisis de estos datos es el siguiente. L a sum a de cuadrados total es
..2

s s r - 'Z 'Z
= 63^156187>

= 8 1 .oo

12
L a suma de cuadrados de los bloques se encuentra con la ecuacin 4-28 como
1

SS

= - 7

*^

v2

y2 ~ -

'

12

= ^ [(2 2 1 )2 + (207)2 + (2 2 4 )2 +(218)2 ] -

(870)2

=55.00

4-4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

157

Tabla 4*24 Anlisis de varianza del ejemplo 4-5

Fuente de variacin
Tratamientos (ajustados
para los bloques)
Bloques
Error
Tbtal

Grados de
libertad

Suma de
cuadrados

Cuadrado
medio
T58

22/75
3
5

55.00
3.25
81.00

Valor P
11.66

0.0107

0.65

11

P ara calcular la sum a de cuadrados de los tratam ientos ajustados p ara los bloques, prim ero se determ inan
los totales de los tratam ientos ajustados utilizando la ecuacin 4-30 como
i = (218) - i (221 + 224 + 218) = - 9 / 3
Q2 = ( 2 1 4 ) - i ( 2 0 7 + 224+218) = - 7 / 3
Q* = (216)j (221+207 + 224) = - 4 / 3
4 = (2 2 2 ) - ^ ( 2 2 1 + 207 + 2 1 8 )= 2 0 /3

L a suma de cuadrados de los tratam ientos ajustados se calcula con la ecuacin 4-29 como

^ Tralamicnto&(ajuslados)

1=1____

_ 3 [ ( - 9 /3 ) 2 + ( - 7 / 3)2 + ( - 4 / 3 ) 2 + ( 2 0 / 3)2] =
(2)(4)
La suma de cuadrados del error se obtiene por sustraccin como

SSj-

SS TraiamieiitQj^utadofi)

^ ^ B lo q u e i

= 81.00 - 2 2 7 5 - 55.00= 2 5
E n la tabla 4-24 se m uestra el anlisis de varianza. Puesto que el valor P es pequeo, se concluye que el ca
talizador em pleado tiene un efecto significativo sobre el tiem po de reaccin.

Si el factor bajo estudio es fijo, las pruebas para las medias de tratam ientos individuales pueden ser
de inters. Si se em plean contrastes ortogonales, los contrastes deben hacerse sobre los totales de los tra
tam ientos ajustados, las {Q} en lugar de las (y ,}. L a suma de cuadrados de los contrastes es

SSC ^ Xa J

c?

donde {c,} son los coeficientes de los contrastes. Pueden usarse otros m todos de com paracin m ltiple

158

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

para com parar todos los pares de efectos de los tratam ientos ajustados (seccin 4-4.2), los cuales se esti
m an con i = kQJ(Xa), El error estndar del efecto de un tratam iento ajustado es

kM SF

H it 1

<4-32>

E n el anlisis que acaba de describirse, se h a hecho la particin de la suma de cuadrados total en una
sum a de cuadrados de los tratam ientos ajustados, una suma de cuadrados de los bloques sin ajuste y una
suma de cuadrados del error. En ocasiones habra inters en evaluar los efectos de los bloques. Para ello
se requiere hacer una particin alternativa de S S es decir,
SSj~

^^Tratamientos

^^Bloquesfajustados)

Aqu, Sealamientos est sin ajuste. Si el diseo es simtrico, es decir, si a = b, puede obtenerse una frm ula
simple p ara 5 S Bloques(aj USta[ios). Los totales de los bloques ajustados son
Q'i = y.j - J

n 9V

7 = 1, 2,...,

L ^ B lo q u cs(aju stad o s)

(4-33)

)2

(4-34)

El BIBD del ejemplo 4-5 es simtrico porque a = b = 4, Por lo tanto,


,' = (2 2 1 )- j (218+ 216+222) = 7 /3
g ; = (2 2 4 )- | ( 2 1 8 + 214+216) = 2 4 / 3
g ; = ( 2 0 7 ) -i(2 1 4 + 2 1 6 + 2 2 2 ) = - 3 1 / 3
Q = (218)- i (218+ 214+ 222) = 0

Bloques(ajustados)

_ 3 [(7 /3 )2 + ( 2 4 / 3)2 + (3 1 /3 )2 + (0 )2]


(2)(4)

Asimismo,
(218) +(214) +(216) +(222)
Tratamientos

Tabla 4-25

(870)2 _ ^
12

Anlisis de varianza del ejemplo 4-5, incluyendo tanto los tratamientos como los bloques

Fuente de variacin
Tratamientos (ajustados)
Tratamientos (sin ajuste)
Bloques (sin ajuste)
Bloques (ajustados)
E rror
Tbtal

Suma de
cuadrados

G rados de
libertad

22.75
11.67
55.00
66,08
3,25
81.0

3
3
3
3
5
11

Cuadrado
medio
7.58

22.03
0.65

F0

Valori*

11.66

0.0107

33.90

0.0010

4-4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

159

E n la tabla 4-25 se presenta un resum en del anlisis de varianza del BIBD simtrico. Observe que las
sumas de cuadrados asociadas con los cuadrados m edios de la tabla 4-25 no producen la suma de cuadra
dos total, es decir,
S S j

*^l'^Trataimentos(ajustados)

*^*^Bloquea(ajustad(H)

^^E

E sto es consecuencia del carcter no ortogonal de los tratam ientos y los bloques.
Salida de computadora
Existen varios paquetes de com putadora que realizarn el anlisis de un diseo de bloques incompletos
balanceados. El procedim iento de M odelos Lineales G enerales (G eneral Linear M odels) del SAS es uno
de ellos, y M initab, un paquete de estadstica para com putadoras personales de uso generalizado, es otro.
L a p arte superior de la tabla 4-26 es la salida del procedim iento de M odelos Lineales G enerales de M ini
tab para el ejem plo 4-5. Al com parar las tablas 4-26 y 4-25, se observa que M initab h a calculado la suma
de cuadrados de los tratam ientos ajustados y la suma de cuadrados de los bloques ajustados (en la salida
de M initab se les llam a AdjSS o SS ajustada).
L a parte inferior de la tabla 4-26 es un anlisis de com paraciones m ltiples, en el que se utiliza l m
todo de Tkey. Se presentan los intervalos de confianza para las diferencias de todos los pares de m edias y
la prueba de Tkey. Observe que el m todo de Hikey llevara a la conclusin de que el catalizador 4 es di
ferente de los otros tres.

4'4.2

Estimacin de mnimos cuadrados de los parmetros

Considere la estim acin de los efectos de los tratam ientos en el m odelo BIBD. Las ecuaciones norm ales
de mnimos cuadrados son
a

/r .N fi+ r 2

t + k 2

i l

j = y..

;- l
b

r,. : rp,+ r ,, + ]T

. = y

i = 1 ,2 ,..., a

(4-35)

j .k + ^ l n + kj = y i
1=1

j = 1, 2,..., b

Al im poner las restricciones Z r . = 'J = 0, se encuentra que // = > . Adems, al utilizar las ecuaciones
p ara {$} para elim inar los efectos de los bloques de las ecuaciones p ara {r}, se obtiene
b

rki - r?; - 2 2
7=1

nn**p = tyi. ~ 2

p&i

n ty.j

(436)

7=1

Observe que el m iem bro del lado derecho de la ecuacin 4-36 es kQ, donde Q es el total del tratam iento
ajustado i-simo (ver la ecuacin 4-29). Entonces, puesto que 2
= A sip # i y n 2pj = np (ya que npj =
0 o 1), la ecuacin 4-36 puede reescribirse como
r ( k - l)f; - ^ 2
p~ 1

P*i

p = kQ

i = 1 ,2 ,..., a

(4-37)

Tabla 4-2 6

Anlisis de M initab (Modelo Lineal General) para el ejemplo 4-5

Modelo Lineal General

Factor
C a ta l ys t
B l oc k

Type
fixe d
fix ed

L ev e ls V al u e s
412 3 4
412 3 4

A n a l y s i s of V a r i a n c e for Time, us ing A d j u s t e d SS for Tes ts


S ource
C a t a lyst
Slo ck
Error
Total

DF
3
3
5
11

Seq SS
1 1. 6 6 7
6 6. 0 8 3
3. 25 0
81.000

Adj SS
2 2. 7 5 0
66 . 08 3
3 .2 5 0

Adj MS
7 .583
22.028
0 . 65 0

f
11 .67
3 3. 8 9

P
0.011
0.001

T u k ey 9 5 . 0 % S i m u l t a n e o u s C o n f i d e n c e I n t e r v a l s
R e s p o n s e V a r i a b l e Time
All P a i r w i s e C o m p a r i s o n s a m o n g L ev e l s of C a t al ys t
C a t al y st = 1 s u b t r a c t e d from:
C a t al y st
2
3
4

Low e r
-2.327
-1.952
1 .048

Center
0.2500
0.6250
3.6250

Upp er
2.827
3.2 02
6.2 02

------------- + ----------- + ----------- ------(------------* ----------- )


(-------------* ----------- )
(------------ * ----------- )
0.0

2.5

5.0

C a t a l y s t - 2 s u b t r a c t e d from:
Catalyst
3
4

Lo wer
-2.202
0 . 7 98

Ce nt er
0.3750
3.3750

U p pe r
2 .9 5 2
5.952

------------ + ----------- + ----------- + ----<-----------* ----------- )


(------------ * ----------- >
0 .0

2.5

5.0

C a t a l y s t = 3 s u b t r a c t e d from:
Catalyst
4

L ow er
0.4228

C en t e r
3.000

Upper
5 .5 77

------------ + ----------- + ----------- + ----(----------- * ----------- >


0 .0

T u k e y S i m u l t a n e o u s Tes ts
R e s p o n s e V a r i a b l e Time
All P a i r w i s e C o m p a r i s o n s a m o n g L ev e ls of C a t a l y s t
Catalyst

= 1 subtracted

from:

Level
Catalyst
2
3
4

Difference
of M ea n s
0.2500
0.6250
3.6250

SE of
Difference
0 . 69 8 2
0 . 69 8 2
0 .6 9 82

Catalyst

= 2 subtracted

from:

Level
Catalyst
3
4

Difference
of M ea n s
0.3750
3.3750

SE of
Difference
0 . 69 8 2
0 .6 9 82

Catalyst

= 3 subtracted

from:

Level
Catalyst
4

Difference
of M e a n s
3.000

SE ot
Difference
0 .6 9 8 2

T-Value
0.3581
0.8951
5.1918

Adjusted
P - V a lu e
0 .9 82 5
0.8085
0 . 01 3 0

T-Value
0.5371
4.8338

Adjusted
P-VaLue
0 . 94 6 2
0 .0 17 5

T-Value
4 .2 97

Adjusted
P-Value
0.0281

2.5

5.0

4-4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

Por ltimo, observe que la restriccin


1), de donde se obtiene

161

= 0 implica que 2" =1 p = -~t y recuerde que r(k - 1 ) = A(a pTi


X a ^k Q t

i = 1 ,2 ,..., a

(4-38)

Por lo tanto, los estim adores de mnimos cuadrados de los efectos de los tratam ientos en el m odelo de
bloques incom pletos balanceados son
r,= ^ -

1= 1,2,...,

Aa

(4-39)

Como una ilustracin, considere el BIBD del ejem plo 4-5. Puesto que Q 1 = -9/3, Q2 = -7/3, Q3 = -4/3
y Q4 = 20/3, se obtiene

(2)(4)
. _ *-4/3)
(2X 4)

(2)(4)
3(20/3)

' -

20' 8

como se encontr en la seccin 4-4.1.

4-4.3

Recuperacin de informacin interbloques en el diseo


de bloques incompletos balanceados

Al anlisis del BIBD presentado en la seccin 4-4.1 suele llamrsele el anlisis intrabloques porque las
diferencias de los bloques se eliminan y todos los contrastes de los efectos de los tratamientos pueden ex
presarse como comparaciones entre las observaciones del mismo bloque. Este anlisis es apropiado inde
pendientemente de si los bloques son fijos o aleatorios. Yates [113c] seal que si los efectos de los
bloques son variables aleatorias no correlacionadas con medias cero y varianza a \ , es posible obtener in
formacin adicional acerca de los efectos de los tratamientos t. Yates llam anlisis interbloqnes al m
todo para obtener esta informacin adicional.
Considere los totales de los bloques y 4 como una coleccin de b observaciones. El modelo para estas
observaciones (siguiendo a John [61d]) es
+

y.i

n ijT i + \ k j + ^

=i

e# )

i=i

(4-40)

donde el trmino entre parntesis puede considerarse como el error. Los estimadores interbloques de fi y
r, se encuentran minimizando la funcin de mnimos cuadrados

L=
Se obtienen as las siguientes ecuaciones normales de mnimos cuadrados:
a
fi-.Nfi+r J

"

t, = y_

Ti :k r + r r i + a ] t p = 2
p-

p*i

;- l

(4-41)
nf y ,

*=

2- - - a

162

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

donde p y r denotan los estimadores interbloques. Al im poner la restriccin Z*=1( = 0, se obtienen las
soluciones de las ecuaciones 4-41 como
= l

Tt = -------- :-------T A

(4-42)

i = 1 ,2,..., a

(4-43)

Es posible dem ostrar que los estim adores interbloques { r,} y los estim adores intrabloques { z } no estn
correlacionados.
Los estim adores interbloques { r ,} pueden diferir de los estim adores intrabloques { ,}. Por ejemplo,
los estim adores interbloques para el BIBD del ejemplo 4-5 se calculan de la siguiente m anera:
i = 663-(3X3)(72.50_) = iQ5Q

t2= 649(3)(3)(7250) _

_^5Q

652-(3)(3)(72.50) = _ 0 5 0
3

3 -2
646 (3)(3)(72.50)
t , -------------j T j --------------- 6-50
Observe que los valores de 2 jb^1n ij y se usaron en la pgina 157 para calcular los totales de los tratam ien
tos ajustados en el anlisis intrabloques.
Suponga ahora que quieren combinarse los estim adores interbloques e intrabloques para obtener
una sola estim acin de la varianza mnim a insesgada de cada r. Es posible dem ostrar que i y f son insesgados y tam bin que
V (il) =

Xa

(intrabloques)

v ( r ) = k(f
II ( o 1 + k o ) )
Q\T Al

(intrabloques)

Se usa una com binacin lineal de los dos estim adores, por ejemplo
T = a 1 i + a 1f

(4-44)

para estim ar t. E n este m todo de estimacin, el estim ador combinado insesgado de la varianza mnima
r deber ten er las ponderaciones a l = u l(ul + u2) y a 2 = u j ( u 1 + u 2), donde w, = HV(ri ) y u 2 = 1/K(r, ).
Por lo tanto, las ponderaciones ptimas son inversamente proporcionales a las varianzas de t y r. Esto
implica que el m ejor estim ador com binado es

4-4 DISEOS DE BLOQUES INCOMPLETOS BALANCEADOS

163

que puede simplificarse como


kQ (o2 + k o ] ) + 2

niy.) kry..
i = l, 2,..., a

( r - A)ct +a(o2 + k a l )

(4-45)

D esafortunadam ente, la ecuacin 4-45 no puede usarse para estim ar r, porque no se conocen las varianzas a2y o 2 . El enfoque comn es estim ar c r y o 2 a partir de los datos y sustituir estos parm etros de la
ecuacin 4-45 con las estimaciones. L a estimacin que suele tom arse para o2 es el cuadrado medio del
erro r del anlisis de varianza intrabloques, o el e rro r intrabloques. Por lo tanto,
o 2 = M S
L a estim acin de o 2 se encuentra a partir del cuadrado medio de los bloques ajustados para los trata
mientos. E n general, para un diseo de bloques incompletos balanceados, este cuadrado medio es

Xa
M S Bloques(ajustados)

. ? . v.
+2 fy - l
i=i

(4-46)

(6 - 1)

y su valor esperado (cuya deduccin se hace en Graybill [50]) es


t] = a 2 +

E[MS

a ( r - 1)

Por lo tanto, si M 5Bloques(ajllsudos) > MSE, la estimacin de a \ es


[M S Bioquesfajiistidi-K) M S B ](ft 1)
a l =
o (r-l)

(4-47)

y si JWSBloques(ajll3tadosj < M Se, se hace 2 = 0. Esto resulta en el estim ador combinado


kQ (2 + k d l ) +
T. =

(r A)ct +Xa( + k )
y. ~ ( i / ) x .

>0

2, = 0

( 4 - 4 8 a)
(4 -4 8 b )

A continuacin se calculan las estimaciones combinadas para los datos del ejemplo 4-5. Por la tabla
4-25 se obtiene 2 = M SE = 0.65 yM SBloques(ajustados) = 22.03. (Observe que para calcular MSBloque5(ajU5tados) se
hace uso del hecho de que ste es un diseo simtrico. En general, debe usarse la ecuacin 4-46.) Puesto
que M 5Bloqucs(a]UStadQS) > M S E, se usa la ecuacin 4-47 p ara estim ar a 2 como
(22.03- 0.65X3)
p

4 (3 - 1 )

Por lo tanto, pueden sustituirse o 2 = 0.65 y 2 = 8.02 en la ecuacin 4-48a para obtener las estimaciones
com binadas que se enlistan enseguida. Por conveniencia, tam bin se presentan las estimaciones intrablo-

164

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADO S LATINOS Y DISEOS RELACIONADOS

ques e interbloques. E n este ejemplo, las estimaciones combinadas estn prximas a las estimaciones in
trabloques debido a que la varianza de las estimaciones interbloques es relativam ente grande.

4-5
4-1.

4-2.

Parmetro

Estimacin intrabloques

7,
t2
r3
t4

-L 2
-0.88
-0.50
2.50

PROBLEMAS

Estimacin interbloques

Estimacin combinada

1050
-3.50
-0.50
-6.50

-L9
-0.88
-0.50
2.47

-------------------------------------------------------------------------------------------

U n qumico quiere pro b ar el efecto de cuatro agentes qumicos sobre la resistencia de un tipo p articu lar de
tela. D ebido a que podra haber variabilidad de un rollo de tela a otro, el qumico decide usar un diseo de b lo
ques aleatorizados, con los rollos de tela considerados com o bloques. Selecciona cinco rollos y aplica los
cuatro agentes qumicos de m anera aleatoria a cada rollo. A continuacin se p resen tan las resistencias a la
tensin resultantes. A nalizar los datos de este experim ento (utilizar a = 0.05) y sacar las conclusiones
apropiadas.
Rollo

A gente
qumico

1
2
3
4

73
73
75
73

68
67
68
71

74
75
78
75

71
72
73
75

67
70
68
69

Se estn com parando tres soluciones de lavado diferentes a fin de estudiar su efectividad p ara retard ar el
crecim iento de bacterias en contenedores de leche de 5 galones. El anlisis se hace en un laboratorio y slo
pueden realizarse tres ensayos en un da. Puesto que los das podran rep resen tar un a fuente potencial de va
riabilidad, el experim entador decide usar un diseo de bloques aleatorizados. Se hacen observaciones en
cuatro das, cuyos datos se m uestran enseguida. A nalizar los datos de este experim ento (utilizar a = 0.05) y
sacar las conclusiones apropiadas.
Das

4-3.

4-4.
4-5.

Solucin

1
2
3

13
16
5

22
24
4

18
17
1

39
44
22

G raficar las resistencias a la tensin medias observadas p ara cada tipo de agente qumico en el problem a 4-1
y com pararlas con una distribucin t con la escalacin apropiada. Q u conclusiones se sacaran a p artir de
esta representacin grfica?
G raficar los conteos de bacterias prom edio p ara cada solucin en el problem a 4-2 y com pararlos con u na dis
tribucin t escalada. Q u conclusiones p u ed en sacarse?
E n un artculo de Fire Safety Journal (El efecto del diseo de boquillas en la estabilidad y el desem peo de
surtidores de agua turbulenta, vol. 4) se describe un experim ento en el que se determ in un factor de la for
m a para varios diseos diferentes de boquillas con seis niveles de la velocidad del flujo de salida del surtidor.

165

4-5 PROBLEMAS

E l inters se centr en las diferencias potenciales entre los diseos de las boquillas, con la velocidad conside
rad a com o una variable perturbadora. Los datos se presen tan a continuacin.

Velocidad del flujo de salida del surtidor (m/s)

D iseo de la
boquilla

11.73

14.37

16.59

20.43

23.46

28.74

1
2
3
4
5

0.78
0.85
0.93
1.14
0.97

0.80
0.85
0.92
0.97
0.86

0.81
0.92
0.95
0.98
0.78

0.75
0.86
0.89
0.88
0.76

0.77
0.81
0.89
0.86
0.76

0.78
0.83
0.83
0.83
0.75

a) E l diseo de la boquilla afecta el factor de la form a? C om parar las boquillas con un diagram a de disper
sin y con un anlisis de varianza, utilizando a = 0.05.
b ) A nalizar los residuales de este experimento.
c)

Q u diseos de las boquillas son diferentes con respecto al factor de la form a? Trazar un a grfica del
factor de la form a prom edio para cada tipo de boquilla y com pararla con un a distribucin escalada.
C om parar las conclusiones que se sacaron a p artir de esta grfica con las de la prueba del rango mltiple
de D uncan.
C onsidere el experim ento del algoritm o para controlar la proporcin de alm ina del captulo 3, seccin 3-8.
El experim ento se llev a cabo en realidad com o un diseo de bloques aleatorizados, en el que se selecciona
ron seis periodos com o bloques, y se probaron los cuatro algoritmos p ara controlar la proporcin en cada p e
riodo. El voltaje prom edio de la celda y la desviacin estndar del voltaje (indicada entre parntesis) p ara
cada celda son los siguientes:

Algoritmo
p ara controlar
la proporcin
1
2
3
4

Tiempo
1
4.93
4.85
4.83
4.89

(0.05)
(0.04)
(0.09)
(0.03)

4.86 (0.04)
4.91 (0.02)
4.88 (0.13)
4.77 (0.04)

2
4.75
4.79
4.90
4.94

(0.05)
(0.03)
(0.11)
(0.05)

4.95
4.85
4.75
4.86

(0.06)
(0.05)
(0.15)
(0.05)

5
4.79
4.75
4.82
4.79

(0.03)
(0.03)
(0.08)
(0.03)

6
4.88
4.85
4.90
4.76

(0.05)
(0.02)
(0.12)
(0.02)

a) A nalizar los datos del voltaje prom edio de las celdas. (U tilizar a = 0.05.) La eleccin del algoritm o para
controlar la proporcin afecta el voltaje prom edio de las celdas?

b ) R ealizar el anlisis apropiado de la desviacin estndar del voltaje. (R ecuerde que a ste se le llam ru i
do del crisol.) La eleccin del algoritmo p ara controlar la proporcin afecta el ruido del crisol?
c) Realizar los anlisis residuales que parezcan apropiados.
d ) Q u algoritm o p ara controlar la proporcin debera seleccionarse si el objetivo es reducir tan to el vol
taje prom edio de las celdas como el ruido del crisol?
El fabricante de una aleacin m aestra de aluminio produce refinadores de textura en form a de lingotes. La
com paa produce el producto en cuatro hornos. Se sabe que cada horno tiene sus propias caractersticas
nicas de operacin, por lo que en cualquier experim ento que se corra en la fundicin en el que se use ms de
un horno, los hornos se considerarn como una variable perturbadora. Los ingenieros del proceso sospechan
que la velocidad de agitacin afecta la m edida de la textura del producto. Cada horno puede operarse con

166

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

cuatro diferentes velocidades de agitacin. Se lleva a cabo un diseo de bloques aleatorizados p ara un refina
dor particular y los datos resultantes de la m edida de la textura se m uestran a continuacin:

H om o
Velocidad de agitacin (rpm)

5
10
15
20

8
14
14
17

4
5
6
9

5
6
9
3

6
9
2
6

a) Existe evidencia de que la velocidad de agitacin afecta la m edida de la textura?


b ) Representar los residuales de este experimento en una grfica de probabilidad normal. Interpretar esta grfica.
c)

4-8.
4-9.
4-10.
4-11.
4-12.

4-13.

G raficar los residuales contra el horno y la velocidad de agitacin. E sta grfica proporciona alguna in
form acin til?
d) Cul sera la recom endacin de los ingenieros del proceso con respecto a la eleccin de la velocidad de
agitacin y del horno para este refinador de textura particular si es deseable un a m edida de la textura p e
quea?
A nalizar los datos del problem a 4-2 utilizando la prueba general de significacin de la regresin.
Suponiendo que los tipos de agentes qumicos y los rollos de tela son fijos, estim ar los parm etros del modelo
t y i del problem a 4-1.
Trazar una curva de operacin caracterstica p ara el diseo del problem a 4-2. La prueba parece ser sensible
a las diferencias pequeas en los efectos de los tratam ientos?
Suponga que falta la observacin del agente qumico 2 y el rollo 3 en el problem a 4-1. A nalizar el problem a
estim ando el valor faltante. Realizar el anlisis exacto y com parar los resultados.
Dos valores faltantes en un bloque aleatorizado. Suponga que en el problem a 4-1 faltan las observaciones del
agente qumico tipo 2 y el rollo 3 y del agente qumico tipo 4 y el rollo 4.
a) A nalizar el diseo haciendo la estimacin iterativa de los valores faltantes, como se describe en la sec
cin 4-1.3.
b) D erivar SSEcon respecto a los dos valores faltantes, igualar los resultados con cero y resolver las ecuacio
nes para las estimaciones de los valores faltantes. A nalizar el diseo utilizando estas dos estimaciones de
los valores faltantes.
c) D educir las frm ulas generales para estim ar dos valores faltantes cuando las observaciones estn en blo
ques diferentes.
d) D educir las frm ulas generales para estim ar dos valores faltantes cuando las observaciones estn en el
mismo bloque.
U n ingeniero industrial est realizando un experim ento sobre el tiem po de enfoque del ojo. Se interesa en el
efecto de la distancia del objeto al ojo sobre el tiem po de enfoque. Cuatro distancias diferentes son de in te
rs. C uenta con cinco sujetos p ara el experim ento. D ebido a que puede h aber diferencias entre los indivi
duos, el ingeniero decide realizar el experim ento en un diseo de bloques aleatorizados. Los datos obtenidos
se presentan a continuacin. A nalizar los datos de este experim ento (utilizar a = 0.05) y sacar las conclusio
nes apropiadas.

Sujeto
Distancia (pies)
4
6
8
10

10
7
5
6

6
6
3
4

6
6
3
4

6
1
2
2

6
6
5
3

4-5 PROBLEMAS

4-14.

167

Se estudia el efecto de cinco ingredientes diferentes (A, B ,C ,D y E) sobre el tiem po de reaccin de un proce
so qumico. Cada lote de m aterial nuevo slo alcanza p ara perm itir la realizacin de cinco corridas. Adems,
cada corrida requiere aproxim adam ente 1V2 horas, por lo que slo pueden realizarse cinco corridas en un
da. El experim entador decide realizar el experim ento como un cuadrado latino p ara que los efectos del da y
el lote puedan controlarse sistemticam ente. O btiene los datos que se m uestran enseguida. A nalizar los d a
tos de este experim ento (utilizar a 0.05) y sacar conclusiones.

D a

4-15.

Lote

1
2
3
4
5

A - 8
C - 11

5 =4
> = 6
= 4

B =1
E =2
A =9
C=8

D = 1
A= 7

D 2

5 = 3

C= 1
D 3
E= 1
B= 6
A = 8

1
2
3
4

4-17.
4-18.
4-19,

E =3

5 =8
D 5
A = 10
C = 8

U n ingeniero industrial investiga el efecto de cuatro m todos de ensam blaje (A, B, C yD ) sobre el tiem po de
ensam blaje de un com ponente de televisores a color. Se seleccionan cuatro operadores p ara el estudio. A de
ms, el ingeniero sabe que todos los m todos de ensam blaje producen fatiga, de tal m odo que el tiem po re
querido p ara el ltim o ensamblaje puede ser mayor que p ara el prim ero, independientem ente del m todo.
Es decir, se desarrolla una tendencia en el tiem po de ensam blaje requerido. P ara tom ar en cuenta esta fuente
de variabilidad, el ingeniero em plea el diseo del cuadrado latino que se presenta a continuacin. A nalizar
los datos de este experim ento (a = 0.05) y sacar las conclusiones apropiadas.

O rden de
ensamblaje

4-16.

C = 10
E =6

___________
1
2
C = 10

5 =7
A = 5
D = 10

O perador_____________
3
4

> = 14
C = 18
5 = 10
A = 10

A = 1

B = 8

D = 11

C = 11
B = 12

D = 9

C = 14

Suponga que en el problem a 4-14 falta la observacin del lote 3 en el da 4. Estim ar el valor faltante con la
ecuacin 4-24, y realizar el anlisis utilizando este valor.
Considere un cuadrado latino p x p con renglones (a,), columnas (k) y tratam ientos (t) fijos. O btener esti
m aciones de mnimos cuadrados de los parm etros del m odelo a, k y t.
D educir la frm ula del valor faltante (ecuacin 4-24) p ara el diseo del cuadrado latino.
Diseos que incluyen varios cuadrados latinos. (Ver C ochran y Cox [26] y John [61d],) El cuadrado latino p x p
contiene nicam ente p observaciones para cada tratam iento. P ara obtener m s rplicas, el experim entador
puede usar varios cuadrados, por ejemplo n. N o es relevante si los cuadrados usados son el mismo o son dife
rentes. El modelo apropiado es
i = 1,

7 = 1, 2,..., p
yjkh

+ P h + a i(h)

+k(h)

^ ijkh

fc = 1, 2,..., p
h = 1, 2,..., n

168

4-20.
4-21.
4-22.

CAPTULO 4

BLOQUES ALEATORIZADOS, CUADRADOS LATINOS Y DISEOS RELACIONADOS

d o n d e yijU es la observacin del tratam ien to ; en el rengln i y la colum na k del cuadrado /-simo. Observe
que a m y klh) son los efectos del rengln y la colum na en el cuadrado A-simo, p h es el efecto del cuadrado
h- simo y (tp)h es la interaccin entre los tratam ientos y los cuadrados.
a) Establecer las ecuaciones norm ales p ara este m odelo y resolverlas p ara las estimaciones de los p arm e
tros del m odelo. Suponga que las condiciones auxiliares apropiadas de los parm etros son 2,hp h = 0,
2 , ,</,) = 0 y 2 k k(h) = 0 p ara cada h,
= 0, ^(p)h = 0 p ara cada h y Z*(p)jh = 0 p ara cada j.
b) D esarrollar la tabla del anlisis de varianza p ara este diseo.
C om entar la form a en que pueden utilizarse las curvas de operacin caracterstica del apndice con el diseo
del cuadrado latino.
Suponga que en el problem a 4-14 los datos tom ados en el da 5 se analizaron incorrectam ente y fue necesario
descartarlos. D esarrollar un anlisis apropiado p ara los datos restantes.
El rendim iento de un proceso qumico se midi utilizando cinco lotes de m ateria prim a, cinco concentracio
nes del cido, cinco tiem pos de procesam iento (A, B, C, D y E) y cinco concentraciones del catalizador (a, ,
y, <5, f ). Se us el cuadrado grecolatino siguiente. A nalizar los datos de este experim ento (utilizar a = 0.05) y
sacar conclusiones.

Concentracin del cido

4-23.

L ote

1
2
3
4
5

A a 26
By = 18

B 16
C = 21
Da = 12
Ey = 15

Cf = 20

D = 15
E = 10

A e = 24

1
2
3
4

4-25.
4-26.

4-27.

D = 16
Ea = 11
Ay = 25
B e = 14

= 19
= 18
= 16
22
= 17

c = n

Es
A
B
Ca
Dy

= 13
21
13

=
=
=
=

11
14

Suponga que en el problem a 4-15 el ingeniero sospecha que los sitios de trabajo usados p o r los cuatro op era
dores pueden representar una fuente adicional de variacin. E s posible introducir u n cuarto factor, el sitio de
trabajo (a, ,y , ) ,y realizar otro experimento, de donde resulta el cuadrado grecolatino siguiente. A nalizar
los datos de este experim ento (utilizar a = 0.05) y sacar conclusiones.

O perador

O rden de
ensamblaje

4-24.

Cy
De
E
A
Ba

C
Ba
A
Dy

= 11
= 8
= 9
= 9

By = 10
C = 12
Da = 11
A = 8

D Ay =
B =
Ca =

4
14
10
7
18

Aa
D
Cy
B

8
= 12
= 15
= 6

C onstruir un hipercuadrado 5 x 5 p ara estudiar los efectos de cinco factores. D esarrollar la tabla del anlisis
de varianza p ara este diseo.
Considere los datos de los problem as 4-15 y 4-23. D espus de elim inar las letras griegas del problem a 4-23,
analizar los datos utilizando el m todo desarrollado en el problem a 4-19.
Considere el diseo de bloques aleatorizados con un valor faltante en la tabla 4-7. A nalizar los datos utilizan
do el anlisis exacto del problem a del valor faltante revisado en la seccin 4-1.4. C om parar los resultados con
el anlisis aproxim ado de estos datos que se presenta en la tabla 4-8,
U n ingeniero estudia las caractersticas del rendim iento de com bustible de cinco tipos de aditivos de gasoli
na. E n l~prueba de carretera el ingeniero desea usar los automviles como bloques; sin em bargo, debido a

4-5 PROBLEMAS

169

una restriccin de tiem po, debe utilizar un diseo de bloques incompletos. R ealiza el diseo balanceado con
los cinco bloques siguientes. A nalizar los datos de este experim ento (utilizar a = 0.05) y sacar conclusiones.
Automvil
Aditivo

1
2
3
4
5
4-28.
4-29.

2
4
6
8
10
12
14

4-33.
4-34.
4-35.
4-36.
4-37.
4-38.

14

13
13
12
12

12
10
9

11
12

13
11
10

C onstruir un conjunto de contrastes ortogonales p ara los datos del problem a 4-27. Calcular la sum a de cua
drados p ara cada contraste.
Se estudian siete concentraciones diferentes de m adera dura p ara determ inar su efecto sobre la resistencia
del papel producido. Sin em bargo, en la planta piloto slo pueden hacerse tres corridas de produccin por
da. D ado que los das pueden diferir, el analista utiliza el diseo de bloques incom pletos balanceados que se
m uestra abajo. A nalizar los datos de este experim ento (utilizar a = 0.05) y sacar conclusiones.

Concentracin de
m adera dura (% )

4-30.
4-31.
4-32.

14
12
13
11

2
17
14

Das
1
114
126

117

120
120
137

141

119
117
129

145

134
149
150

120
136

143
118

123
130

127

A nalizar los datos del ejem plo 4-6 utilizando la pru eb a general de significacin de la regresin.
D em ostrar que /c2=1jf / (Xa) es la suma de cuadrados ajustada de los tratam ientos en un BIBD.
U n experim entador quiere com parar cuatro tratam ientos en bloques de dos corridas. E ncontrar u n BIBD
p ara este experim ento con seis bloques.
U n experim entador quiere com parar ocho tratam ientos en bloques de cuatro corridas. E ncontrar un BIBD
con 14 bloques y A = 3.
Realizar el anlisis interbloques del diseo del problem a 4-27.
Realizar el anlisis interbloques del diseo del problem a 4-29.
C om probar que no existe u n BIBD con parm etros a = 8, r 8, k = 4 y b = 16,
D em ostrar que la varianza de los estim adores intrabloques {r,} es k(al) o 2 / (Xa2).
Diseos extendidos de bloques incompletos. O casionalm ente, el tam ao del bloque cum ple con la relacin a < k
< 2a. U n diseo extendido de bloques incompletos consiste en un a sola rplica de cada tratam iento en cada
bloque junto con un diseo de bloques incompletos con k* = k - a. E n el caso balanceado, el diseo de blo
ques incom pletos tendr los parm etros k* = k - a , r* = r - b y A*. D esarrollar el anlisis estadstico. (Suge
rencia: en el diseo extendido de bloques incompletos, se tiene A = 2r - b + A*.)

Introduccin
a los diseos
factoriales

5-1

DEFINICIONES Y PRINCIPIOS BSICOS

E n muchos experim entos interviene el estudio de los efectos de dos o ms factores. En general, los dise
os factoriales son los ms eficientes para este tipo de experimentos. Por diseo factorial se entiende que
en cada ensayo o rplica com pleta del experim ento se investigan todas las combinaciones posibles de los
niveles de los factores. Por ejemplo, si el fa c to r^ tiene a niveles y el factor B tiene b niveles, cada rplica
contiene todas las ab combinaciones de los tratam ientos. Cuando los factores estn incluidos en un dise
o factorial, es comn decir que estn cruzados.
El efecto de un factor se define como el cambio en la respuesta producido por un cambio en el nivel
del factor. Con frecuencia se le llam a efecto principal porque se refiere a los factores de inters prim ario
en el experimento. Por ejemplo, considere el experim ento sencillo de la figura 5-1. Se trata de un experi
m ento factorial de dos factores en el que los dos factores del diseo tienen dos niveles. A estos niveles se
les ha denom inado bajo y alto y se denotan como
y + , respectivam ente. El efecto principal del
factor vi de este diseo de dos niveles puede visualizarse como la diferencia entre la respuesta prom edio
con el nivel bajo de A y la respuesta prom edio con el nivel alto de A . Num ricam ente, esto es
, 40+ 52 20+ 30
A ------------------------ = 21
2
2
Es decir, cuando el fa c to r^ se increm enta del nivel bajo al nivel alto se produce un increm ento de la res
puesta prom edio de 21 unidades. D e m anera similar, el efecto principal de B es
30+ 52 20+40
B = ---------------------- = 1 1
2
2
Cuando los factores tienen ms de dos niveles, es necesario m odificar el procedim iento anterior, ya que
existen otras formas de definir el efecto de un factor. Este punto se estudia con mayor profundidad ms
adelante.
E n algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un
factor no es la misma para todos los niveles de los otros factores. Cuando esto ocurre, existe una interac-

170

5-1 DEFINICIONES Y PRINCIPIOS BSICOS

171

+
(Alto)

(Bajo)

(Alto)

(Bajo)

(Atto)

(Bajo)

Factor A

Factor A

Figura 5-1 Experimento factorial de dos


factores con la respuesta (y) indicada en los
vrtices.

Figura 5-2 Experimento factorial de dos


factores con interaccin.

cin entre los factores. Por ejemplo, considere el experim ento factorial de dos factores que se ilustra en la
figura 5-2. Con el nivel bajo del factor B (o B~), el efecto de A es
A = 5 0 - 2 0 = 30
y con el nivel alto del factor B (o B +), el efecto de A es
A - 1 2 - 4 0 = -2 8
Puesto que el efecto de^4 depende del nivel que se elige para el factor B, se observa que existe una interac
cin entredi y B. La m agnitud del efecto de la interaccin es la diferencia prom edio de estos dos efectos de
A , o A B = (-28 - 30)/2 = -29. Evidentem ente, en este experim ento la interaccin es grande.
Estas ideas pueden ilustrarse grficamente. E n la figura 5-3 se grafican los datos de las respuestas de
la figura 5-1 contra el fa c to r^ para ambos niveles del factor B. Observe que las rectas B ~ y B + son aproxi
m adam ente paralelas, lo cual indica la ausencia de interaccin entre los factores >1 y B. D e m anera simi
lar, en la figura 5-4 se grafican los datos de las respuestas de la figura 5-2. En este caso se observa que las
rectas 5 " y B + no son paralelas. Esto indica una interaccin entre los factores A y B. Grficas como stas
son de gran ayuda para interpretar las interacciones significativas y p ara reportar los resultados al perso
nal sin preparacin estadstica. Sin embargo, no debern utilizarse como la nica tcnica para el anlisis
de datos, ya que su interpretacin es subjetiva y su apariencia con frecuencia es engaosa.

Factor A
Figura 5-3
teraccin.

Experimento factorial sin in

Factor A

Figura 5-4 Experimento factorial con inter


accin.

172

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

E l concepto de interaccin puede ilustrarse de o tra m anera. Suponga que los dos factores del diseo
tratado son cuantitativos (tem peratura, presin, tiem po, etc.). Entonces una representacin con un mo
delo de regresin del experim ento factorial de dos factores podra escribirse como
y = o + A + 2x 2 + 12x 1x 2 + E

donde y es la respuesta, las/S son parm etros cuyos valores deben determ inarse,*! es una variable que re
presenta al factor ^4, x 2es una variable que representa al factor B, y e es un trm ino del error aleatorio. Las
variables y x 2 se definen en una escala codificada de -1 a + 1 (los niveles bajo y alto de A y B), yx-c2 re
presenta la interaccin entre ^ y x2.
Las estimaciones de los parm etros en este m odelo de regresin resultan estar relacionadas con las
estimaciones de los efectos. Para el experim ento ilustrado en la figura 5-1 se encuentra que los efectos
principales de A y B son^4 = 21 y B = 11. Las estimaciones d e xy 2 son la m itad del valor del efecto prin
cipal correspondiente; por lo tanto, l = 21 / 2 = 10.5 y 2 = 1 1 / 2 = 5.5. El efecto de la interaccin de la
figura 5-1 es A S = 1, por lo que el valor del coeficiente de la interaccin en el m odelo de regresin es
l2 = 1 / 2 = 0.5. El parm etro 0 se estim a con el prom edio de las cuatro respuestas, o
0 = (2 0 + 4 0 + 3 0 + 5 2 )/4 = 35.5. Por lo tanto, el m odelo de regresin ajustado es

y = 35. 5 + 10. 5- j

5. 5j e 2 + 0. 5^

a) La superficie de respuesta

6) La grfica de contorno

Figura 5-5 La superficie de respuesta y la grfica de contorno para el mode


lo = 35.5 + lOA-j + 5.5*2-

5-1 DEFINICIONES Y PRINCIPIOS BSICOS

173

Las estimaciones de los parm etros obtenidas de esta m anera para el diseo factorial en el que todos los
factores tienen dos niveles ( - y + ) resultan ser estim aciones de mnim os cuadrados (se abundar sobre el
tem a ms adelante).
El coeficiente de la interaccin ( 12 0.5) es pequeo en com paracin con los coeficientes de los
efectos principales l y 2. L a interpretacin que se har de este hecho es que la interaccin es pequea y
puede ignorarse. Por lo tanto, al elim inar el trm ino O .Sx^ se obtiene el m odelo
y = 35.5+10.5^+5.5*2
E n la figura 5-5 se m uestran las representaciones grficas de este modelo. E n la figura 5-5a se tiene una
grfica del plano de los valores de y generados por las diferentes com binaciones de*! y x 2. A esta grfica
tridimensional se le llam a grfica de superficie de respuesta. En la figura 5-5b se m uestran las lneas de
contorno para las respuestas constantes^ en el plano jcl9jf2- Observe que como la superficie de respuesta es
un plano, la grfica de contorno contiene lneas rectas paralelas.
Suponga ahora que la contribucin de la interaccin en el experim ento no fuera insignificante; es de
cir, que el coeficiente 12no fuera pequeo. En la figura 5-6 se presenta la superficie de respuesta y la gr
fica de contorno del m odelo
y = 35.5+10.5*! +5.5jc2 + 8x^2

a) La superficie de respuesta

*1
b) La grfica de contorno
Figura 5-6 La superfcie de respuesta y la grfica de contomo para el mo
delo = 35.5 + 10.5*! + 5.5*2 + 8*1*2-

174

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

(Se ha hecho que el efecto de la interaccin sea el prom edio de los dos efectos principales.) Observe que
el efecto significativo de la interaccin provoca el torcim iento del plano de la figura 5-6a. Este torci
m iento de la superficie de respuesta produce lneas de contorno curvas para las respuestas constantes en
el plano x 1,x 2, como se m uestra en la figura 5-6b. Por lo tanto, una interaccin es una form a de curvatura
en el m odelo de superficie de respuesta fundam ental del experimento.
El m odelo de superficie de respuesta de un experim ento es de gran im portancia y utilidad. El tem a se
am pliar en la seccin 5-5 y en captulos posteriores.
E n general, cuando una interaccin es grande, los efectos principales correspondientes tienen escaso
significado prctico. E n el experim ento de la figura 5-2, la estim acin del efecto principal deyl sera
,

50+12 20+ 40 ,
-------- 2
=

que es muy pequeo, y se llegara a concluir que no hay ningn efecto debido a A . Sin embargo, cuando se
examinan los efectos de A con niveles diferentes del factor B, se observa que no es ste el caso. El factor^4
tiene un efecto, pero depende del nivel del factor B. Es decir, el conocimiento de la interaccin A S es ms
til que el conocimiento del efecto principal. U na interaccin significativa suele enm ascarar la significa
cin de los efectos principales. Estos puntos se ponen de manifiesto con claridad en la grfica de la inter
accin de la figura 5-4. E n presencia de una interaccin significativa, el experim entador deber por lo
general examinar los niveles de uno de los factores, por ejemplo del factor A , m anteniendo fijos los nive
les de los otros factores para sacar conclusiones acerca del efecto principal d e

5-2

LA VENTAJA DE LOS DISEOS FACTORIALES

Es sencillo ilustrar la ventaja de los diseos factoriales. Suponga que se tienen dos factores A y B, cada
uno con dos niveles. Los niveles de los factores se denotan p o rA ~ ,A +, B y B +. Podra obtenerse inform a
cin acerca de ambos factores hacindolos variar uno a la vez, como se m uestra en la figura 5-7. El efecto
de cambiar el factor A est dado por A +B~-A~B~, y el efecto de cambiar el factor i est dado por A~B+
A~B~. D ebido a que est presente el error experimental, es deseable realizar dos observaciones, por ejem
plo, p ara cada com binacin de tratam ientos y estim ar los efectos de los factores utilizando las respuestas
prom edio. Por lo tanto, se necesita un total de seis observaciones.
Si se hubiera efectuado un experim ento factorial, se habra registrado una com binacin adicional
de los tratam ientos, A +B +. A hora, utilizando slo cuatro observaciones, pueden hacerse dos estim acio
nes del efecto d e A : A +B ~ -A 'B ~ y A +B +- A B +. D e m anera similar, pueden hacerse dos estim aciones del

Factor A

Figura 5-7

Experimento con un factor a la vez.

5-3 DISEO FACTORIAL DE DOS FACTORES

175

Figura 5-8 Eficiencia relativa de un diseo factorial con


respecto a un experimento de un factor a la vez (dos niveles
del factor).

efecto de B. Estas dos estimaciones de cada efecto principal podran prom ediarse para producir efectos
principales prom edio que tienen la misma precisin que las estim aciones del experim ento con un solo
factor, pero slo se requieren cuatro observaciones en total, y nosotros diram os que la eficiencia relati
va del diseo factorial con respecto al experim ento de un factor a la vez es de (6/4) = 1.5. E n general,
esta eficiencia relativa aum entar conform e se increm ente el nm ero de factores, com o se m uestra en
la figura 5-8.
Suponga ahora que est presente una interaccin. Si el diseo de un factor a la vez indicara que A~B+
y A +B ~dieron mejores respuestas que^l , una conclusin lgica sera que^4+ + sera todava mejor. Sin
embargo, si est presente una interaccin, esta conclusin puede ser una equivocacin grave. Para un
ejemplo, referirse al experim ento de la figura 5-2.
E n resumen, observe que los diseos factoriales ofrecen varias ventajas. Son ms eficientes que los
experim entos de un factor a la vez. Adems, un diseo factorial es necesario cuando puede haber interac
ciones presentes a fin de evitar llegar a conclusiones incorrectas. Por ltimo, los diseos factoriales perm i
ten la estimacin de los efectos de un factor con varios niveles de los factores restantes, produciendo
conclusiones que son vlidas para un rango de condiciones experimentales.

5-3
5-3.1

DISEO FACTORIAL DE DOS FACTORES


Un ejemplo

Los tipos ms simples de diseos factoriales incluyen nicam ente dos factores o conjuntos de tratam ien
tos. Hay a niveles del factor A y b niveles del factor B, los cuales se disponen en un diseo factorial; es de
cir, cada rplica del experim ento contiene todas las ab combinaciones de los tratam ientos. E n general,
hay n rplicas.
Como ejemplo de un diseo factorial en el que intervienen dos factores, un ingeniero est diseando
una batera que se usar en un dispositivo que se som eter a variaciones de tem peratura extremas. E l ni
co parm etro del diseo que puede seleccionar en este punto es el m aterial de la placa o nodo de la bate
ra, y tiene tres elecciones posibles. Cuando el dispositivo est fabricado y se enve al campo, el ingeniero
no tendr control sobre las tem peraturas extremas en las que operar el dispositivo, pero sabe por expe-

176

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 5-1

Tipo de
material
1
2
3

Datos de la vida (en horas) para el ejemplo del diseo de la batera

Tfemperatura (F)
15
130
74
150
159
138
168

70
155
180
188
126
110
160

34
80
136
106
174
150

125
40
75
122
115
120
139

20
82
25
58
96
82

70
58
70
45
104
60

rie n d a que la tem peratura probablem ente afectar la vida efectiva de la batera. Sin embargo, la tem pe
ratura puede controlarse en el laboratorio donde se desarrolla el producto para fines de prueba.
El ingeniero decide probar los tres m ateriales de la placa con tres niveles de tem p eratu ra15,70 y
125F, ya que estos niveles de tem peratura son consistentes con el m edio am biente donde se usar final
m ente el producto. Se prueban cuatro bateras con cada combinacin del m aterial de la placa y la tem pe
ratura, y las 36 pruebas se corren de m anera aleatoria. E n la tabla 5-1 se presentan los datos del
experim ento y de la vida observada de la batera.
E n este problem a, el ingeniero quiere responder las preguntas siguientes:
1.
2.

Q u efectos tienen el tipo de m aterial y la tem peratura sobre la vida de la batera?


Existe alguna eleccin del m aterial que produzca de manera regular una vida larga de la batera
independientemente de la temperatura?

L a segunda pregunta es de particular im portancia. Quiz sea posible encontrar una alternativa del m ate
rial que no resulte afectada considerablem ente por la tem peratura. D e ser ste el caso, el ingeniero puede
hacer que la batera sea robusta para la variacin de la tem peratura en el campo. Se trata de un ejemplo
de la aplicacin del diseo experim ental estadstico en el diseo de productos robustos, un problem a de
ingeniera muy im portante.
E l anterior es un ejemplo especfico del caso general de un diseo factorial de dos factores. Para p a
sar al caso general, sea y ^ la respuesta observada cuando el factor A tiene el nivel i-simo (i = 1,2,..., a) y
el factor B tiene el nively-simo (j = 1,2,..., b) en la rplica -sima (k = 1 ,2 ,..., n). E n general, el experi
m ento factorial de dos factores aparecer como en la tabla 5-2. El orden en que se hacen las abn observa
ciones se selecciona al azar, por lo que este diseo es un diseo com pletam ente aleatorizado.

Tabla 5-2

Arreglo general de un diseo factorial de dos factores

Factor B
1
Factor vi

ym , ym ,
,yu
y n u y 212,
,y2 1*

y 121>y 122,

yM,yii2,

ya21>ya22,

y a b l, yab2,

" ',y a l n

,ya2n

**) X itn

y ib i,y ib 2 ,

,yi2n

' , y 1 bn

y 221, y 222,

y ^ b i, y2b2j

y22n

mm,y2 b n

5-3 DISEO FACTORIAL DE DOS FACTORES

177

Las observaciones de un experim ento factorial pueden describirse con un modelo. Hay varias formas
de escribir el m odelo de un experim ento factorial. El modelo de los efectos es
t = l,
y =

+*i +j H rf)a + *

j = \

a
2, - b

i 5 - 1)

k = 1, 2,..., n
donde (i es el efecto prom edio global, r, es el efecto del nivel /'-esimo del factors! de los renglones, j es el
efecto del nivel j- simo del factor B de las columnas, (r)^ es el efecto de la interaccin entre r, y jf y ijk es
un com ponente del error aleatorio. Se supone que ambos factores son fyos, y los efectos de los tratam ien
tos se definen como las desviaciones de la media global, por lo que
= Oy
= 0. D e m anera si
milar, los efectos de las interacciones son fijos y se definen de tal m odo que
~ 2*=1(r/3). = 0.
Puesto que hay n rplicas del experim ento, hay abn observaciones en total.
O tro m odelo posible de un experim ento factorial es el modelo de las medias
i = 1, 2,..., a
y ijk = H ii+ ak

j = i , 2, . . . , b

k = 1, 2,..., n
donde la m edia de la celda -sim a es
= t * + * i + 1 + ( . * ) ij

Tambin podra usarse un modelo de regresin como en la seccin 5-1. Los modelos de regresin resultan
particularm ente tiles cuando uno o ms de los factores del experim ento son cuantitativos. E n la mayor
p arte de este captulo se usar el m odelo de los efectos (ecuacin 5-1) con referencia al m odelo de regre
sin en la seccin 5-5.
E n el diseo factorial de dos factores, los factore's (o tratam ientos) de los renglones y las colum nas,/!
y B, son de igual inters. Especficam ente, el inters se encuentra en probar hiptesis acerca de la igual
dad de los efectos de los tratam ientos de los renglones, por ejemplo,
tf o : r i = r 2 = - = t , 0
H l : al menos una r, * 0

^5_2aj

y de la igualdad de los efectos de los tratam ientos de las columnas, por ejemplo,
H o'-i = i = - = t = 0
H 1: al m enos una j * 0

(5-2b)

Tkmbin existe inters en determ inar si los tratam ientos de los renglones y las columnas interactan. Por
lo tanto, tam bin querra probarse
H o: (*/?) = 0

para todas las i, j

H^. al menos una (t)^ * 0


A continuacin se indica cmo se prueban estas hiptesis utilizando un anlisis de varianza de dos factores.

5*3.2

Anlisis estadstico del modelo con efectos fijos

Sea que y, denote el total de observaciones bajo el nivel i-simo del factor A , que y denote el total de
observaciones bajo el nivel j- simo del factor B, que
denote el total de observaciones de la celda

178

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

/-sima, y que y denote el gran to tal de todas las observaciones. Se definen^.., ^q. y y... como los p ro
m edios correspondientes de los renglones, las colum nas, las celdas y el gran prom edio. Expresado m a
tem ticam ente,
= ir
bn

y L

* = 1 , 2 ,..., a

(5-3)

La sum a de cuadrados total corregida puede escribirse como

=1S7=1

k= l

(>V-

_ y... )2= 2 E =1

K a .

x.

) + ( y . j . - y... )

/= ! j= l k

+ ( y i j - y L - . j + y . . ) + ( y iik- h ) T
a

(5-4)
a

+"22 ( > v y . , ) '


=1

j=i

i= l j =1 k= l

ya que los seis productos cruzados del lado derecho de la igualdad son cero. Observe que se ha hecho la
particin de la suma de cuadrados total en una suma de cuadrados debida a los renglones, o factor vi
(SS*); una suma de cuadrados debida a las colum nas, o factor B (SSB); u na sum a de cuadrados debida a
la interaccin e n t r e r y B (SSAB); y una suma de cuadrados debida al error (SSE). Por el ltim o com ponen
te del lado derecho de la igualdad de la ecuacin 5-4, se observa que debe haber por lo m enos dos rplicas
(n > 2) para obtener una suma de cuadrados del error.
La ecuacin 5-4 puede escribirse simblicamente como
SST = S S A + S S B + 5 5 ^ + SSE
El nm ero de grados de libertad asociado con cada suma de cuadrados es

Efecto

G rados de libertad

a -l
b -1
(a -l)(b -l)
ab(n -1 )
abn -1

Interaccin vlB
E rror
Tbtal

(5-5)

5-3 DISEO FACTORIAL DE DOS FACTORES

179

E sta asignacin de los abn - 1 grados de libertad totales a las sumas de cuadrados puede justificarse de la
siguiente m anera: los efectos principales/! y B tienen a y b niveles, respectivam ente; por lo tanto, tienen a
- 1 y b - 1 grados de libertad, como se indica. Los grados de libertad de la interaccin son slo el nm ero
de grados de libertad de las celdas (que es ab - 1 ) m enos el nm ero de grados de libertad de los dos efec
tos p rin cip ales^ y B; es decir, ab - 1 - (a - 1 ) - (b - 1 ) = (a - 1 )(b - 1 ) . D entro de cada una de las ab celdas
hay - 1 grados de libertad entre las n rplicas; p or lo tanto hay ab(n - 1 ) grados de libertad para el error.
Observe que la suma del nm ero de grados de libertad en el lado derecho de la ecuacin 5-5 es igual al n
m ero total de grados de libertad.
C ada sum a de cuadrados dividida por sus grados de libertad es un cuadrado medio. Los valores espe
rados de los cuadrados m edios son

E (M S a ) = E\

bn2 r f
= a 1 +
a -lj
a 1
b

anV 1

E (M S m ) = E

SS,

2 , 1-1 ;'=1
= o +(a -l)(b -l)

Observe que si es verdadera la hiptesis nula de que no hay efectos de los tratam ientos de los renglones,
ni de los tratam ientos de las columnas, ni interaccin, entonces MSA, MSB, MSg y MSE son todas estim a
ciones de o2. Sin embargo, si hay diferencias entre los efectos de los tratam ientos de los renglones, por
ejemplo, entonces MSA ser mayor que MSE. D e m anera similar, si estn presentes efectos de los trata
m ientos de las columnas o de la interaccin, entonces los cuadrados medios correspondientes sern m a
yores que MSe. Por lo tanto, p ara probar la significacin de los dos efectos principales y su interaccin,
sim plemente se divide el cuadrado m edio correspondiente por el cuadrado m edio del error. Los valores
grandes de este cociente implican que los datos no apoyan la hiptesis nula.
Si se supone que el m odelo (ecuacin 5-1) es adecuado y que los trm inos del error E ijk tienen una dis
tribucin norm al e independiente con varianza a2 constante, entonces cada uno de los cocientes de cua
drados m edios MSA/MSE, MSgMSE y MSABIMSE se distribuyen como F con a - 1, b - 1 y (a - 1)(b - 1)
grados de libertad en el num erador, respectivam ente, y ab(n - 1 ) grados de libertad en el denom inador,1y
la regin crtica sera la cola superior de la d istribucin/1. El procedim iento de prueba suele resumirse en
una tabla del anlisis de varianza, como se m uestra en la tabla 5-3.
E n lo que a los clculos se refiere, por lo general se em plea un paquete de software de estadstica para
realizar el anlisis de varianza. Sin embargo, no es complicado obtener frmulas para calcular m anual1 La prueba F puede considerarse como una aproximacin de una prueba de aleatorizacin, como se seal anteriormente.

180

CAPTULO 5

Tabla 5-3

La tabla del anlisis de varianza para el diseo factorial de dos factores, modelo con efectos fijos

Fuente de
variacin

Tratamientos B

Suma de
cuadrados

G rados de
libertad

ssA

o -l

SSB
SSjW

C uadrado medio
1*0
1!
co
si

T ratam ientos^

Interaccin

INTRODUCCIN A LOS DISEOS FACTORIALES

b -1
(a -l)(b -)

m se

MS =
B b -1

MSe

MS,>
MSe

m s ab

II

Tbtal

ssr

SSab
(a l)(b 1)

**3
O?
to

ab(n 1)

SSE

F - MS*

a -l

AB

E rror

F0

a b ( n - 1)

abn 1

m ente las sumas de cuadrados de la ecuacin 5-5. La suma de cuadrados total se calcula como de costum
bre con
,=1 ;=1 *=1

UUn

Las sumas de cuadrados de los efectos principales son


SSA = ~ Y y 2 ~
bn abn

(5-7)

SSB = ~ S
an

(5-8)

^ - 4 abn

Es conveniente obtener S S ^ en dos pasos. Se calcula prim ero la suma de cuadrados entre los totales de
las ab celdas, a la que se denom ina la suma de cuadrados debida a los subtotales:
smoaes

1 x*^ ^
yijr
n 1=1 j-ii

y*
abn

E sta suma de cuadrados tam bin contiene a SSA y SSB. Por lo tanto, el segundo paso consiste en calcular
SSM como
SS AB= S S S M c s - S S A - S S B
(5-9)
Puede calcularse SSE p o r sustraccin como
SSE = SST - S S AB - SSA - SSB
(5-10)
o
SSE = SST 5 5 Subtotales

EJEMPLO 5 - 1 ....................................................................................................................................
El experimento del diseo de la batera
E n la tabla 5-4 se presenta la vida efectiva (en horas) observada en el ejem plo del diseo de la batera que
se describi en la seccin 5-3.1. Los totales de los renglones y las columnas se indican en los m rgenes de
la tabla y los nm eros encerrados en un crculo son los totales de las celdas.

5-3 DISEO FACTORIAL DE DOS FACTORES

Tabla 5-4
Tipo de

Datos de la vida (en horas) del experimento del diseo de la batera


_________________________________ Tem peratura (F)

m aterial
1
2
3

181

70_________________________125______________________ y^_

15
130
74
150
159
138
168

155
180
188
126
110
160

lis

1738

20
82
25
58
96
82

70
58
70
45
104
60

1291

@ )

770

998
1300
1501
3799 = x .

Las sumas de cuadrados se calculan de la siguiente m anera:


a

i ,

i* ! 7=1

2k
ibn
abn

k=l,

(3 7 9 9 )2

= (130)2 + (1 5 5 )2 + (7 4 )2 + ... + (6 0 )2 - v~ _ ' '


36

=77,646.97

1 a

Men^

_ y v2 _ J L _
b n Z *
abn
^ I _ [ ( 9 9 8 ) 2 + (1 3 0 0 )2 + (1 5 0 1 )2 ] - ^ | ^

j-

= 10,683.72

2^ ^ 2
(3T99)2
= ^ ^ [ ( 1 7 3 8 ) 2 +(1291) +(770) ] 3 ^ = 39,118.72

1 a b

OC

- .Y Y

Interaccin

2 . y... _ r n
-

ft fo fl

_ C
Material

Temperatura

= -^[(539 ) 2 + (229)2 + + (3 4 2 )2] - ^ ^ 10,68372


-39,118.72= 9613.78
y

SSE = SST 5 5 Materia ^ T e m p e ra tu ra

^ In te ra c c i n

= 77,646.97-10,683.72 - 39,118.72 - 9613.78= 18,230.75


E n la tabla 5-5 se m uestra el anlisis de varianza. Puesto que .F0 05 4_27 = 2.73, se concluye que hay una in
teraccin significativa entre los tipos del m aterial y la tem peratura. Adems, F005 2 27 = 3.35, por lo que los
efectos principales del tipo de m aterial y la tem peratura tam bin son significativos. En la tabla 5-5 tam
bin se m uestran los valores P para los estadsticos de la prueba.
Como ayuda para interpretar los resultados de este experim ento, es conveniente construir una grfi
ca de las respuestas prom edio para cada combinacin de los tratam ientos. E sta grfica se m uestra en la fi
gura 5-9. E l hecho de que las rectas no sean paralelas indica que la interaccin es significativa. E n general,
se consigue una vida m s larga con una tem peratura baja, independientem ente del tipo de m aterial. Al
cam biar de una tem peratura baja a una interm edia, la vida de la batera con el m aterial tipo 3 tiene un in-

182
Tabla 5-5

CAPTULOS

INTRODUCCIN A LOS DISEOS FACTORIALES

Anlisis de varianza de los datos de la vida de la batera

Fuente de
variacin
Tipos de material
Tfemperatura
Interaccin
Error
Total

Suma de
cuadrados
10,683.72
39,118.72
9,613.78
18,230.75
77,646.97

Grados de
libertad
2
2
4
27
35

Cuadrado
medio
5,341.86
19,559.36
2,403.44
675.21

Fo
7.91
28.97
3.56

Valor P
0.0020
0.0001
0.0186

cremento real, m ientras que con los m ateriales tipos 1 y 2 disminuye. Con una tem peratura de interm edia
a alta, la vida de la batera disminuye p ara los m ateriales tipos 2 y 3 y se m antiene en esencia sin cambio
p ara el m aterial tipo 1. El m aterial tipo 3 parece producir los m ejores resultados si se quiere una prdida
m enor de la vida efectiva cuando la tem peratura cambia.

Comparaciones mltiples
Cuando el anlisis de varianza indica que las m edias de los renglones o las columnas difieren, por lo gene
ral es de inters hacer com paraciones entre las medias individuales de los renglones o las columnas para
descubrir diferencias especficas. Los m todos de com paraciones mltiples revisados en el captulo 3 son
tiles a este' respecto.
Se ilustra ahora el uso de la prueba de Tkey con los datos de la vida de la batera del ejem plo 5-1.
Observe que en este experim ento, la interaccin es significativa. Cuando la interaccin es significativa, las
com paraciones entre las m edias de uno de los factores (por ejem plo,.<4) pueden ser oscurecidas por la in
teraccin AB. U n a form a de abordar esta cuestin consiste en fijar el factor B en un nivel especfico y apli
car la prueba de Tkey a las m edias del factor/1 con ese nivel. Para ilustrar, suponga que en el ejem plo 5-1
el inters se encuentra en detectar las diferencias entre las m edias de los tres tipos de m aterial. Puesto
que la interaccin es significativa, esta com paracin se hace con un solo nivel de la tem peratura, por
ejem plo el nivel 2 (70F). Se supone que la m ejor estim acin de la varianza del erro r es M SE de la tabla del
anlisis de varianza, utilizando el supuesto de que la varianza del erro r experim ental es la misma p ara to
das las com binaciones de tratam ientos.

Figura 5-9
plo 5-1.

Grfica tipo de material-temperatura para el ejem

5-3 DISEO FACTORIAL DE DOS FACTORES

183

Los prom edios de los tres tipos de m aterial a 70F dispuestos en orden ascendente son
12 = 57.25
y n = 119.75
y n = 145.75

(m aterial tipo 1)
(m aterial tipo 2)
(m aterial tipo 3)

y
^0.0j = Qo.os (3> 2 7 )^
=

~~

167521
4

= 4547
donde <?00s(3,27) = 3.50 se obtiene por interpolacin en la tabla V III del apndice. Las com paraciones por
pares dan como resultado
3 vs. 1:
3 vs. 2:
2 vs. 1:

145.75 - 57.25 = 88.50 > Toos = 45.47


145.75 - 119.75 = 26.00 < r 005 = 45.47
119.75 - 57.25 = 62.50 > T0t05 = 45.47

E ste anlisis indica que con el nivel de tem p eratu ra de 70F, la vida m edia de la b atera es la m ism a
p a ra los m ateriales tipos 2 y 3, y que la vida m edia de la b atera p a ra el m aterial tipo 1 es significativa
m en te m enor.
Si la interaccin es significativa, el experim entador podra com parar las m edias de todas las ab celdas
p ara determ inar cules difieren significativamente. En este anlisis, las diferencias entre las m edias de las
celdas incluyen los efectos de la interaccin, as com o ambos efectos principales. E n el ejem plo 5-1, esto
dara 36 com paraciones entre todos los pares posibles de las nueve m edias de las celdas.

Salida de computadora
E n la figura 5-10 se presenta la salida de com putadora de Design-Expert para los datos de la vida de la b a
tera del ejem plo 5-1. Observe que
M odelo

^ M a te ria l

Tem peratura + ^ ^ I n te r a c c i n

= 10,683172+39,118.72+9613.78
= 59,416.22
y que
r

2 _ Moa _ 59,416.22 = 0.7652


SSTottJ
77,646.97

E s decir, cerca de 77% de la variabilidad de la vida de la batera es explicada p o r el m aterial de la placa de


la batera, la tem peratura y la interaccin entre el tipo de m aterial y la tem peratura. E n la salida de com
putadora se m uestran tam bin los residuales del m odelo ajustado. A continuacin se indica cmo usar es
tos residuales p ara verificar la adecuacin del modelo.

184

CAPTULO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

Response: Life
in hours
ANOVA for Selected Factorial Model
Analysis of variance table [Partial sum of squares]
Mean
Sum of
Squares
DF
Square
Source

F
Value

7427.03

10683.72

5341.86

7.91

0.0020

39118.72

19559.36

28.97

<0.0001

A B

9613.78

2403.44

3.56

0.0186

18230.75

27

675.21

Residual
L a c k o f F it

0.000

P u r e Error

18230.75

27

Cor Total

77646.97

35

Std. Dev.
Mean
C.V.
PRESS

25.98
105.53
24.62
32410.22

Diagnostics Case tatistics


Standard Actual Predicted
Value
Order
Value

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

Figura 5-10

130.00
74.00
155.00
180.00
150.00
159.00
188.00
126.00
138.00
168.00
110.00
160.00
34.00
80.00
40.00
75.00
136.00
106.00
122.00
115.00
174.00
150.00
120.00
139.00
20.00
82.00
70.00
58.00
25.00
58.00
70.00
45.00
96.00
82.00
104.00
60.00

134.75
134.75
134.75
134.75
155.75
155.75
155,75
155.75
144.00
144.00
144.00
144.00
57.25
57.25
57.25
57.25
119.75
119.75
119.75
119.75
145.75
145.75
145.75
145.75
57.50
57.50
57.50
57.50
49.50
49.50
49.50
49.50
85.50
85.50
85.50
85.50

11.00

Prob F

59416.22

Model

<0.0001

significant

675.21

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision

Residual

4.75
-60.75
20.25
45.25
-5.75
3.25
32.25
-29.75
-6.00
24.00
-34.00
16.00
-23.25
22.75
-17.25
17.75
16.25
-13.75
2.25
-4.75
28.25
4.25
-25.75
-6.75
-37.50
24.50
12.50
0.50
-24.50
8.50
20.50
-4.5C
10.50
-3.50
18.50
-25.50

Leverage

0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250
0.250

Salida de Design-Expert para el ejemplo 5-1.

0.7652
0.6956
0.5826
8.178
Student
Residual

-0.211
-2.700
0.900
2.011
-0.256
0.144
1.433
-1.322
-0.267
1.066
-1.511
0.711
-1.033
1.011
-0.767
0.789
0.722
-0.611
0.100
-0.211
1.255
0.189
-1.144
-0.300
-1.666
1.089
0.555
0.022
-1.089
0.378
0.911
-0.200
0.467
-0.156
0.822
-1.133

Cook's
Distance

0.002
0.270
0.030
0.150
0.002
0.001
0.076
0.065
0.003
0.042
0.085
0.019
0.040
0.038
0.022
0.023
0.019
0.014
0.000
0.002
0.058
0.001
0.048
0.003
0.103
0.044
0.011
0.000
0.044
0.005
0.031
0.001
0.008
0.001
0.025
0.048

Outlier
t

-0.207
-3.100
0.897
2.140
-0.251
0.142
1.463
-1.341
-0.262
1.069
-1.550
0.704
-1.035
1.011
-0.761
0.783
0.716
-0.604
0.098
-0.207
1.269
0.185
-1.151
-0.295
-1.726
1.093
0.548
0.022
-1.093
0.372
0.908
-0.196
0.460
-0.153
0.817
-1.139

5-3 DISEO FACTORIAL DE DOS FACTORES

5-3.3

185

Verificacin de la adecuacin del modelo

A ntes de adoptar las conclusiones del anlisis de varianza, deber verificarse la adecuacin del m odelo
fundam ental. Como anteriorm ente, la herram ienta prim aria de diagnstico es el anlisis residual. Los
residuales del m odelo factorial de dos factores son
eik= yik ~ yjk

( 5 'i i )

y puesto que el valor ajustado yjk = y (el prom edio de las observaciones de la celda ij-sima), la ecua
cin 5-11 queda como
eiJk = y,Jk - y i,

(5 - 1 2 )

E n la salida de com putadora de Design-Expert (figura 5-10) y en la tabla 5-6 se m uestran los residuales
de los datos de la vida de la b atera del ejem plo 5-1. L a grfica de probabilidad norm al de estos residua
les (figura 5-11) no revela nada particularm ente problem tico, aun cuando el residual negativo ms gran
de (-60.75 con 15F para el m aterial tipo 1) se aparta un poco de los dems. El valor estandarizado de este
residual es -60.75/V675.21 = -2.34, y es el nico residual cuyo valor absoluto es mayor que 2.
E n la figura 5-12 se grafican los residuales contra los valores ajustados y ijk. E sta grfica indica una li
gera tendencia de la varianza de los residuales a increm entarse cuando la vida de la batera se increm enta.
E n las figuras 5-13 y 5-14 se grafican los residuales contra los tipos del m aterial y la tem peratura, respecti
vam ente. Am bas grficas indican una ligera desigualdad de la varianza, con la com binacin del trata
m iento 15F y m aterial tipo 1, teniendo posiblem ente una varianza mayor que las dems.
E n la tabla 5-6 se observa que la celda 15F-material tipo 1 contiene los dos residuales extremos
(-60.75 y 45.25). Estos dos residuales son los principales responsables de la desigualdad de la varianza de
tectada en las figuras 5-12 a 5-14. Al examinarse nuevam ente los datos no se observa ningn problem a ob
vio, tal como un error al registrar los datos, por lo que estas respuestas se aceptan como legtimas. Es
posible que esta com binacin de tratam ientos particular produzca una vida de la batera ligeram ente ms
errtica que las dems. Sin embargo, el problem a no es lo suficientem ente grave como p ara tener un im
pacto dram tico en el anlisis y las conclusiones.

5-3.4

Estimacin de los parmetros del modelo

Los parm etros del m odelo de los efectos para el diseo factorial de dos factores
y>jk

la b ia 5-6
Tipo de
m aterial
1
2
3

+ j + (j ) t + Ern

(513)

Residuales del ejemplo 5-1___________________________________________________________ __


__________________________________ Tem peratura (F)_________________________
15
70
125
-4.75
-60.75
-5.75
3.25
-6.00
24.00

20.25
45.25
32.25
-29.75
-34.00
16.00

-23.25
22.75
16.25
-13.75
28.25
4.25

-17.25
17.75
2.25
-4.75
-25.75
-6.75

-37.50
24.50
-24.50
8.50
10.50
-3.50

12.50
0.50
20.50
-4.50
18.50
-25.50

186

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Residual

Figura 5-11 Grfica de probabilidad normal de los residuales del ejemplo 5-1.

pueden estimarse por mnimos cuadrados. Puesto que el modelo tiene 1 + a + ab parmetros que deben
estimarse, hay 1 + a + b + ab ecuaciones normales. Al utilizar el mtodo de la seccin 3-9, no es difcil de
mostrar que las ecuaciones normales son
a

i= l

j= l

(# ) ,- * .

/i'.abnft + b n ^ + a n ^ .
i= 1 ;'=1

(5-14a)

5-3 DISEO FACTORIAL DE D O S FACTORES

187

60
40
20

J o

R_________

*2

__________

-20

*3
Tipo de material

-40
-60
-80
Figura 5-13 Grfica de los residuales contra el tipo de mate
rial para el ejemplo 5-1.

b
x :bnfi+bn +/2) @
i -1

j .a n j i + n ^

O a

= X..

= 1,2,...,a

(5-14b)

= y;

j= ,2 ,...,b

(5-14c)

i =i

f, -t-an/S,
/-i
A

(r/3):n /i+ n e , + 0 , + 0 0 )* =

i = 1 ,2 ,..., a
; = 1 ,2 ,...,b

(5-14d)

Por conveniencia, el parm etro que corresponde a cada ecuacin norm al se indica a la izquierda de las
ecuaciones 5-14.
60r
40

20r
.* o

i ________ i
*15

7 0
*

*125
Temperatura (F)

-20

-40
-60

F igura 5-14 G rfica d e lo s residuales contra la tem peratura


para el ejem plo 5-1.

188

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

El m odelo de los efectos (ecuacin 5-13) est sobreparam etrizado. Observe que la suma de las a
ecuaciones de la ecuacin 5-14b es igual a la ecuacin 5-14ay que la suma de las b ecuaciones de la ecua
cin 5-14c es igual a la ecuacin 5-14a. Asimismo, la operacin sum a de la ecuacin 5-14d sobre j p ara una
i particular dar la ecuacin 5-14b, y la operacin sum a de la ecuacin 5-14d sobre i p ara una j particular
dar la ecuacin 5-14c. Por lo tanto, haya + b + 1 dependencias lineales en este sistema de ecuaciones y
no existir ninguna solucin nica. A fin de obtener una solucin, se im ponen las restricciones
= 0

(5-15a)

i = 0

(5-15b)

i=l

2
i=i

( i) #= 0

j = l,2 ,...,b

(5-15C)

( ) r

= 1 ,2 ,..., a

(5-15d)

Las ecuaciones 5-15a y 5-15b constituyen dos restricciones, m ientras que las ecuaciones 5-15c y 5-15d for
m an a + b - 1 restricciones independientes. Por lo tanto, se tienen en total a + b + 1 restricciones, el n
m ero que se requiere.
Al aplicar estas restricciones, las ecuaciones norm ales (ecuaciones 5-14) se simplifican considerable
m ente, y se obtiene la solucin
f i=

y...

i- i..-y ...

i = 1 ,2 ,..., a

j = y .j.- y .. .

J = 1 ,2 ,..., b

00)# =

_ (i = 1,2,..., a

y v. - y,.. - y.. + y_ 7- = 1; 2 ,...,

(5 - 1 6 )

Observe el gran atractivo intuitivo de esta solucin de las ecuaciones norm ales. Los efectos de los trata
m ientos de los renglones se estim an con el prom edio del rengln m enos el gran prom edio; los tratam ien
tos de las columnas se estim an con el prom edio de la colum na m enos el gran prom edio, y la interaccin
ij- sima se estima con el prom edio de la celda 27-sima m enos el gran prom edio, el efecto del rengln i-sim o y el efecto de la colum na /-sim a.
Al utilizar la ecuacin 5-16, el valor ^justado yijk puede encontrarse como
y 9k = + i i + j H T)i i

= x . .+ ( , ._ - x .. ) + ( ^ .- . .)
H yij.-yL-y.j.+y.)

=h
Es decir, la observacin fc-sima de la celda ij'-sima se estim a con el prom edio de las n observaciones de
esa celda. E ste resultado se us en la ecuacin 5-12 para obtener los residuales del m odelo factorial de
dos factores.
Puesto que se han usado restricciones (ecuaciones 5-15) para resolver las ecuaciones norm ales, los
parm etros del m odelo no tienen estim aciones nicas. Sin em bargo, ciertas funciones im portantes de
los parm etros del m odelo son estimables, es decir, tienen una estim acin nica independientem ente de
las restricciones elegidas. U n ejem plo es r , - r u + ( t ) L - (r )u , que podra considerarse como la verdade-

189

5-3 DISEO FACTORIAL DE DOS FACTORES

ra diferencia entre los niveles /-simo y w-simo del factor Observe que la verdadera diferencia entre
los niveles de cualquier efecto principal incluye un efecto de la interaccin promedio. Es este resultado
el que perturba las pruebas de los efectos principales en presencia de una interaccin, como se seal an
teriormente. En general, cualquier funcin de los parmetros del modelo que sea una combinacin lineal
del miembro izquierdo de las ecuaciones normales es estimable. Esta propiedad tambin se hizo notar en
el captulo 3 cuando se estudi el modelo de un solo factor. Para mayores detalles, ver el material suple
mentario del texto de este captulo.

5-3.5

Eleccin del tamao de la muestra

Para determinar un tamao de la muestra (el nmero de rplicas, n) apropiado en un diseo factorial de
dos factores, el experimentador puede apoyarse en las curvas de operacin caracterstica que aparecen en
la parte V del apndice. En la tabla 5-7 se muestra el valor apropiado del parmetro <&2, as cmo los gra
dos de libertad del numerador y el denominador.
Una forma muy eficaz de emplear estas curvas consiste en encontrar el valor menor de O2 que corres
ponde a una diferencia especificada entre las medias de dos tratamientos cualesquiera. Por ejemplo, si la
diferencia en las medias de dos renglones cualesquiera es D, entonces el valor mnimo de O2 es
nbD 2

<*>2 = ^ r
(5-17)
2aa2
mientras que si la diferencia en las medias de dos columnas cualesquiera es D, entonces el valor mnimo
de <5? es
2 = n a tf
2b a 2

Por ltimo, el valor mnimo de <>2 que corresponde a una diferencia D entre dos efectos de interaccin
cualesquiera es
& s

--------------

(5 .1 9 )

2 u 2[ ( a - l ) ( b - l ) + l )

Para ilustrar el uso de estas ecuaciones, considere los datos de la vida de la batera del ejemplo 5-1.
Suponga que antes de correr el experimento se decide que la hiptesis nula deber rechazarse con una alta

labia 5-7 Parmetros de la curva de operacin caracterstica de la parte V del apndice para el diseo factorial
__________de dos factores, modelo con efectos fijos___________________________________________________
Factor

I2

/i=l
ao2

Grados de libertad
del numerador

Grados de libertad
del denominador

a -1

ab(n -1 )

f>-l

ab(n 1)

(-!)(*>-!)

ab(n - 1 )

ba2

AB

- 1 2 m
i=i j*i
aJ[(-l)(f>-l)+l]

190

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

probabilidad si la diferencia en la vida m edia de la batera entre dos tem peraturas cualesquiera es basta
de 40 horas. P or lo tanto D = 40, y si se supone que la desviacin estndar de la vida de la batera es apro
xim adam ente 25, entonces por la ecuacin 5-18 se obtiene

K 3 )(4 0 )2
2(3)(25)2
= 1.28m
como el valor m nimo de O 2. Suponiendo que a = 0.05, ahora puede usarse la parte V del apndice para
construir la tabla siguiente:
n
2
3
4

<X2
2.56
3.84
5.12

vt = Grados de
libertad del numerador
2
2
2

1.60
1.%
2.26

v2 = Grados de
libertad del error
9
18
27

0.45
0.18
0.06

Observe que con n = 4 rplicas se obtiene un riesgo de cerca de 0.06, o una probabilidad aproxima
da de 94%, de rechazar la hiptesis nula si la diferencia en la vida m edia de la batera con dos niveles de
tem peratura cualesquiera es hasta de 40 horas. Por lo tanto, se concluye que cuatro rplicas bastan para
proporcionar la sensitividad deseada siem pre y cuando la estim acin usada para la desviacin estndar de
la vida de la batera no tenga un erro r grave. E n caso de duda, el experim entador podra repetir el proce
dim iento anterior con otros valores de a para determ inar el efecto que tendra una estim acin equivocada
de este parm etro sobre la sensitividad del diseo.

5-3.6

1 supuesto de no interaccin en un modelo de dos factores

O casionalm ente, un experim entador siente que es apropiado un modelo de dos factores sin interaccin,
p or ejemplo
i = 1,2,..., a
yik =

+j + *

i = 2> >b
= 1 ,2 ,..., ji

(5-20)

Sin embargo, se deber ser muy cuidadoso al hacer caso omiso de los trm inos de interaccin, ya que la
presencia de una interaccin significativa puede ten er un im pacto dram tico sobre la interpretacin de
los datos.
El anlisis estadstico de un m odelo factorial de dos factores sin interaccin es directo. E n la tabla 5-8
se presenta el anlisis de los datos de la vida de la batera del ejem plo 5-1, suponiendo que es vlido el moTabla 5-8

Anlisis de varianza de los datos de la vida de la batera suponiendo que no hay interaccin

Fuente de
variacin

Suma de
cuadrados

Tipos de material
Temperatura
Error
Tbtal

10,683.72
39,118.72
27,844.53
77,646.96

Grados de
libertad
~
2
31
35

Cuadrado
medio

F0
J J i l M 195
19,559.3621.78
898.21

5-3 DISEO FACTORIAL DE DOS FACTORES

191

dlo sin interaccin (ecuacin 5-20). Como ya se seal, los dos efectos principales son significativos. Sin
embargo, tan pronto como se efecta el anlisis residual de estos datos, se pone de m anifiesto que el mo
delo sin interaccin es inadecuado. P ara el m odelo de dos factores sin interaccin, los valores ajustados
son yijk =y + 4 - . E n la figura 5-15 se presenta la grfica d e5^. - %* (los prom edios de las celdas m enos
el valor ajustado de esa celda) contra el valor ajustado yijk. A hora las cantidades . - >U pueden conside
rarse como las diferencias entre las m edias de las celdas observadas y las m edias de las celdas estimadas
suponiendo que no hay interaccin. C ualquier patrn en estas cantidades sugiere la presencia de una in
teraccin. E n la figura 5-15 se observa un patrn claro cuando las can tid ad es^. - %k pasan de positivo a
negativo, y despus de nuevo a positivo y a negativo. E sta estructura es el resultado de la interaccin entre
los tipos del m aterial y la tem peratura.

5*3.7

Una observacin por celda

E n ocasiones se encuentran experim entos de dos factores con u na sola rplica, es decir, en los que slo
hay una observacin p or celda. Cuando hay dos factores y una sola observacin por celda, el m odelo de
los efectos es
yt = fi+T, + j +(T0) +

i = 1,2,..., a
( 5 -2 1 )

E l anlisis de varianza para esta situacin se presenta en la tabla 5-9, suponiendo que ambos factores son
fijos.
Al examinar los cuadrados m edios esperados, se observa que la varianza del erro r o 2es no estimable;
es decir, que el efecto de la interaccin de los dos factores (T)tj y el erro r experim ental no pueden sepa
rarse de alguna m anera obvia. Por consiguiente, no se cuenta con pruebas p ara los efectos principales a
m enos que el efecto de la interaccin sea cero. Si no hay una interaccin presente, entonces (r/3),y = 0 para
to d a i y j, y un m odelo plausible es

*=/+*,+/>,+*,

{ jlW z l

(M 2)

Si el m odelo (ecuacin 5-22) es apropiado, entonces el cuadrado m edio de los residuales de la tabla 5-9 es
un estim ador insesgado de o2, y los efectos principales pueden probarse com parando MSA y M SB con
Residual*

Figura 5*15 Grfica de


de la batera.

y ^ contra

para los datos de la vida

192

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

labia 5-9 Anlisis de varianza de un modelo de dos factores, una observacin por celda

Fuente de
variacin
Renglones (A)

Suma de
cuadrados
y

y?,

y 2.

tf

ab

ab

Columnas (B)

Residual o AB

Sustraccin

Total

Grados de
libertad

Cuadrado
medio

a -1

MSa

b- 1

m sb

(fl- l ) ( 6 - l )

b
2
Y ? y- p ** ab

Residual

Cuadrado medio
esperado

,.

S J .m
(-<)<> - i i

ab- 1

U n a prueba desarrollada por Tkey [ I ll a ] es til para determ inar si est presente una interaccin.
E n el procedim iento se supone que el trm ino de la interaccin tiene una form a particularm ente simple,
a saber,
0 0 ) ,

Y*ij

donde y es u na constante desconocida. Al definir as el trm ino de la interaccin, puede usarse un enfo
que de regresin para probar la significacin del trm ino de la interaccin. E n la prueba se hace la parti
cin de la suma de cuadrados de los residuales en un com ponente con un solo grado de libertad debido a
la no aditividad (interaccin) y un com ponente del error con (a - l)(ft -1 ) - 1 grados de libertad. E n lo que
a los clculos se refiere, se tiene
n2
o
b

22

SSN =

,/=l ;=i

y h y , y . - y - .

SS +ssB+ ~
A

abSSASSB

(5-23)

con un grado de libertad, y


^

Error ^ R e s id u a l

S S N

(5-24)

con (a - 1)(> -1 ) - 1 grados de libertad. Para probar la presencia de una interaccin, se calcula
SS
F

(5-25)

S S ^ /K a -W -l)-!]

Si F 0 > Fa 1; (a _ 1)(f) _ !)_ !, debe rechazarse la hiptesis de que no hay ninguna interaccin.

EJEMPLO 5 - 2 ............................................................................... ....................................................


Las impurezas presentes en un producto qumico son afectadas por dos factores, la presin y la tem pera
tura, E n la tabla 5-10 se m uestran los datos de una sola rplica de un experimento factorial. Las sumas de
cuadrados son

193

5-3 DISEO FACTORIAL DE DOS FACTORES


Tabla 5-10

Datos de las impurezas del ejemplo 5-2

Ifemperatura
CF)

Presin

100
125
150

25
5
3
1

30
4
1
1

35
6
4
3

40
3
2
1

45
5
3
2

23
13
8

y.,

13

10

44 = y

y i.

'

ab

= i [ 9 2 + 6 2 +132 + 6 2 + i o 2] - ^ ~

1L60

= 166-129.07 = 36.93

^Residual $ST SSA S S g


= 3 6 .9 6 - 23.3311.60 = ZOO
L a suma de cuadrados de la no aditividad se calcula con la ecuacin 5-23 de la siguiente m anera:
a

= i

j-i

22

= (5 )(2 3 )(9 )+ (4 )(2 3 )(6 )+ + (2)(8)(10)= 7236

22
SSN =

i- 1

v=l

abSSASSB
[7236-(44)(23t33+ ll,60+ 129.07)]2
(3)(5)(23l33)(11.60)

. M
I , 0.0985
4059.42
y la suma de cuadrados del error es, por la ecuacin 5-24,
^ E ir o r

Residual

^SN

= 2.00 - 0.0985=1.9015
E l anlisis de varianza com pleto se resum e en la tabla 5-11. El estadstico de prueba para la no aditivi
dad e s f 0 = 0.0985/0.2716 = 0.36, de donde se concluye que no hay evidencia de interaccin en estos da
tos. Los efectos principales de la tem peratura y la presin son significativos.

Para concluir esta seccin, se hace n otar que el m odelo factorial de dos factores con una observacin
p o r celda (ecuacin 5-22) luce exactam ente igual que el m odelo de bloques com pletos aleatorizados

194

CAPTULO 5

labia 5-11

INTRODUCCIN A LOS DISEOS FACTORIALES

Anlisis de varianza del ejemplo 5-2

Fuente de
variacin
'temperatura
Presin
No aditividad
Error
Total

Suma de
cuadrados
23.33
11.60
0.0985
1.9015
36.93

Grados de
libertad
2
4
1
7
14

Cuadrado
medio
11.67
2.90
0.0985
0.2716

F0
42.97
10.68
0.36

Valor .P
0.0001
0.0042
0.5674

(ecuacin 4-1). De hecho, la prueba de Tukey con un solo grado de libertad para la no aditividad puede
aplicarse directamente para probar la presencia de una interaccin en el modelo de bloques aleatoriza
dos. Sin embargo, es necesario recordar que las situaciones experimentales que llevan al modelo de blo
ques aleatorizados y al modelo factorial son muy diferentes. En el modelo factorial, todas las ab corridas
se hacen de manera aleatoria, mientras que en el modelo de bloques aleatorizados la aleatorizacin slo
ocurre dentro del bloque. Los bloques constituyen una restriccin sobre la aleatorizacin. Por lo tanto, la
manera en que se corren los experimentos, as como la interpretacin de los dos modelos, es muy diferente.

5-4

DISEO FACTORIAL GENERAL

Los resultados del diseo factorial de dos factores pueden ampliarse al caso general en que hay a niveles
del factor>4, b niveles del factor B, c niveles del factor C, etc., dispuestos en un experimento factorial. En
general, habr abc n observaciones totales si se hacen n rplicas del experimento completo. De nueva
cuenta, observe que es necesario un mnimo de dos rplicas (n a 2) para determinar una suma de cuadra
dos debida al error si todas las interacciones posibles estn incluidas en el modelo.
Cuando todos los factores del experimento son fijos, es sencillo formular y probar hiptesis acerca de
los efectos principales y las interacciones. Para un modelo con efectos fijos, los estadsticos de prueba
para cada efecto principal e interaccin pueden construirse dividiendo el cuadrado medio correspondien
te del efecto o interaccin por el cuadrado medio del error. Ibdas estas pruebas F sern de una cola supe
rior. El nmero de grados de libertad de cualquier efecto principal es el nmero de niveles del factor
menos uno, y el nmero de grados de libertad de una interaccin es el producto del nmero de grados de
libertad asociados con los componentes individuales de la interaccin.
Por ejemplo, considere el modelo del anlisis de varianza de tres factores:
yv = /*+*, +j +Yk +(T)n +(*y)* +(A0*
i = 1, 2, . . . , a
+

+v

i i l z i
1= 1 ,2 ,...,

Suponiendo que4, B y C son fijos, la tabla del anlisis de varianza se presenta en la tabla 5-12. Las prue
bas F para los efectos principales y las interacciones se siguen directamente de los cuadrados medios es
perados.

Tbla 5-12

La tabla del anlisis de varianza del modelo de tres factores con efectos jos

F u e n te de variacin

G rad o s d e lib ertad

C u ad ra d o m edio

ssA

a- 1

M Sa

SSB

b- 1

m sb

ssc

c -1

M SC

AB

S S AB

( - 1) ( * - 1 )

M Sm

AC

S S AC

(a -l)(c -l)

m s ac

(t-l)(c -l)

MSgc

S S ABC

(o - l)(f> - l ) ( c - 1)

M S abc

E rro r

SSE

abc(n - 1 )

m se

Total

SST

aben - 1

C u a d rad o m edio esperado

f.

b e n ^ r ,2
a 1i

a+

AS
s

S um a de cuadrados

II

b 1
JL !

vi
c 1

JW5C
F

a s
P

(T%

<*jO

0
F
0

(fl-l)(c -l)

M Sm
m s
A f^
m se

M SBC
BC

ABC

\o
Ul

SSsc

(> -l)(c -l)

" E S E
(a - i ) ( f c - i ) ( C - i )
a2

A
JWSjUIC

196

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

E n general, los clculos del anlisis de varianza se efectuaran utilizando un paquete de software de
estadstica. Sin embargo, en ocasiones resultan tiles las frmulas para calcular m anualm ente las sumas
de cuadrados de la tabla 5-12. La suma de cuadrados total se encuentra de la m anera acostum brada como

r-S
A -
i=l ;=i k-1 (=1
uutn

<^>

Las sumas de cuadrados de los efectos principales se encuentran a partir de los totales de los factores
B (y ) y C ( y k) de la siguiente manera:
<5 - 2 8 >

.y=i

SSr = t / i -
abn
aben

<

5-29>
(5-30)

Para calcular las sumas de cuadrados de las interacciones de dos factores, se necesitan los totales de las
celdas^! x B ,A x C y B x C. Con frecuencia es til desplegar la tabla de los datos originales en tres tablas
de dos vas p ara calcular estas cantidades. Las sumas de cuadrados se encuentran con

= SSSMMaiM)- S S A ~ S S a
,2
^ c i y L - - n-s s A-s s c
=

^ S u b to ta le s (- 4C )

A ~ SSC

SSBC = Y

Y y% H
aben

^ S u b to ta lo s (fiC )

(5-31)

SSB

SSB

(5-32)

- ssc

SSC

(5-33)

Observe que las sumas de cuadrados de los subtotales de dos factores se encuentran a partir de los totales
de cada tabla de dos vas. La suma de cuadrados de la interaccin de los tres factores se calcula a partir de
los totales de las celdas {yijk.} de tres vas como
2
y k - ^ - - S S A - S S B - S S c - S S AB- S S AC- S S BC
(5-34a)
SS ABC
n ,=i j=\ k=\
~

Subtotalcs ( ABC )

uDcn
A

SSB

SSC

SS^

,SS Ac

SSBC

(5-34b)

L a suma de cuadrados del error puede encontrarse restando la suma de cuadrados de cada efecto princi
pal e interaccin de la suma de cuadrados total o con
SSE = SST

Subtotalesf A B C )

(5-35)

197

5-4 DISEO FACTORIAL GENERAL

EJEMPLO 5 - 3 ....................................................................................................................................
El problema del embotelladlo de un refresco
U na em presa em botelladora de refrescos est interesada en obtener alturas de llenado ms uniformes en
las botellas que se fabrican en su proceso de manufactura. Tericamente, la m quina de llenado llena cada
botella a la altura objetivo correcta, pero en la prctica, existe variacin en tom o a este objetivo, y a la em bo
telladora le gustara entender m ejor las fuentes de esta variabilidad y, en ltim a instancia, reducirla.
El ingeniero del proceso puede controlar tres variables durante el proceso de llenado: el porcentaje
de carbonatacin (A), la presin de operacin en el llenador (B ) y las botellas producidas por m inuto o ra
pidez de lnea (C). Es sencillo controlar la presin y la rapidez, pero el porcentaje de carbonatacin es
ms difcil de controlar durante la m anufactura real debido a que vara con la tem peratura. Sin embargo,
para los fines de un experim ento, el ingeniero puede controlar la carbonatacin en tres niveles: 10,12 y 14
p o r ciento. Elige dos niveles para la presin (25 y 30 psi) y dos niveles para la rapidez de lnea (200 y 250
bpm ). El ingeniero decide correr dos rplicas de un diseo factorial con estos tres factores, haciendo las
24 corridas de m anera aleatoria. La variable de respuesta observada es la desviacin prom edio de la altu
ra del llenado objetivo que se observa en una corrida de produccin de botellas con cada conjunto de con
diciones. E n la tabla 5-13 se m uestran los datos que resultaron de este experim ento. Las desviaciones
positivas son alturas de llenado arriba del objetivo, m ientras que las desviaciones negativas son alturas de
llenado abajo del objetivo. Los nm eros encerrados en crculos de la tabla 5-13 son los totales de las cel
das de tres vas yijk_.
L a sum a de cuadrados total corregida que se encuentra con la ecuacin 5-27 es

= 5 7 1 - - = 336.625
24
Tabla 5-13

Datos de la desviacin de la altura de llenado del ejemplo 5-3


Presin de operacin (B )
30 psi

25 psi

Rapidez de lnea

Rapidez de lnea (C)

Porcentaje de
carbonatacin (A)

250

200

200

yi..

250
1

-1

12

14

10

(C)

"J

-4

1
6

Totales B x C y t

10

Totales

34
54

Totales

y -

y.k.
B

25

30

200

250

10
12
14

-5
4
22

1
16
37

10
12
14

-5
6
25

1
14
34

59

@>

11

20

15
21

X;..

20

75

= y...

198

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

y las sumas de cuadrados de los efectos principales que se calculan con las ecuaciones 5-28,5-29 y 5-30 son

ss

CAfronatacin

!>/%
ben

/ _ _f

V 2

'

~ aben
y*

= I k - 4 ) 1 +(20)! +(59)2] -

= 252.750

y -

abn

aben

= [(2 6 )2 + (4 9 )2] - ^ - = 22.042


Para calcular las sumas de cuadrados de las interacciones de dos factores, se deben encontrar los to ta
les de las celdas de dos vas. Por ejem plo, para encontrar la carbonatacin-presin o interaccin A S , se
necesitan los totales de las celdas^! x B {y,y } que se m uestran en la tabla 5-13. Utilizando la ecuacin
5-31, se encuentra que las sumas de cuadrados son
s s a b

=e nS" S"

yfj

- ~ r ~ - s s A

aben

- s s B

= ^ [ ( - 5 ) 2 + (1 )2 + ( 4 ) 2 + (16)2 + (2 2 )2 + (3 7 )2] - ^ 25Z 750-45.375


= 5.250
P ara la carbonatacin-rapidez o interaccin A C se usan los totales de las c e ld a s^ x C {y,.k} que se m ues
tran en la tabla 5-13 y la ecuacin 5-32:
^ - y L

- - s s A- s s c

= ^ -[(-5 )2 + (1 )2 + ( 6 ) 2 + (1 4 )2 + (2 5 )2 + (3 4 )2] - ^ 252.750 - 22.042


= 0.583
L a presin-rapidez o interaccin B C se encuentra con los totales de las celdas B x C {yjt } que se m ues
tran en la tabla 5-13 y la ecuacin 5-33:

5-4 DISEO FACTORIAL GENERAL

199

La suma de cuadrados de la interaccin de los tres factores se encuentra con los totales de las celdas
v x S x C {y,jk}, los cuales estn encerrados en un crculo en la tabla 5-13. Por la ecuacin 5-34a se en
cuentra

^= ^2 2 2

n -i jmi k=i

yk -^ -M A -S S '-S S c-S S n -S S ^-S S K


aocn

= |t (-4 )2+ (- l)2+ (-l)2+ -+ (1 6 )2

252.750 - 45.375- 2 2 0 4 2 - 5 .250- 0.583-1.042

= 1.083
Por ltimo, al observar que
^subtoiaw^c)

"

Z n Z = 328.125

se tiene
SSE

SST

^ S u W o U k s ( ABC)

= 336.625- 328.125
= 8.500
E n la tabla 5-14 se resum e el anlisis de varianza. Se observa que el porcentaje de carbonatacin, la
presin de operacin y la rapidez de lnea afectan significativamente el volum en de llenado. El cociente F
de la interaccin carbonatacin-presin tiene un valor P de 0.0558, lo cual indica cierta interaccin entre
estos factores.
El siguiente paso deber ser un anlisis de los residuales de este experim ento. Se deja como ejercicio
p ara el lector, pero se seala que la grfica de probabilidad norm al de los residuales y los dem s diagns
ticos usuales no indican ningn motivo de preocupacin im portante.
Como ayuda para la interpretacin prctica de este experimento, en la figura 5-16 se grafican los tres
efectos principales y la interaccinAB (carbonatacin-presin). Las representaciones de los efectos princi
pales son slo grficas de los promedios de las respuestas marginales para los niveles de los tres factores.
Observe que las tres variables tienen efectos principales positivos; es decir, el increm ento de la variable
mueve hacia arriba la desviacin prom edio del llenado objetivo. L a interaccin entre la cabonatacin y la
presin es bastante pequea, como lo indica la forma similar de las dos curvas de la figura 5-16d.
Puesto que la em presa quiere que la desviacin prom edio del llenado objetivo est cerca de cero, el
ingeniero decide recom endar el nivel bajo de la presin de operacin (25 psi) y el nivel alto de la rapidez
de lnea (250 bpm , que maximizar la rapidez de produccin). E n la figura 5-17 se grafica la desviacin
Tabla 5-14

Anlisis de varianza del ejemplo 5-3

Fuente de variacin
Porcentaje de carbonatacin (A)
Presin de operacin (B)
Rapidez de lnea (C)

AB
AC
BC
ABC
E rror
Total

Suma de
cuadrados

G rados de
libertad

Cuadrado
medio

252.750
45.375
22.042
5.250
0.583
1.042
1.083
8.500
336.625

2
1
1
2
2
1
2
12
23

126.375
45.375
22.042
2.625
0.292
1.042
0.542
0.708

F0

Valor P

178.412
64.059
31.118
3.706
0.412
1.471
0.765

<0.0001
<0.0001
0.0001
0.0558
0.6713
0.2485
0.4867

200

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

.2

Presin (B)

a)

Rapidez de lnea (Cl

c>

b)

Interaccin
carbonatacin-presin

d)

Figura 5-16 Grficas de los efectos principales y la interaccin del


ejemplo 5-3. a) Porcentaje de carbonatacin (A), b) presin (B), c) ra
pidez de lnea (C), d) interaccin carbonatacin-presin.

prom edio observada de la altura de llenado objetivo con los tres diferentes niveles de carbonatacin para
este conjunto de condiciones de operacin. A hora, el nivel de la carbonatacin no puede actualm ente
controlarse perfectam ente en el proceso de m anufactura, y la distribucin norm al indicada con la lnea
continua de la figura 5-17 es una aproximacin de la variabilidad de los niveles de carbonatacin que se

"Oj

Si

j2
JE >

g O.

ll
Porcentaje de carbonatacin (A)

Figura 5-17 Desviacin promedio de la altura de llenado


con rapidez alta y presin baja para diferentes niveles de
carbonatacin.

5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA

201

registran actualmente. Como el proceso es im pactado por los valores del nivel de carbonatacin sacado
de esta distribucin, la fluctuacin de las alturas de llenado ser considerable. Esta variabilidad de las al
turas de llenado podra reducirse si la distribucin de los valores del nivel de carbonatacin siguieran la
distribucin norm al indicada con la lnea punteada de la figura 5-17. La reduccin de la desviacin estn
dar de la distribucin del nivel de carbonatacin se consigui finalm ente m ejorando el control de la tem
p eratu ra durante la m anufactura.

Se seal ya que si todos los factores de un experim ento factorial son fijos, la construccin del esta
dstico de prueba es directa. El estadstico para probar cualquier efecto principal o interaccin se form a
siem pre dividiendo el cuadrado m edio del efecto principal o la interaccin por el cuadrado m edio del
error. Sin embargo, si el experim ento factorial incluye uno o ms factores aleatorios, la construccin del
estadstico de prueba no siem pre se hace de esta m anera. Es necesario examinar los cuadrados medios es
perados para determ inar las pruebas correctas. La revisin com pleta de los experim entos con factores
aleatorios se pospone hasta el captulo 12.

5-5

AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA

Se ha visto que puede resultar til ajustar una curva de respuesta a los niveles de un factor cuantitativo
p ara que el experim entador cuente con una ecuacin que relacione la respuesta con el factor. E sta ecua
cin podra utilizarse para hacer interpolaciones, es decir, para predecir la respuesta en niveles interm e
dios entre los factores, respecto de los que se utilizaron realm ente en el experim ento. Cuando al menos
dos de los factores son cuantitativos, puede ajustarse una superficie de respuesta para predecir .y con va
rias com binaciones de los factores del diseo. En general, se usan mtodos de regresin lineal para ajus
tar estos modelos a los datos experimentales. Este procedim iento se ilustra en la seccin 3-5.1 para un
experim ento con un solo factor, A continuacin se presentan dos ejemplos que incluyen experim entos
factoriales. Se utilizar un paquete de software de com putadora para generar los modelos de regresin.
P ara mayor inform acin acerca del anlisis de regresin, referirse al captulo 10 y al m aterial suplem enta
rio del texto de este captulo.

EJEMPLO 5 - 4 ....................................................................................................................................
Considere el experim ento que se describe en el ejemplo 5-1. El factor tem peratura es cuantitativo y el tipo
de m aterial es cualitativo. Adems, hay tres niveles de la tem peratura. Por consiguiente, puede calcularse
un efecto de la tem peratura lineal y uno cuadrtico para estudiar la form a en que la tem peratura afecta la
vida de la batera. E n la tabla 5-15 se presenta la salida condensada de Design-Expert para este experim en
to, donde se supone que la tem peratura es cuantitativa y el tipo de m aterial es cualitativo.
El anlisis de varianza de la tabla 5-15 indica que la fuente de variabilidad m odelo se ha subdividido en varios com ponentes. Los com ponentes A y A 1 rep resen tan los efectos lineal y cuadrtico de
la tem peratura, y B representa el efecto principal del factor tipo de material. Recuerde que el tipo de m a
terial es un factor cualitativo con tres niveles. Los trminos A B y A 2B son las interacciones del factor tem
p eratu ra lineal y cuadrtico con el tipo de m aterial.
Los valores P indican que ,42y A B no son significativos, m ientras que el trm ino A 2B es significativo.
Con frecuencia se piensa en elim inar los trm inos o factores no significativos del modelo, pero en este

Tabla 5-15

Salida de Design-Expert para el ejemplo 5-4

Response: Life
in hr
ANOVA for Response Surface Reduced Cubic Model
Analysis of variance table [Partial sum of squares]
Mean
F
Sum of
Source
Squares
DF
Square
Value

Model

<0.0001

7427.03

11.00

39042.67

39042.67

57.82

<0.0001

0.0020

10683.72

5341.86

7.91

A 2

76.06

76.06

0.11

0.7398

A B

2315.08

1157.54

1.71

0.1991

7298.69

3649.35

5.40

0.0106

18230.75

27

675.21

A ZB

Residual
L a c k o f Fit

0.000

P u r e Error

18230.75

27

Cor Total

77646.97

35

Std. Dev.
Mean
C.V.
PRESS

25.98
105.53
24.62
32410.22

Term

Prob > F

59416.22

Intercept
A-Temp
B[1]
B[2]
A2
AB[1]
AB[2]
A 2B[1]
A 2B[2]

Coefficient
Estimate

107.58
-40.33
-50.33
12.17
-3.08
1.71
-12.79
41.96
-14.04

significant

675.21

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision
DF

1
1
1
1
1
1
1
1
1

Standard
Error

Final Equation in Terms of Coded Factors:


Life =
+ 107.58
-40.33 *A
-50.33 *B[1]
+ 12.17 *B[2]
-3.08 *A2
+ 1.71 *ABI1]
-12.79 *AB[2]
+41.96 *A2B[1]
-14.04 *A2B[2]
Final Equation in Terms of Actual Factors:
Material Type
1
Life =
+ 169.38017
-2.48860 *Temp
+0.012851 *Temp2
Material Type
2
Life =
+ 159.62397
-0.17901 *Temp
+0.41627 *Temp2
Material Type
3
Life =
+ 132.76240
+0.89264 *Temp
-0.43218 *Temp2

7.50
5.30
10.61
10.61
9.19
7.50
7.50
12.99
12.99

0.7652
0.6956
0.5826
8.178
95% a
Low

92.19
-51.22
-72.10
-9.60
-21.93
-13.68
-28.18
15.30
-40.70

95% Cl
High

122.97
-29.45
-28.57
33.93
15.77
17.10
2.60
68.62
12.62

VIF

1.00
1.00

5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA

203

caso e lim in a r^ 2y A B y co n se rv ar^2# resultar en un m odelo que no es jerrquico. El principio de je ra r


qua establece que si un m odelo contiene un trm ino de orden superior (tal como^425 ), deber contener
tam bin todos los trm inos de orden inferior que lo com ponen (A 2 y A B en este caso). La jerarqua p ro
m ueve un tipo de consistencia interna en un modelo, y muchos constructores de modelos estadsticos si
guen rigurosam ente este principio. Sin embargo, la jerarqua no es siem pre una buena idea, y muchos
m odelos en realidad funcionan m ejor como ecuaciones de prediccin que no incluyen los trm inos no sig
nificativos que propone la jerarqua. P ara mayor informacin, ver el m aterial suplem entario del texto de
este captulo.
L a salida de com putadora incluye tam bin estim aciones de los coeficientes del m odelo y una ecua
cin para la prediccin final de la vida de la batera en trm inos de factores codificados. E n esta ecuacin,
los niveles de la tem peratura son^l = -1 ,0 , +1, respectivam ente, cuando la tem peratura est en los nive
les bajo, interm edio y alto (1 5 ,7 0 ,125F). Las variablesi[ l] y 5[2] son variables indicadoras codificadas
que se definen de la siguiente m anera:

B[2]

Tipo de materia]
1
2
3
1
0
-1
-1
0
1

Hay tam bin ecuaciones para la prediccin de la vida de la batera en trm inos de los niveles de los facto
res reales. Observe que com o el tipo de m aterial es un factor cualitativo, hay una ecuacin para la vida
predicha como una funcin de la tem peratura para cada tipo de m aterial. E n la figura 5-18 se m uestran

Temperatura

Figura 5-18 La vida predicha como una funcin de la tem peratura para los tres ti
pos de material, ejemplo 5-4.

204

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

las curvas de respuesta generadas p or estas tres ecuaciones de prediccin. Com prense con la grfica de
la interaccin de dos factores para este experim ento de la figura 5-9.

Si varios de los factores de un experim ento factorial son cuantitativos, puede usarse una superficie de
respuesta p ara m odelar la relacin entre y y los factores del diseo. Adems, los efectos de los factores
cuantitativos pueden representarse con efectos polinomiales con un solo grado de libertad. D e m anera si
milar, es posible hacer la particin de las interacciones de factores cuantitativos en com ponentes de inter
accin con un solo grado de libertad. Esto se ilustra en el ejemplo siguiente.

EJEMPLO 5 - 5 ....................................................................................................................................
Se piensa que la vida efectiva de una herram ienta de corte instalada en una m quina controlada num ri
cam ente se afecta por la velocidad de corte y el ngulo de la herram ienta. Se seleccionan tres velocidades
y tres ngulos, y se lleva a cabo un experim ento factorial con dos rplicas. En la tabla 5-16 se m uestran los
datos codificados. Los nm eros de las celdas encerrados en crculos son los totales de las celdas {y,y.}.
E n la tabla 5-17 se presenta la salida condensada de Design-Expert para este ejemplo. Los trm inos A
y A 1 son los efectos lineal y cuadrtico del ngulo de la herram ienta, y B y B 2 son los efectos lineal y cua
drtico de la velocidad. Los trm inos AB, A 2B , A B 2 y A 2B 2 representan los componentes lineal x lineal,
cuadrtico x lineal, lineal x cuadrtico y cuadrtico x cuadrtico de la interaccin de dos factores. Aun
cuando hay algunos valores P grandes, se han conservado todos los trm inos del m odelo para respetar la
jerarqua. E n la ecuacin de prediccin expresada en factores codificados se utilizan los niveles - 1 ,0 y +1
de A y B p ara representar los niveles bajo, interm edio y alto, respectivam ente, de estos factores.
E n la figura 5-19 se presenta la grfica de contorno de la superficie generada por la ecuacin de p re
diccin de la vida de la herram ienta. E l examen de esta superficie de respuesta indica que la vida mxima
de la herram ienta se consigue con velocidades de corte de alrededor de 150 rpm y ngulos de la h erra
m ienta de 25. La grfica de la superficie de respuesta tridim ensional de la figura 5-20 proporciona en
esencia la misma informacin, pero ofrece una perspectiva diferente, y en ocasiones ms til, de la super
ficie de respuesta de la vida de la herram ienta. L a exploracin de las superficies de respuesta es un aspec
to muy im portante del diseo experimental, el cual se estudiar en detalle en el captulo 11.

Tabla 5-16

Datos del experimento de la vida de la herramienta de corte

ngulo de la herramienta
_____________ Velocidad de corte (pulg/min)__________ ___
_______(grados)________________ 125
_________ 150___________________ J75________________y,
15
?

-1

CD

20
2

16

25

y.,.

-2

12

14

9
24 = y

5-5 AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA


Tabla 5-17

Salida de Design-Expert para el ejemplo 5-5

Response: Life
in Hours
ANOVA for Response Surfece Reduced Order 4 Model
Analysis of variance table [Partial sum of squares]
F
Sum of
Mean
DF
Value
Squares
Square
Source

Model

Prob F

111.00

13.87

9.61

49.00

49.00

33.92

0.0013
0.0003
0.0088

16.00

16.00

11.08

A 2

0.000

0.000

0.000

1.0000

EP

1.33

1.33

0.92

0.3618

A B

8.00

8.00

5.54

0.0431

A * B

2.67

2.67

1.85

0.2073

42.67

42.67

29.54

0.0004

5.54

0.0431

A B 2

8.00

8.00

13.00

1.44

L a c k o f Fit

0.000

P u r e Error

13.00

A * &

Residual
Cor Total
Std. Dev.
Mean
C.V.
PRESS
Factor

Intercept
A-Tool Angle
B-Speed
A2
B2
AB
A 2B
AB2
A 2B2

significant

1.44

17

124.00
1.20
1.33
90.14
52.00

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision

Coefficient
Estimate

DF

2.00
3.50
2.00

1
1
1
1
1
1
1
1
1

0.000

1.00
-1.00
-1.00
-4.00
-3.00

Standard
Error

CDh)

Final Equation in Terms of Coded Factors:


Life s
+2.00
+3.50 *A
+2.00 *B
+0.000 *AJ
+ 1.00 *B2
-1.00 A i
-1.00 *A2 *B
-4.00 *A <B2
-3.00 *A2
Final Equation in Terms of Actual Factors:
Life =
-1068.00000
+136.30000 *Tool Angle
+ 14.48000 Speed
-4.08000 Tool Angle*
-0.049600 *Speed2
-1.86400 *Tool Angle *Speed
+0.056000 *Tool Angle2 Speed
+6.40000E-003 *Tool Angle Speed2
1.92000E004 *Tool Angle2 Speed2

0.85
0.60
0.60
1.04
1.04
0.42
0.74
0.74
1.27

0.8952
0.8020
0.5806
8.237
95% Cl
Low

0.078
2.14
0.64
-2.35
-1.35
-1.96
-2.66
-5.66
-5.88

95% Cl
High

3.92
4.86
3.36
2.35
3.35
0.039
0.66
-2.34
-0.12

VIF

3.00
3.00
3.00
3.00
1.00
3.00
3.00
5.00

ngulo de la herramienta

Figura 5-19 Grfica de contorno tridimensional de la superficie de respuesta de la vida de


la herramienta del ejemplo 5-5.

Figura 5-20 Superficie de respuesta tridimensional de la vida de la herramienta del


ejemplo 5-5.

206

5-6 FORMACIN DE BLOQUES EN UN DISEO FACTORIAL

5-6

207

FORMACIN DE BLOQUES EN UN DISEO FACTORIAL

Se han revisado los diseos factoriales en el contexto de un experim ento completamente aleatorizado. En
ocasiones no es factible o prctico hacer la aleatorizacin com pleta de todas las corridas de un diseo fac
torial. Por ejemplo, la presencia de un factor perturbador puede hacer necesario que el experim ento se
corra en bloques. Los conceptos bsicos de la formacin de bloques se analizaron en el captulo 4 en el
contexto de un experim ento con un solo factor. A hora se indica la form a en que la formacin de bloques
puede incorporarse en un diseo factorial. O tros aspectos de la form acin de bloques en diseos factoria
les se presentan en los captulos 7, 8, 9 y 13.
Considere un experim ento factorial con dos factores (A y B) y n rplicas. E l m odelo estadstico lineal
de este diseo es
i = 1,2,..., a
y&=f*+T:i +j+(T: ) ij+m

'7 = 1 ,2 ,...,*
k = l,2

(5-36)

donde t, j y (v)^ representan los efectos de los fa c to re s^ , B y la interaccin A B , respectivam ente. Su


ponga ahora que para realizar este experim ento se necesita una m ateria prim a particular. E sta m ateria
prim a est disponible en lotes cuyo tam ao no es suficiente para perm itir que se corran todas las abn com
binaciones de los tratam ientos con el mismo lote. Sin embargo, si un lote contiene m aterial suficiente
para hacer ab observaciones, entonces un diseo alternativo es correr cada una de las n rplicas utilizando
un lote separado de m ateria prima. Por consiguiente, los lotes de m ateria prim a representan una restric
cin sobre la aleatorizacin o un bloque, y se corre una sola rplica de un experim ento factorial com pleto
dentro de cada bloque. El m odelo de los efectos para este nuevo diseo es
i = l, 2,,.., a
y 'j k = P + * i + j + ( T ) i + 0 K+i:ifi

; = l,2 ,...,
k = l,2 ,...,n

(5-37)

donde <5*es el efecto del bloque fc-simo. D esde luego, dentro de un bloque el orden en que se corren las
com binaciones de los tratam ientos est com pletam ente aleatorizado.
E n el m odelo (ecuacin 5-37) se supone que la interaccin entre los bloques y los tratam ientos es in
significante. A nteriorm ente se estableci el mismo supuesto en el anlisis de diseos de bloques aleatori
zados. Si estas interacciones existen, no pueden separarse del com ponente del error. D e hecho, el
trm ino del erro r en este m odelo se com pone en realidad de las interacciones (r)*, ()jky (r)llk. E n la
tabla 5-18 se describe el anlisis de varianza. La disposicin tiene un gran parecido con la de un diseo
factorial, con la sum a de cuadrados del error reducida por la suma de cuadrados de los bloques. E n lo que
a los clculos se refiere, la suma de cuadrados de los bloques se encuentra como la suma de cuadrados en
tre los totales de los n bloques {y.*}.
E n el ejemplo anterior, la aleatorizacin se restringi al interior de un lote de m ateria prima. E n la
prctica, una diversidad de fenm enos pueden producir restricciones sobre la aleatorizacin, como el
tiem po, los operadores, etc. Por ejemplo, si el experim ento factorial com pleto no pudo correrse en un da,
entonces el experim entador podra correr una rplica com pleta el da 1, una segunda rplica el da 2, etc.
Por consiguiente, cada da sera un bloque.

FJEMPLO 5 - 6 ....................................................................................................................................
U n ingeniero estudia los m todos para m ejorar la capacidad p ara detectar objetivos en el campo de ac
cin de un radar. D os factores que el ingeniero considera im portantes son la cantidad de ruido de fondo,
o desorden de terreno, en el cam po de accin del radar y el tipo de filtro colocado sobre la pantalla. Se

208

CAPTULO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 5-18

Anlisis de varianza de u n diseo factorial de dos factores en bloques completos aleatorizados

Fuente de
variacin
Bloques
A

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio esperado

J _ Y y* _ l L
ab
* abn

n -1

o2+ aba]

J_ v
2 y lb n Z y' " abn

a -1

F0

MSa
MSe

a 1

m sb

b-1

B
AB

-n 2 2 r i - - ^ s s .

(a -l)(* -l)

Sustraccin

(ab - l)(n - 1 )

Error
Total

b -i

MS,

( a - l ) ( b - 1)

MSM
MSe

<r2

abn - 1

disea un experim ento utilizando tres niveles del desorden de terreno y dos tipos de filtro. Estos factores
se considerarn fijos. El experim ento se lleva a cabo seleccionando al azar una com binacin de los trata
m ientos (nivel del desorden de terreno y tipo de filtro) e introduciendo despus una seal que representa
el objetivo en el campo de accin del radar. La intensidad de este objetivo se increm enta hasta que el ope
rador lo observa. Entonces se mide el nivel de intensidad en el m om ento de la deteccin como la variable
de respuesta. D ebido a la disponibilidad de los operadores, es conveniente seleccionar un operador y
m antenerlo en el sistema hasta que se han realizado todas las corridas necesarias. Adems, los operado
res difieren en su habilidad y capacidad para operar el sistema. P or consiguiente, parece lgico usar los
operadores como bloques. Se seleccionan cuatro operadores al azar. U na vez que se ha elegido a un ope
rador, el orden en que se corren las seis com binaciones de los tratam ientos se determ ina aleatoriam ente.
P or lo tanto, se tiene una corrida de un experim ento factorial 3 x 2 en un bloque com pleto aleatorizado.
Los datos se presentan en la tabla 5-19.
El m odelo lineal p ara este experim ento es
/ = 1, % 3
y * = f t + t i + j + ( r ) + k + e *

i = !> 2

k = 1,2, 3, 4
donde t representa el efecto del desorden de terreno, j representa el efecto del tipo de filtro, (r)^ es la
interaccin, k es el efecto del bloque y jk es el com ponente NID (0, o2) del error. Las sumas de cuadrados
del desorden de terreno, del tipo de filtro y de su interaccin se calculan de la m anera usual. La suma de

Tabla 5-19

Nivel de intensidad al detectarse el objetivo

Operadores (bloques)
Tipo de filtro
Desorden de terreno
Bajo
Intermedio
Alto

------------------------------------- -----------------------------
________ 1
2________ 1
2________ 1
2________1
2
90
102
114

86
87
93

96
106
112

84
90
91

100
105
108

92
97
95

92
96
98

81
80
83

5-6 FORMACIN DE BLOQUES EN UN DISEO FACTORIAL


Tabla 5-20

209

Anlisis de varianza del ejemplo 5-6

Suma de
cuadrados
335.58
1066.67
77.08
402.17
166.33
2047.83

Fuente de variacin
Desorden de terreno (G)
Tipo de filtro (F)
GF
Bloques
Error
Tbtal

Grados de
libertad
2
1
2
3
15
23

Cuadrado
medio
167.79
1066.67
38.54
134.06
11.09

Fo
15.13
96.19
3.48

Valor P
0.0003
<0.0001
0.0573

cuadrados debida a los bloques se encuentra a partir de los totales de los operadores {y *} de la siguiente
manera:

Bloques

_ J _ v

ab Z ,

2 -J L

> -*

abn

- fej[(572)1+<579)!+<597)1+(530)I1= 402.17
E n la tab la 5-20 se resum e el anlisis de varianza com pleto de este experim ento. L a presentacin de
la tab la 5-20 indica que todos los efectos se probaron dividiendo sus cuadrados m edios p o r el cuadrado
m edio del error. Tnto el desorden de terreno com o el tipo de filtro son significativos en el nivel de 1%,
m ientras que su interaccin slo es significativa en el nivel de 10%. Por lo tanto, se concluye que tanto
el nivel del desorden de terren o como el tipo de filtro de cam po usado en la pantalla afectan la habili
dad del operador para detectar el objetivo, y existe cierta evidencia de una ligera interaccin entre ambos
factores.

E n el caso de dos restricciones sobre la aleatorizacin, cada una conp niveles, si el nm ero de combi
naciones de los tratam ientos en un diseo factorial de k factores es exactam ente igual al nm ero de nive
les de la restriccin, es decir, sip = ab ... ra, entonces el diseo factorial puede correrse en un cuadrado
latino p x p . Por ejem plo, considere una m odificacin del experim ento de la deteccin del objetivo en el
rad ar del ejemplo 5-6. Los factores de este experimento son el tipo de filtro (dos niveles) y el desorden de
terreno (tres niveles), y los operadores se consideran como bloques. Suponga ahora que debido a lim ita
ciones de tiem po, slo pueden hacerse seis corridas por da. Por lo tanto, los das se convierten en una se
gunda restriccin sobre la aleatorizacin, lo cual resu lta en un diseo del cuadrado latino 6 x 6 , com o
se m uestra en la tabla 5-21. E n esta tabla se han usado las letras m insculas/yg p ara representar los nive
les i-simo y/-sim o del tipo de filtro y del desorden de terreno, respectivam ente. Es decir, f g 2 representa
el filtro tipo 1 y un desorden de terreno interm edio. Observe que se necesitan ahora seis operadores, en
lugar de los cuatro del experim ento original, por lo que el nm ero de combinaciones de tratam ientos en
el diseo factorial 3 x 2 es exactam ente igual al nm ero de niveles de restriccin. Adems, en este diseo
cada operador se usara una sola vez en cada da. Las letras latinas A, B, C, D, E y F representan las 3 x 2
= 6 combinaciones de tratam ientos del diseo factorial como sigue: A = f ig l, B = f ig 2>C = f-g ^ D = f s i , E
= te i y

= t e 3-

210

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Tabla 5-21 El experimento de la deteccin del radar realizado en un cuadrado latino


Operador
Da
1
2
3
4
1
B ( f o = 106) C(flg3 = 108)
Aifigi = 90)
W x i = 81)
2
C(fig3 = 114) ^(fiS i = 96)
F(fig 83)
B t f to = 105)
3
B (ffo = 102) E (f*z = 90)
F (f* 3 = 95)
(figi = 92)
4
E(fig2 - 887) D (ffo = 84) A ( f lgl - 100)
BViSi - 96)
5
C ( f o = 112) D(fXi = 92)
E(fig2 = 80)
F(f*3 = 93)
6
D < f& = 86)
c ( f x 3 = 98)
Effigi = 97)
F (f* 3 = 91)

6x6
5

P<f> = 90)
F<S$i =
=
E ( f # i = 86)
C(f,g 3 =
= 85)
C (fo, = 110) F ( f * 3 =
B i f fo Aifigi - 90)
B fiS i = 100) Aifigi =

88)
84)
104)
91)
98)
92)

Los cinco grados de libertad entre las seis letras latinas corresponden a los efectos principales del tipo
de filtro (un grado de libertad), el desorden de terreno (dos grados de libertad) y su interaccin (dos gra
dos de libertad). El m odelo estadstico lineal de este diseo es
\i = 1 ,2 ,..., 6
y w = /* + a t +*j + k H*)jk + 0 /

= 1 ,2 ,3
= 1 ,2

<5-38>

1 = 1 ,2 ,...,6
donde z y k son los efectos del desorden de terreno y del tipo de filtro, respectivam ente, y a y 8, represen
tan las restricciones sobre la aleatorizacin de los das y los operadores, respectivam ente. P ara calcular las
sumas de cuadrados, la siguiente tabla de dos vas de los totales de los tratam ientos es til:
Desorden de terreno
Bajo
Intermedio
Alto
y..k.

Filtro tipo 1
560
607
646
1813

Filtro tipo 2
512
528
543

y...

1072
1135
1189
3396= y.

1583

Adems, los totales de los renglones y las columnas son


Renglones (y_u):
Columnas iyik):

563
572

568
579

568
597

568
530

565
561

564
557

E n la tabla 5-22 se resum e el anlisis de varianza. Se ha agregado una colum na a esta tabla que indica
cmo se determ ina el nm ero de grados de libertad de cada suma de cuadrados.
Tabla 5-22 Anlisis de varianza del experimento de la deteccin en el radar realizado como un diseo factorial 3 x 2 en un
cuadrado latino

Fuente de
variacin
Desorden de terreno, G
Tipo de filtro, F
GF
Das (renglones)
Operadores
(columnas)
Error
Tbtal

Suma de
cuadrados
571.50
1469.44
126.73
4.33
428.00

Grados de
libertad
2
1
2
5
5

Frmula general
para los grados
de libertad
a-l
b- 1
( f l- l) ( f t - l )
ab- 1
ab- 1

198.00
2798.00

20
36

(ab - l)(ab - 2)
(ab)21

Cuadrado
medio
285.75
1469.44
63.37
0.87
85.60
9.90

F0
28.86
148.43
6.40

Valor P
<0.0001
<0.0001
0.0071

5-7 PROBLEMAS

5-7

5-1.

211

PROBLEMAS

Se estudia el rendim iento de un proceso qumico. Se piensa que las dos variables ms im portantes son la p re
sin y la tem peratura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experim ento factorial con
dos rplicas. Los datos del rendim iento son:

Presin (psig)
Tem peratura (C)

200

215

230

150

90.4
90.2
90.1
90.3
90.5
90.7

90.7
90.6
90.5
90.6
90.8
90.9

90.2
90.4
89.9
90.1
90.4
90.1

160
170

a) A nalizar los datos y sacar conclusiones. U tilizar a = 0.05.


b ) C onstruir las grficas de los residuales apropiadas y com entar la adecuacin del modelo.
c) Bajo qu condiciones debera operarse este proceso?
5-2.

U n ingeniero sospecha que el acabado superficial de una pieza m etlica se afecta p o r la velocidad de alim en
tacin y la profundidad de corte. Selecciona tres velocidades de alim entacin y cuatro profundidades de cor
te. D espus realiza un experim ento factorial y obtiene los siguientes datos:

Velocidad de alimentacin
(pulg/min)

Profundiad de corte (pulg)


0.15

0.18

0.20

0.25

0.20

74
64
60

79
68
73

82
88
92

99
104
96

0.25

92
86
88

98
104
88

99
108
95

104
110
99

0.30

99
98
102

104
99
95

108
110
99

114
111
107

a) A nalizar los datos y sacar conclusiones. U tilizar a 0.05.


b) C onstruir las grficas de los residuales apropiadas y com entar la adecuacin del modelo.

5-3.
5-4.

c) O btener estim aciones puntuales del acabado superficial prom edio con cada velocidad de alim entacin.
d ) E ncontrar los valores P para las pruebas del inciso a.
P ara los datos del problem a 5-2, calcular la estim acin de un intervalo de confianza de 95% de la diferencia
m edia en la respuesta p ara velocidades de alim entacin de 0.20 y 0.25 pulg/min.
E n un artculo de Industrial Quality Control se describe u n experim ento p ara investigar el efecto del tipo de
cristal y del tipo de fsforo sobre la brillantez de un cinescopio. L a variable de respuesta es la corriente (en
m icroam peres) necesaria p ara obtener un nivel de brillantez especfico. Los datos son los siguientes:

CAPTULO 5

212

INTRODUCCIN A LOS DISEOS FACTORIALES

Tipo de fsforo

Tipo de
cristal

5-5.

280
290
285

300
310
295

290
285
290

230
235
240

260
240
235

220
225
230

a) Existe algn indicio de que alguno de los dos factores influye en la brillantez? U tilizar a = 0.05.
b) Los dos factores interactan? U tilizar a = 0.05.
c) A nalizar los residuales de este experimento.
Johnson y L eone ( Statistics and Experimental Design in Engineering and the Physical Sciences, John Wiley)
describen un experim ento realizado para investigar la torcedura de placas de cobre. Los dos factores estudia
dos fueron la tem peratura y el contenido de cobre de las placas. L a variable de respuesta fue un a m edida de
la cantidad de torcedura. Los datos fueron los siguientes:

Contenido de cobre (% )
Tem peratura (C)

40

60

80

50
75
100
125

17,20
12, 9
16,12
21,17

16,21
18,13
18,21
23,21

24,22
17,12
25,23
23,22

100
28,27
27,31
30,23
29,31

a) Existe algn indicio de que alguno de los dos factores afecta la cantidad de torcedura? H ay alguna in
teraccin entre los factores? U tilizar a = 0.05.
b) A nalizar los residuales de este experimento.
c)

5-6.

G raficar la torcedura prom edio con cada nivel del contenido de cobre y com pararlas con un a distribu
cin t con la escala apropiada. D escribir las diferencias en los efectos de los diversos niveles del conteni
do de cobre sobre la torcedura. Si es deseable una to rced u ra baja, qu nivel del contenido de cobre
debera especificarse?
d) Supnga que no es sencillo controlar la tem p eratu ra en el m edio am biente donde van a usarse las placas
de cobre. E ste hecho modifica la respuesta que se dio p ara el inciso c?
Se estudian los factores que influyen en la resistencia a la ru p tu ra de un a fibra sinttica. Se eligen cuatro m
quinas de produccin y tres operadores y se corre un experim ento factorial utilizando fibra del mismo lote de
produccin. Los resultados son los siguientes:

M quina
O perador

3
108
109

110
108

109
110

110
115

110
112

110
111

111
109

114
112

116
114

112
115

114
119

120
117

5-7 PROBLEMAS

213

A nalizar los datos y sacar conclusiones. U tilizar a = 0.05.


b) C onstruir las grficas de los residuales apropiadas y com entar la adecuacin del modelo.
a)
5-7.

U n ingeniero m ecnico estudia la fuerza de em puje desarrollada por un a taladradora. Sospecha que la velo
cidad de taladrado y la velocidad de alim entacin del m aterial son los factores ms im portantes. Selecciona
cuatro velocidades de alim entacin y usa una velocidad de taladrado alta y o tra baja elegidas p ara represen
ta r las condiciones de operacin extremas. O btiene los siguientes resultados. A nalizar los datos y sacar con
clusiones. U tilizar a = 0.05.

Velocidad de alimentacin
Velocidad de taladrado
125

200

0.015

0.030

0.045

0.060

2.70
2,78

2.45
2.49

2.60
2.72

2.86

2.83

2.85
2.80

2.86

2.94

2.87

2.88

2.86

5-8.

2.75

Se realiza un experim ento para estudiar la influencia de la tem p eratu ra de operacin y tres tipos de placas de
recubrim iento de cristal, en la salida lum inosa de un tubo de osciloscopio. Se registraron los siguientes datos:

Tem peratura

Tipo de
cristal

100

125

150

580
568
570

1090
1087
1085

1392
1380
1386

550
530
579

1070
1035

1000

1328
1312
1299

546
575
599

1045
1053
1066

867
904
889

a) U tilizar a = 0.05 en el anlisis. Existe un efecto de interaccin significativo? El tipo de cristal o la tem
peratu ra afectan la respuesta? A qu conclusiones se llega?

b) A justar un m odelo apropiado que relacione la salida lum inosa con el tipo de cristal y la tem peratura.
c) A nalizar los residuales de este experim ento. C om entar la adecuacin de los m odelos que se hayan consi
5-9.
5-10.

derado.
Considere el experim ento del problem a 5-1. A justar un m odelo apropiado a los datos de la respuesta. U sar
este m odelo como gua p ara las condiciones de operacin del proceso.
U sar la prueba de Tkey para determ inar los niveles del factor presin que son significativam ente diferentes
p ara los datos del problem a 5-1.

214
5-11.

CAPTULO 5

INTRODUCCIN A LOS DISEOS FACTORIALES

Se llev a cabo un experimento para determinar si la temperatura de coccin o la posicin en el homo afec
taban el espesor del endurecimiento de un nodo de carbono. Los datos se presentan a continuacin:

Posicin
1

5-12.
5-13.

1
36
18
30

Factor de la columna
2
3
36
39
22
20
37
33

4
32
20
34

Se piensa que la resistencia al corte de un adhesivo se afecta por la presin de aplicacin y la temperatura. Se
realiza un experimento factorial en el que ambos factores se suponen fijos. Analizar los datos y sacar conclu
siones. Realizar una prueba de no aditividad.

Presin
(lb/pulg2)
120
130
140
150
5-15.

850
565
510
590
526
538
532

Suponga que se considera que no existe ninguna interaccin. Desarrollar el modelo estadstico. Realizar el
anlisis de varianza y probar las hiptesis sobre los efectos principales. Qu conclusiones pueden sacarse?
Comentar la adecuacin del modelo.
Deducir los cuadrados medios esperados para un anlisis de varianza de dos factores con una observacin
por celda, suponiendo que ambos factores son fijos.
Considere los siguientes datos de un experimento factorial de dos factores. Analizar los datos y sacar conclu
siones. Realizar una prueba de no aditividad. Utilizar a = 0.05.

Factor del rengln


1
2
3
5-14.

800
570
565
583
528
547
521

Tbmperatura (C)
825
1063
1080
1043
988
1026
1004

Tfemperatura (F)
260
270
250
11.28
9.60
9.00
10.10
9.57
9.69
8.43
11.01
9.03
10.44
9.98
9.80

Considere el modelo de tres factores


i = 1,2,..., a
yijk = f i + t i + j + y k + ( i )ij + (y)jk + ijk

j = l,% ...,b
k = l,2 ,...,c

Observe que hay una sola rplica. Suponiendo que los tres factores son fijos, desarrollar la tabla del anlisis
de varianza, incluyendo los cuadrados medios esperados. Qu se usara como error experimental para
probar las hiptesis?

5-7 PROBLEMAS

5-16.

El porcentaje de la concentracin de madera dura en la pulpa bruta, la presin de la cuba y el tiempo de coc
cin de la pulpa se investigan en cuanto a sus efectos sobre la resistencia del papel. Se seleccionan tres niveles
de la concentracin de madera dura, tres niveles de la presin y dos tiempos de coccin. Se lleva a cabo un ex
perimento factorial con dos rplicas, obtenindose los siguientes datos:

Porcentaje de l

madera dura
2
4
8

5-17.

215

Tiempo de coccin 3.0 horas


---------Presin
400
500
650
196.6
197.7
199.8
196.0
196.0
199.4
198.5
196.0
198.4
197.2
196.9
197.6
197.5
195.6
197.4
196.6
196.2
198.1

Tiempo de coccin 4.0 horas


Presin
400
500
650
198.4
199.6
200.6
200.4
198.6
200.9
197.5
198.7
199,6
198.1
198.0
199.0
197.6
197.0
198.5
198.4
197.8
199.8

a) Analizar los datos y sacar conclusiones. Utilizar a = 0.05.


b) Construir las grficas de los residuales apropiadas y comentar la adecuacin del modelo.
c) Bajo qu conjunto de condiciones debera operarse este proceso? Por qu?
El departamento de control de calidad de una planta de acabados textiles estudia el efecto de varios factores
sobre el teido de una tela de algodn y fibras sintticas utilizada para fabricar camisas para caballero. Se se
leccionaron tres operadores, tres duraciones del ciclo y dos temperaturas, y se tieron tres ejemplares peque
os de la tela bajo cada conjunto de condiciones. La tela terminada se compar con un patrn, y se le asign
una evaluacin numrica. Los datos se presentan enseguida. Analizar los datos y sacar conclusiones. Comen
tar la adecuacin del modelo.

Tfcmperatura

n del ciclo
40

50

60

5-18.

5-19.

1
23
24
25
36
35
36
28
24
27

300
Operador
2
27
28
26
34
38
39
35
35
34

3
31
32
29
33
34
35
26
27
25

1
24
23
28
37
39
35
26
29
25

350
Operador
2
38
36
35
34
38
36
36
37
34

3
34
36
39
34
36
31
28
26
24

Suponga que en el problema 5-1 quiere rechazarse la hiptesis nula con una alta probabilidad si la diferencia
entre el verdadero rendimiento promedio con dos presiones cualesquiera es mayor que 0.5. Si una estima
cin previa razonable de la desviacin estndar del rendimiento es 0.1, cuntas rplicas debern correrse?
Se estudia el rendimiento de un proceso qumico. Los dos factores de inters son la temperatura y la presin.
Se seleccionan tres niveles de cada factor; sin embargo, slo es posible hacer nueve corridas en un da. El ex

216

CAPTULO 5 INTRODUCCIN A LOS DISEOS FACTORIALES

perimentador corre una rplica completa en cada da. Los datos se muestran en la tabla siguiente. Analizar
los datos, suponiendo que los das son bloques.

Da 1
Presin
Temperatura__________250_________ 260__________ 270_________
Baja
863
840
85
Intermedia
88.5
87.3
89.0
Alta
89.1
90.2
91.3

5-20.
5-21.
5-22.

Considere los datos del problema 5-5. Analizar los datos, suponiendo que las rplicas son bloques.
Considere los datos del problema 5-6. Analizar los datos, suponiendo que las rplicas son bloques.
En un artculo de Journal o f Testing and Evaluation (vol. 16, no. 2, pp. 508-515) se investigaron los efectos de
la frecuencia de carga cclica y de las condiciones ambientales sobre el crecimiento de las fisuras por fatiga
con un esfuerzo constante de 22 MPa para un material particular. Los datos del experimento se presentan
abajo (la respuesta es el ndice de crecimiento de las fisuras por fatiga):

Frecuencia

10

0.1

5-23.

250
86.1
89.4
91.7

Da 2
Presin
260__________ 270
85^2
873
89.9
90.3
93.2
93.7

Aire
2.29
2.47
2.48
2.12
2.65
2.68
2.06
2,38
2.24
2.71
2.81
2.08

Medio ambiente
H20
H20 salada
2.06
1.90
2.05
1.93
2.23
1.75
2.06
2.03
3.10
3.20
3.18
3.24
3.96
3.98
3.64
3.24
11.00
9.96
10.01
11.00
9.06
9.36
11,30
10.40

a) Analizar los datos de este experimento (utilizar a 0.05).


b) Analizar los residuales.
c) Repetir los anlisis de los incisos ayb utilizando ln(y) como la respuesta. Comentar los resultados.
En un artculo de IEEE Transactions on Electron Devices se describe un estudio sobre el dopado del polisilicio. El experimento que se muestra a continuacin es una variante de dicho estudio. La variable de respuesta
es la corriente fundamental.
Dopado del
polisilicio (iones)

Temperatura de revenido (C)


900
950
1000
4.60
10.15
11.01
4.40
10.20
10.58
9.38
10.81
3.20
10.02
10.60
3.50

5-7 PROBLEMAS

217

a) Existe evidencia (con a = 0.05) que indique que el nivel de dopado del polisilicio o la temperatura de fi
jacin afecten la corriente fundamental?
b) Construir representaciones grficas como ayuda para interpretar este experimento.
c) Analizar los residuales y comentar la adecuacin del modelo.
d) El modelo
y 0

2X 2

?2X2

est apoyado por este experimento (x, = nivel de dopado,


este modelo y graficar la superficie de respuesta.

l 2 ^ l ^ 2
= temperatura)? Estimar los parmetros de

Diseo factorial l

6-1

INTRODUCCIN

Los diseos factoriales se usan am pliam ente en experim entos que incluyen varios factores cuando es n e
cesario estudiar el efecto conjunto de los factores sobre una respuesta. E n el captulo 5 se presentaron los
m todos generales para el anlisis de los diseos factoriales. Sin embargo, hay varios casos especiales del
diseo factorial general que son im portantes debido a su uso generalizado en el trabajo de investigacin y
porque constituyen las bases de otros diseos de gran valor prctico.
El ms im portante de estos casos especiales es el de k factores, cada uno con slo dos niveles. Estos
niveles pueden ser cuantitativos, como dos valores de tem peratura, presin o tiem po, o bien cualitativos,
como dos mquinas, dos operadores, los niveles alto y bajo de un factor, o quiz la presencia o ausen
cia de un factor. U na rplica com pleta de este diseo requiere 2 x 2 x ... x 2 = 2l observaciones y se le
llam a diseo factorial 2*.
E ste captulo se enfoca en esta clase en extremo im portante de diseos. A lo largo del captulo se su
pone que 1) los factores son fijos, 2) los diseos son com pletam ente aleatorizados y 3) se satisfacen los su
puestos de norm alidad usuales.
El diseo 2k es de particular utilidad en las etapas iniciales del trabajo experim ental, cuando proba
blem ente se estn investigando muchos factores. Este diseo proporciona el m enor nm ero de corridas
con las que pueden estudiarse k factores en un diseo factorial com pleto. Por consiguiente, estos diseos
se usan am pliam ente en los experimentos de tamizado o seleccin de factores.
Puesto que slo hay dos niveles p ara cada factor, se supone que la respuesta es aproxim adam ente li
neal en el rango elegido para los niveles de los factores. E n muchos experim entos de tam izado de facto
res, cuando se acaba de iniciar el estudio del proceso o sistema, este supuesto suele ser razonable. E n la
seccin 6-6 se presentar un m todo simple para verificar este supuesto, y se analizarn las acciones que
debern em prenderse en caso de que se viole.
218

6-2 EL DISEO 21

6-2

219

EL DISEO 23

El prim er diseo de la serie 2* es el que slo tiene dos factores, por ejemplo, A y B; cada uno se corre a dos
niveles. A este diseo se le llam a diseo factorial 2 \ Los niveles de los factores pueden denom inarse arbi
trariam ente bajo y alto. Como un ejemplo, considere la investigacin del efecto de la concentracin
del reactivo y de la cantidad del catalizador sobre la conversin (rendim iento) de un proceso qumico. Sea
la concentracin del reactivo el fa c to r^ , y sean 15 y 25 por ciento los dos niveles de inters. El catalizador
es el factor B, con el nivel alto denotando el uso de 2 libras del catalizador y el nivel bajo denotando el uso
de 1 libra. Se hacen tres rplicas del experimento, y los datos son los siguientes:

A
-

Combinacin de
tratamientos
A bajo, B bajo
A alto, B bajo
A bajo, B alto
A alto, B alto

+
+

______ Rplica
II
I
25
28
32
36
18
19
31
30

ni
27
32
23
29

Tota
80
100
60
90

Las com binaciones de los tratam ientos se ilustran grficam ente en la figura 6-1. Por convencin, el
efecto de un factor se denota con u n a letra mayscula latina. Por lo tanto, A se refiere al efecto del facto rA , B al efecto del factor B, y A B a la interaccin AB. E n el diseo 2Z, los niveles bajo y alto de A y B
se denotan por
y + , respectivam ente, en los ejesA y B. Por lo tanto, - en el eje A representa el nivel
bajo de la concentracin (15% ), m ientras que + representa el nivel alto (25% ), y - en el eje B representa
el nivel bajo del catalizador, m ientras que + denota el nivel alto.
Las cuatro combinaciones de tratam ientos suelen representarse con letras minsculas, como se
m uestra en la figura 6-1. Por la figura se observa que el nivel alto de cualquiera de los factores en una com
binacin de tratam ientos se denota por la letra minscula correspondiente y que el nivel bajo de un factor
en una com binacin de tratam ientos se denota por la ausencia de la letra respectiva. Por lo tanto, a repreab - 90
(31 + 30 +29)

>-60

Mo + < >
(2 libras)

-S-S
II

Bajo
(1 libra)

(1) - 80
(28 + 25 + 27)

(36 + 32 + 32)

Bajo

Alto

a = 100

+
(15%)

(25%)
Concentracin
del reactivo,

A
Figura 6-1
seo 22.

Combinaciones de los tratamientos en el di

220

CAPTULO 6

DISEO FACTORIAL 2

senta la combinacin de tratam ientos conA en el nivel alto y B en el nivel bajo, b re p re se n ta d en el nivel
bajo y B en el nivel alto, y ab representa ambos factores en el nivel alto. Por convencin, se usa (1) para de
n otar que ambos factores estn en el nivel bajo. E sta notacin se utiliza en todas las series 2k.
E n un diseo factorial con dos niveles, el efecto prom edio de un factor puede definirse como el cam
bio en la respuesta producido por un cambio en el nivel de ese factor prom ediado p ara los niveles del otro
factor. Asimismo, los smbolos (1), a, b y ab representan ahora el total de las n rplicas hechas con la com
binacin de los tratam ientos, como se ilustra en la figura 6-1. A hora el efecto de A en el nivel bajo de 5 es
[a - (1 )\/n y el efecto de A con el nivel alto de B es [ab - b]/n. Al prom ediarse estas dos cantidades se obtie
ne el efecto principal de A:
A = ~ { [ a b ~ b ] + [ a -(l))}

= [ & + -&-(l)]

(6-1)

El efecto principal prom edio de B se encuentra a partir del efecto deB con el nivel bajo d e A (es decir,
[b - (l)]/n ) y con el nivel alto de A (o sea, [ab - a\lri) como
B = j { [ a b - a ] + [ b - ( l) ] }

= j n [ a b + b ~ a - ( l )]

(6-2)

El efecto de la interaccin A S se define como la diferencia prom edio entre el efecto de A con el nivel
alto de B y el efecto de A con el nivel bajo de B. Por lo tanto,
AB = ^ { [ a b -b ] -[ a -(l)] }

= [ r + (1 )- - f e ]

(6-3)

D e m anera alternativa, AB puede definirse como la diferencia prom edio entre el efecto de B con el
nivel alto de A y el efecto de B con el nivel bajo de A . Esto llevar tam bin a la ecuacin 6-3.
Las frmulas de los efectos de A , B y A B pueden deducirse con otro m todo. El efecto de A puede en
contrarse como la diferencia en la respuesta prom edio de las dos combinaciones de tratam ientos situadas
a la derecha del cuadrado de la figura 6-1 (a este prom edio se le llam ayA+, porque es la respuesta prom e
dio con las combinaciones de tratam ientos donde A est en el nivel alto) y las dos com binaciones de trata
m ientos situadas a la izquierda del cuadrado de la figura 6-1 (o yA-). Es decir,
A = ^ - y A_ ab+ a + (1 )
2
n
2n
= . la b + a - b - m i

Se trata exactam ente del mismo resultado que el de la ecuacin 6-1. El efecto de B , ecuacin 6-2, se
encuentra como la diferencia entre el prom edio de las dos combinaciones de tratam ientos de la parte su-

6-2 EL DISEO 2Z

221

perior del cuadrado (yB+) y el prom edio de las dos com binaciones de tratam ientos de la parte inferior
(a-), o
B=
_ a b +b
2

a + (l)
n

2n

= ^ [ ab+ b - a - ( l ) ]
Por ltimo, el efecto de la interaccin A B es el prom edio de las com binaciones de tratam ientos de la dia
gonal de derecha a izquierda del cuadrado [ab y (1)] menos el prom edio de las com binaciones de trata
m ientos de la diagonal de izquierda a derecha ( y b), o
A B = ab+ (Y )_a+ b_
2

2n

resultado que es idntico a la ecuacin 6-3.


Utilizando el experim ento de la figura 6-1, los efectos prom edio pueden estim arse como
A = ^ ( 9 0 + 1 0 0 - 6 0 - 80) = 8.33
5 =
2 (3

(90 + 6 0 -1 0 0 - 80) = -5 .0 0
y
'

A B = ^ ( 9 0 + 8 0 -1 0 0 - 60) = 1.67

El efecto de A (concentracin del reactivo) es positivo; esto sugiere que al in c re m e n ta r del nivel bajo
(15% ) al nivel alto (25% ), el rendim iento se increm entar. El efecto de B (catalizador) es negativo; esto
sugiere que al increm entar la cantidad del catalizador que se agrega al proceso se reducir el rendim ien
to. El efecto de la interaccin parece ser pequeo en com paracin con los dos efectos principales.
E n muchos experim entos que incluyen diseos 2k, se examinar la m agnitud y la direccin de los efec
tos de los factores a fin de determ inar las variables que son de posible im portancia. E n la mayora de los
casos puede usarse el anlisis de varianza para confirm ar esta interpretacin. Hay varios paquetes de soft
ware de estadstica excelentes que son tiles para establecer y analizar diseos 2k. Se cuenta tam bin con
m todos especiales que ahorran tiem po cuando los clculos se hacen m anualm ente.
Considere las sumas de cuadrados de A, B y AB. Observe, por la ecuacin 6-1, que se us un contraste
p ara estim ar A , a saber
Contraste x = a b + a - b - ( l )

(6-4)

A este contraste suele llam rsele el efecto total de A . A partir de las ecuaciones 6-2 y 6-3, se observa que
tam bin se usan contrastes para estim ar B y AB. Adems, estos tres contrastes son ortogonales. L a suma
de cuadrados de cualquier contraste puede calcularse con la ecuacin 3-29, la cual establece que la suma
de cuadrados del contraste es igual al cuadrado del contraste dividido por el nm ero de observaciones en

222

CAPTULO 6

DISEO FACTORIAL 2*

cada total del contraste multiplicado por la suma de cuadrados de los coeficientes del contraste. P or con
siguiente, se tienen

(M )
(M )
y

_ [ a b + (l)-a -b ] 2
S S ab -

4n

( 6 ' 7 )

como las sumas de cuadrados de A , B y AB.


Al utilizar el experim ento de la figura 6-1, las sumas de cuadrados de las ecuaciones 6-5,6-6 y 6-7 pue
den encontrarse como

20833
(-3 0 )2
SS ~

4 ( 3 ) = 75 00

(68)

33
M

4(3)

L a suma de cuadrados total se encuentra como de costumbre, es decir,

r - j i - ^
=l ;=1 Jfc=1

<m>

E n general, S S Ttiene An - 1 grados de libertad. L a suma de cuadrados del error, con 4(n - 1 ) grados de li
bertad, suele calcularse por sustraccin como
SSE = SST - S S A - SSB - S S ^

(6-10)

Para el experim ento de la figura 6-1, se obtiene


2

j-i *=i i i - h
9398.00 - 9075.00 = 323.00
y

ssE= ssT ssA- ssB- ss^


-

= 3 2 3 .0 0 - 208.33- 75.00 - 8.33


= 31.34
al utilizar SSA, SSg y 5 5 ^ de la ecuacin 6-8. E n la tabla 6-1 se resum e el anlisis de varianza completo.
Con base en los valores P, se concluye que los efectos principales son estadsticam ente significativos y que
no hay interaccin entre estos factores. Esto confirma la interpretacin de los datos que se hizo original
m ente con base en las m agnitudes de los efectos de los factores.
Con frecuencia resulta conveniente escribir las combinaciones de los tratam ientos en el orden (1), a,

-Z EL DISEO 21
Tabla 6-1

Fuente de
variacin
A
B
AB
Error
Total

223

Anlisis de varianza del experim ento de la figura 6-1

Suma de
cuadrados
208.33
75.00
8.33
31.34
323.00

Cuadrado
medio
208.33
75.00
8.33
3.92

Grados de
libertad
1
1
1
8
11

53.15
19.13
2.13

Valor P
0.0001
0.0024
0.1826

b, ab. Se hace referencia a esto com o el orden e st n d a r (u orden de Yates, p o r el D r. F rank Yates). Al
utilizar este orden estndar, se observa que los coeficientes de los contrastes usados p ara estim ar los
efectos son
Efectos
A:
B:
AB:

(1)
-1
-1
+1

a
+1
-1
-1

b
-1
+1
-1

ab
+1
+1
+1

Observe que los coeficientes de los contrastes para estimar el efecto de la interaccin son slo el producto
de los coeficientes correspondientes de los dos efectos principales. El coeficiente de un contraste es siem
pre +1 o -1, y puede usarse una tabla de signos positivos y negativos como la tabla 6-2 para determinar el
signo correcto para cada combinacin de tratamientos. Los encabezados de las columnas de la tabla 6-2
son los efectos principales (A y B), la interaccin A e I, que representa el total o promedio del experi
mento completo. Observe que la columna que corresponde a I incluye nicamente signos positivos. Las
etiquetas de los renglones son las combinaciones de los tratamientos. Para encontrar el contraste para es
timar cualquier efecto, simplemente se multiplican los signos de la columna apropiada de la tabla por la
combinacin de tratamientos correspondiente y se hace la suma. Por ejemplo, para estimarA, el contras
te es -(1 ) + a - b + ab, que concuerda con la ecuacin 6-1.
El modelo de regresin

En un diseo factorial 2k es sencillo expresar los resultados del experimento en trminos de un modelo de
regresin. Puesto que 2* es tan slo un diseo factorial, podra usarse un modelo de los efectos o de las
medias, pero el enfoque del modelo de regresin es mucho ms natural e intuitivo. Para el experimento
del proceso qumico de la figura 6-1, el modelo de regresin es

y = o+ lxl+ 2x2+e
donde X! es una variable codificada que representa la concentracin del reactivo y x 2 es una variable codi
ficada que representa la cantidad del catalizador y las/i son los coeficientes de regresin. La relacin en
labia 6-2
________

Signos algebraicos para calcular los


efectos en el diseo 22______________________

Combinacin de
tratamientos
(1)
a
b
ab

____ Efecto factorial____


I
A
B
AB
+

+
+
+

+
+

+
+

224

CAPTULO 6

DISEO FACTORIAL l l-

tre las variables naturales la concentracin del reactivo y la cantidad de catalizador y las variables
codificadas es
C oncentracin-(C oncentracin baja + Concentracin ^ ) / 2
X

-------------------------------------------------------------------------------------------------------------------------------------------

(Concentracin j,, - Concentracinbaja ) / 2


y

Catalizador - (Catalizadorbsjo +Catalizadoralto ) / 2


X

--------------------------------------------------------- ;--------------------------
-------- ----------------------------

(C atalizador^ - Catalizadorbajo ) / 2

Cuando las variables naturales slo tienen dos niveles, esta codificacin producir la familiar nota
cin 1 p ara los niveles de las variables codificadas. Para ilustrar esto en el ejemplo tratado, observe que
_ Concentracin - (15+ 25) / 2
*1 _
( 2 5 - 1 5 ) /2
20
_ Concentracin
_
Por lo tanto, si la concentracin est en el nivel alto (Concentracin = 25%), e n to n c e s^ = +1; si la con
centracin est en el nivel bajo (Concentracin = 15%), entonces x x = -1 . Adems,
Catalizador - (1 + 2) / 2
*2 "

(2 -1 )/2

_ C a ta liz a d o r-1.5
~

05

Por lo tanto, si el catalizador est en el nivel alto (Catalizador = 2 libras), entoncesx 2 = +1; si el cataliza
dor est en el nivel bajo (Catalizador = 1 libra), entonces x 2 = -1.
El m odelo de regresin ajustado es

( 8.33^
5>= 27.5+ - k

5,00\
+ \ \ x 2

donde la ordenada al origen es el gran prom edio de las 12 observaciones, y los coeficientes de regresin 1
y 2 son la m itad de las estimaciones de los efectos de los factores correspondientes. L a razn de que el
coeficiente de regresin sea la m itad de la estimacin del efecto es que un coeficiente de regresin m ide el
efecto de un cambio unitario e n x sobre la m edia de y, y la estim acin del efecto se basa en un cambio de
dos unidades (de -1 a +1). Se dem ostrar ms adelante que este m todo simple para estim ar los coefi
cientes de regresin consiste en producir las estimaciones de mnimos cuadrados de los parm etros. Ver
tam bin el m aterial suplem entario de este captulo.
R esid u ales y a d e c u a c i n del m od elo

El m odelo de regresin puede usarse para obtener el valor predicho o ajustado de y en los cuatro puntos
del diseo. Los residuales son las diferencias entre el valor observado y el valor ajustado de y. Por ejem
plo, cuando la concentracin del reactivo est en el nivel bajo (xx = -1 ) y el catalizador est en el nivel bajo
(x2 = -1 ), el rendim iento predicho es

6-2 EL DISEO V

225

Hay tres observaciones en esta combinacin de tratam ientos, y los residuales son
e 1 = 2 8 - 25.835= 2.165
e2 = 2 5 -2 5 .8 3 5 = -0 .8 3 5
e 3 = 2 7 -2 5 .8 3 5 = 1 .1 6 5
Los valores predichos y los residuales restantes se calculan de m anera similar. Para el nivel alto de la con
centracin del reactivo y el nivel bajo del catalizador,

= 34.165

e4 = 3634.165= 1.835
e5 = 3 2 -3 4 .1 6 5 = -2.165
. e 6 = 3 2 -3 4 .1 6 5 = -2 .1 6 5
Para el nivel bajo de la concentracin del reactivo y el nivel alto del catalizador,

= 20.835

en = 1 8 - 20.835 = -2.835
e8 = 1 9 -2 0 .8 3 5 = -1 .8 3 5
eg = 2 3 - 20.835 = 2165
P or ltimo, para el nivel alto de ambos factores,
* = 2 7 -5 + (

/ - 5 .0 0 \
)(+ !)+ (
J (+ l)

= 29.165

em = 3 1 -2 9 .1 6 5 = 1 .8 3 5
en = 30 - 29.165 = 0.835
e 12 = 2 9 -2 9 .1 6 5 = -0.165
E n la figura 6-2 se presenta una grfica de probabilidad norm al de estos residuales y una grfica de los re
siduales contra el rendim iento predicho. Estas grficas parecen ser satisfactorias, por lo que no hay razn
para sospechar problem as con la validez de las conclusiones.
La superficie de respuesta
El m odelo de regresin

(8.33^

f-5.00

226

CAPTULO 6
99

DISEO FACTORIAL 2k

T
+

95
90
I

80

I 70

1 50

5 30
a

20
10

1
J _____ L
- 2 .8 3 3

- 2 .0 0 0

2 .1 6 7

- 0 .3 3 3

0 .5 0 0

1 .3 3 3

2 .1 6 7

Residual
a) Grfica de probabilidad normal

2 .1 6 7

1 .3 3 3

0 .5 0 0

- 0 .3 3 3

'i
.
1 .1 6 7

2.000

- 2 .8 3 3
2 0 .8 3

2 3 .0 6

2 5 .2 8

2 7 .6 0

2 9 .7 2

3 1 .9 4

3 4 .1 7

Rendimiento predicho
6 ) Residuales contra el rendimiento predicho

Figura 6-2 Grficas de los residuales para el experimento del proce


so qumico.

puede usaise para generar grficas de superficie de respuesta. Si se desea construir estas grficas en trminos
de los niveles de los factores naturales, entonces simplemente las relaciones entre las variables naturales y las
codificadas que se dieron anteriormente se sustituyen en el modelo de regresin, de donde se obtiene
_

/8.33V Concentracin - 20 \ - 5 . 0 0 y C a t a l i z a d o r - 1.5

>=27-5+h~J( 5

0.5

= 18.33+ 0.8333Concentracin - 5.00Catalizador


E n la figura 6-3a se presenta la grfica de superficie de respuesta tridim ensional del rendim iento de
este modelo, y la figura 6-3b es la grfica de contorno. Puesto que el m odelo es de p rim er orden (es decir,
contiene nicam ente los efectos principales), la superficie de respuesta ajustada es un plano. Al examinar

6-2 EL DISEO 22

227

a) Superficie de respuesta

Concentracin del reactivo


6 ) Grfica de contorno

Figura 6-3 Grfica de la superficie de respuesta y grfica de contorno del


experimento del proceso qumico.

la grfica de contorno se observa que el rendim iento aum enta cuando la concentracin del reactivo se in
crem enta y la cantidad de catalizador disminuye. Frecuentem ente se usa una superficie ajustada como
sta para encontrar la direccin del mejoramiento potencial de un proceso. U na m anera formal de hacer
esto, llam ada mtodo del ascenso ms pronunciado, se presentar en el captulo 11 cuando se estudien los
m todos para realizar la exploracin sistemtica de las superficies de respuesta.

228

CAPTULO 6

6-3

EL DISEO 23

DISEO FACTORIAL 2l

Suponga que tres factores,A , B y C, cada uno con dos niveles, son de inters. Al diseo se le llam a diseo
factorial 23, y en este caso la representacin geom trica de las ocho com binaciones de tratam ientos puede
hacerse con un cubo, como se m uestra en la figura 6-4a. Utilizando la notacin + y
para representar
los niveles alto y bajo de los factores, las ocho corridas del diseo 23 pueden enlistarse como en la figura
6-4b. Se le conoce en ocasiones como la m atriz del diseo. H aciendo una ampliacin de la notacin de las
etiquetas revisada en la seccin 6-2, las combinaciones de los tratam ientos en el orden estndar se escri
ben como (1), a, b, ab, c, ac, be y abe. R ecuerde que estos smbolos representan tam bin el total de las n
observaciones hechas con esa combinacin de tratam ientos particular.
Existen en realidad tres notaciones diferentes p ara las corridas del diseo 23 que son de uso general.
L a prim era es la notacin + y - , llam ada con frecuencia notacin geomtrica. La segunda es el uso de las
etiquetas en letras minsculas p ara identificar las combinaciones de los tratam ientos. L a tercera y ltim a
notacin utiliza 1 y 0 para denotar los niveles alto y bajo, respectivam ente, de los factores, en lugar de
+ y - , Estas diferentes notaciones se ilustran enseguida para el diseo 23:

Corrida
1
2
3
4
5
6
7
8

Etiquetas

a)

+
+

+
-

+
+
+
+

a
b
ab
c
ac
be
abe

+ '

0
1
0
1
0
1
0
1

0
0
1
1
0
0
1
1

c
0
0
0
0
1
1
1
1

Hay siete grados de libertad entre las ocho combinaciones de tratam ientos del diseo 2 \ Ties grados
de libertad se asocian con los efectos principales de A , B y C. C uatro grados de libertad se asocian con las
interacciones; uno con cada una de las interacciones AB, A C y B C y uno con la interaccin A B C .
Considere la estim acin de los efectos principales. Prim ero, considere la estimacin del efecto princi
p a l i . El efecto de A cuando B y C estn en el nivel bajo es [a - (1)]/. D e m anera similar, el efecto de A

Factor
Corrida
1

Bajo

Alto
Factor A

a) Vista geomtrica

Figura 6-4 El diseo factorial 23.

3
4
5

+
-

+
+
-

b) La matriz del diseo

6-3 EL DISEO V

229

cuando B est en el nivel alto y C est en el nivel bajo es [ab - b]/n. El efecto de A cuando C est en el nivel
alto y B est en el nivel bajo es [ac - c\ln. P or ltimo, el efecto de A cuando tanto B como C estn en el ni
vel alto es [abe-bc]/n. P or lo tanto, el efecto prom edio de^4 es slo el prom edio de estos cuatro efectos, o
1
A = \a -(l)+ a b -b + a c -c + a b c -b c 1
4

(6-11)

E sta ecuacin tam bin puede desarrollarse como un contraste entre las cuatro combinaciones de tra
tam ientos de la cara derecha del cubo de la figura 6-5a (donde A est en el nivel alto) y las cuatro de la
cara izquierda (donde^4 est en el nivel bajo). Es decir, el efecto de A es slo el prom edio de las cuatro co
rridas donde A est en el nivel alto fyA+) m enos el prom edio de las cuatro corridas dondeyl est en el nivel
bajo fyA~), o
A = h * -h a+ ab+ ac+ abc
4n

(1 )+ b + c+ b c
4n

E sta ecuacin puede reescribirse como


A -^-[a+ ab + ac+ abc~ (1)b c bc~\
An
que es idntica a la ecuacin 6-11.

j
a) Efectos principales

AB

AC

BC

6 ) Interaccin de dos factores

= corridas +
O corridas -

c) Interaccin de los tres factores

Figura 6-5 Representacin geomtrica de los contrastes que corresponden a


los efectos principales y las interacciones del diseo 23.

230

CAPTULO 6

DISEO FACTORIAL 2l

D e m anera similar, el efecto de B es la diferencia en los prom edios entre las cuatro combinaciones de
tratam ientos de la cara frontal del cubo y las cuatro de la cara posterior. Se obtiene as
B =

= [ b + a b + b c + a b c ( l ) ~ a c - a c ]

(6-12)

E l efecto de C es la diferencia en los prom edios entre las cuatro com binaciones de tratam ientos de la cara
superior del cubo y las cuatro de la cara inferior, es decir,
C = 5 v - c= ^ -[ c + a c + b c + a b c -(l)-a -b -a b ]
An

(6-13)

Los efectos de la interaccin de dos factores pueden calcularse con facilidad. U na m edida de la interaccinA B es la diferencia entre los efectos prom edio de A con los dos niveles de B. Por convencin, a la
m itad de esta diferencia se le llam a la interaccin A B . Utilizando smbolos,

B
A lto ( + )
Bajo (-)
D iferencia

Efecto promedio de A
[(abc-bc)+(ab-b)]
2n
{ ( a c - c ) + [ a (!)]}
2n
[a b c - bc + a b - b - a c + c - a + ( 1)]
2n

Puesto que la interaccin A B es la m itad de esta diferencia,


l a b c - b c + a b - b - a c + c - a - l-(l)l
AB = 1

^
An

(6-14)

L a ecuacin 6-14 puede escribirse de la siguiente m anera:


abc+ a b+ c+ ( 1) bc+ b+ ac+ a
A B = ------------------^ -------------------An
An
E n esta forma, resulta fcil ver que la interaccin A es la diferencia en los prom edios entre las corridas
de dos pianos diagonales del cubo de la figura 6-5b. U tilizando un razonam iento lgico similar y con refe
rencia a la figura 6-5b, las interacciones A C y B C son
A C = - [ ( ! ) a + b a b c+ a c bc-ubc]

(6-15)

1
BC = [ ( l ) + a - b - a b - c - a c + b c + a b c ]

(6-16)

231

6-3 EL DISEO 23

La interaccin A B C se define como la diferencia prom edio entre la interaccin A para los dos dife
rentes niveles de C. Por lo tanto,
ABC =

{ [abe - b c ] [acc][ab b]+[a (1 )]}

= [ a b c -b c -a c + c -a b + b + a -(l)i
An

(6-17)

Como antes, la interaccin B C puede considerarse como la diferencia de dos prom edios. Si se aslan las
corridas de los dos prom edios, stas definen los vrtices de los dos tetraedros que com ponen el cubo de la
figura 6-5c.
E n las ecuaciones 6-11 a 6-17, las cantidades entre corchetes son contrastes de las combinaciones de
los tratam ientos. Es posible desarrollar una tabla de signos positivos y negativos a partir de los contrastes,
la cual se m uestra en la tabla 6-3. Los signos de los efectos principales se determ inan asociando un signo
positivo con el nivel alto y un signo negativo con el nivel bajo. U na vez que se han establecido los signos de
los efectos principales, los signos de las columnas restantes pueden obtenerse multiplicando las columnas
precedentes apropiadas, rengln por rengln. Por ejemplo, los signos de la colum na AB son el producto
de los signos de la colum na A y la columna B en cada rengln. E l contraste de cualquier efecto puede ob
tenerse fcilm ente con esta tabla.
L a tabla 6-3 tiene varias propiedades interesantes: 1) Con excepcin de la colum na /, cada u n a de las
columnas tienen el mismo nm ero de signos positivos y negativos. 2) L a suma de los productos de los sig
nos de dos columnas cualesquiera es cero. 3) La colum na / multiplicada p or cualquiera de las columnas
deja la colum na sin cambio. Es decir, I es un elemento identidad. 4) E l producto de dos columnas cuales
quiera produce una columna de la tabla. Por ejemplo, A x B = A , y
A B xB = A B 2 =A
Se observa que los exponentes de los productos se form an utilizando la aritm tica mdulo 2. (Es decir, el
exponente slo puede ser 0 o 1; si es m ayor que 1, se reduce con m ltiplos de 2 hasta que es 0 o 1.) Todas
estas propiedades se derivan de la ortogonalidad de los contrastes usados para estim ar los efectos.
Las sumas de cuadrados de los efectos se calculan con facilidad, ya que cada efecto tiene un contraste
correspondiente con un solo grado de libertad. E n el diseo 23 con n rplicas, la suma de cuadrados de
cualquier efecto es

S J = (C o n ra a e)l

Tabla 6-3

(618)

Signos algebraicos para calcular los efectos del diseo 23

Combinacin de
tratam ientos____________ /

Efecto factorial

(1)
a

+
+

b
ab
c
ac
be
abe

+
+
.
+
+

AB

+
+

+-

_
+

_
+
+
+
-

AC

+
_

_
-

_
-

ABC

BC

232

CAPTULO 6

DISEO FACTORIAL 2l

EJEMPLO 6 - 1 ....................................................................................................................................
R ecuerde el ejemplo 5-3, donde se present un estudio del efecto del porcentaje de carbonatacin, la pre*
sin de operacin y la velocidad de lnea sobre la altura de llenado de una bebida carbonatada. Suponga
que slo se usan dos niveles de carbonatacin, de tal modo que el experim ento es un diseo factorial 23
con dos rplicas. Los datos (es decir, las desviaciones de la altura de llenado de especificacin) se m ues
tran en la tabla 6-4, y en la figura 6-6 se presenta la representacin geom trica del diseo.
Al utilizar los totales bajo las combinaciones de los tratam ientos que se m uestran en la tabla 6-4, los
efectos de los factores pueden estimarse de la siguiente m anera:
A = [ a -(l)+ a b -b + a c -c + a b c -b c ]
4n

= i[l-(-4)+5-(-l)+3-(-l)+ll-2].
= |[24]=3.00
1

B = [>+ a b + b e+ abc - (1 ) - a - c ac\

= i[-l+5+2+ll(-4)1-(1)3]
= [18]=2.25
1

C = [c+ ac+ bc+ abc( \ ) a b ab\

= |[-l + 3+2+ll (4)1-(1)5]


= i[1 4 ]= 1 .7 5

A B = [ a b -a -b + (l)+ a b c -b c -a c + c \
=

^[5- l-(-l)+(-4)+ll-2 - 3+(-l)]

= [6]=0.75
Tabla 6-4

El experimento de la altura de llenado, ejemplo 6-1_________________________________ ______ ______ ____


Desviacin de la
altura de llenado

Factores codificados
C orrida
1
2
3
4
5
6
7
8

Niveles del factor

Rplica 1

Rplica 2

-1
1
-1
1
-1
1
-1
1

1
-1
1
1
-1
-1
1
1

-1
-1
-1
-1
1
1
1
1

-3
0
-1
2
-1
2
1
6

-1
1
0
3
0
1
1
5

Bajo (-1)

A (psi)
10
B (psi)
25
C (b/min) 200

A lto (+ 1 )
12
30
250

6-3 EL DISEO 2s
b e -2

c =-1
250 bpm

abc

233

=11

-.3

1
1
1

Velocidad (Cl

ab =5
30 psi

200 bpm

|'Tn--4

-i

10%

Presin (B)
25 psi

12%
Carbonatacin (Al

Figura 6-6 El diseo 23 para el experimento de la desviacin de


la altura de llenado del ejemplo 6- 1 .

A C = (1 )-a + b -a b -c + a c -b c + a b c ]
4n
= | [ - 4 - l + ( - l ) - 5( - l ) + 3 2+11]

= [2 ] = 0.25
BC = ^~ [(1 )+ a b a b c ac+bc+abc]
= ^ [ 4+ 1

( 1)

5 ( 1)

3+2+11]

= -g[4]=0.50
y
i
ABC = -la b e -b c -a c + c -a b + b + a -(l)
4n
= [ n -2 -3 + (-l)-5 + (-l)+ l-(-4 )]
= |[ 4 ] = 0.50
Los efectos ms grandes son para la carbonatacin (A = 3.00), la presin (B = 2.25), la velocidad (C =
1.75) y la interaccin carbonatacin-presin (AB = 0.75), si bien el efecto de la interaccin no parece te
ner un im pacto tan grande sobre la desviacin de la altura de llenado como los efectos principales.
Las sumas de cuadrados se calculan con la ecuacin 6-18 de la siguiente m anera:
SSA
SSB
D

(24)

16

= 36.00

_ (18)2
= 20.25
16

ssLc _

(14)2
= 12.25
16

234

CAPTULO 6 DISEO FACTORIAL 21

Tabla 6-5

Resumen de la estimacin de los efectos del ejemplo 6-1

Factor

A
B
C
AB
AC
BC
ABC

Estim acin
del efecto

Sumas de
cuadrados

Contribucin
porcentual

3.00
2.25
1.75
0.75
0.25
0.50
0.50

36.00
20.25
12.25
2.25
0.25
1.00
1.00
5.00
78.00

46.1538
25.9615
15.7051
2.88462
0.320513
1.28205
1.28205
6.41026

E rror puro
Total

SSM =

= Z2S

S S AC = ^ f = 0-25

S S b c=

(4
16 = 100

(4 )2

SlSx * c = l6 =L00
L a suma de cuadrados total es S S T = 78.00, y por sustraccin, SSE = 5.00. E n la tabla 6-5 se resum en las
estimaciones de los efectos y las sumas de cuadrados. La colum na etiquetada contribucin porcentual
m ide la contribucin porcentual de cada uno de los trm inos del m odelo a la suma de cuadrados total. La
contribucin porcentual es con frecuencia una gua aproxim ada pero efectiva de la im portancia relativa
de cada trm ino del m odelo. Observe que los efectos principales dom inan en realidad este proceso, expli
cando ms de 87% de la variabilidad total, m ientras que la interaccin A B explica m enos de 3%.
E l anlisis de varianza de la tabla 6-6 puede usarse para confirm ar la m agnitud de estos efectos. Por la
tabla 6-6 se observa que los efectos principales son altam ente significativos (todos tienen valores P muy

Tabla 6-6

Anlisis de varianza de los datos de la altura de llenado


F uente de
variacin

Suma de
cuadrados

G rados de
libertad

Cuadrado
medio

Porcentaje de carbonatacin (A)


Presin (B )
Velocidad de lnea (C)

E rror

36.00
20.25
12.25
2.25
0.25
1.00
1.00
5.00

1
1
1
1
1
1
1
8

36.00
20.25
12.25
2.25
0.25
1.00
1.00
0.625

Total

78.00

15

AB
AC
BC
ABC

Fo

Valor P

57.60
32.40
19.60
3.60
0.40
1.60
1.60

<0.0001
0.0005
0.0022
0.0943
0.5447
0.2415
0.2415

6-3 EL DISEO 23

235

pequeos). La interaccin A es significativa con un nivel aproximado de 10%; p o r lo tanto, existe una li
gera interaccin entre la carbonatacin y la presin.
Quiz el lector quiera referirse al ejemplo 5-3 para la interpretacin prctica de este experimento.
Los responsables del proceso decidieron correrlo con presin baja y velocidad de lnea alta, y reducir la
variabilidad de la carbonatacin controlando con mayor precisin la tem peratura. Se consigui as una
reduccin sustancial en la desviacin de la altura de llenado del valor objetivo.

El modelo de regresin y la superficie de respuesta


E l m odelo de regresin para predecir la desviacin de la altura de llenado es
y = Q+ 1x 1 + 2x 2 + 3x J ^~i2 x ix i
1
-

AA

i 3 ' 0 0 "!

f 2 -2 5 i

i 1 ' 7 5 '!

a 7 5 i

( 2 r i + ( 2 r 2+l 2 r 3+( 2 r 1* 2

donde las variables codificadas x x, x 2y x 3 representan a A , B y C, respectivam ente. El trm ino x&2 es Ia in "
teraccin A B . Los residuales pueden obtenerse como la diferencia entre las desviaciones de la altura de
llenado observada y la predicha. El anlisis de estos residuales se deja como ejercicio para el lector.
E n la figura 6-7 se m uestra la superficie de respuesta y la grfica de contorno p ara la desviacin de la
altura de llenado obtenida con el modelo de regresin, suponiendo que la velocidad de lnea est en el ni
vel alto (x3 = 1). Observe que como el m odelo contiene la interaccin, las lneas de contorno de la desvia
cin de las alturas de llenado constantes son curvas (o la superficie de respuesta es un plano torcido).
Es deseable operar este proceso de llenado de tal modo que la desviacin del llenado est tan cerca de
cero como sea posible. L a grfica de contorno indica que si la velocidad de lnea est en el nivel alto, en
tonces hay varias combinaciones de los niveles de la carbonatacin y la presin que satisfarn este objeti
vo. Sin embargo, ser necesario ejercer un control preciso de estas dos variables.
Solucin por computadora
Hay muchos paquetes de software de estadstica que establecern y analizarn diseos factoriales con dos
niveles. L a salida de uno de estos program as de com putadora, Design-Expert, se m uestra en la tabla 6-7.
E n la parte superior de la tabla se presenta el anlisis de varianza del m odelo completo. El form ato de
esta presentacin es un tanto diferente de los resultados dados en la tabla 6-6. Observe que el prim er ren
gln del anlisis de varianza es un resum en global del m odelo com pleto (todos los efectos principales y las
interacciones), y la sum a de cuadrados del m odelo es
^Modelo =: SS a

= 7ao

SSB S S C + S S AB + S S AC + SSBC + SSABC

Por lo tanto, el estadstico


F0 = M SMo =
= 16.69
M Se
0.63
est probando las hiptesis
H ^ . , = 2 = 3 = n = n = n = l23 = 0
H 1: al m enos una * 0

236

CAPTULO 6 DISEO FACTORIAL 2l

a) La superficie de respuesta

Carbonatacin

b) La grfica de contorno

Superficie de respuesta y grfica de contorno de la desvia


cin de la altura de llenado, con la velocidad en el nivel alto (250 bpm),
ejemplo 6-1.

Figura 6-7

Tabla 6-7

Salida de Design-Expert para el ejemplo 6-1

Response: Fill Deviation in Height


ANOVA for Selected Factorial Model
Analysis of variance table [Partial sum of squares]
F
Sum of
Mean
Value
DF
Square
Squares
Source

Model

A
B
C
A B
A C
B C
A B C

Residual

73.00

10.43

16.69

36.00
20.25
12.25
2.25
0.25

1
1
1
1
1
1
1

36.00
20.25
12.25
2.25
0.25

57.60
32.40
19.60
3.60
0.40
1.60
1.60

1.00
1.00
5.00

L a c k o f F it

0.000

Pure Error

5.00

Factor

Intercept
A-Carbonation
B-Pressure
C-Speed
AB
AC
BC
ABC

0.63

0
8

0.63

significant

0.0005
0.0022

0.0943
0.5447
0.2415
0.2415

0.9359
0.8798
0.7436
13.416

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision

0.79
1.00
79.06
20.00

Std. Dev.
Mean
C.V.
PRESS

1.00

0.0003

< 0.0001

15

78.00

Cor Total

1.00

Prob > F

Coefficient
Estimate

1.00
1.50
1.13
0.88
0.38
0.13
0.25
0.25

DF

1
1
1
1
1
1
1
1

Standard
Error

0.20
0.20
0.20
0.20
0.20
0.20
0.20
0.20

Final Equation in Terms of Coded Factors:

Fill Deviation =
+1.00
+1.50
A
+ 1.13 *B
+0.88 *C
+0.38
A
A
+0.13
+0.25 *B
+0.25
A

*B
*C
*C
*B *C

Final Equation in Terms of Actual Factors:

Fill Deviation =
-225.50000
+21.00000 'Carbonation
+7.80000 Pressure
+1.08000 "Speed
-0.75000 Carbonation Pressure
-0.10500
Carbonation
Speed
-0.040000 Pressure Speed
+4.00000E-00: Carbonation Pressure
Speed

Reduced Model:
Response: RII Deviation in Height
ANOVA for Selected Factorial Model
Analysis of variance table [Partial sum of squares]

9 5 % Cl

95 % Cl

Low

High

0.54
1.04
0.67
0.42
-0.081
-0.33
-0.21
-0.21

1.46
1.96
1.58
1.33
0.83
0.58
0.71
0.71

VIF

1.00
1.00
1.00
1.00
1.00
1.00
1.00

Tabla b-1

(continuacin)

Sum of
Squares

DF

36.00

20.25

12.25

A B

2.25

Source

Model

70.75

Residual

F
Value

Prob > F

36.00

54.62

<0.0001

20.25

30.72

0.0002

12.25

18.59

0.0012

2.25

3.41

0.0917

0.66
1.20

0.3700

Mean
Square

17.69

7.25

11

L a c k o f Fit

2.25

0.75

Pure Error

5.00

Cor Total

0.63

78.00

15

Std. Dev.
Mean
C.V.
PRESS

0.81
1.00
81.18
15.34

Intercept
A-Carbonation
B-Pressure
C-Speed
AB

<0.0001

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision

Coefficient
Estimate

Factor

26.84

DF

1.00
1.50
1.13
0.88
0.38

1
1
1
1
1

significant

n o t significant

0.9071
0.8733
0.8033
15.424

Standard
Error

0.20
0.20
0.20
0.20
0.20

95% Cl

9 5 % Cl

Low

High

0.55
1.05
0.68
0.43
-0.072

1.45
1.95
1.57.
1.32
0,82

V1F

1.00
1.00
1.00
1.00

Final Equation in Terms of Coded Factors:

Fill Deviation =

+ 1.00

+ 1.50 *A
+1.13 *B
+0.88 *C
+0.38 *A *B
Final Equation in Terms of Actual Factors:

Fill Deviation =
+9.62500
-2.62500 *Carbonation
1.20000 Pressure
+0.035000 *Speed
+0.15000 *Carbonation Pressure

Diagnostics Case Statistics


Standard
Actual
Predicted
Order
Value
Value

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

238

-3.00
-1.00
0.000
1.00
-1.00
0.000
2.00
3.00
-1.00
0.000
2.00
1.00
1.00
1.00
6.00
5.00

-2.13
-2.13
0.12
0.12
-0.63
-0.63
3.13
3.13
-0.37
-0.37
1.88
1.88
1.13
1.13
4.88
4.88

Residual

-0.88
1.13
-0.12
0.88
-0.38
0.63
-1.13
-0.13
-0.63
0.37
0.13
-0.88
-0.13
-0.13
1.13
0.13

Leverage

0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313
0.313

Student
Residual

-1.300
1.671
-0.186
1.300
-0.557
0.928
-1.671
-0.186
-0.928
0.557
0.186
-1.300
-0.186
-0.186
1.671
0.186

Cook's
Distance

0.154
0.254
0.003
0.154
0.028
0.078
0.254
0.003
0.078
0.028
0.003
0.154
0.003
0.003
0.254
0.003

Outlier
t

-1.347
1.845
-0.177
1.347
-0.539
0.922
-1.845
-0.177
-0.922
0.539
0.177
-1.347
-0.177
-0.177
1.845
0.177

6-3 EL DISEO 23

239

Puesto que F n es grande, se concluira que al m enos una de las variables tiene un efecto diferente de cero.
Entonces se prueba la significacin de cada efecto factorial individual utilizando el estadstico F. Estos re
sultados concuerdan con la tabla 6-6.
Abajo del anlisis de varianza del m odelo com pleto se presentan varios estadsticos R 2. L a R 2ordina
ria es
R2=
SSTotal

= 7 ^ = 0.9359
78.00

y m ide la proporcin de la variabilidad total explicada por el modelo. U n problem a potencial con este es
tadstico es que siem pre se increm enta cuando se agregan factores al modelo, incluso cuando estos facto
res no son significativos. El estadstico R 2 ajustada, definido como

o2

_ i_

SSE / dfE _
S S ToM/ d f Toui

_ 5.00/8 _
78.00/15

es un estadstico que est ajustado para el tam ao del modelo; es decir, p ara el nm ero de factores. La
R 2 ajustada puede decrecer en realidad si se agregan trm inos no significativos al modelo. El estadstico
PRESS es una m edida de qu tan bien predecir datos nuevos el m odelo (PRESS es en realidad el acrnimo de Prediction Error Sum o f Squares suma de cuadrados del error de prediccin, y se calcula a partir
de los errores de prediccin obtenidos al predecir el punto i-simo de los datos con un m odelo que incluye
todas las observaciones, excepto la i-sima). U n m odelo con un valor pequeo de PRESS indica que es po
sible que el m odelo sea un buen predictor. El estadstico R 2 de prediccin se calcula como
Prediccin

PRESS . 20.00
11
=
= 1= 0.7436
SSTotal
78.00

Esto indica que se esperara que el m odelo completo explique cerca de 74% de la variabilidad de los datos
nuevos.
La siguiente seccin de la salida presenta el coeficiente de regresin de cada trm ino del m odelo y el
e rro r estn d ar (se, standard error) de cada coeficiente, definido como

sffl=v^=^=J l r a20
Los intervalos de confianza de 95% para cada coeficiente de regresin se calculan a partir de
~ 10.025,N - p Se( ) ^~t 0.025,N - p Se{ )
donde los grados de libertad de t es el nm ero de grados de libertad del error; es decir, N es el nm ero to
tal de corridas en el experim ento (16), y p es el nm ero de parm etros del m odelo (8). Tambin se presen
ta el m odelo com pleto en trm inos de las variables codificadas y de las variables naturales.
E n la ltim a seccin de la tabla 6-7 se ilustra la salida despus de elim inar los trm inos de las interac
ciones no significativas. E ste m odelo reducido contiene ahora slo los efectos principales A , B y C, y la
in t e r a c c i n ^ . L a sum a de cuadrados de los residuales o del e rro r se com pone ahora de un com ponen
te del e rro r puro (P ure E rro r) que surge de las rplicas de los ocho vrtices del cubo, y un com ponen
te de falta de aju ste (Lack of F it), com puesto p or las sumas de cuadrados de las interacciones que se
elim inaron del m odelo (BC, A C y A B C ). D e nueva cuenta, la representacin del m odelo de regresin
de los resultados experim entales se presenta en trm inos de las variables codificadas y las variables n a

240

CAPTULO 6

DISEO FACTORIAL l k

turales. La proporcin de la variabilidad total de la desviacin de la altura del llenado que se explica por
este m odelo es
R 2 = SSmoc1 =
= 0.9071
SSTotal
78.00
que es m enor que lai?2 del m odelo completo. Observe, sin embargo, que lai?2 ajustada del m odelo reduci
do apenas ha cambiado ligeram ente respecto de la R 2 ajustada del m odelo com pleto, y PRESS del m ode
lo reducido es considerablem ente menor, lo cual produce un valor ms grande de
del m odelo
reducido. Evidentem ente, la eliminacin de los trm inos no significativos del m odelo com pleto h a produ
cido un m odelo final que posiblem ente funcionar con mayor eficiencia como predictor de datos nuevos.
Observe que los intervalos de confianza para los coeficientes de regresin del m odelo reducido son lige
ram ente ms cortos que los intervalos de confianza correspondientes en el m odelo completo.
E n la ltim a seccin de la salida se presentan los residuales del m odelo reducido. Design-Expert tam
bin construir todas las grficas de los residuales que se estudiaron anteriorm ente.
Otros mtodos para evaluar la significacin de los efectos
El anlisis de varianza es una m anera formal de determ inar cules son los efectos de los factores que son
diferentes de cero. Existen varios m todos ms que son tiles. A continuacin se indica cmo calcular el
e rro r estn d ar de los efectos y cmo usar los errores estndar para construir intervalos de confianza para
los efectos. O tro m todo, que se ilustrar en la seccin 6-5, utiliza grficas de probabilidad norm al para
valorar la im portancia de los efectos.
Es sencillo encontrar el error estndar de un efecto. Si se supone que hay rplicas en cada una de las
2k corridas del diseo, y si y n, y2, ..., yin son las observaciones de la corrida i-sima, entonces

es u na estimacin de la varianza de la corrida z-sima. Las estimaciones de la varianza del diseo 2 pue
den combinarse para dar una estimacin de la varianza global:

s - 7 < h t t - y, r

(M 9)

sta es tam bin la estim acin de la varianza dada por el cuadrado medio del error en el anlisis de varian
za. L a varianza de la estimacin de cada efecto es
t,,

'( E f e c to ) . '

/ Contraste \
1

(n2

)'

-K (Contraste)

C ada contraste es una combinacin lineal de los 2k totales de los tratam ientos, y cada total consta de n ob
servaciones. Por lo tanto,
K(Contraste) = n2k o 2

6-3 EL DISEO 23

241

y la varianza de un efecto es
K(Efecto) = ------ , -r n2k a 2
K
(2 )
o2
n l k~2
2a
~
J t F
E l erro r estndar estim ado se encontrara sacando la raz cuadrada de esta ltim a expresin y sustituyen
do 2 con su estim acin S1:
2S
se(Efecto) = ,
(6-20)
v2
Observe que el error estndar de un efecto es el doble del error estndar de un coeficiente de regre
sin estim ado en el m odelo de regresin del diseo 2k (ver la salida de com putadora de Design-Expert del
ejemplo 6-1).
Los intervalos de confianza de 100(1 - a ) por ciento para los efectos se calculan a partir de Efecto
ta/2 N-^e(E.ecto), donde los grados de libertad de t son slo los grados de libertad de los residuales o del
erro r (N - p = nm ero total de corridas - nm ero de parm etros del m odelo).
Para ilustrar este m todo, considere el experim ento de la desviacin de la altura de llenado del ejem
plo 6-1. El cuadrado m edio del error e s M SE = 0.625. Por lo tanto, el error estndar de cada efecto es (uti
lizando S 2 = M Se)

se(Efecto) =

25
JrF
2V625

4 W )
= 0.40
Entonces, 0.025,8 = 2.31 y 0025 9se(Efecto) = 2.31(0.40) = 0.92, de donde los intervalos de confianza de
95% aproximados para los efectos de los factores son
A:

a0 0 0 .9 2

B:

Z25+0.92

C:

1.75 0.92

AB:

0.75 0.92

AC: 0.250.92
BC: 0.50+0.92
ABC: 0.500.92
Este anlisis indica que A , B y C son factores im portantes, porque son las nicas estim aciones de los efec
tos de los factores para las que los intervalos de confianza de 95% aproximados no incluyen al cero.
Efectos de dispersin
El ingeniero de proceso que trabaj en el caso del llenado tam bin se interes en los efectos de disper
sin; es decir, alguno de los factores afecta la variabilidad de la desviacin de la altura de llenado de una

242

CAPTULO 6

DISEO FACTORIAL 2k

-0

=1

Figura 6-8 Rangos de la desviacin de la altura de llenado del


ejemplo 6-1 .

corrida a otra? U na m anera de responder esta pregunta es examinando el rango de las desviaciones de la
altura de llenado para cada una de las ocho corridas del diseo 23. Estos rangos se grafican en el cubo de la
figura 6 - 8 . Observe que los rangos son aproxim adam ente iguales para las ocho corridas del diseo. Por
consiguiente, no hay evidencia slida que indique que alguna de las variables del proceso afecte directa
m ente la variabilidad de la desviacin de la altura de llenado en el proceso.

6-4

EL DISEO GENERAL 2k

Los m todos de anlisis que se han presentado hasta este punto pueden generalizarse p ara el caso de un
diseo factorial 2k, es decir, un diseo con k factores que tienen dos niveles cada uno. El m odelo estadsti
co para un diseo 2k incluira k efectos principales, ( * ) interacciones de dos factores, ( 3 ) interacciones de
tres fa cto res,..., y una interaccin de k factores. Es decir, p ara un diseo 2k el m odelo com pleto conten
dra 2k - l efectos. Tkmbin se usa aqu la notacin introducida anteriorm ente p ara las com binaciones de
los tratam ientos. Por ejemplo, en un diseo 25, abd denota la com binacin de tratam ientos con los facto
res A , B y D en el nivel alto y los factores C y E en el nivel bajo. Las combinaciones de los tratam ientos
pueden escribirse en orden estn d ar introduciendo los factores uno a la vez y com binando sucesivamente
cada nuevo factor con los que lo preceden. Por ejemplo, el orden estndar de un diseo 2 4 es (1), a, b, ab,
c, ac, be, abc, d, ad, bd, abd, cd, acd, bed y abed.
El enfoque general p ara el anlisis estadstico del diseo 2k se resum e en la tabla 6 -8 . Como se seal
anteriorm ente, suele em plearse un paquete de software de com putadora en este proceso de anlisis.
A estas alturas, la secuencia de pasos de la tabla 6 - 8 debe resultar familiar. El prim er paso es estim ar
los efectos de los factores y examinar sus signos y magnitudes. D e este m odo el experim entador obtiene inTabla 6-8
1.
2.
3.
4.
5.
6.

Procedimiento de anlisis
para un diseo 2k

Estim ar los efectos de los factores


Form ar el m odelo inicial
Realizar las pruebas estadsticas
Refinar el modelo
A nalizar los residuales
Interpretar los resultados

6-4 EL DISEO GENERAL 2*

243

formacin prelim inar respecto de los factores y las interacciones que pueden ser importantes, y en qu di
recciones debern ajustarse estos factores para m ejorar la respuesta. Para formar el modelo inicial del
experimento, por lo general se elige el modelo completo, es decir, todos los efectos principales y las interac
ciones, siempre que se haya hecho una rplica de al menos uno de los puntos del diseo (en la seccin si
guiente se revisa una modificacin de este paso). Despus, en el paso 3 se usa el anlisis de varianza para
probar formalm ente la significacin de los efectos principales y las interacciones. E n la tabla 6-9 se presenta
la forma general de un anlisis de varianza para un diseo factorial 2k con n rplicas. El paso 4, retinar el
modelo, suele consistir en la eliminacin de las variables no significativas del modelo completo. El paso 5 es
el anlisis residual usual para verificar la adecuacin del modelo y los supuestos. E n ocasiones ocurrir una
refinacin del modelo despus del anlisis residual, si se encuentra que el modelo es inadecuado o que hay
violaciones serias de los supuestos. El ltimo paso consiste generalm ente en el anlisis grfico: grficas de
los efectos principales o las interacciones, o superficies de respuesta y grficas de contorno.
Aun cuando los clculos descritos se realizan por lo general con una computadora, en ocasiones es ne
cesario calcular manualm ente la estimacin de un efecto o la suma de cuadrados de un efecto. Para estimar
un efecto o calcular la suma de cuadrados de un efecto, prim ero debe determ inarse el contraste asociado
con ese efecto. Esto puede hacerse siempre utilizando una tabla de signos positivos y negativos, como la ta
bla 6-2 o 6-3. Sin embargo, para valores grandes de k esto resulta laborioso, y puede usarse un m todo alter
nativo. En general, el contraste del efecto A B K se determ ina expandiendo el miembro derecho de
C ontraste^...* = ( a l ) ( & l ) - ( f c l )
Tabla 6-9

(6-21)

Anlisis de varianza de un diseo 2l


Fuente de
variacin

k efectos principales
A
B
K

Suma de
cuadrados

SSA
SSB

G rados de
libertad
1
1

SSK

AB
AC

SS^
SSAC

1
1

JK

SSJK

ABC
ABD

S$abc
SSa b d

IJK

SS,'m

( ) interacciones de dos factores

(* ) interacciones de tres factores


1

( ) = 1 interaccin de k factores

ABC

SSjbc -k

E rror

s s e

2k( n - l )

T otal

S S

n2k - 1

244

CAPTULO 6

DISEO FACTORIAL l k

Para expandir la ecuacin 6-21 se usa el lgebra ordinaria reem plazando 1 con (1) en la expresin final.
El signo de cada grupo de parntesis es negativo si el factor est incluido en el efecto y es positivo si el fac
to r no est incluido.
Para ilustrar el uso de la ecuacin 6-21, considere un diseo factorial 23. El contraste d eA B sera
C o n tra ste ^ = ( a - l ) ( 6 - l ) ( c + l )
= a b c + a b + c + ( l) - a c b ca b
Como un ejemplo ms, en un diseo 25, el contraste de A B C D sera

Contraste^^ =

(a ~

1)(^~ l ) ( c " 1)(< l ) ( e + l)

= abede+ ede+ bde+ ade+ bce


+ ace+ abe+ e+ abcd+ cd+ bd
+ a d + b c + a c + a b + (l)a b c
abed abd acd bed ae
- b e ceabeed e abdeaede bede
U na vez que se han calculado los contrastes de los efectos, pueden estim arse los efectos y calcular las
sumas de cuadrados de acuerdo con
A B K=

(Contraste

(6-22)

SSab ~k = n 2 k (Contraste

x)

(6-23)

respectivam ente, donde n denota el nm ero de rplicas. Se cuenta tam bin con un algoritmo tabular de
bido al Dr. F rank Yates que en ocasiones puede ser til para el clculo m anual de las estimaciones de los
efectos y las sumas de cuadrados. Referirse al m aterial suplem entario del texto de este captulo.

6-5

UNA SOLA RPLICA DEL DISEO 2*

Incluso para un nm ero m oderado de factores, el nm ero total de combinaciones de tratam ientos en un
diseo factorial 2k es grande. Por ejemplo, un diseo 2S tiene 32 combinaciones de tratam ientos, un dise
o 26tiene 64 combinaciones de tratam ientos, etc. D ebido a que por lo general los recursos son limitados,
el nm ero de rplicas que el experim entador puede em plear quizs est restringido. Con frecuencia, los
recursos disponibles perm iten hacer nicam ente una sola rplica del diseo, a m enos que el experim en
tador est dispuesto a om itir algunos de los factores originales.
U n riesgo obvio cuando se realiza un experim ento que tiene una sola corrida para cada combinacin
de prueba es que el m odelo puede ajustarse al ruido. Es decir, si la respuesta y es sum am ente variable,
pueden resultar conclusiones engaosas del experim ento. L a situacin se ilustra en la figura 6-9a. E n esta
figura, la lnea recta representa el verdadero efecto del factor. Sin embargo, debido a la variabilidad alea
toria presente en la variable de respuesta (representada por la franja som breada), el experim entador ob
tiene en realidad las dos respuestas m edidas representadas por los puntos negros. Por consiguiente, el
efecto del factor estimado est cerca de cero y el experim entador ha llegado a una conclusin errnea res
pecto de este factor. A hora bien, si hay menos variabilidad en la respuesta, la posibilidad de u na conclu
sin errnea ser ms reducida. O tra form a de asegurarse de que se obtienen estimaciones confiables de
los efectos es increm entando la distancia entre los niveles bajo (-) y alto ( + ) del factor, como se ilustra en

6-5 UNA SOLA RPLICA DEL DISEO 2*

245

_______________ I___________________________ I________

Factor, x

b I Separacin agresiva de los niveles del factor


Figura 6*9 El impacto de la eleccin de los niveles del factor en un diseo
no replicado.

la figura 6-9b. Observe que en esta figura la distancia increm entada entre los niveles bajo y alto del factor
resulta en una estimacin razonable del verdadero efecto del factor.
E l uso de la estrategia de una sola rplica es com n en los experim entos de exploracin cuando hay
un nm ero relativam ente grande de factores bajo consideracin. D ebido a que en estos casos nunca pue
de tenerse la certeza absoluta de que el erro r experim ental es pequeo, una buena prctica en este tipo de
experim entos es separar los niveles de los factores de m anera agresiva. Quizs el lector encuentre til re
leer las pautas generales para elegir los niveles de los factores del captulo 1.
U na sola rplica de un diseo 2k se denom ina en ocasiones diseo factorial no replicado. Con una
sola rplica, no se cuenta con ninguna estimacin interna del error (o error puro). U na form a de abor
dar este anlisis de un diseo factorial no replicado consiste en suponer que algunas interacciones de o r
den superior son insignificantes y com binar sus cuadrados m edios para estim ar el error. Esto es una
apelacin al principio de efectos esparcidos; es decir, la m ayora de los sistemas estn dom inados por al
gunos de los efectos principales y las interacciones de orden inferior, y la mayor parte de las interacciones
de orden superior son insignificantes.

246

CAPTULO 6

DISEO FACTORIAL 2*

Cuando se analizan datos de diseos factoriales no replicados, ocasionalmente ocurren interacciones


de orden superior reales. El uso de un cuadrado m edio del error que se obtiene agrupando las interaccio
nes de orden superior no es apropiado en estos casos. U n m todo de anlisis atribuido a D aniel [35a] pro
porciona una form a simple de resolver este problem a. D aniel sugiere examinar una grfica de
probabilidad norm al de las estimaciones de los efectos. Los efectos que son insignificantes siguen una
distribucin norm al, con m edia cero y varianza o2, y tendern a localizarse sobre una lnea recta en esta
grfica, m ientras que los efectos significativos tendrn m edias diferentes de cero y no se localizarn sobre
la lnea recta. Por lo tanto, el m odelo prelim inar se especificar de tal m odo que contenga aquellos efectos que aparentem ente son diferentes de cero, con base en la grfica de probabilidad norm al. Los efectos
aparentem ente insignificantes se combinan como una estimacin del error.

E JE M P L O 6 - 2 ...........................................................................................................................................................
U n a so la r p lic a d el d ise o 24
U n producto qumico se fabrica en un envase presurizado. Se lleva a cabo un experim ento factorial en la
planta piloto p ara estudiar los factores que se piensa influyen en el ndice de filtracin de este producto.
Los cuatro factores son la tem peratura (A), la presin (B), la concentracin del form aldehdo (C) y la ve
locidad de agitacin (D ). C ada factor est presente con dos niveles. L a m atriz del diseo y los datos de la
respuesta obtenidos de una sola rplica del experim ento 24 se m uestran en la tabla 6-10 y en la figura 6-10.
Las 16 corridas se hacen de m anera aleatoria. El ingeniero del proceso est interesado en maximizar el n
dice de filtracin. Las condiciones actinales del proceso producen ndices de filtracin de alrededor de 75
gal/h. Asimismo, en el proceso actual la concentracin de form aldehdo, factor C, se usa en el nivel alto.
Al ingeniero le gustara reducir la concentracin de form aldehdo lo ms posible, pero no h a podido h a
cerlo porque siem pre produce ndices de filtracin ms bajos.
E l anlisis de estos datos se iniciar construyendo una grfica de probabilidad norm al de las estim a
ciones de los efectos. L a form acin de signos positivos y negativos para las constantes de los contrastes

Tabla 6-10

Nm ero
de corrida
1
2
3
4 .
- 5
6.
7 '
8
9 !"'
10,
11 1
- 12 ......
13
"
-.14,. 15
16 '

Experimento del ndice de filtracin en la planta piloto

Factor

A
_
+
+
+

+
+

B
+
+

+
+

+
+

+
+

C
-
+
+
+
+

+
+
+
+

+
+
+
+
+
+
+
+

E tiqueta de
la corrida

ndice de
filtracin (gal/h)

(1)

45
71
48
65
68
60
80
65
43
100
45
104
75
86
70
96

a
b
ab
c
ac
be
abe
d
ad
bd
abd
cd
acd
bed
abed

6-5 UNA SOLA RPLICA DEL DISEO 2*

247

Figura 6-10 Datos del experimento del indice de filtracin en la


pianta piloto para el ejemplo 6-2.

del diseo 24 se m uestra en la tabla 6-11. A p a rtir de estos contrastes pueden estim arse 15 efectos factoria
les, y las sumas de cuadrados se presentan en la tabla 6-12.
E n la figura 6-11 se m uestra la grfica de probabilidad norm al de estos efectos. Tbdos los efectos que
caen sobre la recta son insignificantes, m ientras que los efectos grandes estn apartados de ella. Los efec
tos im portantes que surgen de este anlisis son los efectos principales de A, C y D y las interacciones
A C y AD.
Los efectos principales de A , C y D se grafican en la figura 6-12a. Los tres efectos son positivos, y si
slo se consideraran estos efectos principales, los tres factores se correran en el nivel alto a fin de maxim izar el ndice de filtracin. Sin em bargo, siempre es necesario examinar cualquier interaccin que sea
im portante. R ecuerde que los efectos principales no tienen m ucho significado cuando estn presentes en
interacciones significativas.
Las interacciones A C y A D se grafican en la figura 6-12. Estas interacciones son la clave p ara resol
ver el problem a. Observe, por la interaccin AC, que el efecto de la tem peratura es muy pequeo cuando
la concentracin est en el nivel alto y muy grande cuando la concentracin est en el nivel bajo, obte
nindose los m ejores resultados con la concentracin baja y la tem peratura alta. L a interaccinA D indica
que la velocidad de agitacin!) tiene un efecto reducido con una tem peratura baja, pero un efecto positi
vo grande con la tem peratura alta. Por lo tanto, los m ejores ndices de filtracin pareceran obtenerse
cuando A y D estn en el nivel alto y C est en el nivel bajo. E sto perm itira la reduccin de la concentra
cin de form aldehdo a un nivel ms bajo, otro de los objetivos del experim entador.

Proyeccin de Un diseo
Es posible hacer otra interpretacin de los efectos de la figura 6-11. Puesto qije B (presin) no es signifi
cativa y todas las interacciones en las que interviene B son insignificantes*B puede descartarse del experi
m ento, de tal modo que el diseo se convierte en un factorial 23 en A, C y D con dos rplicas. Esto es fcil
de ver examinando nicam ente las columnas A, C y D t n la m atriz del dise que se m uestra en la tabla
6-10 y observando que esas columnas form an dos rplicas de un diseo 23. E n la tabla 6-13 se resum e el
anlisis de varianza de los datos utilizando este supuesto de simplificacin. Las conclusiones que se saca
ran de este anlisis se m antienen en esencia sin cambios respecto de las del ejem plo 6-2. Observe que al
hacer la proyeccin de la rplica nica del diseo 24 en un diseo 23 con (Jos rplicas, se tiene ahora tanto
una estim acin de la interaccinA C D como una estim acin del error basada ein lo que en ocasiones se de
nom ina rplica oculta.

In)
00

Tabla 6-11

Constantes de los contrastes del diseo 24

AB

(1)

a
b
ab

+
+
+
+
+

ac
be
abe
d
ad
bd
abd
cd
acd
bed
abed

+
+
+
+
+
+
+

+
+
+
+
+
+
+

+
+
- '

C
+
+
+
+
+
+
+
+

AC
+
+
+
+ .
+
+
+
+

BC

ABC

AD

BD

ABD

CD

+
+
+
+
+
+
+
+

+
+
+
+
+
+
+
+

+
-

+
+
+
+
+
+
+
+

+
+
+
+
+
+
+

+
+
+
+
-

+
+
+
+

+
+
+
+
+
+
+
+

+
+
+
+

+
+
+
+

'

ACD

BCD

ABCD

+
+
+
+
-

+
+
+

+
+

+
+
+
-

+
+
+
+
+
+
-

+
+

+
+

6-5 UNA SOLA RPLICA DEL DISEO 2*

Tabla 6-12 Estimaciones de los efectos de los factores y sumas de


___________ cuadrados del diseo factorial V del ejemplo 6-2

Estimacin
del efecto
21.625
3.125
9.875
14.625
0.125
-18.125
16.625
2.375
-0.375
-1.125
1.875
4.125
-1.625
-2.625
1.375

Suma de
cuadrados
1870.56
39.0625
390.062
855.563
0.0625
1314.06
1105.56
22.5625
0.5625
5.0625
14.0625
68.0625
10.5625
27.5625
7.5625

% de probabilidad normal

Trmino del
modelo
A
B
C
D
AB
AC
AD
BC
BD
CD
ABC
ABD
ACD
BCD
ABCD

Efecto

Figura 6-11 Grfica de probabilidad normal de los efectos para el diseo factorial
24 del ejemplo 6-2.

Contribucin
porcentual
32.6397
0.681608
6.80626
14.9288
0.00109057
22.9293
19.2911
0.393696
0.00981515
0.0883363
0.245379
1.18763
0.184307
0.480942
0.131959

249

250

CAPTULO

DISEO FACTORIAL 2k

b) Grficas de las interacciones


Figura 6-12
plo 6-2 .

Grficas de los efectos principales y las interacciones para el ejem

Tabla 6-13

Anlisis de varianza del experimento del ndice filtracin en la planta piloto en A, C y D

Fuente de
variacin

A
C
D
AC
AD
CD
ACD
E rror
Total

Suma de
cuadrados
1870.56
390.06
855.56
1314.06
1105.56
5.06
10.56
179.52
5730.94

G rados de
libertad
1
1
1
1
1
1
1
8
15

Cuadrado
medio
1870.56
390.06
855.56
1314.06
1105.56
5.06
10.56
22.44

Fo
83.36
17.38
38.13
58.56
49.27
<1
<1

Valor P
<0.0001
<0.0001
<0.0001
<0.0001
<0.0001

6-5 UNA SOLA RPLICA DEL DISEO 2*

251

El concepto de proyectar un diseo factorial no replicado en un diseo factorial con rplicas en m e


nos factores es muy til. E n general, si se tiene una sola rplica del diseo 2k, y si h (h < k) factores son in
significantes y pueden descartarse, entonces los datos originales corresponden a un diseo factorial
com pleto con dos niveles en los k - h factores restantes con 2* rplicas.
Verificacin de diagnstico
D ebern aplicarse las verificaciones de diagnstico usuales a los residuales de un diseo 2k. El anlisis
realizado indica que los nicos efectos significativos son^4 = 21.625, C = 9.875, D = 14.625, A C = -18.125
y A D = 16.625. Si esto es correcto, los ndices de filtracin estim ados estn dados por
.

/21.625^

/9.875\

/14.625\

(18A25)

(16.625\
+ [

} X' X<

donde 70.06 es la respuesta prom edio y las variables codificadasxlt *3, jc4 asum en valores entre -1 y +1. El
ndice de filtracin predicho p ara la corrida (1) es

= 46.22
Puesto que el valor observado es 45, el residual e s e = _ y - > > = 4 5 - 46.22 = -1.22. A continuacin se p re
sentan los valores de y, y y e = y - y para las 16 observaciones.
1

9
46.22
69.39
46.22
69.39
74.23
61.14
74.23
61.14
44.22
100.65
44.22
100.65
72.23
92.40
72.23
92.40

II

(1)

a
b
ab
c
ac
be
abe
d
ad
bd
abd
cd
acd
bed
abed

y
45
71
48
65
68
60
80
65
43
100
45
104
75
86
70
96

-1.22
1.61
1.78
-4.39
-6.23
-1.14
5.77
3.86
-1.22
-0.65
0.78
3.35
2.77
-6.40
-2.23
3.60

E n la figura 6-13 se m uestra la grfica de probabilidad normal de los residuales. Los puntos de esta grfica
se localizan razonablem ente prximos a una lnea recta, brindando apoyo a la conclusin de que ^4, C, D,
A C y A D son los nicos efectos significativos y que se satisfacen los supuestos fundam entales del anlisis.

252

CAPTULO

DISEO FACTORIAL 2k

E
o

Residual

Figura 6-13 Grfica de probabilidad normal de los residuales del ejemplo 6-2.

La superfcie de respuesta
Las grficas de las interacciones de la figura 6-12 se utilizaron para ofrecer una interpretacin prctica de
los resultados de este experim ento. E n ocasiones es til em plear la superficie de respuesta p ara este fin.
L a superfcie de respuesta se genera por el m odelo de regresin
70.06+

9.875^

x ,+

18.125

/14.625'l

2 r 3+(

16.625

E n la figura 6-14a se muestra la grfica de contom o de la superficie de respuesta cuando la velocidad de agita
cin est en el nivel alto (es decir, x4 = 1). Los contornos se generan a partir del modelo anterior canx4 = 1, o
.

(38.25\

/9.875\

y= 7 7 . 3 7 2 5 + + (

)* ,

|18.125\

Jv>

Observe que los contornos son lneas curvas porque el m odelo contiene un trm ino de interaccin.
L a figura 6-146 es la grfica de contorno de la superficie de respuesta cuando la tem peratura est en
el nivel alto (es decir, x 1 = 1). Cuando se hace x l = 1 en el m odelo de regresin se obtiene
8.25

31.25

6-5 UNA SOLA RPLICA DEL DISEO 2*

253

Temperatura, A te-|)

a) Grfica de contorno con la velocidad de agitacin (>),

- 1

Concentracin, C (13 )

b) Grfica de contorno con la temperatura IA), x, = 1

Figura 6*14 Grficas de contorno del ndice de filtracin, ejemplo 6-2.

Estos contornos son rectas paralelas porque el m odelo contiene nicam ente los efectos principales de los
factores C (x3) y D (x4).
Ambas grficas de contorno indican que si se quiere maximizar el ndice de filtracin, las variables A
(tj) y D (x4) debern estar en el nivel alto y que el proceso es relativam ente robusto p ara la concentracin
C. Se obtuvieron conclusiones similares a partir de las grficas de las interacciones.
La m itad de grfica normal de los efectos
U na alternativa para la grfica de probabilidad normal de los efectos de los factores es la m itad de grfica
norm a!. Es una grfica del valor absoluto de las estimaciones de los efectos contra sus probabilidades or*
males acumuladas. E n la figura 6-15 se m uestra la m itad de grfica norm al de los efectos para el ejemplo
6-2. L a lnea recta de la m itad de grfica normal siempre pasa por el origen y deber pasar tam bin cerca del
valor de los datos del percentil cincuenta. Muchos analistas sienten que es ms fcil interpretar la m itad de

254

CAPTULO

DISEO FACTORIAL 2k

Efecto

Figura 6-15 Mitad de grfica normal de los efectos de los factores del ejemplo 6-2.

grfica normal, en particular si slo se cuenta con pocas estimaciones de los efectos, como cuando el experi
m entador ha usado un diseo de ocho corridas. Algunos paquetes de software construirn ambas grficas.
Otros mtodos para analizar diseos factoriales no replicados

El procedim iento de anlisis estndar para un diseo factorial de dos factores no replicado es la grfica
norm al (o m itad de grfica norm al) de los efectos estim ados de los factores. Sin embargo, los diseos no
replicados son tan usados en la prctica que se han propuesto m uchos procedim ientos formales de anli
sis p ara resolver la subjetividad de la grfica de probabilidad norm al. H am ada y Balakrishnan [52] com
p araron algunos de estos m todos. E ncontraron que el m todo propuesto por L enth [70] tiene una
potencia adecuada para detectar efectos significativos. Tambin es fcil de im plem entar y, como resulta
do, est em pezando a aparecer en algunos paquetes de software p ara analizar datos de diseos factoriales
no replicados. Se ofrece una breve descripcin del m todo de Lenth.
Suponga que se tienen m contrastes de inters, por ejemplo cu c2, ..., cm. Si el diseo es un factorial 2k
no replicado, estos contrastes corresponden a las m = 2k - 1 estim aciones de los efectos de los factores. La
base del m todo de L enth es estim ar la varianza de un contraste a partir de las estimaciones ms peque
as (en valor absoluto) de los contrastes. Sean
j0

= 1.5 X m ediana ( | c y|)

/'S ,'= 1.5 x m ediana ( | c j : | c y| <2. 5s 0 )

v..

6-5 UNA SOLA RPLICA DEL DISEO 2

255

PSE denota el pseudo error estndar, y L enth dem uestra que es un estim ador razonable de la varianza
del contraste cuando no hay muchos efectos activos (significativos). E l M is se usa para juzgar la significacin de los contrastes. U n contraste individual puede com pararse con el m argen de e rro r (ME, margin o f
error)
M E = 1 0 025 d x P S E
donde los grados de libertad se definen como d = m i3. Para hacer inferencias sobre un grupo de contras
tes, L enth sugiere usar el m argen de e rro r sim ultneo (SME, simultaneous margin o f error)
SM E = t Y d x PSE
donde el punto porcentual de la distribucin t que se usa es y = 1 - (1 + 0.951/m)/2.
Para ilustrar el m todo de Lenth, considere el experim ento 24 del ejem plo 6-2. Los clculos dan como
resultado s0 = 1.5 x | -2 .6 2 5 1 = 3.9375 y 2.5 x 3.9375 = 9.84375, de donde
P SE = 1.5 X 11.75) = 2625
M E = 2571 x 2625 = 6.75
SM E = 5.219 x 2 6 2 5 = t t 7 0
Considere ahora las estim aciones de los efectos de la tabla 6-12. El criterio SM E indicara que los cuatro
efectos ms grandes (en m agnitud) son significativos, ya que las estim aciones de sus efectos exceden
SM E. El efecto principal de C es significativo de acuerdo con el criterio M E, pero no con respecto al SME.
Sin embargo, puesto que es evidente que la interaccin A C es im portante, probablem ente C se incluira
en la lista de efectos significativos. Observe que en este ejemplo el m todo de L enth produjo la misma
respuesta que la obtenida anteriorm ente con el exam en de la grfica de probabilidad norm al de los
efectos.
Varios autores (ver H am ada y Balakrishnan [52], Loughin [73], Loughin y Noble [74] y L am tz y W hit
comb [69]) han hecho notar que el m todo de Lenth falla para controlar los ndices del error tipo I, y que
pueden usarse m todos de simulacin para calibrar su procedim iento. L am tz y W hitcom b [69] sugieren
reem plazar los multiplicadores M E y SM E con m ultiplicadores ajustados de la siguiente m anera:
Nmero de contrastes
ME original
ME ajustado
SME original
SME ajustado

7
3.764
2.295
9.008
4.891

15
2.571
2.140
5.219
4.163

31
2.218
2.082
4.218
4.030

Estos resultados coinciden en gran m edida con los de Ye y H am ada [114].


E n general, el m todo de L enth es un procedim iento ingenioso y til. Sin embargo, recom endam os
utilizarlo como complemento de la grfica de probabilidad norm al usual de los efectos, no com o su susti
tuto.
Bisgaard [10] ha proporcionado una sutil tcnica grfica, llam ada carta de inferencia condicional,
como ayuda p ara interpretar la grfica de probabilidad normal. L a finalidad de esta grfica es ayudar al
experim entador a juzgar los efectos significativos. Esto sera relativam ente sencillo si se conociera la des
viacin estndar o, o si pudiera estim arse a partir de los datos. E n diseos no replicados, no se cuenta con
ninguna estim acin interna de o, p or lo que la carta de inferencia condicional est diseada para ayudar
al experim entador a evaluar la m agnitud de los efectos para un rango de valores de la desviacin estndar.

256

CAPTULO

DISEO FACTORIAL 2k

Bisgaard fundam enta la grfica en el resultado de que el erro r estndar de un efecto, en un diseo de dos
niveles con N corridas (para un diseo factorial no replicado, N = 2k), es
2o
-J
donde o es la desviacin estndar de una observacin individual. Entonces 2 veces el error estndar de
un efecto es

U na vez que se estim an los efectos, se hace una grfica como la que se m uestra en la figura 6-16, con las
estim aciones de los efectos graficadas en el eje vertical, o ejey. E n esta figura se han usado las estimacio
nes de los efectos del ejem plo 6-2. El eje horizontal, o jc, de la figura 6-16 es la escala de la desviacin es
tndar (a). Las dos rectas estn en
4a
4a
y ~ +W

y y~~7W

E n el ejem plo tratado aqu, N = 16, por lo que las rectas estn eny = + o y y = -a . Por lo tanto, p ara cual
quier valor dado de la desviacin estndar a, la distancia entre estas dos rectas puede leerse como un in
tervalo de confianza de 95% aproximado para los efectos insignificantes.
E n la figura 6-16 se observa que si el experim entador piensa que la desviacin estndar est entre 4 y
8, entonces los factores A , C ,D y las interacciones A C y A D son significativos. Si el experim entador piensa
que la desviacin estndar tiene un valor de hasta 10, el factor C quiz no sea significativo. Es decir, para

Figura 6-16
ejem plo 6-2.

Carta d e inferencia con d icion al para el

6-5 UNA SOLA. RPLICA DEL DISEO 2*

07

J V

24---- 1---- 3. 14

257

30
4. >9-----1---- 4.

1
1

1
1

J^kSr Ifl-------- 1.! fl

70

lk l- -

-^9.43

2.1 7---------- 2.<

Figura 6-17 Datos del experimento de perforacin del ejemplo 6-3.

cualquier supuesto dado acerca de la m agnitud de a, el experim entador puede construir una cinta de m e
dir para juzgar la significacin aproxim ada de los efectos. La carta tam bin puede usarse en sentido in
verso. Por ejemplo, suponga que estuviera en duda si el factor C es significativo o no. Entonces el
experim entador podra preguntar si es razonable esperar que a pudiera ser tan grande como 10 o ms. Si
es im probable que a sea tan grande como 10, entonces puede concluirse que C es significativo.
Se presentan ahora tres ilustrativos ejemplos de diseos factoriales 2* no replicados.

EJEMPLO 6 - 3 ....................................................................................................................................
Transformacin de datos en un diseo factorial
Daniel [35b] describe un diseo factorial 24 utilizado para estudiar la rapidez de avance de una perforadora
como una funcin de cuatro factores: la carga de la perforadora (A), la rapidez de flujo (B), la velocidad de rota
cin (C) y el tipo de lodo de perforacin usado (D). Los datos del experimento se presentan en la figura 6-17.
E n la figura 6-18 se m uestra la grfica de probabilidad norm al de las estim aciones de los efectos de
este experim ento. Con base en esta grfica, los factores B, C y D , junto con las interacciones BC y BD,
req u ieren in terp retaci n . L a figura 6-19 es la grfica de probabilidad norm al de los residuales y la fi-

Estimacin del efecto

Figura 6-18

Grfica de probabilidad normal de los efectos del ejemplo 6-3.

258

CAPTULO 6

DISEO FACTORIAL 2l

Residuales

Figura 6-19

Grfica de probabilidad normal de los residuales del ejemplo 6-3.

gura 6-20 es la grfica de los residuales contra la velocidad de avance predicha a partir del m odelo que
contiene los factores identificados. Hay problem as evidentes con la norm alidad y la igualdad de la varian
za. Con frecuencia se usa una transform acin de los datos para abordar estos problem as. Puesto que la va
riable de respuesta es una razn de cambio, la transformacin logartmica parece un candidato razonable.

je

'K
4 o

-2

--------------------------

11

14

Velocidad de avance predicha


Figura 6-20 G rfica de lo s residuales contra la velocid ad d e avance
predicha en el ejem plo 6-3.

6-5 UNA SOLA RPLICA DEL DISEO 2*

259

Estimacin dal efecto

Figura 6-21 Grfica de probabilidad normal de los efectos del ejemplo 6-3 des
pus de la transformacin logartmica.

E n la figura 6-21 se presenta la grfica de probabilidad norm al de las estimaciones de los efectos des
pus de hacer la transform acin y* = ln y. Observe que al parecer ahora es posible una interpretacin
m ucho ms simple, ya que slo los factores B ,C y D estn activos. E s decir, expresar los datos en la m tri
ca correcta ha simplificado su estructura hasta el punto de que las dos interacciones han dejado de reque
rirse en el m odelo explicatorio.

Residuales

Figura 6-22 Grfica de probabilidad normal de los residuales del ejemplo 6-3
despus de la transformacin logartmica.

260

CAPTULO 6 DISEO FACTORIAL 2

0.2

0.1

0.1

_____ I _______ I________I________I------------L - l _


0

0.5

1.0

1.5

2.0

2.5

Velocidad de avance logartmica predicha

Figura 6-23 Grfica de los residuales contra la velocidad predicha


para el ejemplo 6-3 despus de la transformacin logartmica.

E n las figuras 6-22 y 6-23 se presentan, respectivam ente, una grfica de probabilidad norm al de los
residuales y una grfica de los residuales contra la rapidez de avance predicha p ara el m odelo en la escala
logartm ica que contiene a B, C y D. A hora estas grficas son satisfactorias. Se concluye que el m odelo
y* = lny slo requiere los factores B, C y D para una interpretacin adecuada. E n la tabla 6-14 se resum e
el anlisis de varianza de este modelo. La sum a de cuadrados del m odelo es
^Modelo = SSg + S S C + SSD
= 5.345+1.339 + 0.431
= 7.115
y R 2 = S S ModcJ S S T = 7.115/7.288 = 0.98, por lo que el m odelo explica cerca de 98% de la variabilidad de la
rapidez de avance de la perforadora.

EJEMPLO 6 - 4 ................................... ................................................................................................


Efectos de localizacin y disp ersin en un diseo factorial no replicado
Se corri un diseo 24 en un proceso de m anufactura de paneles laterales y ventanas de un avin com er
cial. Los paneles se hacen en una prensa, y bajo las condiciones actuales es demasiado elevado el nm ero
Tabla 6-14

Anlisis de varianza del ejemplo 6-3 despus de la transformacin logartmica

Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

B (Flujo)
C (Velocidad)
D (Lodo)

5.345
1.339
0.431
0.173
7.288

1
1
1
12
15

5.345
1.339
0.431
0.014

E rror
Tbtal

F0
381.79
95.64
30.79

Valor P
<0.0001
<0.0001
<0.0001

6-5 UNA SOLA RPLICA DEL DISEO 2*


______Factores_____

Bajo (-)

A ~ Temperatura (F)
295
B - Tiempo de sujecin (min)
7
C = Flujo de resina
10
D = Tiempo de cierre (s)
15

261

Alto(+)
325
9
20
30

Figura 6*24 Datos del experimento del proceso de los paneles


del ejemplo 6-4.

prom edio de defectos por panel en una operacin de prensado. (El prom edio actual del proceso es 5.5 de
fectos p or panel.) Se investigan cuatro factores utilizando una sola rplica de un diseo 2 \ en el que cada
rplica corresponde a una sola operacin de prensado. Los factores son la tem peratura (A), el tiem po de
sujecin (B), el flujo de resina (C) y el tiem po de cierre en el prensado (D). E n la figura 6-24 se m uestran
los datos de este experimento.
E n la figura 6-25 se m uestra la grfica de probabilidad norm al de los efectos de los factores. Es evi
dente que los dos efectos ms grandes son A = 5.75 y C = -4.25. N ingn efecto de los otros factores pare
ce ser tan grande, y A y C explican cerca de 77% de la variabilidad total, por lo que se concluye que la
tem peratura (A ) bajay el flujo de resina (C) alto reduciran la incidencia de defectos en los paneles.
E l anlisis residual cuidadoso es un aspecto im portante de cualquier experim ento. L a grfica de pro
babilidad norm al de los residuales no indic anomalas, pero cuando el experim entador grafic los resi-

Efectos de los factores

Figura 6-25 Grfica de probabilidad normal de los efectos de los factores para
el experimento del proceso de los paneles del ejemplo 6-4.

262

CAPTULO 6 DISEO FACTORIAL 2l

5 r

B = Tiempo de sujecin

Figura 6-26 Grfica de los residuales contra el tiempo de suje


cin para el ejemplo 6-4.

duales contra cada uno de los fa c to re s ^ a D , la grfica de los residuales contra B (tiem po de sujecin)
present el patrn de la figura 6-26. Este factor, que carece de im portancia en lo que se refiere al nm ero
prom edio de defectos por panel, es muy im portante en su efecto sobre la variabilidad del proceso, con el
tiem po de sujecin bajo dando como resultado una variabilidad m enor en el nm ero prom edio de defec
tos p or panel en una operacin de prensado.
El efecto de dispersin del tiem po de sujecin tam bin es muy evidente en la grfica de cabo de la fi
gura 6-27, donde se grafica el nm ero prom edio de defectos por panel y el rango del nm ero de defectos
en cada punto del cubo definido por los factores^!, B y C. El rango prom edio cuando B est en el nivel alto
(la cara posterior del cubo de la figura 6-27) es KB+ = 4.75, y cuando B est en el nivel bajo es R B- = 1.25.
Como resultado de este experim ento, el ingeniero decidi operar el proceso con la tem peratura baja
y el flujo de resina alto para reducir el nm ero prom edio de defectos, con el tiem po de sujecin bajo para
reducir la variabilidad en el nm ero de defectos p or panel, y con el tiem po de cierre en el prensado bajo
(el cual no tuvo ningn efecto ni sobre la localizacin ni sobre la dispersin). El nuevo ajuste de las condi
ciones de operacin produjo un nuevo prom edio del proceso de m enos de un defecto por panel.
Los residuales de un diseo 2k proporcionan mucha informacin acerca del problema bajo estudio. Pues
to que los residuales pueden considerarse como los valores observados del ruido o error, con frecuencia ofre
cen informacin acerca de la variabilidad del proceso. Puede hacerse el examen sistemtico de los residuales
de un diseo 2k no replicado para proporcionar informacin acerca de la variabilidad del proceso.
-4.5
-7.2 5

A = 3.5
3 .2 5-

C- Flujo de resina

R = 6.5

R - 4.5

295

325

A = Temperatura (F)
F igura 6-27 G rfica d e cubo de la tem peratura, e l tiem po d e su jecin y el flujo de
resina para e l ejem plo 6-4.

la b ia 6 '1 5

C orrida
1
2
3
4
5

6
7
8

9
10
11
12
13
14
15
16
s<f)

sin
F*

Clculo de los efectos de dispersin paca el ejemplo 6-4

AB

AC

BC

+
-

+
+
+
+
+
+
-

+
+
-

+
+
+
+
+
+
+
2.25
1.85
0.39

+
+

+
+
+
+
+
+
+

+
+
+
+
+
+
+
+

+
+
+
+
+
+
+
+

2.72
0.83
2.37

2.21
1.86
0.34

1.91
2.20
-0 .2 8

1.81
2.24
-0 .4 3

ABC
-

+
+
+

+
+
+
+
+
+
+

+
+
+
+

+
+
+
-

AD

BD

+
+
+
+
+
+
+
-

+
+
+
+
+
+
+

ABD
-

+
+
+
+
+
+
+
-

CD

ACD

BCD

ABCD

Residual

+
+
+
+
+
+
+

+
+
+
+
+
+
+
-

+
+
+
+
+
+
+
-

-0 .9 4
-0 .6 9
-2 .4 4
-2 .6 9
-1 .1 9
0.56
-0 .1 9

2.06
0.06
0.81
2.06
3.81
-0.69
-1.44
3.31
-2 .4 4

+
+
+
+
+
+

1.80
2.26
-0 .4 6

1.80
2.24
-0 .4 4

2.24
1.55
0.74

2.05
1.93
0.12

2.28
1.61
0.70

1.97
2.11
-0 .1 4

1.93
1.58
0.40

1.52
2.16
-0 .7 0

2.09
1.89
0.28

1.61
2.33
-0 .7 4

263

264

CAPTULO 6

DISEO FACTORIAL 2l

Considere la grfica de los residuales de la figura 6-26. L a desviacin estndar de los ocho residuales
donde B est en el nivel bajo es S(B~) = 0.83, y la desviacin estndar de los ocho residuales donde B est
en el nivel alto es S (B +) 2.72. E l estadstico
a

S (B~ )

(6-24)

tiene una distribucin aproxim adam ente norm al cuando las dos varianzas o2( 5 +) y (^(B ) son iguales.
Para ilustrar los clculos, el valor de F' es

= ln

(2.72)2
(0.83)2

= 2.37
E n la tabla 6-15 se presenta el conjunto com pleto de contrastes para el diseo 24 junto con los resi
duales p ara cada corrida del experim ento del proceso de los paneles del ejem plo 6-4. Cada colum na de
esta tabla contiene el mismo nm ero de signos positivos y negativos, y es posible calcular la desviacin es
tn d ar de los residuales de cada grupo de signos en cada columna, por ejemplo, 5 (/+) y S(i~), i = 1,2,..., 15.
Entonces
S 2( i +)
F = ln5 2( n

i = 1 ,2 ,..., 15

(6-25)

es un estadstico que puede usarse para evaluar la m agnitud de los efectos de dispersin del experimento.
Si la varianza de los residuales de las corridas donde el factor i es positivo es igual a la varianza de los resi
duales de las corridas donde el factor i es negativo, entonces F tiene una distribucin aproxim adam ente
normal. Los valores de F ' se presentan al final de cada colum na de la tabla 6-15.
L a figura 6-28 es la grfica de probabilidad norm al de los efectos de dispersin F . Evidentem ente, B
es un factor im portante en lo que se refiere a la dispersin del proceso. Para un estudio ms amplio de

aT

r,
F igura 6-28 G rfica d e probabilidad norm al de lo s efectos de dispersin
F ' d el ejem plo 6-4.

6-5 UNA SOLA RPLICA DEL DISEO 2*

. 265

este procedim iento, ver Boxy M eyer [19] y Myers y M ontgomery [85a]. Asimismo, para que los residuales
del m odelo ofrezcan la inform acin apropiada acerca de los efectos de dispersin, es necesario especifi
car correctam ente el modelo de localizacin. R eferirse al m aterial suplem entario del texto de este captu
lo para mayores detalles y un ejemplo.

EJEMPLO 6 - 5 .................... *.............................................................................................................


Mediciones duplicadas de la respuesta
U n equipo de ingenieros en una fbrica de semiconductores realizaron un diseo factorial 24 en un hom o
de oxidacin vertical. Se apilan cuatro obleas en el hom o, y la variable de respuesta de inters es el es
pesor del xido en las obleas. Los cuatro factores del diseo son la tem peratura (A), el tiem po (), la p re
sin (C) y el flujo de gas (D). El experim ento se lleva a cabo cargando cuatro obleas en el hom o, ajustando
las variables del proceso en las condiciones de prueba requeridas por el diseo experim ental, procesando
las obleas y m idiendo despus el espesor del xido en las cuatro obleas. E n la tabla 6-16 se presentan el di
seo y las mediciones del espesor resultantes. E n esta tabla, las cuatro columnas bajo el encabezado
Espesor contienen las mediciones del espesor del xido de cada oblea individual, y las dos ltimas co
lum nas contienen el prom edio m uestral y la varianza m uestral de las mediciones del espesor en las cuatro
obleas de cada corrida.
L a m anera apropiada de analizar este experim ento es considerar las mediciones del espesor de las
obleas individuales como mediciones duplicadas, y no com o rplicas. Si fueran en realidad rplicas,
cada oblea se habra procesado individualmente en una sola corrida del hom o. Sin embargo, debido a que
las cuatro obleas se procesaron en conjunto, recibieron los factores de los tratam ientos (es decir, los nive
les de las variables del diseo) simultneamente, p or lo que hay m ucho m enos variabilidad en las m edicio
nes del espesor de las obleas individuales que la que se habra observado si cada oblea fuera una rplica.
Por lo tanto, el promedio de las mediciones del espesor es la variable de respuesta correcta que deber
considerarse inicialmente.
E n la tabla 6-17 se m uestran las estimaciones de los efectos de este experim ento, utilizando el espesor
del xido prom edio como la variable de respuesta. Observe que los fa cto res^ y B y la in te ra c c io n e s tie
nen efectos grandes que explican en conjunto cerca de 90% de la variabilidad del espesor prom edio del

la b ia 6 '16
O rden
estndar

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

El experimento del espesor del xido


O rden de
la corrida
10
7
3
9
6
2
5
4
12
16
8
1
14
15
11
13

-1

-1
1

1
-1
-1
-1

-1
-1

A
1
1

-1

1
1
-1

-1

1
1
1
1
1
-1

-1
1

1
1

-1
I

-1

-1

1
1
1
1

1
1
1

_1
1

1
1

D
1

-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
1

Espesor
378
415
380
450
375
391
384
426
381
416
371
445
377
391
375
430

376
416
379
446
371
390
385
433
381
420
372
448
377
391
376
430

379
416
382
449
373
388
386
430
375
412
371
443
379
386
376
428

y
379
417
383
447
369
391
385
431
383
412
370
448
379
400
377
428

378
416
381
448
372
390
385
430
380
415
371
446
378
392
376
429

2
0.67
3.33
3.33
6.67
2
0.67
8.67
12.00
14.67
0.67
6
1.33
34
0.67
1.33

266

CAPTULO 6 DISEO FACTORIAL 2k

Tabla 6-17
Trm ino del
m odelo

A
B
C
D
AB
AC
AD
BC
BD
CD
ABC
ABD
ACD
BCD
ABCD

Estimaciones de los efectos del ejemplo 6-5, la variable de


respuesta es el espesor promedio del xido
Estimacin
del efecto

Suma de
cuadrados

43.125
18.125
-10.375
-1.625
16.875
-10.625
1.125
3.875
-3.875
1.125
-0.375
2.875
-0.125
-0.625
0.125

7439.06
1314.06
430.562
10.5625
1139.06
451.563
5.0625
60.0625
60.0625
5.0625
0.5625
33.0625
0.0625
1.5625
0.0625

Contribucin
porcentual
67.9339
12.0001
3.93192
0.0964573
10.402
4.12369
0.046231
0.548494
0.548494
0.046231
0.00513678
0.301929
0.000570753
0.0142688
0.000570753

xido. La figura 6*29 es una grfica de probabilidad norm al de los efectos. Al examinar esta representa
cin, se concluira que los factores A, B y C y las interacciones AB y A C son im portantes. E n la tabla 6-18
se m uestra el anlisis de varianza de este modelo.
E l m odelo para predecir el espesor prom edio del xido es

y 3 9 9 . 1 9 + 2 1 . 5 6 ^

+ 9 .0 6 * 2

5 .1 9 * 3

+ 8.44*1* 2 5 . 3 1 x j j t : 3

El anlisis residual de este m odelo es satisfactorio.


Los experim entadores estn interesados en obtener un espesor prom edio del xido de 400 , y las es
pecificaciones del producto requieren que el espesor sea de entre 390 y 410 . E n la figura 6-30 se presen
tan dos grficas de contorno del espesor prom edio, una con el factor C (o *3), la presin, en el nivel bajo
(es decir, x 3 = -1 ) y la otra con C (o x 3) en el nivel alto (es decir, x3 = + 1). Al examinar estas grficas de
contorno, es evidente que hay muchas combinaciones del tiem po y la tem peratura (factores A y B ) que
producirn resultados aceptables. Sin embargo, si la presin se m antiene constante en el nivel bajo, la
ventana de operacin se corre hacia el extremo izquierdo, o ms bajo, del eje del tiem po, indicando que
se necesitarn duraciones del ciclo ms cortas para conseguir el espesor del xido deseado.
Es interesante observar los resultados que se hubieran obtenido si las mediciones del espesor del xi
do de las obleas se hubieran considerado incorrectam ente como rplicas. E n la tabla 6-19 se presenta el
anlisis de varianza del m odelo com pleto basado en tratar el experim ento como un diseo factorial 24 con
rplicas. Observe que hay m uchos factores significativos en este anlisis, lo cual sugiere un m odelo mucho
ms complejo del que se encontr cuando se utiliz el espesor prom edio del xido como la respuesta. La
razn de esto es que la estim acin de la varianza del error de la tabla 6-19 es muy pequea ( 2 = 6.12). El
cuadrado m edio de los residuales de la tabla 6-19 refleja la variabilidad entre las obleas dentro de una co
rrida y la variabilidad entre las corridas. La estim acin del error que se obtiene en la tabla 6-18 es mucho
ms grande, d 2 = 17.61, y es principalm ente una m edida de la variabilidad entre las corridas. sta es la
m ejor estim acin del error que deber usarse para juzgar la significacin de las variables del proceso que
se modifican de una corrida a otra.
U n a pregunta lgica que podra plantearse es: qu dao causa identificar dem asiados factores como
im portantes?, como ciertam ente sera el caso en el anlisis incorrecto de la tabla 6-19. La respuesta es que

6-5 UNA SOLA RPLICA DEL DISEO 2

Efecto

Figura 6-29 Grfica de probabilidad normal de los efectos para la respuesta del es
pesor promedio del xido, ejemplo 6*5.
Tbla 6-18

Source

Mode!

Anlisis de varianza (de Design-Expen) para la respuesta espesor promedio del xido,
ejemplo 6-5

Sum of
Squares

DF

Mean
Square

<0.000

10774.31

2154.86

122.35

7439.06

7439.06

422.37

<0.000

1314.06

1314.06

74.61

<0.000

430.56

430.56

24.45

A B

1139.06

1139.06

64.67

A C

25.64

451.56

451.56

Residual
Cor Total

176.12
10950.44

10
15

17.61

Std. Dev.
Mean
C.V.
PRESS

4.20
399.19
1.05
450.88

Factor

Intercept
A-Time
&-Temp
C-Pressure
A B

Prob > F

A
C

A C

F
Value

fi-Squared
Adj. /?-Squared
Pred. ^Squared
Adeq. Precision

0.0006
<0.000
0.0005

0.9839
0.9759
0.9588
27.967

Coefficient
Estimate

DF

Standard
Error

95% Cl
Low

95% Cl
High

399.19
21.56
9.06
-5 .1 9
8.44
-5.31

1
1
1
1
1
1

1.05
1.05
1.05
1.05
1.05
1,05

396.85
19.22
6.72
-7.53
6.10
-7 .6 5

401.53
23.90
11.40
-2 .8 5
10.78
-2.97

267

268

CAPTULO 6

DISEO FACTORIAL 2l

Tiempo

Tiempo

(&)*3= +1
Grficas de contorno del espesor promedio del xido con
la presin (x3) mantenida constante.
Figura 6-30

intentar m anipular u optim izar los factores que no son im portantes sera un desperdicio de recursos, y po
dra resultar en agregar variabilidad innecesaria a otras respuestas de inters.
Cuando se hacen mediciones duplicadas de la respuesta, casi siem pre hay inform acin til acerca de
algn aspecto de la variabilidad del proceso contenida en estas observaciones. P or ejemplo, si las m edi
ciones duplicadas son pruebas mltiples hechas con un instrum ento de medicin en la misma unidad ex-

6-5 UNA SOLA RPLICA DEL DISEO 2*

la b ia 6-19

Anlisis de varianza (de Design-Expert) de la respuesta individuai del espesor del xido de
las obleas

Source
Model

S u m of
Squares
43801.75

29756.25

5256.25

1722.25

DF
15

2920.12

F
Value
476.75

29756.25

4858.16

5256.25

858.16

<0.0001

1722.25

281.18

<0.0001

Mean
Square

Prob > F
<0.0001
<0.0001

42.25

42.25

6.90

0.0115

A B

4556.25

4556.25

743.88

<0.0001

A C

1806.25

1806.25

294.90

<0.0001

A D

20.25

20.25

3.31

0.0753

B C

240.25

240.25

39.22

<0.0001

B D

240.25

240.25

39.22

<0.0001

C D

20.25

20.25

3.31

0.0753

A B D

132.25

132.25

21.59

<0.0001

A B C

2.25

2.25

0.37

0.5473

A C D

0.25

0.25

0.041

0.8407

B C D

6.25

6.25

1.02

0.3175

A B C D

0.25

0.25

0.041

0.8407

294.00

48

6.12

Residual
L a c k o f Fit

269

0.000

P u r e Error

294.00

48

Cor. Total

44095.75

63

6.13

perim ental, entonces las mediciones duplicadas proporcionan cierta inform acin acerca de la eficiencia
del instrum ento de medicin. Si las mediciones duplicadas se hacen en diferentes lugares dentro de una
unidad experim ental, pueden brindar cierta informacin acerca de la uniformidad de la variable de res
puesta en esa unidad. E n el ejemplo tratado aqu, ya que se tiene u n a observacin en cada una de cuatro
unidades experim entales que se han som etido a un procesam iento conjunto, se tiene cierta informacin
acerca de la variabilidad dentro de las corridas del proceso. E sta inform acin se encuentra contenida en la
varianza de las mediciones del espesor del xido de las cuatro obleas de cada corrida. Sera de inters de
term inar si alguna de las variables del proceso influye en la variabilidad al interior de las corridas.
L a figura 6-31 es una grfica de probabilidad norm al de las estim aciones de los efectos obtenidas uti
lizando ln (2) com o la respuesta. R ecuerde que en el captulo 3 se indic que la transform acin logartmi
ca es por lo general apropiada p ara m odelar la variabilidad. No hay ningn efecto individual fuerte, pero
el factor A y la interaccin BD son los ms grandes. Si se incluyen tam bin los efectos principales d e B y D
p ara obtener un m odelo jerrquico, entonces el m odelo de ln(sz) es
l n( s2) = 1.08+0.41*! - 0.40;t2 +0.20jc4 - 0.56x2x A
El m odelo explica apenas poco m enos de la m itad de la variabilidad en la respuesta ln(s2), lo cual desde
luego no es nada espectacular para un m odelo emprico, pero con frecuencia es difcil obtener modelos
excepcionalm ente buenos de las varianzas.
L a figura 6-32 es una grfica de contorno de la varianza predicha (no del logaritm o de la varianza pre
dicha) con la presin x3en el nivel bajo (recuerde que con esto se minimiza la duracin del ciclo) y el flujc
de gasx4 en el nivel alto. E sta eleccin del flujo de gas produce los valores mnimos de la varianza predicha
en la regin de la grfica de contorno.
E n este caso, los experimentadores se enfocaron en seleccionar valores de las variables de diseo que die
ran un espesor medio del xido dentro de las especificaciones del proceso y tan cerca de 400 como fuera po
sible, haciendo al mismo tiem po que la variabilidad dentro de las corridas sea pequea, por ejemplo s2 < 2..

270

CAPTULO 6 DISEO FACTORIAL 2l

Efecto

Figura 6-31 Grfica de probabilidad normal de los efectos utilizando ln ( j) como


la respuesta, ejemplo 6-5.
Varianza

Figura 6-32 Grfica de contorno de s2 (variabilidad dentro de las co


rridas) con la presin en el nivel bajo y el flujo de gas en el nivel alto.

6'6 ADICIN DE PUNTOS CENTRALES EN EL DISEO 2

271

1.00

0.60

C3
C

IE aoo
OSO

1.00

1.00

-0.60

aoo

060

1j00

Tiempo
Figura 6-33 Superposicin del espesor promedio del xido y las res
puestas s1con la presin en el nivel bajo y el flujo de gas en el nivel alto.

U na m anera posible de encontrar un conjunto de condiciones adecuado es superponiendo las grficas de


contorno de las figuras 6-30 y 6-32. La grfica de la superposicin se m uestra en la figura 6-33, con las es
pecificaciones del espesor m edio del xido y la restriccin 2 < 2 indicadas como contornos. E n esta grfi
ca, la presin se m antiene constante en el nivel bajo y el flujo de gas se m antiene constante en el nivel alto.
L a regin no som breada cerca de la parte central izquierda de la grfica identifica una regin factible
p ara las variables tiem po y tem peratura.
ste es un ejemplo simple del uso de las grficas de contorno p ara estudiar dos respuestas sim ult
neam ente. Este problem a se analizar con mayor detalle en el captulo 11.

6-6

ADICIN DE PUNTOS CENTRALES EN EL DISEO 2*

U na preocupacin potencial en el uso de diseos factoriales de dos niveles es el supuesto de la linealdad


de los efectos de los factores. D esde luego, no es necesaria la linealdad perfecta, y el sistema 2* funciona
r bastante bien incluso cuando el supuesto de linealdad sea vlido slo de m anera muy aproximada. D e
hecho, se ha sealado ya que si se agregan los trm inos de interaccin a un m odelo de los efectos princi
pales o de prim er orden, de donde se obtiene
k

(6-26)
entonces se tiene un m odelo con la capacidad de representar cierta curvatura en la funcin de respuesta.
E sta curvatura, desde luego, es resultado del torcim iento del plano inducido p o r los trm inos de interac
cin ijXfCj-

272

CAPTULO 6

DISEO FACTORIAL 2k

H abr situaciones en que la curvatura de la funcin de respuesta no est m odelada adecuadam ente
por la ecuacin 6-26. E n tales casos, un m odelo lgico por considerar es
k

0+2
J=1

j x j +

2E

a x ix i

i< i

+2

/=1

iix j + e

(6-27)

donde las n representan efectos cuadrticos o de segundo orden puros. A la ecuacin 6-27 se le llam a mo
delo de superficie de respuesta de segundo orden.
C uando se realiza un experim ento factorial de dos niveles, por lo general se anticipa el ajuste del m o
delo de prim er orden de la ecuacin 6-26, pero deber estarse alerta ante la posibilidad de que el m odelo
de segundo orden de la ecuacin 6-27 sea en realidad ms apropiado. Existe un m todo p ara hacer una r
plica de ciertos puntos de un diseo factorial 2k que ofrecer proteccin contra la curvatura de los efectos
de segundo orden a la vez que perm itir una estim acin independiente del error que va a obtenerse. El
m todo consiste en agregar pontos centrales en el diseo 2k. stos consisten en n rplicas que se corren
en los puntos x = 0 (i = 1 ,2 ,..., k). U na razn im portante p ara agregar rplicas de las corridas en el cen
tro del diseo es que los puntos centrales no afectan las estim aciones usuales de los efectos en un diseo
2k. Cuando se agregan puntos centrales, se supone que los k factores son cuantitativos.
Para ilustrar este enfoque, considere un diseo 2Zcon una observacin en cada uno de los puntos fac
toriales (-, - ) , ( + , - ) , ( - , + ) y ( + , + ) , y nc observaciones en el punto central (0,0). E n la figura 6-34 se ilus
tra la situacin. Sea yF el prom edio de las cuatro corridas en los cuatro puntos factoriales y sea y c el
prom edio de las n c corridas en el punto central. Si la d ife re n c ia ^ - y c es pequea, entonces los puntos
centrales caen en el plano (o cerca de l) que pasa por los puntos factoriales, y no hay curvatura cuadrti
ca. Por otra parte, sij/F ~ yc es grande, entonces est presente una curvatura cuadrtica. L a sum a de cua
drados de la curvatura cuadrtica p u ra con un solo grado de libertad est dada por
pp

_ n Fn c (y F ~ y c ) 2
Cuadrtica pura

il p T fv

donde, en general, nF es el nm ero de puntos del diseo factorial. E sta cantidad puede com pararse con el
cuadrado m edio del error para probar la curvatura cuadrtica pura. Ms especficam ente, cuando se
y

F igura 6-34

D ise o 22 con p u n tos centrales.

6-6 ADICI N DE PUNTO S CENTRALES EN EL DISEO 2*

273

agregan puntos en el centro del diseo 2k, con la prueba de la curvatura (utilizando la ecuacin 6-28) en
realidad se prueban las hiptesis
f i o - 'Z ^

= 0

y-1

K v % h * 0
/=1
Adems, si los puntos factoriales del diseo no tienen rplicas, pueden usarse los nc puntos centrales para
construir una estim acin del error con n c - 1 grados de libertad.

EJEMPLO 6 - 6 ..............................................................................................................................
U n ingeniero qumico estudia el rendim iento de un proceso. Hay dos variables de inters, el tiem po de
reaccin y la tem peratura de reaccin. D ebido a que no se tiene la seguridad sobre el supuesto de linealidad en la regin de exploracin, el ingeniero decide realizar un diseo factorial 22 (con una sola rplica de
cada co rrid a factorial) aum entando con cinco p untos centrales. E l diseo y los datos del rendim iento
se m uestran en la figura 6-35.
E n la tabla 6-20 se resum e el anlisis de varianza de este experim ento. El cuadrado m edio del error se
calcula a partir de los puntos centrales de la siguiente m anera:
SSK
m se =
nc - 1
(6-29)
Puntos centrales

nc - 1
Por lo tanto, p o r la tabla 6-20,

M Se =

2 (y, 40.46)2
<=i

_ 0.1720
4
= 0.0430
40.0
160 -

9
so
5
6
E
il
<q

41.5

f 40.3
155 -

40.5
40.7
40.2
40.6

150 - -1

39.3

40.9

-1
30

35

40

A = Tiempo de reaccin {min)


Figura 6-35 E l d ise o 22 con cin co puntos
cen trales para e l ejem plo 6-6.

274
la b ia 6-20

CAPTULO 6

DISEO FACTORIAL 2k

Anlisis de varianza del ejemplo 6-6

Fuente de
variacin
A (Tiempo)
B (Tfemperatura)
AB
Cuadrtica pura
Error
Total

Suma de
cuadrados
2.4025
0.4225
0.0025
0.0027
0.1720
3.0022

Grados de
libertad
1

Cuadrado
medio
2.4025
0.4225
0.0025
0.0027
0.0430

1
1
4
8

Fo
55.87
9.83
0.06
0.06

Valor P
0.0017
0.0350
0.8185
0.8185

E l prom edio de los puntos de la parte factorial del diseo es yF 40.425, y el prom edio de los puntos si
tuados en el centro esc = 40.46. L a d ife r e n c ia ^ - y c = 40.425 - 40.46 = -0.035 parece ser pequea. L a
sum a de cuadrados de la curvatura cuadrtica pura de la tabla del anlisis de varianza se calcula con la
ecuacin 6-28 de la siguiente m anera:
_ nFn c ( F - c
Cuadrtica pura

+ c

_ (4)(5)(0.035)2
4+5
= 0.0027
E l anlisis de varianza indica que ambos factores tienen efectos principales significativos, que no existe
interaccin, y que no hay evidencia de curvatura de segundo orden en la respuesta en la regin de explora
cin. Es decir, la hiptesis nula H 0: u + n = 0 no puede rechazarse.

E n el ejemplo 6-6 se lleg a la conclusin de que no haba indicios de efectos cuadrticos; es decir, un
m odelo de prim er orden
y 0 + 1X1 + 2X2 + i 2Xl X2 "*"

es apropiado (aun cuando probablem ente no se necesite el trm ino de la interaccin). H abr situaciones
en las que se necesitarn los trm inos cuadrticos. Es decir, se tendr que suponer entonces un m odelo de
segundo orden tal como
y Q + 1Xl + %X 2

l 2 Xl X 2 ~^~llXl

22X2

D esafortunadam ente, los parm etros desconocidos (las ) de este m odelo no pueden estimarse, ya que
hay seis parm etros p or estim ar y el diseo 22 m s los puntos centrales de la figura 6-35 slo tienen cinco
corridas independientes.
U n a solucin simple y de gran efectividad de este problem a es aum entar el diseo 2Zcon cuatro corri
das axiales, como se ilustra en la figura 6-36a. El diseo resultante, llam ado diseo central compuesto,
puede usarse entonces p ara ajustar el m odelo de segundo orden. E n la figura 6-366 se m uestra un diseo
central com puesto para k = 3 factores. Este diseo tiene 14 + n c corridas (generalm ente 3 < n c < 5), y es
u n diseo muy eficiente p ara ajustar el modelo de segundo orden con 10 parm etros en k = 3 factores.
Los diseos com puestos centrales se usan am pliam ente p ara construir modelos de superficie de res
puesta de segundo orden. Estos diseos se estudiarn con m ayor detalle en el captulo 11.

6-6 ADICIN DE PUNTOS CENTRALES EN EL DISEO 2*


x2

o) Dos factores

275

*3

() Tres factores

Figura 6-36 Diseos centrales compuestos.

Se concluye esta seccin con algunas sugerencias y observaciones adicionales tiles referentes al uso
de puntos centrales.
1.

2.

3.

4.

5.

Cuando un experimento factorial se lleva a cabo en un proceso en marcha, considere utilizar las
condiciones de operacin actuales (o de receta) como el punto central del diseo. Esto con fre
cuencia le asegura al personal de operacin que al menos una parte de las corridas del experimento
van a realizarse bajo condiciones familiares, y por lo tanto es improbable que los resultados obteni
dos (por lo menos para estas corridas) sean peores que los que se obtienen tpicamente.
Cuando el punto central de un experim ento factorial corresponde con las condiciones de opera
cin actuales, el experim entador puede usar las respuestas observadas en el punto central para
proporcionar una verificacin aproximada de si algo inusual ocurri durante el experimento.
Es decir, las respuestas del punto central debern ser muy similares a las respuestas observadas
histricam ente en la operacin rutinaria del proceso. Con frecuencia el personal de operacin
llevar una carta de control para m onitorear el desempeo del proceso. E n ocasiones las res
puestas de los puntos centrales pueden graficarse directam ente en la carta de control como una
verificacin de la form a en que estuvo operando el proceso durante el experim ento.
Considere correr las rplicas del punto central en orden no aleatorio. Especficam ente, debern
correrse uno o dos puntos centrales en o cerca del principio del experim ento, uno o dos cerca de
la parte media, y uno o dos cerca del final. Al separar los puntos centrales en el tiem po, el experi
m entador tiene una verificacin aproximada de la estabilidad del proceso durante el experim en
to. Por ejemplo, si ha ocurrido una tendencia en la respuesta m ientras se realizaba el
experim ento, graficar las respuestas de los puntos centrales contra el tiem po puede poner de m a
nifiesto esta situacin.
E n ocasiones los experimentos tienen que realizarse en situaciones en las que la informacin pre
via acerca de la variabilidad del proceso es escasa o nula. En estos casos, correr dos o tres puntos
centrales como las primeras corridas en el experimento puede ser de suma utilidad. Estas corridas
pueden proporcionar una estimacin prelim inar de la variabilidad. Si la magnitud de la variabili
dad parece razonable, se contina; por otra parte, si la variabilidad observada es mayor que la anti
cipada (o que la razonable!), habr que detenerse. Con frecuencia es muy provechoso estudiar la
cuestin de por qu es tan grande la variabilidad antes de proceder con el resto del experimento.
G eneralm ente, se utilizan puntos centrales cuando todos los factores del diseo son cuantitati
vos. Sin embargo, en ocasiones habr una o ms variables cualitativas o categricas y varias cuan

276

CAPTULO

DISEO FACTORIAL 2k

Tipo de
catalizador

Figura 6-37
centrales.

U n diseo 23 con un factor cualitativo y puntos

titativas. Sigue siendo posible em plear los puntos centrales en estos casos. P ara ilustrar este
punto, considere un experim ento con dos factores cuantitativos, el tiem po y la tem peratura, cada
uno con dos niveles, y un solo factor cualitativo, el tipo de catalizador, tam bin con dos niveles
(orgnico e inorgnico). E n la figura 6-37 se m uestra el diseo 23 para estos factores. Observe
que los puntos centrales se colocan en las caras opuestas del cubo que incluyen los factores cuan
titativos. E n otras palabras, los puntos centrales pueden correrse con las combinaciones de los
tratam ientos en los niveles alto y bajo de los factores cualitativos, siem pre y cuando esos subespacios incluyan nicam ente factores cuantitativos.

6-7
6-1.

PROBLEMAS

-------------------------------------------------------------------------------------------

U n ingeniero est interesado en los efectos de la velocidad de corte (A), la geom etra de la h erram ienta (B) y
el ngulo de corte (C) sobre la vida (en horas) de un a m quina herram ienta. Se eligen dos niveles de cada
factor y se corren tres rplicas de un diseo factorial 23. Los resultados fueron los siguientes:

+
+

+
-

+ .

+
+
+
+

Combinacin de
tratam ientos
(1)

a
b
ab
c
ac
be
abe

Rplica
I

II

III

22
32
35
55
44
40
60
39

31
43
34
47
45
37
50
41

25
29
50
46
38
36
54
47

a) Estim ar los efectos de los factores. Q u efectos p arecen ser grandes?


t) U sar el anlisis de varianza para confirm ar las conclusiones del inciso a.
c) Escribir un m odelo de regresin para predecir la vida de la h erram ienta (en horas) con base en los resul
tados de este experim ento.

6-2.

d) A nalizar los residuales. H ay algn problem a evidente?


e) C on base en el anlisis de las grficas de los efectos principales y las interacciones, cules seran los ni
veles de A, B y C que se recom endara utilizar?
Considere nuevam ente el inciso c del problem a 6-1. U tilizar el modelo de regresin p ara generar las grficas
de la superficie de respuesta y de contorno de la respuesta, la vida de la herram ienta. In terp retar estas grfi
cas. O frecen alguna idea respecto de las condiciones de operacin deseables p ara este proceso?

6-7 PROBLEMAS

6-3.

6-4.

6-5.

Encontrar el error estndar de los efectos de los factores y aproximar los lmites de confianza de 95% para los
efectos de los factores en el problema 6-1. Los resultados de este anlisis concuerdan con las conclusiones
del anlisis de varianza?
Representar los efectos de los factores del problema 6-1 en una grfica relativa a una distribucin t escalada
apropiadamente. En esta representacin grfica se identifican de manera adecuada los factores importan
tes? Comparar las conclusiones de esta grfica con los resultados del anlisis de varianza.
Se usa una mquina para hacer ranuras de localizacin en una tarjeta de circuitos impresos. El nivel de vibra
cin en la superficie de la tarjeta cuando se hacen las ranuras se considera una fuente principal de variacin
dimensional de las ranuras. Se piensa que dos factores influyen en la vibracin: el tamao de las ranuras (A) y
la velocidad de corte (B). Se seleccionan dos tamaos de las ranuras (y i de pulgada) y dos velocidades (40 y
90 rpm), y se hacen ranuras en cuatro tarjetas con cada conjunto de condiciones que se muestran abajo. La
variable de respuesta es la vibracin medida como el vector resultante de tres acelermetros (x,yyz) en cada
tarjeta de prueba.

6-6,

6-7.

277

+
+

Combinacin de
tratamientos

(1)
a
b
ab

I
18.2
27.2
15.9
41.0

Rplica
n
III
18.9
12.9
24.0
22.4
14.5
15.1
43.9
36.3

IV
14.4
22.5
14.2
39.9

a) Analizar los datos de este experimento.


t) Construir una grfica de probabilidad normal de los residuales, y graficar los residuales contra el nivel de
vibracin predicho. Interpretar estas grficas,
c) Hacer la grfica de la interaccin,^. Interpretar esta grfica. Qu niveles del tamao de las ranuras y
la velocidad se recomendaran para la operacin rutinaria?
Considere nuevamente el experimento descrito en el problema 6-1. Suponga que el experimentador efectu
nicamente ocho ensayos de la rplica 1. Adems, corri cuatro puntos centrales y obtuvo los siguientes valo
res de la respuesta: 36, 40, 43, 45.
a) Estimar los efectos de los factores. Qu efectos son grandes?
t) Efectuar un anlisis de varianza, incluyendo una verificacin de la curvatura cuadrtica pura. A qu
conclusiones se llega?
c) Escribir un modelo apropiado para predecir la vida de la herramienta, con base en los resultados de este
experimento. Este modelo difiere en alguna forma sustancial del modelo del problema 6-1, inciso c?
d) Analizar los residuales.
e) A qu conclusiones se llegara acerca de las condiciones de operacin apropiadas para est proceso?
Se llev a cabo un experimento para mejorar el rendimiento de un proceso qumico. Se seleccionaron cuatro
factores y se corrieron dos rplicas de un experimento completamente aleatorizado. Los resultados se pre
sentan en la tabla siguiente:

Combinacin
de tratamientos

Rplica
I
II

(1)
a
b
ab
c
ac
be
abe

90
74
81
83
77
81
88
73

93
78
85
80
78
80
82
70

Combinacin
de tratamientos
d
ad
bd
abd
cd
acd
bed
abed

Rplica
I
II
98
72
87
85
99
79
87
80

95
76
83
86
90
75
84
80

278

CAPTULO 6

DISEO FACTORIAL 2

a ) Estim ar los efectos de los factores.


b) C onstruir la tabla del anlisis de varianza y determ inar cules factores son im portantes p ara explicar el
rendim iento.
Escribir un m odelo de regresin para predecir el rendim iento, suponiendo que los cuatro factores se hi
cieron variar en el rango de -1 a + 1 (en unidades codificadas).
d) G raficar los residuales contra el rendim iento predicho y en un a escala de probabilidad norm al. El anli
sis residual parece ser satisfactorio?
e) D os interacciones de tres factores, ABC y ABD, aparentem ente tienen efectos grandes. T tazar un a grfi
ca de cubo en los fa c to re s^ , B y C con los rendim ientos prom edio indicados en cada vrtice. R epetir lo
anterior utilizando los fa c to re s ^ , B y D. Estas dos grficas ayudan en la interpretacin d e los datos?
D nde se recom endara que se corriera el proceso con respecto a las cuatro variables?
U n bacterilogo est interesado en los efectos de dos m edios de cultivo diferentes y dos tiem pos diferentes
sobre el crecim iento de un virus particular. Realiza seis rplicas de un diseo 22, haciendo las corridas de m a
n era aleatoria. A nalizar los datos del crecim iento viral que se presentan enseguida y sacar las conclusiones
apropiadas. A nalizar los residuales y com entar la adecuacin del m odelo.
c)

6-8.

Medio de cultivo
Tiempo, h

6-9.

12

21
23
20

22
28
26

25
24
29

26
25
27

18

37
38
35

39
38
36

31
29
30

34
33
35

U n ingeniero industrial em pleado por una com paa refresquera est interesado en los efectos de dos dife
rentes tipos de botellas de 32 onzas sobre el tiem po de entrega de cajas de 12 botellas del producto. Los dos
tipos de botellas son de vidrio y de plstico. Se usan dos em pleados p ara realizar un a tarea que consiste en
mover 40 cajas del producto 50 pies en una plataform a de carga estndar y acom odarlas en un estante de ven
ta. Se hacen cuatro rplicas de un diseo factorial 22y los tiem pos observados se enlistan en la siguiente tabla.
A nalizar los datos y sacar las conclusiones apropiadas. A nalizar los residuales y com entar la adecuacin del
modelo.

Em pleado
Tipo de botella

6-10.

Vidrio

5.12
4.98

4.89
5.00

6.65
5.49

6.24
5.55

Plstico

4.95
4.27

4.95
4.25

5.28
4.75

4.91
4.71

E n el problem a 6-9, el ingeniero tam bin estuvo interesado en las diferencias en la fatiga potencial que resul
ta de los tipos de botellas. Como una m edida de la cantidad de esfuerzo requerido, midi el aum ento del rit
mo cardiaco (pulso) inducido po r la tarea. Los resultados se presentan a continuacin. A nalizar los datos y
sacar conclusiones. A nalizar los residuales y com entar la adecuacin del modelo.

6-7 PROBLEMAS

279

Em pleado
Tipo de botella

6-11.
6-12.

Vidrio

39
58

45
35

20
16

13
11

Plstico

44
42

35
21

13
16

10
15

Calcular los lmites de confianza aproxim ados p ara los efectos de los factores del problem a 6-10. Los resul
tados de este anlisis concuerdan con el anlisis de varianza realizado en el problem a 6-10?
E n un artculo de AT&T Technical Journal (vol. 65, pp. 39-50) se describe la aplicacin de diseos factoriales
de dos niveles en la fabricacin de circuitos integrados. U n paso bsico del procesam iento es hacer crecer
una capa epitaxial sobre obleas de silicio pulidas. Las obleas se m ontan en un susceptor, se colocan en el inte
rior de una cam pana de cristal y se introducen vapores qumicos. E l susceptor se hace girar y se aplica calor
hasta que la capa epitaxial tiene el espesor suficiente. Se corri un experim ento utilizando dos factores: rapi
dez de flujo de arsnico (A) y tiem po de deposicin (B ). Se corrieron cuatro rplicas y se midi el espesor de
la capa epitaxial (en //m ). Los datos se m uestran a continuacin:

Rplica

Niveles de factores

II

III

IV

14.037
13.880
14.821
14.888

16.165
13.860
14.757
14.921

13.972
14.032
14.843
14.415

13.907
13.914
14.878
14.932

Bajo (-)

A lto ( + )

55%

59%

Corto
(10 min)

Largo
(15 min)

a) E stim ar los efectos de los factores.


t) Conducir un anlisis de varianza. Q u factores son im portantes?
c)

6-13.

6-14.
6-15.

Escribir una ecuacin de regresin que podra usarse p ara predecir el espesor de la capa epitaxial en la
regin de la velocidad de flujo del arsnico y el tiem po de deposicin utilizado en este experim ento.
d) A nalizar los residuales. Se observa algn residual que debiera causar preocupacin?
e) C om entar la form a en que se podra resolver el punto atipico potencial encontrado en el inciso d.
Continuacin delproblema 6-12. U sar el m odelo de regresin del inciso c del problem a 6-12 p ara generar una
grfica de contorno de la superficie de respuesta p ara el espesor epitaxial. Suponga que es de im portancia
crtica obtener un espesor de la capa de 14.5 fim. Q u ajustes de la velocidad de flujo del arsnico y del tiem
po de deposicin se recom endaran?
Continuacin del problema 6-13. E n qu form a cam biara la respuesta dada en el problem a 6-13 si la veloci
dad de flujo del arsnico fuera ms difcil de controlar en el proceso que el tiem po de deposicin?
Se utiliza una aleacin de nquel y titanio para fabricar com ponentes de los m otores de turbina de aviones.
L a form acin de fisuras es un problem a potencialm ente serio de las piezas term inadas, ya que pueden provo
car fallas irreversibles. Se realiza una prueba de las piezas p ara determ inar el efecto de cuatro factores sobre
las fisuras. Los cuatro factores son la tem peratura de vaciado (A), el contenido de titanio (B), el m todo de
tratam iento trm ico (C) y la cantidad de refinador de grano usada (D ). Se hacen dos rplicas de un diseo 2"
y se m ide la longitud de las fisuras (en mm x 10-2) inducidas en un ejem plar de prueba de m uestra som etido a
una prueba estndar. Los datos se m uestran en la siguiente tabla:

280

CAPTULO 6 DISEO FACTORIAL 2k

A
+
+
+
+
+
+
+
+

B
+
+
+
+
+
+
+
+

C
+
+
+
+
+
+
+
+

Combinacin de
tratamientos

+
+
+
+
+
+
+
+

(1)
a
b
ab
c
ac
be
abe
d
ad
bd
abd
cd
acd
bed
abed

____ Rplica
I
II
im i
6.376
14.707
15.219
11.635
12.089
17.273
17.815
10.403
10.151
4.368
4.098
9.360
9.253
13.440
12.923
8.561
8.951
16.867
17.052
13.876
13.658
19.824
19.639
11.846
12.337
6.125
5.904
11.190
10.935
15.653
15.053

a ) Estim ar los efectos de los factores. Q u efectos de los factores parecen ser grandes?
b) Conducir un anlisis de varianza. Alguno de los factores afecta la form acin de fisuras? U tilizar a =
0.05.
Escribir un m odelo de regresin que pued a usarse p ara predecir la longitud de las fisuras com o u na fun
cin de los efectos principales y las interacciones significativas que se han identificado en el inciso b.
d ) A nalizar los residuales de este experimento.
c)

e)

H ay algn indicio d e q u e alguno d e los fa c to re s afecte la v ariab ilid ad d e la fo rm a ci n d e fisu ras?

f)
6-16.

6-17.

Q u recom endaciones se haran respecto de las operaciones del proceso? U tilizar grficas de las in te
racciones y/o de los efectos principales com o ayuda p ara sacar conclusiones.
Continuacin delproblema 6-15. U na de las variables del experim ento descrito en el problem a 6-15, el m todo
de tratam iento trm ico (C), es una variable categrica. Suponga que los dem s factores son continuos.
a) Escribir dos m odelos de regresin para predecir la longitud de las fisuras, uno p ara cada nivel de la varia
ble m todo de tratam iento trm ico. Q u diferencias, en caso de haberlas, se observan en estas dos
ecuaciones?
b) G enerar las grficas de contorno apropiadas de la superficie de respuesta p ara los dos m odelos de regre
sin del inciso a.
c) Q u conjunto de condiciones se recom endara p ara los fac to re s^ , B y D sise utiliza el m todo de tra ta
m iento trm ico C = + ?
d ) R epetir el inciso c suponiendo que quiere usarse el m todo de tratam iento trm ico C = - .
U n experim entador corre una sola rplica de un diseo 24. Se calcularon las siguientes estim aciones de los
efectos:

A =
B =
C=
D=

76.95
-67.52
-7.84
-18.73

AB = -51.32
A C = 11.69
AD = 9.78
BC = 20.78
B D = 14.74
CD = 1.27

ABC
ABD
ACD
BCD
ABCD

= -2.82
= -6.50
= 10.20
= -7.98
= -6.25

a) Construir una grfica de probabilidad normal de estos efectos.


b) Identificar un modelo tentativo, con base en la grfica de los efectos del inciso a.

6-7 PROBLEMAS

6-18.

281

En un artculo de Solid State Technology (Diseo ortogonal para optimizacin de procesos y su aplicacin en
el grabado qumico con plasma) se describe la aplicacin de diseos factoriales en el desarrollo de un proce
so de grabado qumico con nitruros en un dispositivo de grabado qumico con plasma para una sola oblea. El
proceso usa C2F6como gas de reaccin. Cuatro factores son de inters: el entrehierro nodo-ctodo (A), la
presin en la cmara del reactor (B ), el flujo del gas C2F6(C) y la potencia aplicada al ctodo (>). La respues
ta de inters es la rapidez de grabado para el nitruro de silicio. Se corre una sola rplica de un diseo 24; los
datos se muestran enseguida:

Nmero de Orden real de


corrida
la corrida
1
13
2
8
12
3
4
9
5
4
15
6
16
7
8
3
1
9
14
10
11
5
10
12
13
11
14
2
7
15
6
16

+
+

+
+
+
+

+
+

+
+
+
+

+
+

+
+
+
+
+
+
+
+

Rapidez de grabadc, Niveles de los factores


B ajo(-)
A lto(+)
(/min)
A (cm)
0.80
1.20
550
B (mTbrr) 450
550
669
C (SCCM) 125
200
604
650
D (W)
275
325
633
642
601
635
1037
749
1052
868
1075
860
1063
729

a) Estimar los efectos de los factores. Considere una grfica de probabilidad normal de los efectos de los
factores. Qu efectos parecen ser grandes?
b) Efectuar un anlisis de varianza para confirmar los resultados obtenidos en el inciso a.
c) Cul es el modelo de regresin que relaciona la rapidez de grabado con las variables significativas del
proceso?
d) Analizar los residuales de este experimento. Comentar la adecuacin del modelo.
e) Si no todos los factores son importantes, hacer la proyeccin del diseo 24 en un diseo 2k con k < 4 y
conducir el anlisis de varianza.
f) Ttazar grficas para interpretar cualquier interaccin significativa.
g) Graficar los residuales contra el orden real de las corridas. Qu problemas podran ponerse de mani
fiesto en esta grfica?
6-19. Continuacin delproblema 6-18. Considere el modelo de regresin obtenido en el inciso c del problema 6-18.
a) Construir las grficas de contorno de la rapidez de grabado utilizando este modelo.
b) Suponga que fuera necesario operar este proceso con una rapidez de 800 /min. Cules seran los ajus
tes de las variables del proceso que se recomendaran?
6-20. Considere la rplica nica del diseo 24del ejemplo 6-2. Suponga que se decidi arbitrariamente analizar los
datos suponiendo que las interacciones de tres y cuatro factores eran insignificantes. Conducir este anlisis y
comparar los resultados con los que se obtuvieron en el ejemplo. Piensa el lector que es una buena idea su
poner de manera arbitraria que las interacciones son insignificantes incluso cuando sean de orden relativa
mente alto?
6-21. Se realiz un experimento en una fbrica de semiconductores en un esfuerzo para incrementar el rendimien
to. Se estudiaron cinco factores, cada uno con dos niveles. Los factores (y los niveles) fueron: A = ajuste de
apertura (pequea, grande), B = tiempo de exposicin (20% abajo del nominal, 20% arriba del nominal),

282

CAPTULO 6

DISEO FACTORIAL 2k

C = tiem po de desarrollo (30 s, 45 s), D = tam ao de la m scara (pequea, grande) y E tiem po de grabado
(14.5 min, 15.5 min). Se corri el diseo 25 no replicado que se m uestra a continuacin.
II

d = 8
ad = 10
bd = 32
abd = 50
cd = 18
acd 21
bed 44
abed = 61

CO

(1) = 7
a 9
b = 34
ab -= 55
c = 16
ac -= 20
be -= 40
abe =60

ae = 12
be = 35
abe 52
ce = 15
ace = 22
bee = 45
abee 65

de = 6
ade = 10
bde = 30
abde = 53
ede = 15
aede 20
bede = 41
abcde= 63

a) Construir una grfica de probabilidad normal de las estimaciones de los efectos. Qu efectos parecen
ser grandes?
b) Efectuar un anlisis de varianza para confirmar los resultados obtenidos en el inciso a.
c) Escribir el m odelo de regresin que relacione el rendim iento con las variables significativas del proceso.

Graficar los residuales en papel probabilidad normal. La grfica es satisfactoria?


e) Graficar los residuales contra los rendimientos predichos y contra cada uno de los cinco factores. Co
mentar las grficas.
d)

f)

6-22.

6-23.

In terp retar cualquier interaccin significativa.

g) Qu recomendaciones se haran respecto de las condiciones de operacin del proceso?


h) Hacer la proyeccin del diseo 25 de este problema en un diseo 2k en los factores importantes. Esque
matizar el diseo e indicar el promedio y el rango de los rendimientos en cada corrida. Es de ayuda este
esquema para interpretar los resultados de este experimento?
Continuacin delproblema 6-21, Suponga que el experimentador corri cuatro puntos centrales adems de los
32 ensayos del experimento original. Los rendimientos obtenidos en las corridas de los puntos centrales fue
ron 68, 74, 76 y 70.
a) Analizar de nuevo el experimento, incluyendo una prueba para la curvatura cuadrtica pura.
b) Comentar cul sera el siguiente paso.
Se estudiaron cuatro factores, cada uno con dos niveles, en un estudio del rendimiento de un proceso: el
tiempo (A ) , la concentracin (B), la presin (C) y la temperatura (D). Se corri una sola rplica de un diseo
24 y los datos obtenidos se muestran en la siguiente tabla:

N m ero de O rden real de


corrida
la corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

5
9
8
13
3
7
14
1
6
11
2
15
4
16
10
12

+
+

+
+

+
+
+
+

+
+

+
+
+
+

+
+

+
+
+
+
+
+
+
+

Rendim iento
(lbs)
12
18
13
16
17
15
20
15
10
25
13
24
19
21
17
23

Niveles de los factores


Bajo (-)
A lto ( + )
-4 (h )

B( %)
C (psi)
D (C)

2.5
14
60
225

3
18
80
250

6'7 PROBLEMAS

6-24.

6-25.

283

a) Construir una grfica de probabilidad normal de las estimaciones de los efectos. Qu factores parecen
tener efectos grandes?
b) Efectuar un anlisis de varianza utilizando la grfica de probabilidad normal del inciso a como gua para
formar el trmino del error. A qu conclusiones se llega?
c) Escribir un modelo de regresin que relacione el rendimiento con las variables importantes del proceso.
d) Analizar los residuales de este experimento. El anlisis indica algn problema potencial?
e) Es posible plegar este diseo a un diseo 23con dos rplicas? De ser as, esquematizar el diseo con el
promedio y el rango del rendimiento indicados en cada punto del cubo. Interpretar los resultados.
Continuacin delproblema 6-23. Usar el modelo de regresin del inciso c del problema 6-23 para generar una
grfica de contorno de la superficie de respuesta del rendimiento. Analizar el valor prctico de esta grfica
de superficie de respuesta.
El experimento del brownie (pastelito) exquisito. El autor es un ingeniero hecho en la prctica y un firme creyen
te de aprender haciendo las cosas. Durante muchos aos ha impartido el curso de diseo experimental a una
amplia variedad de audiencias y siempre asigna la planeacin, realizacin y anlisis de un experimento real a
los participantes de la clase. Los participantes parecen disfrutar esta experiencia prctica y siempre
aprenden mucho de ella. En este problema se utilizan los resultados de un experimento realizado por Gretchen Krueger en la Universidad Estatal de Arizona.
Existen muchas formas diferentes de hornear brownies. El propsito de este experimento fue determinar
la forma en que el material del molde, la marca de la harina para brownies y el mtodo de batido afectan la
exquisitez de los brownies. Los niveles de los factores fueron:

Factor
A = material del molde
B = mtodo de batido
C = marca de la harina

Bajo (-)
Vidrio
Cuchara
Cara

Alto (+)
Aluminio
Batidora
Barata

La variable de respuesta fue la exquisitez, una medida subjetiva derivada de un cuestionario aplicado a los
sujetos que hicieron el muestreo de cada lote de brownies. (Este cuestionario inclua aspectos como el sabor,
la apariencia, la consistencia, el aroma, etc.) Un panel de prueba integrado por ocho personas hizo el mues
treo de cada lote y llen el cuestionario. La matriz del diseo y los datos de la respuesta se presentan a conti
nuacin:

Lote de
brownies
1
2
3
4
5
6
7
8

+
-

+
-

+
-

+
+
-

+
+

+
+
+
+

1
11
15
9
16
10
12
10
15

2
9
10
12
17
11
13
12
12

Resultados del panel de prueba


3
5
4
6
10
11
10
10
14
16
12
9
11
11
11
11
12
15
13
13
8
15
6
8
14
9
13
13
13
7
10
7
15
12
13
12

7
8
6
11
11
9
14
17
9

8
9
15
12
11
14
9
13
14

a) Analizar los datos de este experimento como si se tratara de ocho rplicas de un diseo 23. Comentar los
resultados.

284

6-26.

CAPTULO 6

DISEO FACTORIAL 2l

b) El anlisis del inciso a es el enfoque correcto? Hay nicamente ocho lotes; se tienen en realidad ocho
rplicas de un diseo factorial 23?
c) Analizar el promedio y la desviacin estndar del puntaje de la exquisitez. Comentar los resultados,
Este anlisis es ms apropiado que el del inciso a? Por qu s o no?
Se condujo un experimento en un proceso qumico para producir un polmero. Los cuatro factores estudia
dos fueron la temperatura (A), la concentracin del catalizador (B), el tiempo (C) y la presin (D). Se obser
varon dos respuestas, el peso molecular y la viscosidad. La matriz del diseo y los datos de la respuesta se
presentan a continuacin:

Nmero Orden real de


de corrida las corridas
18
1
2
9
3
13
4
8
5
3
11
6
14
7
8
17
9
6
7
10
11
2
12
10
4
13
14
19
15
15
16
20
1
17
18
5
16
19
12
20

6-27.

+
+

+
+

+
+
+
+

+
+

+
-

+
0
0
0
0

+
+
0
0
0
0

+
+
+
+
0
0
0
0

+
+
+
+
+
+
+
+
0
0
0
0

Peso
molecular
2400
2410
2315
2510
2615
2625
2400
2750
2400
2390
2300
2520
2625
2630
2500
2710
2515
2500
2400
2475

Niveles de los factores


Alto (+)
Viscosidad
Bajo (-)
1400
120
A (C)
100
1500
8
B (%)
4
C (min)
20
1520
30
75
D (psi)
60
1630
1380
1525
1500
1620
1400
1525
1500
1500
1420
1490
1500
1600
1500
1460
1525
1500

a) Considere nicamente la respuesta del peso molecular. Graficar las estimaciones de los efectos en una
escala de probabilidad normal. Qu efectos parecen ser importantes?
b) Usar un anlisis de varianza para confirmar los resultados del inciso a. Hay algn indicio de curvatura?
c) Escribir un modelo de regresin para predecir el peso molecular como una funcin de las variables im
portantes.
d) Analizar los residuos y comentar la adecuacin del modelo.
e) Repetir los incisos a~d utilizando la respuesta de la viscosidad.
Continuacin delproblema 6-26. Utilizar los modelos de regresin del peso molecular y la viscosidad para res
ponder las preguntas siguientes.
a) Construir una grfica de contorno de la superficie de respuesta para el peso molecular. En qu direc
cin se ajustaran las variables del proceso a fin de incrementar el peso molecular?
b) Construir una grfica de contorno de la superficie de respuesta para la viscosidad. En qu direccin se
ajustaran las variables del proceso para disminuir la viscosidad?

6-7 PROBLEMAS

6-28.

6-29.

6-30.

c) Qu condiciones de operacin se recomendaran si fuera necesario producir un producto con peso mo


lecular entre 2400 y 2500, y con la viscosidad ms baja posible?
Considere una sola rplica del diseo 24del ejemplo 6-2. Suponga que se hicieron cinco corridas de puntos en
el centro (0,0,0,0) y que se observaron las respuestas siguientes: 73,75,71,69 y 76. Probar la curvatura en
este experimento. Interpretar los resultados.
Un valorfaltante en un diseofactorial 2*. No es raro encontrar que falta una de las observaciones de un diseo
2k debido a un equipo de medicin defectuoso, una prueba fallida, o alguna otra razn. Si el diseo se hace
con n rplicas (n > 1), puede emplearse alguna de las tcnicas estudiadas en el captulo 5. Sin embargo, para
un diseo factorial sin rplicas (n = 1) debe usarse otro mtodo. Un enfoque lgico es estimar el valor faltante con un nmero que haga cero el contraste de la interaccin de orden ms alto. Aplicar esta tcnica al expe
rimento del ejemplo 6-2, suponiendo que falta la corrida ab. Compare los resultados obtenidos con los del
ejemplo 6-2.
Un ingeniero realiz un experimento para estudiar el efecto de cuatro factores sobre la aspereza superficial
de una pieza maquinada. Los factores (y sus niveles) son.4 = ngulo de la herramienta (12,15), B = viscosi
dad del fluido de corte (300,400), C = velocidad de alimentacin (10,15 pulg/min) y D = enfriador del fluido
de corte usado (no, s). Los datos de este experimento (con los factores codificados en los niveles usuales -1,
+ 1) se muestran a continuacin.

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

6-31.

285

+
+

+
+

+
+

+
+
+
+

+
+

+
+
+
+

+
+

+
+
+
+
+
+
+
+

Rugosidad superficial
0.00340
0.00362
0.00301
0.00182
0.00280
0.00290
0.00252
0.00160
0.00336
0.00344
0.00308
0.00184
0.00269
0.00284
0.00253
0.00163

a) Estimar los efectos de los factores. Representar las efectos de los factores en una grfica de probabilidad
normal y seleccionar un modelo tentativo.
b) Ajustar el modelo identificado en el inciso a y analizar los residuales. Hay algn indicio de que el mode
lo no sea adecuado?
c) Repetir el anlisis de los incisos a y b utilizando 1ty como la variable de respuesta. Hay algn indicio de
que la transformacin ha sido til?
d) Ajustar un modelo en trminos de las variables codificadas que pueda usarse para predecir la rugosidad
superficial. Convertir esta ecuacin de prediccin en un modelo en las variables naturales.
La resistividad de una oblea de silicio est influida por varios factores. Los resultados de un experimento fac
torial 24 realizado durante un paso crtico del procesamiento se muestran en la tabla siguiente:

286

CAPTULO 6

DISEO FACTORIAL 2k

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

+
+

+
+

+
+

+
+'
+
+

+
+

+
-

+
+

+
+
+
+

+
+
+
+
+
+
+
+

Resistividad
1.92
11.28
1.09
5.75
2.13
9.53
1.03
5.35
1.60
11.73
1.16
4.68
2.16
9.11
1.07
5.30

a) Estimar los efectos de los factores. Representar las efectos de los factores en una grfica de probabilidad
normal y seleccionar un modelo tentativo.
b) Ajustar el modelo identificado en el inciso a y analizar los residuales. Hay algn indicio de que el mode
lo no sea adecuado?
c) Repetir el anlisis de los incisos a y b utilizando ln (y) como la variable de respuesta. Hay algn indicio
de que la transformacin haya sido til?
d) Ajustar un modelo en trminos de las variables codificadas que pueda usarse para predecir la resistivi
dad.
6-32. Continuacin delproblema 6-31. Suponga que el experimentador corri tambin cuatro puntos centrales jun
to con las 16 corridas del problema 6-31. Las mediciones de la resistividad en los puntos centrales son: 8.15,
7.63, 8.95 y 6.48. Analizar de nuevo el experimento incorporando los puntos centrales. Qu conclusiones
pueden sacarse ahora?
6-33. Es frecuente usar el modelo de regresin ajustado de un diseo factorial 2k para hacer predicciones en pun
tos de inters del espacio del diseo.
a) Encontrar la varianza de la respuesta predicha y en un punto X],X2, ...,x k del espacio del diseo. Sugeren
cia: recuerde que las* estn codificadas, y suponga un diseo 2k con el mismo nmero de rplicas n en
cada punto del diseo, de tal modo que la varianza de un coeficiente de regresin sea o 2/(n 2 k) y que la
covarianza entre cualquier par de coeficientes de regresin sea cero.
b) Usar el resultado del inciso a para encontrar la ecuacin de un intervalo de confianza de 100(1 - a) por
ciento para la verdadera respuesta media en el punto x lt x 2, ..., x k del espacio del diseo.
6-34. Modelosjerrquicos. Se ha usado varias veces el principio de jerarqua para seleccionar un modelo; es decir,
se han incluido trminos de orden inferior no significativos en un modelo porque eran factores que estaban
incluidos en trminos de orden superior significativos. Ciertamente, la jerarqua no es un principio absoluto
que deba seguirse en todos los casos. Para ilustrar esto, considere el modelo que result en el problema 6-1,
el cual requiri que se incluyera un efecto principal no significativo para respetar la jerarqua. Utilizar los da
tos del problema 6-1.
a) Ajustar el modelo jerrquico y el modelo no jerrquico.
b) Calcular el estadstico PRESS, la R1 ajustada y el cuadrado medio del error para ambos modelos.
c) Encontrar un intervalo de confianza de 95 % para la estimacin de la respuesta media en el vrtice de un
cubo (*! = x2 = x3 = 1). Sugerencia: usar los resultados del problema 6-33.
d) Con base en los anlisis que se han realizado, qu modelo preferira el lector?

Formacin de
bloques y confusin
en el diseo
factorial 2 k

7-1

INTRODUCCIN

Hay mltiples situaciones en las que es imposible efectuar todas las corridas de un experim ento factorial
2k bajo condiciones hom ogneas. Por ejemplo, un lote de m ateria prim a podra no ser suficiente para ha
cer todas las corridas requeridas. En otros casos, podra ser conveniente m odificar deliberadam ente las
condiciones experim entales p ara asegurar que los tratam ientos tengan la misma efectividad (es decir, que
sean robustos) en diversas situaciones que es posible encontrar en la prctica. Por ejemplo, un ingeniero
qumico puede correr un experim ento en una planta piloto con varios lotes de m ateria prim a porque sabe
que en el proceso real a gran escala posiblem ente se usarn diferentes lotes de m ateria prim a con diversos
grados de calidad.
L a tcnica de diseo utilizada en estas situaciones es la formacin de bloques. E ste captulo se enfoca
en algunas tcnicas especiales para separar en bloques un diseo factorial 2*.

7-2

FORMACIN DE BLOQUES DE UN DISEO FACTORIAL 2kCON RPLICAS

Suponga que se han corrido n rplicas del diseo factorial 2k. E sta situacin es idntica a la que se estudi
en el captulo 5, donde se indic cmo correr un diseo factorial general en bloques. Si hay n rplicas, en
tonces cada conjunto de condiciones no hom ogneas define un bloque, y cada rplica se corre en uno de
los bloques. Las corridas de cada bloque (o rplica) se haran de m anera aleatoria. El anlisis del diseo

Tabla 7-1

Experimento del proceso qumico en tres bloques

Totales de los bloques

Bloque 1
(1) = 28
a = 36
b = 18
ab = 31
B - 113

Bloque 2
(1) = 25
a =32
b = 19
ab 30
B2 = 106

Bloque 3
(1) = 27
a = 32
b = 23
ab = 29
= 111
2 87

288

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2l

Tabla 7-2

Anlisis de varianza del experimento del proceso qumico en tres bloques

Fuente de variacin
Bloques
A (concentracin)
B (catalizador)
AB
Error
Tbtal

Suma de
cuadrados
6.50
208.33
75.00
8.33
24.84
323.00

Grados de
libertad
2
1
1
1
6
11

Cuadrado
medio
3.25
208.33
75.00
8.33
4,14

^0
50.32
18.12
2.01

Valor P
0.0004
0.0053
0.2060

es similar al de cualquier experim ento factorial separado en bloques; por ejemplo, vase la revisin de la
seccin 5-6.

EJEMPLO 7 - 1 ....................................................................................................................................
C onsidere el experim ento del proceso qumico que se describi en la seccin 6-2. Suponga que slo p ue
den hacerse cuatro ensayos experimentales con un solo lote de m ateria prima. Por lo tanto, se necesitarn
tres lotes de m ateria prim a para correr las tres rplicas de este diseo. E n la tabla 7-1 se m uestra el diseo
donde cada lote de m ateria prim a corresponde a un bloque.
E n la tabla 7-2 se m uestra el anlisis de varianza de este diseo separado en bloques. Todas las sumas
de cuadrados se calculan exactam ente igual que en un diseo 2k estndar sin form acin de bloques. La
suma de cuadrados de los bloques se calcula a p artir de los totales de los bloques. Sea que B h B 2y B i re
presenten los totales de los bloques (ver la tabla 7-1). Entonces

(113) +(106) +(111)2


4
= 6.50

(330)
12

Hay dos grados de libertad entre los tres bloques. L a tabla 7-2 indica que las conclusiones de este anlisis,
si el diseo se hubiera corrido en bloques, son idnticas a las de la seccin 6-2 y que el efecto de los blo
ques es relativam ente pequeo.

7-3

CONFUSION DEL DISEO FACTORIAL 2k

Hay muchos problem as en los que es imposible realizar una rplica com pleta de un diseo factorial en un
bloque. La confusin (o mezclado) es una tcnica de diseo m ediante la cual un experim ento factorial
com pleto se distribuye en bloques, donde el tam ao del bloque es m enor que el nm ero de combinacio
nes de los tratam ientos de una rplica. La tcnica hace que la inform acin acerca de ciertos efectos de los
tratam ientos (por lo general las interacciones de orden superior) sea indistinguible de los bloques o est
confundida con los bloques. E n este captulo la atencin se centra en los sistemas de confusin (o mezcla
do) p ara el diseo factorial 2k. Observe que aun cuando los diseos que se presentan son diseos de blo
ques incompletos, ya que cada bloque no contiene todos los tratam ientos o las com binaciones de los
tratam ientos, la estructura especial del sistema factorial 2k perm ite un m todo de anlisis simplificado.
Se considera la construccin y el anlisis del diseo factorial 2k en 2P bloques incompletos, donde
p < k. Por consiguiente, estos diseos pueden correrse en dos bloques, en cuatro bloques, en ocho blo
ques, etctera.

7-4 CONFUSIN DEL DISEO FACTORIAL 2l EN DO S BLOQUES

7-4

289

CONFUSIN DEL DISEO FACTORIAL Zv EN DOS BLOQUES

Suponga que quiere correrse u na sola rplica del diseo 22. C ada una de las 2Z = 4 combinaciones de los
tratam ientos requiere una cantidad de m ateria prim a, p o r ejemplo, y cada lote de m ateria prim a slo al
canza para probar dos com binaciones de tratam ientos. Por lo tanto, se necesitan dos lotes de m ateria pri
ma. Si los lotes de m ateria prim a se consideran com o bloques, entonces deben asignarse a cada bloque
dos de las cuatro com binaciones de tratam ientos.
E n la figura 7-1 se m uestra uno de los diseos posibles para este problem a. L a vista geom trica, figu
ra 7 -la, indica que las combinaciones de tratam ientos localizadas en diagonales opuestas se asignan a blo
ques diferentes. Observe, por la figura 7-1 b, que el bloque 1 contiene las com binaciones de los
tratam ientos (l ) y a b y que el bloque 2 contiene a y b . D esde luego, el orden en que se corren las com bina
ciones de los tratam ientos dentro de un bloque se determ ina aleatoriam ente. Icunbin se decidir aleato
riam ente cul de los bloques se correr prim ero. Suponga que los efectos principales de A y B se estim an
como si no se hubiera hecho la formacin de bloques. Por las ecuaciones 6-1 y 6-2 se obtiene
A = [ a b + a - b - ( l )]
B = \ [ a b + b - a - ( 1)]
Observe que ni A ni B son afectados por la formacin de bloques, debido a que en cada estim acin hay
una combinacin de un tratam iento positivo y uno negativo de cada bloque. Es decir, cualquier diferencia
entre el bloque 1 y el bloque 2 se cancela.
Considere ahora la interaccin A B
AB = \[ a b + (\)-a -b ]
Puesto que las dos combinaciones de tratam ientos con signo positivo [ab y (1)] estn en el bloque 1 y las
dos con signo negativo (a y b) estn en el bloque 2, el efecto de los bloques y la interaccin AB son idnti
cos. Es decir, A B est confundido (o mezclado) con los bloques.
L a razn de esto es evidente en la tabla de signos positivos y negativos del diseo 2Z. Se present origi
nalm ente en la tabla 6-2, pero por conveniencia se repite como la tabla 7-3. A partir de esta tabla se observa
que todas las combinaciones de tratamientos que tienen signo positivo para A B se asignan al bloque 1,

- Corrida en el bloque 1
O - Corrida en el bloque 2

a) Vista geomtrica
Bloque 1

Bloque 2

(1)

a
b

ab

b) Asignacin de las cuatro


corridas en dos bloques
F igura 7-1

D ise o 22 en dos b loq ues.

290

CAPTULO 7

FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2k

Tabla 7-3 Tabla de signos positivos y negativos para el diseo 22


Efecto factorial
Combinacin de
tratamientos
I
A
B
AB
+
+
(1)
a
+
+
b
+
+
ab
+
+
+
+

mientras que todas las combinaciones de tratam ientos que tienen signo negativo paraA B se asignan al
bloque 2. E ste enfoque puede usarse para confundir o mezclar cualquier efecto (A, B o AB) con los blo
ques. P or ejemplo, si (1) y b se hubieran asignado al bloque 1 y a y ab al bloque 2, el efecto principal de A
se habra confundido con los bloques. La prctica usual es confundir la interaccin de orden ms alto con
los bloques.
Este esquem a puede usarse p ara confundir o mezclar cualquier diseo 2k en dos bloques. Como un
segundo ejemplo, considere un diseo 23 que se corre en dos bloques. Suponga que se quiere confundir la
interaccin de los tres factores ABC con los bloques. Por la form acin de signos positivos y negativos de la
tabla 7-4, las com binaciones de tratam ientos que son negativas para A B C se asignan al bloque 1 y las que
son positivas p araA B C al bloque 2. El diseo resultante se m uestra en la figura 7-2. D e nueva cuenta se
resalta que las com binaciones de tratam ientos dentro de un bloque se corren de m anera aleatoria.
Otros mtodos para construir bloques
Se cuenta con otro m todo para construir estos diseos. El m todo utiliza la combinacin lineal
L = a 1x 1+ a 2x 2 + ...+ a kx k

(7-1)

donde*, es el nivel del factor i-simo que aparece en una com binacin de tratam ientos particular y a es el
exponente que aparece en el factor i-simo p ara el efecto que va a confundirse. Para el sistem a 2k, se tiene
, = 0 0 1 yx ~ 0 (nivel bajo) ox = 1 (nivel alto). A la ecuacin 7-1 se le llam a la definicin de contrastes.
Las combinaciones de tratam ientos que producen el mismo valor de L (mod 2) se colocarn en el mismo
bloque. Puesto que los nicos valores posibles d e L (m od 2) son Oy 1, con esto las 2k com binaciones de tra
tam ientos se asignarn a exactam ente dos bloques.

Tabla 7-4 Tabla de signos positivos y negativos para el diseo 23


Combinacin de
Efecto factorial
tratamientos__________ I
A
B AB
(1)
a
b
ab

+
+
+
+

_
+
+

+
++

ac
be
abe

AC

ABC

+
+

+
+

+
+
+

BC

+
+
-

+
+

7-4 CONFUSIN DEL DISEO FACTORIAL Z EN DOS BLOQUES

291

= Corrida en e! bloque 1
O = Corrida en el bloque 2

Bloque 1

Bloque 2

(1 )

ab

b
c
abe

ac
be

b) Asignacin de las ocho


corridas an dos bloques

Figura 7-2
dido.

El diseo 23en dos bloques conA BC confun

Para ilustrar este enfoque, considere un diseo 23 con A B C confundido con los bloques. E n este caso,
x 1corresponde &A,x2a B ,x 3 a C y a 1 = a 2 = a$ = 1. Por lo tanto, la definicin del contraste correspondien
te a A B C es
L = x 1+ x 2 + * 3
L a com binacin de tratam ientos (1) se escribe 000 en la notacin (0, 1); por lo tanto,
L = 1(0)+ 1(0)+ 1(0) = 0 = 0 (m od 2)
D e m anera similar, la com binacin de tratam ientos a es 100, obtenindose
L = l ( l ) + l ( 0 ) + l ( 0 ) = l = l (m o d 2 )
Por lo tanto, (1) y a se correran en bloques diferentes. Para el resto de las com binaciones de tratam ientos
se tiene
b: L = 1 (0 )+ 1 (1 )+ 1 (0 )= 1 = 1 (m od 2)
ab\ L = 1 (1)+ 1(1)+ 1(0)= 2 = 0 (m od 2)
c: L = 1(0)+ 1(0)+ 1(1) = 1 = 1 (m od 2)
ac: L = 1 (1 )+ 1 (0 )+ 1 (1 )= 2 = 0 (m od 2)
be: L = 1 (0 )+ 1 (1 )+ 1 (1 )= 2 = 0 (m od 2)
abc:

L 1(1)+ 1(1)+ 1(1)= 3 = 1 (m od 2)

Por lo tanto, (1), ab, ac y be se corren en el bloque 1 y a, b, c y abe se corren en el bloque 2. Se trata del mis
mo diseo que se ilustr en la figura 7-2, el cual se gener con la tabla de signos positivos y negativos.
Puede usarse otro m todo para construir estos diseos. Al bloque que contiene la com binacin de
tratam ientos (1) se le llam a el bloque principal. Las com binaciones de los tratam ientos incluidas en este
bloque poseen una til propiedad de la teora de grupos; a saber, form an un grupo con respecto a la multi-

292

CAPTULO 7

FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL l k

plicacin m dulo 2. Esto implica que cualquier elem ento [con excepcin de (1)] del bloque principal pue
de generarse multiplicando otros dos elem entos del bloque principal m dulo 2. Por ejemplo, considere el
bloque principal del diseo 23 con A B C confundido, como se m uestra en la figura 7-2. Observe que
ab-ac = a 2bc = be
ab-bc = ab2c = ac
a c'b c = abe1 = ab
Las combinaciones de tratam ientos del otro bloque (o bloques) pueden generarse m ultiplicando uno de
los elem entos del nuevo bloque por cada uno de los elem entos del bloque principal m dulo 2. Para el di
seo 23 con A B C confundido, puesto que el bloque principal es (1), ab, ac y be, se sabe que b est en el otro
bloque. Por lo tanto, los elem entos de este segundo bloque son
b -( 1)

=b

b -a b = ab2 = a
b-ac

= abe

b-b c= b 2c = c
Estos resultados concuerdan con los que se obtuvieron anteriorm ente.
Estimacin del error
Cuando el nm ero de variables es pequeo, por ejem plo k = 2 o 3, por lo general es necesario hacer rpli
cas del experim ento a fin de obtener una estimacin del error. Por ejemplo, suponga que un diseo facto
rial 23 debe correrse en dos bloques con A B C confundido, y el experim entador decide hacer cuatro
rplicas del diseo. El diseo resultante podra verse como el de la figura 7-3. Observe qu&ABC est con
fundido en cada rplica.
E n la tabla 7-5 se m uestra el anlisis de varianza de este diseo. Hay 32 observaciones y 31 grados de
libertad. Adems, puesto que hay ocho bloques, siete grados de libertad deben asociarse con estos blo
ques. E n la tabla 7-5 se presenta la descomposicin de esos siete grados de libertad. La sum a de cuadra
dos del erro r se com pone en realidad de las interacciones de dos factores entre las rplicas, y cada uno de
los efectos (A, B, C, A B, AC , BC ). Por lo general es seguro considerar que las interacciones son cero y tra
tar el cuadrado m edio resultante como una estim acin del error. Los efectos principales y las interaccio
nes de dos factores se prueban contra el cuadrado m edio del error. Cochran y Cox [25b] hacen notar que
el cuadrado medio del bloque o A B C podra com pararse con el error del cuadrado m edio A B C , que es en
realidad rplicas x bloques. E sta prueba suele tener una sensibilidad muy baja.
Si se cuenta con recursos suficientes para hacer rplicas de un diseo confundido, por lo general es
m ejor usar un m todo ligeram ente diferente para disear los bloques en cada rplica. E ste enfoque con
siste en confundir un efecto diferente en cada rplica para obtener cierta inform acin sobre todos los
Rplica I
Bloque 1

ni

ac
ab
be

Figura 7-3

Rplica II

Rplica t i l

Rplica IV

Bloque 2

Bloque 1

Bloque 2

Bloque 1

Bloque 2

Bloque 1

Bloque 2

abe
a

(1)

abe

(1 )

ac

ab
be

a
b
c

ac

b
c

abe
a
b

(1)

ac

abe
a
b
c

ab
be

Cuatro rplicas del d ise o 23 con A B C confundido.

ab
be

7-4 CONFUSIN DEL DISEO FACTORIAL 2 EN DOS BLOQUES

Tabla 7-5

293

Anlisis de varianza de cuatro rplicas de un


diseo T? con ABC confundido

Fuente de variacin

Grados de
libertad

Rplicas
Bloques (ABC)
Error de ABC (rplicas x bloques)
A
B
C
AB
AC
BC
Error (o rplicas x efectos)
Total

3
1
3
1
1
1
1
1
1
18
31

efectos. A este procedim iento se le llama confusin (o mezclado) parcial, y se estudia en la seccin 7-7. Si
k es m oderadam ente grande, por ejemplo k > 4, con frecuencia slo es posible hacer una rplica. El expe
rim entador suele suponer que las interacciones de rdenes superiores son insignificantes y combina sus
sumas de cuadrados como el error. La grfica de probabilidad norm al de los efectos de los factores puede
ser muy til a este respecto.

EJEMPLO 7 - 2 ....................................................................................................................................
Considere la situacin descrita en el ejemplo 6-2. R ecuerde que se estudian cuatro factoresla tem pera
tu ra {A), la presin (B ), la concentracin de form aldehdo (C) y la velocidad de agitacin (D) en una
planta piloto para determ inar su efecto sobre el ndice de filtracin del producto. Se usar este experi
m ento para ilustrar las ideas de la formacin de bloques y la confusin en un diseo no replicado. Se in
troducirn dos modificaciones al experim ento original. Prim era, suponga que no es posible correr las
24 = 16 combinaciones de tratam ientos utilizando un solo lote de m ateria prima. El experim entador
puede correr ocho com binaciones de los tratam ientos con un solo lote de m aterial, por lo que un diseo
24 confundido en dos bloques parece apropiado. Es lgico confundir la interaccin de orden ms alto
A B C D con los bloques. L a definicin del contraste es
L = x 1 + x 2 -t-Xj + x 4
y es sencillo verificar que el diseo es como el que se ilustra en la figura 7-4. D e m anera alternativa, puede
examinarse la tabla 6-12 y observar que las combinaciones de los tratam ientos que son + en la columna
A B C D se asignan al bloque 1 y que las que son - en la colum na A B C D , estn en el bloque 2.
La segunda modificacin que se har es introducir un efecto de los bloques p ara que pueda dem os
trarse la utilidad de la form acin de bloques. Suponga que cuando se seleccionan los dos lotes de m ateria
prim a que se necesitan para correr el experimento, uno de ellos es de calidad mucho ms baja y, como re
sultado, todas las respuestas sern 20 unidades m enores en este lote de m aterial que en el otro. El lote de
calidad m enor se convierte en el bloque 1 y el lote de buena calidad se convierte en el bloque 2 (no es rele
vante a cul de los dos lotes se le llam a bloque 1 o bloque 2). Entonces todas las pruebas del bloque 1 se
realizan prim ero (las ocho corridas del bloque se hacen, desde luego, de m anera aleatoria), pero las res
puestas son 20 unidades ms bajas que las que se habran obtenido si se hubiera usado el m aterial de bue
n a calidad. En la figura 7-4b se m uestran las respuestas resultantes; observe que stas se han encontrado

294

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2k


D

A
a ) Vista geomtrica
Bloque 1

Bloque 2

(1) = 2 5

0-71

ab = 4 5

6-48

ac=-40

c - 68

6c - 6 0

d - 43

ad - 80
bd ~ 2 5
cd - 55
abed - 7 6

abc = 6 5
bed = 7 0
acd = 8 6
abd - 1 0 4

b) Asignacin de las 16 corridas


en los dos bloques

Figura 7-4 El diseo 24 en dos bloques para el ejemplo 7-2.

restando el efecto del bloque de las observaciones originales dadas en el ejem plo 6-2. Es decir, la respues
ta original de la com binacin de tratam ientos (1) fue 45, y en la figura 7-46 se consigna como (1) = 25 (=
45 - 20). Las dem s respuestas de este bloque se obtienen de m anera similar. Despus de que se realizan
las pruebas del bloque 1, se prosigue con las ocho pruebas del bloque 2. No hay ningn problem a con la
m ateria prim a de este lote, p o r lo que las respuestas son exactam ente como fueron originalmente en el
ejemplo 6-2.
E n la tabla 7-6 se m uestran las estim aciones de los efectos p ara esta versin m odificada del ejemplo
6-2. Observe que las estim aciones de los cuatro efectos principales, de las seis interacciones de dos facto
res y de las cuatro interacciones de tres factores son idnticas a las estim aciones de los efectos obtenidas
en el ejemplo 6-2, donde no hubo ningn efecto de bloques. Cuando se construye u n a grfica de probabili
dad norm al de estas estimaciones de los efectos, los factores A, C ,D y las interacciones A C y A D aparecen
como los efectos im portantes, justo como en el experim ento original. (El lector deber verificar esto.)
Q u puede decirse del efecto de la interaccin ABCD '! L a estim acin de este efecto en el experi
m ento original (ejemplo 6-2) fue A B C D = 1.375. E n el presente ejemplo, la estim acin del efecto de la in
teraccin A B C D es A B C D = -18.625. Puesto que A B C D est confundido con los bloques, la interaccin
A B C D estim a el efecto de la interaccin original (1.375) ms el efecto de bloque (-20), de donde A B C D =
1.375 + (-20) = -18.625. (Puede el lector ver por qu el efecto del bloque es -20?) E l efecto del bloque

7-4 CONFUSIN DEL DISEO FACTORIAL 2 EN DOS BLOQUES

295

Tabla 7-6 Estimaciones de los efectos para el diseo 24separado en bloques del
__________ejemplo 7-2

Trmino del
modelo
A
B
C
D
AB
AC
AD
BC
BD
CD
ABC
ABD
ACD
BCD
Bloques (ABCD)

Coeficiente
de regresin
10.81
1.56
4.94
7.31
0.062
-9.06
8.31
1.19
-0.19
-0.56
0.94
2.06
-0.81
-1.31

Estimacin
del efecto
21.625
3.125
9.875
14.625
0.125
-18.125
16.625
2.375
-0.375
-1.125
1.875
4.125
-1.625
-2.625
-18.625

Suma de
cuadrados
1870.5625
39.0625
390.0625
855.5625
0.0625
1314.0625
1105.5625
22.5625
0.5625
5.0625
14.0625
68.0625
10.5625
27.5625
1387.5625

Contribucin
porcentual
26.30
0.55
5.49
12.03
<0.01
18.48
15.55
0.32
<0.01
0.07
0.20
0.96
0.15
0.39
19.51

tam bin puede calcularse directam ente como la diferencia en la respuesta prom edio entre los dos blo
ques, o
Efecto del bloque = yuaqti l - yBloque 2
406 555
~

-1 4 9

8
= -18.625

D esde luego, este efecto es en realidad la estimacin de Bloques + ABC D .


E n la tabla 7-7 se resum e el anlisis de varianza de este experim ento. Los efectos que tienen estim a
ciones grandes estn incluidos en el modelo, y la sum a de cuadrados de los bloques es
_ (406)2 +(555)2
Bloques ~

labia 7-7 Anlisis de varianza del ejemplo 7-2


Fuente de
Suma de
variacin
cuadrados
Bloques (ABCD)
1387.5625
A
1870.5625
C
390.0625
D
855.5625
AC
1314.0625
AD
1105.5625
Error
187.5625
Tbtal
7111,4375

Grados de
libertad
1
1
1
1
1
1
9
15

(961)2
- L - 7 ?- = 1387.5625
16

Cuadrado
medio
1870.5625
390.0625
855.5625
1314.0625
1105.5625
20.8403

*0

Valor P

89.76
18.72
41.05
63.05
53.05

<0.0001
0.0019
0.0001
<0.0001
<0.0001

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2l

296

Las conclusiones de este experim ento coinciden exactam ente con las del ejem plo 6-2, donde no estuvo
presente ningn efecto de bloques. Observe que si el experim ento no se hubiera corrido en bloques, y si
un efecto de m agnitud -2 0 hubiera afectado los 8 prim eros ensayos (los cuales se habran seleccionado de
m anera aleatoria, ya que los 16 ensayos se habran corrido en orden aleatorio en un diseo sin formacin
de bloques), los resultados pudieron haber sido muy diferentes.

7-5

CONFUSIN DEL DISEO FACTORIAL 2* EN CUATRO BLOQUES

Es posible construir diseos factoriales 2k confundidos en cuatro bloques con 2k ~2 observaciones cada
uno. Estos diseos son particularm ente tiles en situaciones en las que el nm ero de factores es m odera
dam ente grande, por ejemplo k > 4, y el tam ao de los bloques es relativam ente pequeo.
Como un ejemplo, considere el diseo 23, Si cada bloque incluir nicam ente ocho corridas, entonces
debern usarse cuatro bloques. La construccin de este diseo es relativam ente directa. Se seleccionan
dos efectos para confundirlos con los bloques, por ejemplo A D E y BCE. Estos efectos tienen las dos defi
niciones de contrastes
Ll = x + x il+ x 5
-^ 2 =

X 2

" ^ 3

~^~X 5

asociadas con ellos. Entonces cada combinacin de tratam ientos producir un par particular de valores
d e L j (mod 2) y L 2 (m od 2), es decir, cualquiera de (L i, L 2) = (0,0), (0,1), (1,0) o bien (1,1). Las com bina
ciones de tratam ientos que producen los mismos valores de (L 1; L 2) se asignan al mismo bloque. En el
ejemplo tratado aqu se encuentra
L, = 0, L 2 = 0

para

(1), ad, bc, abcd, abe, ace,'cde, bde

Lj = 1, L2 = 0

para

a, d, abe, bed, be, abde, ce, acde

= 0, L 2 = 1

para

b, abd, c, acd, ae, de, abce, bcde

i = 1, L 2 = l

para

e, ade, bce, abede, ab, bd, ac, cd

Estas combinaciones de tratam ientos se asignaran a bloques diferentes. En la figura 7-5 se m uestra el di
seo completo.
Con un poco de reflexin, nos damos cuenta de que otro efecto adems de A D E y B C E debe confun
dirse con los bloques. Puesto que hay cuatro bloques con tres grados de libertad entre ellos, y puesto que
A D E y B C E tienen un solo grado de libertad cada una, es evidente la necesidad de confundir un efecto
adicional con un grado de libertad. Este efecto es la interaccin generalizada de A D E y BC E, la cual se

Bloque 1

Bloque 2

Bloque 3

Bloque 4

,= 0

L, = 1

,= 0

, = 1

2= 0

j - 0

l2= i

2-

(1 )

abe

ad ace
bc cde
abcd bde

a
d
abe
bed

be
abde
ce
acde

b abce
abd ae
bcde
c
acd de

e abede
ade bd
bce ac
ab cd

Figura 7-5 El diseo 25 en cuatro bloques con ADE,


BCE y ABCD confundidos.

7-6 CONFUSIN DEL DISEO FACTORIAL 2l EN 2* BLOQUES

297

define como el producto z A D E y BC E mdulo 2. P or lo tanto, en el ejemplo tratado aqu la interaccin


generalizada (A D E)(BC E ) = A B C D E 2 = A B C D tam bin est confundido con los bloques. Es sencillo ve
rificar esto refirindose a la tabla de signos positivos y negativos del diseo 25, como en Davies [36]. La
inspeccin de esta tabla revela que las combinaciones de los tratam ientos se asignan a los bloques de la si
guiente m anera:
Combinaciones de los
tratamientos en el
Bloque 1
Bloque 2
Bloque 3
Bloque 4

Signo zADE

Signo de BCE

+
+

+
+

Signo de ABCD
+
-

Observe que el producto de los signos de dos efectos cualesquiera de un bloque particular (por ejemplo
A D E y BC E ) produce el signo del otro efecto de ese bloque (en este caso, ABCD). Por lo tanto, ADE,
B C E y A B C D estn confundidos con los bloques.
Las propiedades de la teora de grupos del bloque principal m encionadas en la seccin 7-4 siguen
siendo vlidas. Por ejemplo, se observa que el producto de dos com binaciones de tratam ientos del bloque
principal produce otro elem ento del bloque principal. Es decir,
ad-bc = abcd

ab ebde = a b 2d e 2 = ad

etctera. Para construir otro bloque se selecciona una com binacin de tratam ientos que no est en el blo
que principal (por ejemplo b), y se m ultiplica p or todas las com binaciones de tratam ientos del bloque
principal. Se obtiene as
b -( l) = b

b -a d = abd

b-bc = b 2c = c

b abcd = a b 2cd = acd

etctera, lo que producir las ocho combinaciones de tratam ientos del bloque 3. E n la prctica, el bloque
principal puede obtenerse a partir de la definicin de contrastes y de la propiedad de la teora de grupos, y
los dems bloques pueden determ inarse a partir de estas com binaciones de los tratam ientos aplicando el
m todo que se present anteriorm ente.
E l procedim iento general para construir un diseo 2k confundido en cuatro bloques consiste en elegir
dos efectos para generar los bloques, confundindose autom ticam ente un tercer efecto que es la interac
cin generalizada de las dos prim eras. Despus se construye el diseo utilizando las dos definiciones de
contrastes (L ls L 2) y las propiedades de la teora de grupos del bloque principal. Al seleccionar los efectos
que van a confundirse con los bloques, debe tenerse cuidado de obtener un diseo en el que no estn con
fundidos efectos que pueden ser de inters. Por ejemplo, en un diseo 25 podra elegirse confundir
A B C D E y A B D , con lo cual se confunde autom ticam ente CE, un efecto que es de posible inters. U na
m ejor eleccin es confundir A D E y BC E, con lo cual se confunde autom ticam ente ABCD. Es preferible
sacrificar informacin en las interacciones de tres factores A D E y B C E en lugar de la interaccin de dos
factores CE.

7-6

CONFUSIN DEL DISEO FACTORIAL 2k EN 2" BLOQUES

Los m todos descritos antes pueden extenderse a la construccin de un diseo factorial 2k confundido (o
m ezclado) en 2Pbloques (p < k), donde cada bloque contiene exactam ente 2k~p corridas. Se seleccionan p
efectos independientes que van a confundirse, donde por independientes se entiende que ninguno de
los efectos elegidos es la interaccin generalizada de los dems. Los bloques pueden generarse m ediante

Tabla 7-8

Nmero de
factores, k
3
4

Disposiciones de los bloques sugeridas para el diseo factorial 2k

Nmero de
bloques, 1?
2
4
2
4
8
2
4
8
16
2
4
8
16

Tamao del
bloque, 2k~p
4
2
8
4
2
16
8
4
2
32
16
8
4

Efectos elegidos para


generar los bloques

32
2
4
8
16

2
64
32
16
8

AB, BC, CD, DE, EF


ABCDEFG
ABCFG, CDEFG
ABC, DEF, AFG
ABCD, EFG, CDE, ADG

32

ABG, BCG, CDG, DEG, EFG

64

AB, BC, CD, DE, EF, FG

ABC
AB,AC
ABCD
ABC, ACD
AB, BC, CD
ABCDE
ABC, CDE
ABE, BCE, CDE
AB, AC, CD, DE
ABCDEF
ABCF, CDEF
ABEF, ABCD, ACE
ABF, ACF, BDF, DEF

Interacciones confundidas con los bloques


ABC
AB, AC, BC
ABCD
ABC, ACD, BD
AB, BC, CD, AC, BD, AD, ABCD
ABCDE
ABC, CDE, ABDE
ABE, BCE, CDE, AC, ABCD, BD, ADE
Todas las interacciones de dos y cuatro factores (15 efectos)
ABCDEF
ABCF, CDEF, ABDE
ABEF, ABCD, ACE, BCF, BDE, CDEF, ADF
ABE, ACF, BDF, DEF, BC, ABCD, ABDE, AD, ACDE, CE, BDF,
BCDEF, ABCEF, AEF, BE
Todas las interacciones de dos, cuatro y seis factores (31 efectos)
ABCDEFG
ABCFG, CDEFG, ABDE
ABC, DEF, AFG, ABCDEF, BCFG, ADEG, BCDEG
ABCD, EFG, CDE, ADG, ABCDEFG, ABE, BCG, CDFG, ADEF,
ACEG, ABFG, BCEF, BDEG, ACF, BDF
ABG, BCG, CDG, DEG, EFG, AC, BD, CE, DF, AE, BE, ABCD,
ABDE, ABEF, BCDE, BCEF, CDEF, ABCDEFG, ADG, ACDEG,
ACEFG, ABDFG, ABCEG, BEG, BDEFG, CFG, ADEF, ACDF,
ABCF, AFG
Todas las interacciones de dos, cuatro y seis factores (63 efectos)

7-7 CONFUSIN PARCIAL

299

el uso de lasp definiciones de contrastes L u L 2, ...,L p asociadas con estos efectos. Asimismo, se confundi
rn otros 2P- p - l efectos con los bloques, siendo stos las interacciones generalizadas de los p efectos in
dependientes elegidos inicialmente. D eber tenerse cuidado al seleccionar los efectos que van a
confundirse para que no se sacrifique inform acin sobre los efectos que pueden ser de inters potencial.
El anlisis estadstico de estos diseos es directo. Las sumas de cuadrados de todos los efectos se
calculan com o si no se hubiera hecho la formacin de bloques. Despus, la sum a de cuadrados de los blo
ques se encuentra sum ando las sumas de cuadrados de todos los efectos confundidos con los bloques.
Obviamente, la eleccin de losp efectos usados para generar el bloque es crtica, ya que la estructura
de la confusin (o m ezclado) del diseo depende directam ente de ellos. En la tabla 7-8 se presenta una
lista de diseos tiles. P ara ilustrar el uso de esta tabla, suponga que quiere construirse un diseo 26 con
fundido en 23 = 8 bloques con 23 = 8 corridas cada uno. L a tabla 7-8 indica que se elegiran AB E F ,A B C D
y A C E como los/ = 3 efectos independientes para generar los bloques. Los 2p- p - l = 2i - 3 - 1 = 4 efec
tos restantes que estn confundidos son las interacciones generalizadas de estos tres; es decir,
(A B E F )(A B C D ) = A 2B 2CDEF = CDEF
(A B E F )(A C E ) = A 1B C E 2F = BCF
( A B C D )(A C E ) = A 2B C 2E D = BD E
(A B E F )(A B C D )(A C E ) = A 3B 2C 2D E 2F = A D F
E n el problem a 7-11 se le pide al lector que genere los ocho bloques de este diseo.

7-7

CONFUSIN PARCIAL

E n la seccin 7-4 se subray que, a m enos que los experim entadores cuenten con una estim acin previa
del erro r o que estn dispuestos a suponer que ciertas interacciones son insignificantes, deben hacer r
plicas del diseo para obtener una estimacin del error. E n la figura 7-3 se m uestra un diseo factorial 23
en dos bloques co n A B C confundido, con cuatro rplicas. Por el anlisis de varianza de este diseo, el cual
se presenta en la tabla 7-5, se observa que no puede sacarse inform acin acerca de la interaccin ABC de
bido a que A B C est confundido con los bloques en todas las rplicas. Se dice que este diseo est comple
tam ente confundido (o mezclado).
Considere la alternativa que se presenta en la figura 7-6. D e nueva cuenta hay cuatro rplicas del di
seo 23, pero en cada rplica se ha confundido una interaccin diferente. Es decir, A BC est confundido en
la rplica I, A B est confundido en la rplica II, B C est confundido en la rplica III y A C est confundido
en la rplica IV. Como resultado puede obtenerse inform acin deA B C a partir de los datos de las rplicas
II, III y IV; inform acin de AB puede obtenerse de las rplicas I, III y IV; inform acin de A C puede obte-

Rplica I

Rplica n

ABC Confundido

AB Confundido

Rplica III

Rplica IV

BC Confundido

AC Confundido

11 )

(1 )

(1 )

ill

ab
ac
bc

b
c
abe

c
ab
abe

b
ac
bc

a
bc
abe

c
ab
ac

b
ae

F igura 7-6

C onfusin parcial e n el d ise o 23.

abe

a
c
ab
bc

300

CAPITULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2k


Tabla 7-9

Anlisis de varianza de un diseo 23 parcialmente confundido

Grados de
libertad
3

Fuente de variacin
Rplicas
Bloques dentro de rplicas [o ABC (rp. I) + AB (rp. II)
+ BC (rp. III) + AC (rp. IV)]
A
B
C
AB (de las rplicas I, III y IV)
AC (de las rplicas I, II y III)
BC (de las rplicas I, II y IV)
ABC (de las rplicas I, III y IV)
Error
Tbtal

31

nerse de las rplicas I, II y III; e inform acin de B C puede obtenerse de las rplicas I, II y IV. Se dice que
pueden obtenerse tres cuartas partes de la inform acin de las interacciones porque no estn confundidas
en slo tres rplicas. Y ates [113b] llam a a la relacin 3/4 la inform acin relativa de los efectos confundi
dos. Se dice que este diseo est parcialm ente confundido (o mezclado).
E n la tabla 7-9 se m uestra el anlisis de varianza de este diseo. Para calcular las sumas de cuadrados
de las interacciones, slo se usan los datos de las rplicas en las que no est confundida una interaccin.
L a sum a de cuadrados del error consta de las sumas de cuadrados de rplicas x sumas de cuadrados de
efecto principal, ms las sumas de cuadrados de rplicas x sumas de cuadrados de interaccin para cada
rplica en la que esa interaccin no est confundida (por ejemplo, rplicas x A B C para las rplicas II, III
y IV). Adems, hay siete grados de libertad entre los ocho bloques. Es com n hacer la particin de tres
grados de libertad para las rplicas y cuatro grados de libertad para los bloques dentro de las rplicas. La
composicin de la sum a de cuadrados de los bloques se m uestra en la tabla 7-9 y se sigue directam ente de
la eleccin del efecto confundido en cada rplica.

EJEMPLO 7 - 3 ................................................................................................................................
Un diseo 23 con confusin parcial
C onsidere el ejem plo 6-1, en el que se realiz un estudio para determ inar el efecto del porcentaje de car
bonatacin (A), la presin de operacin (B) y la velocidad de lnea (C) sobre la altura de llenado de una
bebida carbonatada. Suponga que cada lote de jarabe alcanza slo para probar cuatro com binaciones de
tratam ientos. Por lo tanto, cada rplica del diseo 23 debe correrse en dos bloques. Se corren dos rplicas,
con A B C confundido en la rplica I y A B confundido en la rplica II. Los datos son los siguientes:

Rplica I
ABC confundido
(1) = - 3
ab ~ 2
ac = 2
be = 1

Rplica II
AB confundido
(1) = - 1
c= 0
ab = 3
abe = 5

a= I
b= 0
ac 1
be = 1

7-8 PROBLEMAS
Tabla 7-10

301

Anlisis de varianza del ejemplo 7-3

Suma de
cuadrados
1.00
2.50
36.00
20.25
12.25
0.50
0.25
1.00
0.50
3.75
78.00

Fuente de
variacin
Rplicas
Bloques dentro de las rplicas
A
B
C
AB (slo en la rplica I)
AC
BC
ABC (slo en la rplica II)
Error
Tbtal

Grados de
libertad
1
2
1
1
1
1
1
1
1
5
15

Cuadrado
medio
1.00
1.25
36.00
20.25
12.25
0.50
0.25
1.00
0.50
0.75
-

F
48.00
27.00
16.33
0.67
0.33
1.33
0.67
-

Valor P

0.0001
0.0035
0.0099
0.4503
0.5905
0.3009
0.4503

Las sumas de cuadrados de A , B, C, A C y B C pueden calcularse de la m anera usual, utilizando las 16


observaciones. Sin embargo, SSABC debe encontrarse utilizando nicam ente los datos de la rplica II y
SSAB utilizando nicam ente los datos de la rplica I de la siguiente m anera:
[ a + b + c + a b c - a b - a c - b c - (

&Sjac ~

l)]2

riP

ri + 0 + 0 + 5 - 3 - l - l - ( - l ) ] 2
( 1) ( 8)
_ [(1)

+ a b c - a c + c - a - b + a b - b c ] 2

n2k
_ [ - 3 + 6 - 2 + (1)0 - ( - l ) + 2 - 1 ] 2 ...

5Q

(1) ( 8)
L a sum a de cuadrados de las rplicas es, en general,
n Jfl
.2
s s

=Y
j

7k
h=1 ^

ir

_ (6)2 +(10)2
8

(16)2
16

donde R h es el total de las observaciones en la rplica /i-sima. L a sum a de cuadrados de los bloques es la
suma de S S ^ c de la rplica I y S S ^ de la rplica II, o SSBlaques = 2.50.
E n la tabla 7-10 se resum e el anlisis de varianza. Los tres efectos principales son im portantes.

7-8
7-1.
7-2,
7-3.

PROBLEMAS

-------------------------------------------------------------------------------------------

Considere el experimento descrito en el problema 6-1. Analizar este experimento suponiendo que cada r
plica representa un bloque de un solo turno de produccin.
Considere el experimento descrito en el problema 6-5. Analizar este experimento suponiendo que cada una
de las cuatro rplicas representa un bloque.
Considere el experimento de la formacin de fisuras en la aleacin de nquel y titanio descrito en el problema
6-15. Suponga que slo pudieron hacerse 16 corridas en un solo da, por lo que cada rplica se trat como un
bloque. Analizar el experimento y sacar conclusiones.

302

7-4.

7-5,
7-6.
7-7.
7-8.
7-9.
7-10.
7-11.

7-12.

CAPTULO 7 FORMACIN DE BLOQUES Y CONFUSIN EN EL DISEO FACTORIAL 2l

Considere los datos de la primera rplica del problema 6-1. Suponga que no fue posible correr todas estas ob
servaciones utilizando barras del mismo lote. Establecer un diseo para correr estas observaciones en dos
bloques de cuatro observaciones cada uno con ABC confundido. Analizar los datos.
Considere los datos de la primera rplica del problema 6-7. Construir un diseo con dos bloques de ocho ob
servaciones cada uno con ABCD confundido. Analizar los datos.
Repetir el problema 7-5 suponiendo que se requieren cuatro bloques. C o n fu n d ir^ /) y ABC (y por consi
guiente CD) con los bloques.
Utilizando los datos del diseo 25 del problema 6-21, construir y analizar un diseo en dos bloques con
ABCDE confundido con los bloques.
Repetir el problema 7-7 suponiendo que se necesitan cuatro bloques. Sugerir un esquema de confusin (o
mezclado) razonable.
Considere los datos del diseo 25del problema 6-21, Suponga que fue necesario correr este diseo en cuatro
bloques con ACDE y BCD (y por consiguiente ABE) confundidos. Analizar los datos de este diseo.
Disear un experimento para confundir un diseo factorial 26en cuatro bloques. Sugerir un esquema de con
fusin apropiado, diferente del que se ilustr en la tabla 7-8.
Considere el diseo 26en ocho bloques con ocho corridas cada uno con ABCD, ACE yABEF como los efec
tos independientes elegidos para confundirlos con los bloques. Generar el diseo. Encontrar los dems efec
tos confundidos con los bloques.
Considere el diseo 22 en dos bloques conAB confundido. Hacer la demostracin algebraica de que S S ^ =
S^BIoques-

7-13.

7-14.
7-15.
7-16.
7-17.

Considere los datos del ejemplo 7-2. Suponga que todas las observaciones del bloque 2 se incrementan en 20,
Analizar los datos que resultaran. Estimar el efecto de bloque. Puede el lector explicar su magnitud? Los
bloques parecen ser ahora un factor importante? Hay otras estimaciones de los efectos que sufran el impac
to de este cambio hecho en los datos?
Suponga que en el problema 6-1 se confundi ABC en la rplica I,AB en la rplica II y BC en la rplica III.
Calcular las estimaciones de los efectos. Construir la tabla del anlisis de varianza.
Repetir el problema 6-1 suponiendo que ABC se confundi con los bloques en todas las rplicas.
Suponga que en el problema 6-7ABCD se confundi en la rplica I y ABC se confundi en la rplica II. Reali
zar el anlisis estadstico de este diseo.
Construir un diseo 23con ABC confundido en las dos primeras rplicas y BC confundido en la tercera rpli
ca. Delinear el anlisis de varianza y comentar la informacin obtenida.

Diseos factoriales
fraccionados de dos niveles

8*1

INTRODUCCIN

Cuando el nm ero de factores de un diseo factorial 2k se increm enta, el nm ero de corridas necesarias
para realizar una rplica com pleta del diseo rebasa con rapidez los recursos de la m ayora de los experi
m entadores. Por ejemplo, una rplica com pleta de un diseo 2requiere 64 corridas. E n este diseo, slo
6 de los 63 grados de libertad corresponden a los efectos principales, y slo 15 a las interacciones de dos
factores. Los 42 grados de libertad restantes se asocian con las interacciones de tres o m s factores.
Si el experim entador puede suponer razonablem ente que ciertas interacciones de orden superior son
insignificantes, es posible obtener inform acin de los efectos principales y las interacciones de orden infe
rior corriendo nicam ente una fraccin del experim ento factorial completo. Estos diseos factoriales
fraccionados se encuentran entre los tipos de diseos de uso ms generalizado en el diseo de productos y
procesos y en el m ejoram iento de procesos.
U n a de las principales aplicaciones de los diseos factoriales fraccionados es en los experim entos de
tam izado o exploracin. Se trata de experim entos en los que se consideran muchos factores y el objetivo
es identificar aquellos factores (en caso de haberlos) que tienen efectos grandes. Los experim entos de ta
mizado suelen realizarse en las etapas iniciales de un proyecto, cuando es posible que m uchos de los fac
tores considerados en un principio tengan un efecto reducido o nulo sobre la respuesta. Entonces los
factores que se identifican como importantes se investigan con mayor detalle en experimentos subsecuentes.
E l uso exitoso de los diseos factoriales fraccionados se basa en tres ideas clave:
1. E l principio de efectos esparcidos o escasez de afectos. C uando hay varias variables, es posible que el
sistem a o proceso est dom inado principalm ente p o r algunos de los efectos principales y las in
teracciones de orden inferior.
2. t a propiedad de proyeccin. Los diseos factoriales fraccionados pueden proyectarse en diseos
ms fuertes (ms grandes) en el subconjunto de los factores significativos.
3. Experimentacin secuencial. Es posible com binar las corridas de dos (o m s) diseos factoriales
fraccionados para ensam blar secuencialm ente un diseo ms grande p ara estim ar los efectos de
los factores y las interacciones de inters.
303

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

304

E ste captulo se enfoca en estos principios, los cuales se ilustran con varios ejemplos.

8-2

LA FRACCIN UN MEDIO DEL DISEO 2k

Considere u na situacin en la que tres factores, cada uno con dos niveles, son de inters, pero los experi
m entadores no estn en posicin de correr las 23 8 com binaciones de tratam ientos. Sin embargo, pue
den llevar a cabo cuatro corridas. Esto sugiere una fraccin un m edio de un diseo 23. Puesto que el
diseo contiene 2 ^ = 4 combinaciones de tratam ientos, es com n llam ar diseo 23~1 a una fraccin un
m edio del diseo 23.
E n la tabla 8-1 se m uestra la agrupacin de signos positivos y negativos del diseo 23. Suponga que se
seleccionan las cuatro com binaciones de tratam ientos a, b ,c y abe como la fraccin un m edio con la que se
trabajar. Estas corridas se m uestran en la parte superior de la tabla 8-1 y en la figura 8-la.
Observe que el diseo 23-1 se form a seleccionando slo las combinaciones de tratam ientos que tienen
signo positivo en la columna^4C. Por lo tanto, n A B C se le llam a el generador de esta fraccin particular.
E n ocasiones se har referencia a un generador, por ejemplo A B C , como una palabra. Adems, la colum
n a identidad I tam bin es siem pre positiva, por lo que a
/ = ABC
se le llam a la relacin de definicin del diseo. E n general, la relacin de definicin de un diseo factorial
fraccionado ser siem pre el conjunto de todas las columnas que son iguales a la colum na identidad I.
Las com binaciones de tratam ientos del diseo 23' 1producen tres grados de libertad que pueden usar
se p ara estim ar los efectos principales. Con referencia a la tabla 8-1, se observa que las combinaciones li
neales de las observaciones usadas para estim ar los efectos principales de A , B y C son
l A = j ( a b c + abc)
B = j ( - a + b - c + a b c )
lc

% (-a -b + c + a b c )

Tkmbin es sencillo verificar que las combinaciones lineales de las observaciones usadas para estim ar las
interacciones de dos factores son
l-B C ~

ac

a ~ b -

c + abc)

~ j ( a + b c+ abc)

A B - z ( - a ~ b + C+ abC)

Tabla 8-1

Signos positivos y negativos del diseo factorial V

Combinacin de
tratamientos
a
b
c
abe
ab
ac
bc

(i)

/
+
+
+
+
+
+
+
+

Efecto factorial
C
AB

AC

BC

ABC

+
+
+
+

+
+
+

+
+

+
+
-

+
+

+
+
-

+
+

8-2 LA FRACCIN UN MEDIO DEL DISEO 2k

305

abc

a) La fraccin principal, I - +ABC

'U 1

be

(1)
6) La fraccin alterna, I - -ABC

Figura 8-1 Las dos fracciones un medio del di


seo 23.

Por lo tanto, lA = tBC, lB= tACy t c =


por consiguiente, es imposible diferenciar entre A y BC , entre B y
A C y entre C y AB. D e hecho, cuando se e s tim a n t, B y C, se estn estim ando en realidad A + BC , B + A C
y C + A B . A dos o ms efectos que tienen esta propiedad se les llam a alias. E n el ejem plo tratado aqu, A y
B C son alias, B y A C son alias y C y A B son alias. Esto se indica con la notacin i -* A + BC, iB -* B + A C y
t c -* C + A B .
L a estructura de los alias p ara este diseo puede determ inarse con facilidad utilizando la relacin de
definicin / = A B C . Al m ultiplicar cualquier columna (o efecto) por la relacin de definicin se obtienen
los alias de esa colum na (o efecto). E n el ejemplo tratado aqu se encuentra que el alias de A es
A I = A A B C = A 2BC
o, puesto que el cuadrado de cualquier columna es la identidad I,
A = BC
D e m anera similar, se encuentra que los alias de B y C son
B -I= B- ABC
B ~ A B 2C = A C
y
C - I = C -A B C
C = ABC 2 - AB
A esta fraccin un medio, con / = +ABC, suele llam rsele la fraccin principal.
Suponga ahora que se eligi la otra fraccin un m edio, es decir, las combinaciones de tratam ientos de
la tabla 8-1 asociadas con los signos negativos de la colum naABC. E sta fraccin un m edio a ltern a o com

306

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

plem entaria (la cual se com pone de las corridas (1), ab, ac y be) se ilustra en la figura &-lb. La relacin de
definicin de este diseo es
I= -A B C
D e la combinacin lineal de las observaciones, p o r ejemplo 'A, i 'By 'c, de la fraccin alterna se obtiene
t'A * > A - B C
f B * B - A C
t'c -* C - A B
P or lo tanto, cuando se estim an A , B y C con esta fraccin particular, en realidad se estn estim ando
A -B C , B -A C y C -AB.
E n la prctica, no im porta cul de las fracciones se usa. Am bas fracciones pertenecen a la misma fa
milia; es decir, las dos fracciones un medio form an un diseo 23 completo. Esto puede observarse con fa
cilidad con referencia a los incisos a y b de la figura 8-1.
Suponga que despus de correr una de las fracciones un m edio del diseo 23, tam bin se corri la
otra. Por lo tanto, se cuenta ahora con las ocho corridas asociadas con el diseo 23 completo. Pueden ob
tenerse entonces las estim aciones sin alias de todos los efectos analizando las ocho corridas como un dise
o 23 com pleto en dos bloques de cuatro corridas cada uno. Esto tam bin podra hacerse sum ando y
restando la com binacin lineal de los efectos de las dos fracciones individuales. Por ejemplo, considere
tA -* A + B C y i a -* A - BC. Esto implica que
W A + t' ) = ( A + B C + A - B C ) - A
y que
H * a - t'A ) = H A + B C - A + B C ) ^ B C
Por lo tanto, p ara los tres pares de combinaciones lineales se obtendra lo siguiente:
i
A
B
C

De *(/, + *',)
A
B
C

D e * ( / ,- / ',)
BC
AC
AB

Resolucin del diseo


Al diseo 23-1 precedente se le llam a diseo de resolucin III. E n este diseo, los efectos principales son
alias de las interacciones de dos factores. U n diseo es de resolucin R cuando ningn efecto del factorp
es alias de otro efecto que contiene m enos de R - p factores. Por lo general se em plea un subndice con un
num eral rom ano para denotar la resolucin del diseo; por lo tanto, la fraccin un m edio del diseo 23
con la relacin de definicin I = A B C (o I = -A B C ) es un diseo 2 3,71.
Los diseos de resolucin III, IV y V son particularm ente im portantes. A continuacin se presentan
las definiciones de estos diseos y un ejemplo de cada uno:
1. Diseos de resolucin III. Se trata de diseos en los que ninguno de los efectos principales es alias
de ningn otro efecto principal, pero los efectos principales son alias de las interacciones de dos
factores, y algunas de las interacciones de dos factores pueden ser alias entre s. El diseo 23' 1de
la tabla 8-1 es un diseo de resolucin III (2^*).
2. Diseos de resolucin IV. Se trata de diseos en los que ninguno de los efectos principales es alias
de ningn otro efecto principal ni de las interacciones de dos factores, pero las interacciones de

8'Z LA FRACCIN UN MEDIO DEL DISEO 2l

307

dos factores son alias en tre s. U n diseo 24"1 con I = A B C D es un diseo de resolucin IV
(2 ^ )3. Diseos de resolucin V. Se trata de diseos en los que ninguno de los efectos principales ni de las
interacciones de dos factores son alias de otro efecto principal o interaccin de dos factores, pero
las interacciones de dos factores son alias de las interacciones de tres factores. U n diseo 25"1con
I = A B C D E es un diseo de resolucin V (2y_I).
En general, la resolucin de un diseo factorial fraccionado de dos niveles es igual al m enor nm ero
de letras en cualquier palabra de la relacin de definicin. Por consiguiente, los diseos precedentes po
dran denom inarse diseos de tres, cuatro y cinco letras, respectivam ente. Por lo comn, es preferible em
plear diseos fraccionados que tengan la resolucin ms alta posible que sea consistente con el grado de
fraccionam iento requerido. E ntre ms alta sea la resolucin, m enos restrictivos sern los supuestos que
se requieren respecto de cules de las interacciones son insignificantes para obtener una interpretacin
nica de los datos.
Construccin de fracciones u n medio
U n a fraccin un medio del diseo 2k de la resolucin ms alta puede construirse apuntando el diseo b
sico, que consta de las corridas de un diseo factorial 2*1completo, y agregndole despus el factor /psi
m o identificando sus niveles positivo y negativo con los signos positivo y negativo de la interaccin ABC
(K ~ 1) del orden ms alto. Por lo tanto, el diseo factorial fraccionado 2 ^ ' se obtiene apuntando el dise
o 22 com pleto como diseo bsico e igualando despus el factor C con la interaccin ^45. L a fraccin al
tern a se obtendra igualando el factor C con la interaccin -A B . Este enfoque se ilustra en la tabla 8-2,
Observe que el diseo bsico siem pre tiene el nm ero correcto de corridas (renglones), pero le falta una
columna. El generador / = A B C - K se resuelve entonces para la colum na faltante (K), de tal m odo que K
= A B C ( K - 1) define el producto de los signos positivos y negativos que deber usarse en cada rengln
p ara producir los niveles del factor /c-simo.
Observe que podra usarse cualquier efecto de interaccin p ara generar la colum na del factor >simo. Sin em bargo, al utilizarse cualquier efecto que no sea A B C (X - 1), no se producir el diseo con la
resolucin m s alta posible.
O tra form a de visualizar la construccin de una fraccin un m edio es m ediante la particin de las co
rridas en dos bloques con la interaccin de orden m s alto ABC K confundida. C ada bloque es un dise
o factorial fraccionado 2*l con la resolucin ms alta.
Proyeccin de fracciones en diseos factoriales
C ualquier diseo factorial fraccionado de resolucin R contiene diseos factoriales completos (posible
m ente diseos factoriales con rplicas) en cualquier subconjunto de R - 1 factores. ste es un concepto
im portante y til. Por ejemplo, si un experim entador tiene varios factores de inters potencial pero piensa
Tabla 8-2 Las dos fracciones un medio del diseo 23
Diseo factorial
22 completo
(diseo
bsico)

2m> I = ABC

Corrida _________A____________ B_______ A _______


1
_
_
_
_
2
+
_
+
_
y
+
+
4
+
+
+
+

B
+
+

C=AB

2n,\ / = -A B C
A_______ B
_

+
+

C = -AB
_

_
+
+

+
+
-

CAPTULO 8

308

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

I
I

1
I

i /

:z z - J = 2
I

---------7 -------- -- f i

/
/
Jtc

abe

/
A

ri

= 3 >

Proyeccin de un diseo
2m1 en tres diseos 22.

Figura 8-2

que slo/? - 1 de ellos tienen efectos im portantes, entonces un diseo factorial fraccionado de resolucin
R es la eleccin de diseo apropiada. S el experim entador est en lo correcto, el diseo factorial fraccio
nado de resolucin R se proyectar en un diseo factorial com pleto en los R - 1 factores significativos.
E ste proceso se ilustra en la figura 8-2 para el diseo 2 ^ , el cual se proyecta en un diseo 22 en cada subconjunto de dos factores.
Puesto que la mxima resolucin posible de una fraccin un m edio del diseo 2k e s R = k, todos los di
seos 2k~l se proyectarn en un factorial completo en (k - 1) cualquiera de los k factores originales. Adems,
un diseo 2<r_1puede proyectarse en dos rplicas de un factorial completo en cualquier subconjunto d e fc -2
factores, cuatro rplicas de un factorial completo en cualquier subconjunto d e fc -3 factores, etctera.

EJEMPLO 8 - 1 ....................................................................................................................................
Considere el experim ento del ndice de filtracin del ejemplo 6-2. El diseo original, ilustrado en la tabla
6-10, es u na sola rplica del diseo 24. E n ese ejem plo se encontr que los efectos principales de A , C y D y
las interacciones A C y A D eran diferentes de cero. Se retom a ahora este experim ento y se simula lo que
habra ocurrido si se hubiera corrido una fraccin un m edio del diseo 24 en vez del diseo factorial com
pleto.
Se usar el diseo 241 con / = A B C D , ya que esta eleccin del generador dar como resultado un di
seo con la resolucin m s alta posible (IV). P ara construir el diseo, prim ero se apunta el diseo bsico,
el cual es un diseo 23, como se m uestra en las tres prim eras columnas de la tabla 8-3. E ste diseo bsico
tiene el nm ero necesario de corridas (ocho) pero slo tres columnas (factores). Para encontrar los nive
les del cuarto factor, se resuelve / = A B C D p a ra D, o D = A B C . Por lo tanto, el nivel d e /? de cada corrida
Tabla 8-3

Corrida
1
2
3
4
5
6
7
8

El diseo

con la relacin de definicin IABCD_________________________________________________

Diseo bsico
B
+
+
+

+
+
+
+

A
+

C
+
+
+
+

D = ABC
+
+
+
+

Combinacin de
tratamientos
(1)
ad
bd
ab
cd
ac
bc
abcd

ndice de
filtracin
45 '
100
45
65
75
60
SO
96

8-2 LA FRACCIN UN MEDIO DEL DISEO 2

309

abcd - 96

ftc = 80

Figura 8-3 El diseo 2 ^ ' para el experimento del ndice de filtracin del ejemplo 8-1.

es el producto de los signos positivos y negativos de las columnasA, B y C .E l proceso se ilustra en la tabla
8-3. Puesto que el generador ABCD es positivo, este diseo 2 ^ es la fraccin principal. El diseo se ilus
tra grficam ente en la figura 8-3.
U tilizando la relacin de definicin, se observa que cada uno de los efectos principales es alias de una
interaccin de tres factores; es decir,A = A 2BC D B C D ,B = A B 2CD = A C D ,C = A B C 2D = A B D y D =
A B C D 2 = A B C . Adems, cada interaccin de dos factores es alias de otra interaccin de dos factores.
Estas relaciones de los alias son A S = C D ,A C = BD y B C = A D . Los cuatro efectos principales ms los
tres pares de alias de interacciones de dos factores representan los siete grados de libertad del diseo.
E n este punto, norm alm ente se aleatorizaran las ocho corridas y se llevara a cabo el experimento.
Puesto que se h a corrido ya el diseo 24 completo, sim plemente se seleccionan los ocho ndices de filtra
cin observados del ejem plo 6-2 que corresponden a las corridas del diseo 2 J^1. Estas observaciones se
m uestran en la ltim a colum na de la tabla 8-3, as como en la figura 8-3.
E n la tabla 8-4 se m uestran las estimaciones de los efectos obtenidas de este diseo 2 J^1. Para ilustrar
los clculos, la com binacin lineal de las observaciones asociadas con el efecto de A es
t A = i ( - 4 5 + loo - 45+ 6 5 - 75+ 60 - 80 + 9 6 )= 19.00-*- A +BC D
m ientras que para el efecto A B se obtendra
e M = 1 (4 5 -1 0 0 - 45+ 65+ 7 5 - 60 - 80 + 96) = -1 .0 0 -* A B + CD
P or la inspeccin de la informacin de la tabla 8-4, no es irrazonable concluir que los efectos principales
de A, C y D son grandes. Adems, si A, C y D son los efectos principales im portantes, entonces es lgico
concluir que las dos cadenas de alias de interaccionesA C + BD y A D + B C tienen efectos grandes, ya que

Tabla 8-4

Estimaciones de los efectos


y los alias del ejemplo 8-1

Estimacin Estructura de los alias


= 19.00
l A -* A + BCD
=
1.50
t B -*B+ ACD
tn
= 14.00
t c +C+ABD
t D -* D+ ABC
n = 16.50
= -1.00
AB+CD
i AC -* AC + BD
^ AC = -18.50
1ad * AD+BC
^ AD = 19.00
"Los efectos significativos se indican en negritas.

310

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

75

96

Figura 8-4 Proyeccin del diseo 2 ^ ' en un diseo 23en A, C


y D para el ejemplo 8-1.

las interacciones A C y A D tam bin son significativas. E n otras palabras, si A, C y D son significativos, en
tonces lo ms posible es que las interacciones significativas seanA C y AD. Se trata de una aplicacin de la
navaja de O ckham (en honor de Guillermo de Ockham ), un principio cientfico que establece que cuan
do uno se confronta con varias interpretaciones posibles de un fenm eno, la interpretacin ms simple
suele ser la correcta. Observe que esta interpretacin concuerda con las conclusiones del anlisis del dise
o 24 com pleto del ejemplo 6-2.
Puesto que el factor B no es significativo, puede sacarse de consideracin. Por consiguiente, este dise
o 2 ^ puede proyectarse en una sola rplica del diseo 23 en los factoresA, C y D , como se m uestra en la
figura 8-4. El examen visual de esta grfica de cubo nos hace sentim os ms cm odos con las conclusiones
a las que se lleg antes. Observe que si la tem peratura (A) est en el nivel bajo, la concentracin (C) tiene
un efecto positivo grande, m ientras que si la tem peratura est en el nivel alto, la concentracin tiene un
efecto muy pequeo. Esto se debe probablem ente a una interaccin AC. Adems, si la tem peratura est
en el nivel bajo, el efecto de la velocidad de agitacin (D) es insignificante, m ientras que si la tem peratura
est en el nivel alto, la velocidad de agitacin tiene un efecto positivo grande. Esto se debe probablem ente
a la interaccin A D que se identific de m anera tentativa unos prrafos antes.
Con base en el anlisis anterior, puede obtenerse ahora un m odelo para predecir el ndice de filtra
cin en la regin experim ental. E ste m odelo es
y = 0 + 1x 1 + 3x 3 + 4x 4 + 13x 1x 3 + 14x 1x 4
donde x 1;x 3y jc4 son variables codificadas (-1 <x ^ + 1 ) que representan a A, C y D , y las son coeficien
tes de regresin que pueden obtenerse a partir de las estimaciones de los efectos como se hizo anterior
m ente. Por lo tanto, la ecuacin de prediccin es
-

|1 9 .0 0 \
/'14.00\
70.75+
*. +

.5 0 \
+/16.50\
r r +/-1
h 8H

/19.00
+

R ecuerde que la ordenada al origen 0 es el prom edio de todas las respuestas en las ocho corridas del di
seo. E ste m odelo es muy similar al que result del diseo factorial com pleto del ejem plo 6-2.

8-2 LA FRACCIN UN MEDIO DEL DISEO 2

311

EJEMPLO 8 - 2 ....................................................................................................................................
Un diseo 25-1usado para mejorar un proceso
Se investigaron cinco factores en un proceso de m anufactura de un circuito integrado en un diseo 25' 1
con el objetivo de m ejorar el rendim iento del proceso. Los cinco factores fueron A = ajuste de apertura
(pequea, grande), B = tiem po de exposicin (20% abajo del nominal, 20% arriba del nom inal), C =
tiem po de desarrollo (30 s, 45 s), D = tam ao de la m scara (pequea, grande) y E = tiem po de grabado
(14.5 min, 15.5 min). E n la tabla 8-5 se m uestra la construccin del diseo 25~1. Observe que el diseo se
construy apuntando el diseo bsico que tiene 16 corridas (un diseo 24 en A , B , C y D ) , seleccionando
A B C D E com o generador, y ajustando despus los niveles del quinto factor E = A B C D . E n la figura 8-5 se
presenta u na representacin geom trica del diseo.
L a relacin de definicin del diseo es I = A B C D E . Por consiguiente, todos los efectos principales
son alias de una interaccin de cuatro factores (por ejemplo, lA ~*A + B C D E ) , y cada una de las interac
ciones de dos factores son alias de una interaccin de tres factores (por ejemplo, t ^ - * A B + C D E ) . Por lo
tanto, el diseo es de resolucin V Se esperara que este diseo 251proporcionara excelente inform acin
respecto de los efectos principales y las interacciones de dos factores.
L a tabla 8-6 contiene las estim aciones de los efectos, las sumas de cuadrados y los coeficientes del
m odelo de regresin para los 15 efectos de este experim ento. E n la figura 8-6 se presenta la grfica de
probabilidad norm al de las estim aciones de los efectos de este experim ento. Los efectos principales de A ,
B y C y la interaccinA B son grandes. R ecuerde que, debido a los alias, estos efectos son en realidad A +
B C D E , B + A C D E , C + A B D E y A B + C D E . Sin embargo, puesto que parece plausible que las interac
ciones de tres factores y de rdenes superiores sean insignificantes, uno siente seguridad en concluir que
slo A , B , C y A B son los efectos im portantes.
E n la tab la 8-7 se resum e el anlisis de varianza d e este experim ento. L a sum a de cuadrados del
m odelo es SSModelo = S S A + S S B + S S C + S S AB = 5 1 A l . 2 5 , y esto explica m s de 99% de la variabilidad
to tal del ren dim iento. E n la figura 8-7 se p resen ta la grfica de probabilidad norm al de los residuales

Tabla 8-5

Corrida
1
2

3
4
5

6
7
8
9
10
11
12
13
14
15
16

Un diseo 25-1 pata el ejemplo 8-2


Diseo bsico
B
+
+
+
+
+
+
+
+
+
+
+
+
-

+
+

+
-

+
-

+
+

+
+
+
+

E =ABCD
+

+
+

+
+
+
+
+
+
+
+

+
+

+
-

Combinacin de
tratamientos
e
a
b
abe
c
ace
bce
abe
d
ade
bde
abd
ede
acd
bed
abede

Rendimiento
8
9
34
52

16
22
45

60
6
10
30
50
15
21
44

63

312

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

bce = 45

abede w 63

cL'
A

Figura 8-5

El diseo 2Sy l del ejemplo 8-2.

Tabla 8-6 Efectos, coeficientes de regresin y sumas de cuadrados del ejemplo 8-2
Nivel -1
Variable
Nombre
-1.000
A
Apertura
-1.000
B
Tiempo de desarrollo
-1.000
C
Tiempo de exposicin
Tamao de la mscara
-1.000
D
-1.000
Tiempo de grabado
E
Efecto estimado
Coeficiente de regresin
Variable
Promedio global
A
B
C
D
E
AB
AC
AD
AE
BC
BD
BE
CD
CE
DE

30.3125
5.5625
16.9375
5.4375
-0.4375
0.3125
3.4375
0.1875
0.5625
0.5625
0.3125
-0.0625
-0.0625
0.4375
0.1875
-0.6875

11.1250
33.8750
10.8750
-0.8750
0.6250
6.8750
0.3750
1.1250
1.1250
0.6250
-0.1250
-0.1250
0.8750
0.3750
-1.3750

Nivel +1
1.000
1.000
1.000
1.000
1.000
Suma de cuadrados
495.062
4590.062
473.062
3.063
1.563
189.063
0.563
5.063
5.063
1.563
0.063
0.063
3.063
0.563
7.563

Estimaciones de los efectos

Figura 8-6 Grfica de probabilidad normal de los efectos del ejemplo 8-2.

labia 8-7 Anlisis de varianza del ejemplo 8-2


Suma de
Fuente de variacin
cuadrados
A (Apertura)
495.0625
B (Tiempo de exposicin)
4590.0625
C (Tiempo de desarrollo)
473.0625
AB
189.0625
Error
28.1875
Ib tal
5775.4375

Grados de
libertad

Cuadrado
medio
495.0625
4590.0625
473.0625
189.0625
2.5625

1
1
1
1
11
15

F0
193.20
1791.24
184.61
73.78

Valor P
<0.0001
<0.0001
<0.0001
<0.0001

99

95
90
80

a.
i

70
50

S
i

30
20

10

Residuales
F igura 8-7

G rfica d e probabilidad norm al d e lo s residuales d el ejem plo 8-2.


313

314

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

R endim iento predicho

Figura 8-8 Grfica de los residuales contra el rendimiento predicho


para el ejemplo 8-2.

y la figura 8-8 es u n a grfica de los residuales co n tra los valores predichos. A m bas grficas son satis
factorias.
Los tres factores A , B y C tienen efectos positivos grandes. L a interaccin apertura-tiem po de exposi
cin o A B se grafica en la figura 8-9. E sta grfica confirma que el rendim iento es ms alto cuando tanto A
como B estn en el nivel alto.

Figura 8-9 Interaccin apertura-tiempo de exposicin del ejemplo 8-2.

8 -2
44.5

LA FRACCIN UN MEDIO DEL DISEO Zl

315

61.5

Figura 8-10 Proyeccin del diseo 2 ^ ' del


ejemplo 8-2 en dos rplicas de un diseo 23 en
los factores A, B y C.

El diseo 251se reducir a dos rplicas de un diseo 23 en tres cualesquiera de los cinco factores origi
nales. (Observar la figura 8-5 ayuda a visualizar esto.) L a figura 8-10 es una grfica de cubo en los factores
A , B y C con los rendim ientos prom edio superpuestos en los ocho vrtices. Es evidente p or la inspeccin
de la grfica de cubo que los rendim ientos ms altos se consiguen con A , B y C en el nivel alto. Los factores
D y E tienen un efecto pequeo sobre el rendim iento prom edio del proceso y pueden ajustarse en los va
lores que optimicen otros objetivos (como el costo).

Secuencias de diseos factoriales fraccionados


E l uso de los diseos factoriales fraccionados lleva con frecuencia a u n a gran econom a y eficiencia en la
experim entacin, en particular si las corridas pueden hacerse secuencialm ente. Por ejemplo, suponga
que se estn investigando k = 4 factores (24 = 16 corridas). Casi siem pre es preferible correr un diseo
fraccionado 2 ^ (ocho corridas), analizar los resultados y despus decidir cul es la m ejor serie de corri
das que deber correrse despus. Si es necesario resolver ambigedades, siem pre puede correrse la frac
cin alterna y com pletar el diseo 24. Cuando se usa este m todo para com pletar el diseo, ambas
fracciones un m edio representan bloques del diseo com pleto con las interacciones de orden superior
confundidas con los bloques (en este caso A B C D estara confundida). Por lo tanto, la experim entacin se
cuencia! tiene como resultado la prdida de inform acin slo en la interaccin de orden ms alto. Su ven
taja es que en m uchos casos se saca inform acin suficiente de la fraccin un m edio para proceder a la
siguiente etapa de la experim entacin, lo cual podra implicar la incorporacin o eliminacin de factores,
el cambio de las respuestas, o la variacin de algunos de los factores en nuevos rangos. Algunas de estas
posibilidades se ilustran grficam ente en la figura 8-11.

EJEMPLO 8 * 3 .................... ...............................................................................................................


Considere nuevamente el experimento del ejemplo 8-1. Se ha usado un diseo 2 4w l y se ha hecho la identi
ficacin tentativa de los tres efectos principales grandes: A , C y D. Hay dos efectos grandes asociados con
interacciones de dos factores, A C + BD y A D + BC. E n el ejemplo 8-2 se utiliz el hecho de que el efecto
principal de B era insignificante para concluir de m anera tentativa que las interacciones im portantes eran

316

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

b) Agregar otra fraccin


para resolver las
ambigedades de la
fraccin original

una tendencia
aparente a la respuesta

/I1---!
/

' /
porque pueden haberse
hecho variar en los
rangos inapropiados

f ) Hacer un aumento para


modelar la curvatura
aparente

e) Hacer una rplica para mejorar


las estimaciones de los efectos o
porque algunas corridas se
hicieron incorrectamente

d) Eliminar y agregar
factores porque el factor
original correspondiente
a la velocidad de alimentacin
del catalizador es insignificante

Figura 8-11 Posibilidades para el seguimiento de la experimentacin despus de un


experimento factorial fraccionado [adaptado de Box (Sequential Experimentation and
Sequential Assembly of Designs) con permiso del editor].

A C y AD. En ocasiones el experimentador tendr que procesar conocimientos que puedan ayudarle a dis
criminar entre las interacciones que probablemente sean importantes. Sin embargo, siempre es posible
aislar la interaccin significativa corriendo la fraccin alterna, dada por / -ABCD. Es directa la demos
tracin de que el diseo y las respuestas son los siguientes;

Corrida
1
2

Diseo bsico
B
C

D = -ABC

3
4
5

+
+

7
8

+
+

+
+

+
+

Combinacin de
tratamientos
d
a
b
abd
c
acd
bed
abe

ndice de
filtracin
43
71
48
104
68
86
70
65

8-3 LA FRACCIN UN CUARTO DEL DISEO 2

317

11

Las combinaciones lineales de las observaciones obtenidas a partir de esta fraccin alterna son
24.25 -* A - BCD

t'

4.75 B - A C D

f 'C

5.75 -* C - ABD
1275 -< D - ABC

1 .2 5 - A B - CD

i1' AB

t ' AC

= - 1 7 .7 5 - A C - BD
= 14.25 - A D - BC

('AD

Estas estimaciones pueden combinarse con las que se obtuvieron de la fraccin un medio original para
obtener las siguientes estimaciones de los efectos:

A
B
C
D
AB
AC

D e *(/, + /-,)
21.63 A
3.13- B
9.88 - C
14.63 +D
0.13 -* A B
-18.13 A C

AD

16.63 -A D

De * ( < ,- /;)
-2.63 -* B C D
-1.63 - A C D
4.13 -* A B D
1.88 -* A B C
-1.13 - CD
-0.38 - BD
2.38 - B C

Estas estimaciones concuerdan exactamente con las del anlisis original de los datos como una sola rpli
ca de un diseo factorial 24, como se consigna en el ejemplo 6-2. Evidentemente, son las interaccionesAC
y AD las que son grandes.

Agregar la fraccin alterna a la fraccin principal puede considerarse como un tipo de experimento
de confirmacin, por cuanto proporciona informacin que permitir fortalecer las conclusiones iniciales
acerca de los efectos de la interaccin de dos factores. En la seccin 8-5 se investigarn otros aspectos de
la combinacin de diseos factoriales fraccionados para aislar las interacciones. En ocasiones un experi
mento de confirmacin no es tan elaborado como ste. Por ejemplo, podra usarse la ecuacin del modelo
para predecir la respuesta en un punto de inters dentro del espacio del diseo (no uno de los puntos del
diseo actual), correr despus realmente ese ensayo (quiz varias veces) y usar la comparacin entre la
respuesta predicha y la observada para confirmar los resultados.

8-3

LA FRACCIN U N CUARTO DEL DISEO 2k

Para un nmero moderadamente grande de factores, con frecuencia son tiles fracciones menores del di
seo 2*. Considere una fraccin un cuarto del diseo 2*. Este diseo contiene 2*"2corridas y es comn lla
marlo diseo factorial fraccionado 2*'2.
El diseo 2k~2puede construirse apuntando primero un diseo bsico compuesto por las corridas aso
ciadas con un diseo factorial completo e n k - 2 factores y asociando despus las dos columnas adiciona
les con las interacciones elegidas apropiadamente que incluyan los primerosk - 2 factores. Por lo tanto,

318

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

una fraccin un cuarto del diseo 2k tiene dos generadores. Si P y Q representan los generadores escogi
dos, entonces a / = P e / ~ Q se les llama las relaciones generadoras del diseo. Los signos de P y Q (+
o - ) determ inan cul de las fracciones un cuarto se produce. Las cuatro fracciones asociadas con la elec
cin de los generadores P y Q pertenecen a la misma fam ilia. La fraccin para la que tanto P como Q
son positivas es la fraccin principal.
L a relacin de definicin com pleta del diseo est com puesta por todas las columnas que son iguales
a la colum na identidad I. stas constarn de P, Q y su interaccin generalizada PQ; es decir, la relacin de
definicin es / = P = Q = PQ. A los elem entos P ,Q y PQ de la relacin de definicin se les denom ina p a
labras. Los alias de cualquier efecto se obtienen m ediante la m ultiplicacin de la colum na de ese efecto
p o r cada palabra de la relacin de definicin. Evidentem ente, cada efecto tiene tres alias. El experim enta
dor deber estar atento al elegir los generadores para que los efectos potencialm ente im portantes no
sean alias entre s.
Como un ejemplo, considere el diseo 26"2. Suponga que se escogen/ = A B C E e l = B C D F como los
generadores del diseo. Entonces la interaccin generalizada de los generadores A B C E y BC D F es
A D E F ; p or lo tanto, la relacin de definicin com pleta de este diseo es
/ = A B C E = BCDF ~ A D E F
Por consiguiente, se trata de un diseo de resolucin IV. P ara encontrar los alias de cualquier efecto (por
ejem plo d eA ), se multiplica ese efecto por cada palabra de la relacin de definicin. Para A , esto produce
A = B C E = A B C D F = D EF
Es sencillo verificar que todos los efectos principales son alias de interacciones de tres y cinco factores,
m ientras que las interacciones de dos factores son alias entre s y de interacciones de rdenes superiores.
Por lo tanto, cuando se estim ad , por ejemplo, en realidad se est estim andoA + B C E + D E F + ABC D F.
E n la tabla 8-8 se m uestra la estructura com pleta de los alias de este diseo. Si las interacciones de tres
factores y de rdenes superiores son insignificantes, este diseo produce estimaciones claras de los efec
tos principales.
P ara construir este diseo se anota prim ero el diseo bsico, el cual consiste en las 16 corridas para
un diseo com pleto 2s-2 = 24 en A , B ,C y D . D espus se aaden los dos factores E y F, asociando sus nive
les ms y m enos con los signos ms y m enos de la interaccin A B C y BCD , respectivam ente. E ste procedi
m iento se m uestra en la tabla 8-9.
O tra form a de construir este diseo es deduciendo los cuatro bloques del diseo 26 con A B C E y
BCDF confundidas y eligiendo despus el bloque con las combinaciones de tratam ientos que son positi
vas p ara A B C E y BCDF. Se tratara de un diseo factorial fraccionado 2s"2con relaciones generadoras / =
A B C E e / = BCDF, y puesto que los dos generadores A B C E y BC D F son positivos, se trata de la fraccin
principal.

Tabla 8-8

Estructura de los alias del diseo 2 ^ 2


con I = ABCE = BCDF = ADEF

A = BCE = DEF = ABCDF


B = ACE = CDF = ABDEF
C = ABE = BDF = ACDEF
D = BCF = AEF = ABCDE
E = ABC = ADF = BCDEF
F = BCD = ADE = ABCEF
ABD = CDE = ACF = BEF
ACD = BDE * ABF = CEF

AB CE = ACDF = BDEF
AC = BE = ABDF = CDEF
AD = EF = BCDE = ABCF
AE = BC = DF = ABCDE F
AF = DE = BCEF = ABCD
BD= CF = ACDE = ABEF
BF = CD = ACEF = ABDE

8-3 LA FRACCIN UN CUARTO DEL DISEO 2


Tabla 8 -9

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

319

C onstruccin del diseo IV con


generadores
------los------------ I A BCE e l = BCDF

Diseo bsico
B
C
-

D
-

+
-

+
+

+
+

+
+
+
+

+
+

+
+
+
+

+
+

E=ABC

+
+

+
-

+
+
+
+
+
+
+
+

F = BCD

+
+
-

+
+
+
+
-

+
+
-

+
+

Hay, desde luego, tres fracciones alternas de este diseo 2 ^ 2 particular. Se trata de las fracciones
con las relaciones generadoras I = A B C E e / = - BCDF; / = -A B C E e / = BCDF; e / = -A B C E e / =
-BC D F. Es sencillo construir estas fracciones con el m todo que se m uestra en la tabla 8-9. Por ejemplo,
si quiere encontrarse la fraccin p ara la que I = A B C E e / = -BC D F, entonces en la ltim a colum na de la
tabla 8-9 se hace F = -B C D , y la colum na de los niveles del factor F queda como
+ + --------- + + + + + + - L a relacin de definicin com pleta de esta fraccin alterna es / = A B C E = -B C D F = -AD EF. A hora
ciertos signos en la estructura de los alias de la tabla 8-9 se han cambiado; por ejemplo, los alias de A son
A = B C E = -D E F = -ABC D F. Por lo tanto, la combinacin lineal de las observaciones lA estim a en reali
dad A + B C E - D E F - ABCD F.
Por ltimo, observe que el diseo factorial fraccionado 2^2 se proyectar en una sola rplica de un
diseo 24 en cualquier subconjunto de cuatro factores que no sea una palabra de la relacin de definicin.
Thmbin se pliega en una fraccin un m edio con una rplica de un diseo 24 en cualquier subconjunto de
cuatro factores que sea una palabra de la relacin de definicin. Por lo tanto, el diseo de la tabla 8-9 se
convierte en dos rplicas de un diseo 24"1 en los factores ABC E, BC D F y AD EF, porque stas son las pa
labras de la relacin de definicin. Hay otras 12 combinaciones de los seis factores, como A B C D ,A B C F ,
etc., p ara las que el diseo se proyecta en una sola rplica del diseo 24. Este diseo tam bin se pliega en
dos rplicas de un diseo 23 en cualquier subconjunto de tres de los seis factores o en cuatro rplicas de un
diseo 22 en cualquier subconjunto de dos factores.
E n general, cualquier diseo factorial fraccionado 2k~2puede plegarse en un diseo factorial com ple
to o bien en un diseo factorial fraccionado en algn subconjunto de r < k - 2 de los factores originales.
Estos subconjuntos de variables que form an diseos factoriales com pletos no son palabras de la relacin
de definicin completa.

EJEMPLO 8 - 4 ....................................................................................................................................
Las piezas fabricadas en un proceso de m oldeo p or inyeccin estn presentando una contraccin excesi
va. Esto est ocasionando problem as en las operaciones de ensamblaje que se realizan despus del m ol
deo p o r inyeccin. U n equipo de m ejoram iento de calidad h a decidido llevar a cabo un experim ento

320

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

diseado p ara estudiar el proceso de m oldeo por inyeccin a fin de poder reducir la contraccin. E l equi
po decide investigar seis factores la tem peratura de m oldeo (A), la velocidad del enroscado (B), el
tiem po de retencin (C), la duracin del ciclo (D), el tam ao del vaciadero ( ) y la presin de la retencin
(.F) con dos niveles cada uno, con el fin de saber cmo se afecta la contraccin debido a cada factor, as
como para obtener inform acin prelim inar acerca de la form a en que los factores interactan.
El equipo decide usar el diseo factorial fraccionado de 16 corridas con dos niveles de la tabla 8-9. El
diseo se m uestra de nuevo en la tabla 8-10, junto con la contraccin observada ( x 10) en la pieza de
prueba producida en cada una de las 16 corridas del diseo. E n la tabla 8-11 se m uestran las estimaciones
de los efectos, las sumas de cuadrados y los coeficientes de regresin de este experim ento.
E n la figura 8-12 se presenta la grfica de probabilidad norm al de las estim aciones de los efectos de
este experim ento. Los nicos efectos grandes son A (tem peratura de m oldeo), B (velocidad del enrosca
do) y la interaccin AB. A la luz de las relaciones de los alias de la tabla 8-8, parece razonable adoptar es
tas conclusiones de m anera tentativa. L a grfica de la interaccin A B de la figura 8-13 indica que el
proceso m uestra una alta insensibilidad a la tem peratura si la velocidad del enroscado est en el nivel
bajo, pero que es muy sensible a la tem peratura si la velocidad del enroscado est en el nivel alto. Con la^
velocidad del enroscado en el nivel bajo, el proceso deber producir una contraccin prom edio de alrede
dor de 10%, independientem ente del nivel de tem peratura elegido.
Con base en este anlisis inicial, el equipo decide hacer el ajuste de la tem peratura de m oldeo y la ve
locidad del enroscado en el nivel bajo. E ste conjunto de condiciones reducir la contraccin media de las
piezas en alrededor de 10%. Sin embargo, la variabilidad de la contraccin de una pieza a o tra sigue sien
do un problem a potencial. D e hecho, la contraccin m edia puede reducirse adecuadam ente m ediante las
m odificaciones anteriores; sin embargo, la variabilidad de la contraccin de una pieza a otra en una corri
da de produccin podra seguir causando problem as en el ensamblaje. U na m anera de abordar esta cues
tin es investigando si alguno de los factores del proceso afecta la variabilidad de la contraccin de las
piezas.
E n la figura 8-14 se presenta la grfica de probabilidad norm al de los residuales. E sta grfica parece
ser satisfactoria. Se construyeron despus las grficas de los residuales contra cada factor. E n la figura

Tabla 8*10 Un diseo 2f2 para el experimento del moldeo por inyeccin del ejemplo 8-4________________________

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

A
+

Diseo bsico
B
C
D
_

+
+

+
+

+
+
+
+.

+
+

+
-

F = BCD

+
+

E=ABC

+
+

+
+
+
+

+
+
+
+

+
+
+
+
+
+
+
+

+
+

' +
+
-

+
+

Contraccin
observada (x 10)
6
10
32
60
4
15
26
60
8
12
34
60
16
5
37
52

8-3 LA FRACCIN U N CUARTO DEL DISEO 2

Tabla 8-11

Efectos, sumas de cuadrados y coeficientes de regresin del ejemplo 8-4

Variable
A
B
C
D
E
F
Variable
Promedio global
A
B
C
D
E
F
AB + CE
A C + BE
AD+EF
A E + BC + DF
AF + DE
BD + CF
BF + CD
ABD
ABF

Nombre
temperatura_moldeo
velocidadenroscado
duracin_retencin
duracinciclo
tamaovaciadero
presinretencin
Coeficiente de regresin
27.3125
6.9375
17.8125
-0.4375
0.6875
0.1875
0.1875
5.9375
-0.8125
-2.6875
-0.9375
0.3125
-0.0625
-0.0625
0.0625
-2.4375

Nivel -1
-1.000
-1.000
-1.000
-1.000
-1.000
-1.000
Efecto estimado
13.8750
35.6250
-0.8750
1.3750
0.3750
0.3750
11.8750
-1.6250
-5.3750
-1.8750
0.6250
-0.1250
-0.1250
0.1250
-4.8750

Slo los efectos principales y las interacciones de dos factores.

95
90

80
70

S
50 x

<C
30
20
10

Estimaciones de los efectos


F igura 8-12

321

G rfica d e probabilidad norm al d e lo s efecto s d el ejem plo 8-4.

Nivel +1
1.000
1.000
1.000
1.000
1.000
1.000
Suma de cuadrados
770.062
5076.562
3.063
7.563
0.563
0.563
564.063
10.562
115.562
14.063
1.563
0.063
0.063
0.063
95.063

322

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DO S NIVELES

Te m p era tura de m olde o, A

Figura 8-13 Grfica de la in te ra c c i n ^ (temperatura de mol


deo-velocidad del enroscado) para el ejemplo 8-4.

8-15 se m uestra una de estas grficas, la de los residuales contra el factor C (tiem po de retencin). La gr
fica revela que hay una dispersin sensiblem ente m enor en los residuales con el tiem po de retencin bajo
que con el tiem po de retencin alto. Estos residuales se obtuvieron de la m anera usual a partir del m odelo
de la contraccin predicha:
9 = o ~*~lXl ^ l x 2 ~^l2XlX2
= 27.3125+ 6.9375^ +17.8125x2 + 5 .9 3 7 5 * ^

Residuales
F igura 8-14

G rfica d e probabilidad norm al de lo s residuales del ejem plo 8-4.

8-3 LA FRACCIN UN CUARTO DEL DISEO 2k

323

Tiempo de retencin (C)

Figura 8-15 Residuales contra el tiempo de retencin (C) para el


ejemplo 8-4.

donde*!, *2y
son las variables codificadas que corresponden a los factores A y B y a la interaccin AB.
Entonces los residuales son
e= y-y
El m odelo de regresin usado para producir los residuales elimina, en esencia, los efectos de localizacin
de A, B y A B de los datos; por lo tanto, los residuales contienen inform acin acerca de la variabilidad no
explicada. L a figura 8-15 indica que existe un patrn en la variabilidad y que la variabilidad de la contrac
cin de las piezas puede ser m enor cuando el tiem po de retencin est en el nivel bajo (recuerde que en el
captulo 6 se seal que los residuales slo transm iten inform acin acerca de los efectos de dispersin
cuando es correcto el m odelo de localizacin o la media).
Lo anterior se observa con mayor claridad en el anlisis de los residuales que se presenta en la tabla
8-12. E n esta tabla, los residuales se ordenan en los niveles bajo (-) y alto (+ ) de cada factor, y se ha calcu
lado la desviacin estndar de los residuales en los niveles bajo y alto de cada factor. Observe que la des
viacin estndar de los residuales con C en el nivel bajo [S(C") = 1.63] es considerablem ente m enor que la
desviacin estndar de los residuales con C en el nivel alto [(C+) = 5.70].
E n el ltim o rengln de la tabla 8-12 se presenta el estadstico

R ecuerde que si las varianzas de los residuales en los niveles alto ( + ) y bajo (-) del factor i son iguales, en
tonces este cociente sigue una distribucin aproxim adam ente norm al con m edia cero, y puede usarse
para evaluar la diferencia en la variabilidad de la respuesta en los dos niveles del factor i. Puesto que el
cociente F'c es relativam ente grande, se concluira que la aparente dispersin o efecto de variabilidad ob
servado en la figura 8-15 es real. Por lo tanto, ajustar el tiem po de retencin en su nivel bajo contribuira a
reducir la variabilidad de una pieza a otra durante una corrida de produccin. E n la figura 8-16 se presen-

324
Tabla 8-12

Clculo de los efectos de dispersin del ejemplo 8-4

AC = BE AE = BC = DF E

C orrida

AB = CE

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

+
+

+
+

S(+)
m

+
+

+
+
+
+

+
+

+
+

+
+

+
-

+
+

+
+
+
+
+
+
+
+

+
+

+
+

+
+

+
+

+
+
+
+

3.39
2.75
0.42

4.01
4.41
-0.19

4.72
3.51
0.59

4.71
3.65
0.51

+
+

+
+
+
+

4.33
4.10
0.11

5.70
1.63
2.50

3.85
4.33
-0.23

+
+
+
+

3.68
4.53
-0.42 -

+
+

3.80 4.01
4.60 4.41
-0.38 -0.19

AF = DE Residual

+
+

ACD

+
+

+
+
+
+

+
+

+
+

BF = CD

+
+
+

ABD

AD = EF BD = CE

+
+

+
+

+
+
+
+

+
+

+
+

4.17 4.64
4.25 3.59
-0.04 0.51

+
+

+
+

3.50
3.12
0.23

3.88
4.52
-0.31

4.87
3.40
0.72

-2.50
-0.50
-0.25
2.00
-4.50
4.50
-6.25
2.00
-0.50
1.50
1.75
2.00
7.50
-5.50
4.75
-6.00

8-3 LA FRACCIN UN CUARTO DEL DISEO 2k

3 25

jr
Figura 8-16

Grfica de probabilidad normal de los efectos de dispersin F del ejemplo 8-4.

ta una grfica de probabilidad norm al de los valores F* de la tabla 8-12; sta tam bin indica que el factor
C tiene un efecto de dispersin grande.
E n la figura 8-17 se m uestran los datos de este experim ento proyectados en un cubo en los fa cto res^ ,
B y C. La contraccin prom edio observada y el rango de la contraccin observada se indican en cada vrti
ce del cubo. Por la inspeccin de la figura se observa que correr el proceso con la velocidad del enroscado
(B) en el nivel bajo es la clave para reducir la contraccin prom edio de las piezas. Si B est en el nivel bajo,
virtualm ente cualquier combinacin de la tem peratura (A) y el tiem po de retencin (C) resultar en valo
res bajos de la contraccin prom edio de las piezas. Sin embargo, al examinar los rangos de los valores de
la contraccin en cada vrtice del cubo, es claro de inm ediato que ajustar el tiem po de retencin (C) en el
nivel bajo es la nica eleccin razonable si se quiere m antener baja la variabilidad de la contraccin de
una pieza a otra en una corrida de produccin.

Figura 8-17 C ontraccin prom ed io y rango d e la contraccin en los


factores A , B y C para el ejem plo 8-4,

326
8-4

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

EL DISEO FACTORIAL FRACCIONADO 2k p GENERAL

A un diseo factorial fraccionado 2k que contiene 2k^ corridas se le llam a fraccin 1/2P del diseo 2k o, de
m anera ms simple, diseo factorial fraccionado 2k~p. E n estos diseos deben seleccionarse p generadores
independientes. L a relacin de definicin de este diseo se com pone de los p generadores elegidos ini
cialm ente y sus 2P- p - 1 interacciones generalizadas. E n la presente seccin se estudia la construccin y el
anlisis de estos diseos.
La estructura de los alias puede encontrarse multiplicando la colum na de cada efecto por la relacin
de definicin. D eber prestarse atencin al elegir los generadores para que los efectos de inters poten
cial no sean alias entre s. C ada efecto tiene 2P- 1 alias. Para valores m oderadam ente grandes de A:, es co
m n suponer que las interacciones de rdenes superiores (por ejemplo, de tercero y cuarto orden y
superiores) son insignificantes, con lo cual se simplifica en gran m edida la estructura de ls alias.
Es im portante seleccionar los p generadores de un diseo factorial fraccionado 2k~p de tal m odo que
se obtengan las m ejores relaciones de los alias posibles. U n criterio razonable es seleccionar los genera
dores p ara que el diseo 2k~F resultante tenga la resolucin ms alta posible. Para ilustrar, considere el di
seo 2 ^ 2 de la tabla 8-9, donde se usaron los generadores E = A B C y F = BCD, con lo cual se produce un
diseo de resolucin IV. ste es el diseo con la resolucin ms alta. Si se hubieran seleccionado E =
A B C y F = A B C D , la relacin de definicin com pleta hubiera sido I = A B C E = A B C D F = DEF, y el dise
o habra sido de resolucin III. Se trata, evidentem ente, de una eleccin inferior porque sacrifica de m a
n era innecesaria inform acin acerca de las interacciones.
E n ocasiones la resolucin por s sola no es suficiente para distinguir entre los diseos. Por ejemplo,
considere los tres diseos 2j^2 de la tabla 8-13. Todos estos diseos son de resolucin IV, pero tienen es
tructuras de los alias muy diferentes (se ha supuesto que las interacciones de tres factores y las de rdenes
superiores son insignificantes) con respecto a las interacciones de dos factores. Evidentem ente, el diseo
A es el que tiene ms alias y el diseo C el que tiene menos, por lo que el diseo C sera una buena eleccin
p ara un diseo 2j2.
Las tres palabras del diseo A tienen longitud 4; es decir, el patrn de la longitud de las palabras es
{4,4,4}. Para el diseo B es {4,4,6} y p ara el diseo C es {4,5,5}. Observe que la relacin de definicin
del diseo C tiene una sola palabra de cuatro letras, m ientras que los dem s diseos tienen dos o tres. Por
lo tanto, el diseo C minimiza el nm ero de palabras de la relacin de definicin que son de longitud m
nima. A un diseo como ste se le llam a diseo de aberracin mnima. M inimizar la aberracin en un di
seo de resolucin R asegura que el diseo tiene el nm ero mnimo de efectos principales que son alias de

Tabla 8-13

Ties elecciones de generadores para el diseo 1 \

G eneradores del diseo A:

G eneradores del diseo B :

G eneradores del diseo C:

F = ABC, G = BCD
I = ABCF = BCDG = ADFG

F = ABC, G ADE
I - ABCF = ADEG = BCDEFG

F = ABCD, G = ABDE
I = ABCDF = ABDEG = CEFG

Alias (interacciones de dos factores)

Alias (interacciones de dos factores)

Alias (interacciones de dos factores)

AB = CF
A C BF
AD = FG
AG = DF
BD = CG
BG = CD
AF = BC = DG

AB = CF
AC = BF
AD = EG
A E = DG
AF = BC
AG = DE

CE - FG
CF - EG
CG = EF

8-4 EL DISEO FACTORIAL FRACCIONADO t * GENERAL

327

interacciones de orden R - 1 , el nm ero mnimo de interacciones de dos factores que son alias de interac
ciones de orden R - 2, etctera. R eferirse a Fries y H unter [46] para mayores detalles.
En la tabla 8-14 se presenta una seleccin de diseos factoriales fraccionados 2k~p para fc < 15 factores
y hasta n < 128 corridas. Los generadores sugeridos en esta tabla resultarn en un diseo con la resolu
cin ms alta posible. Son tam bin los diseos con aberracin mnima.
Las relaciones de los alias para todos los diseos de la tabla 8-14 para los que n < 64 se presentan en
la tabla X ll(a-w ) del apndice. Las relaciones de los alias incluidas en esta tabla se enfocan en los efectos
principales y las interacciones de dos y tres factores. Se da la relacin de definicin com pleta p ara cada di
seo. E sta tabla del apndice hace muy sencillo seleccionar un diseo con la resolucin suficiente para
asegurar que cualesquiera interacciones de inters potencial puedan estimarse.

EJEMPLO 8 - 5 ....................................................................................................................................
P ara ilustrar el uso de la tabla 8-14, suponga que se tienen siete factores y que el inters se encuentra en
estim ar los siete efectos principales y hacerse una idea aproxim ada de las interacciones de dos factores.
Estam os dispuestos a suponer que las interacciones de tres factores y de rdenes superiores son insignifi
cantes. E sta inform acin sugiere que un diseo de resolucin IV sera apropiado.
La tabla 8-14 m uestra que se cuenta con dos fracciones de resolucin IV: la l 1^ 2 con 32 corridas y la
2~3 con 16 corridas. L a tabla X II del apndice contiene las relaciones de los alias com pletas para estos
dos diseos. Los alias para el diseo 2 ^ 3 de 16 corridas se encuentran en la tabla X II(i) del apndice.
Observe que los siete efectos principales son alias de interacciones de tres factores. Las interacciones
de dos factores son alias en grupos de tres. Por lo tanto, este diseo satisfar los objetivos del problem a;
es decir, perm itir la estim acin de los efectos principales y dar cierta idea respecto de las interacciones
de dos factores. No es necesario correr el diseo 2 y2, el cual requerira 32 corridas. La tabla X II(j) del
apndice indica que este diseo perm itira la estim acin de los siete efectos principales y que 15 de las 21
interacciones de dos factores tam bin podran estim arse de m anera nica. (R ecuerde que las interaccio
nes de tres factores y de rdenes superiores son insignificantes.) sta es ms de la inform acin necesaria
acerca de las interacciones. El diseo com pleto se m uestra en la tabla 8-15. Observe que se construy em
pezando con la corrida 16 del diseo 24 en A , B, C y D como el diseo bsico y agregando despus las tres
columnas E = A B C , F = BC D y G = A C D . Los generadores son I = A B C E , I = BC D F e I = A C D G (tabla
8-14). La relacin de definicin com pleta es I = A B C E = BCDF = A D E F = A C D G = B D E G = CEFG =
ABFG.

Anlisis de los diseos factoriales fraccionados 2 ^


Hay varios program as de com putadora que pueden usarse para analizar el diseo factorial fraccionado
2*^. Por ejemplo, el program a Design-Expert ilustrado en el captulo 6 tiene esta capacidad.
El diseo tam bin puede analizarse recurriendo a los principios bsicos; el efecto '-simo se estima con
_ 2(Contraste, )
~

C ontraste.
( N I 2)

donde el Contraste, se encuentra utilizando los signos positivos y negativos de la colum na i y donde
N = 2k~p es el nm ero total de observaciones. El diseo 2k~p slo perm ite la estim acin de 2k~p - 1 efectos (y
sus alias).

Tabla 8 -1 4

Diseos factoriales fraccionados 2 ^ seleccionados

Nmero de
factores, k
3
4
5

Fraccin
,3-1
24- i
^ iv
251
25-2

Nmero de
corridas
4
8
16
8

ojt-l
vi
*6-2
Z,v

32
16

9 S-3

10

, 7-1

vil
27' 2
IV

64
32

,7-3

16

2 7- '1

in

, 8-2
v

64

,8-3
]V

32

o8-4
IV

16

,9-2
vi

128

,9-3
IV

64

,9-4
*IV

32

,g-s

16

-110-3
v

128

Generadores
del diseo
C = AB
D = ABC
E = ABCD
D = AB
= ^C
f - ABCDE
E = ABC
F = BCD
D = AB
E = AC
F = BC
G - ABCDEF
F = ABCD
G = ABDE
E = ABC
F = BCD
G = ACD
D = AB
E = AC
F = BC
G = ABC
G - ABCD
H = ABEF
F = ABC
G = ABD
H = BCDE
E = BCD
F = ACD
G = ABC
H = ABD
H = ACDFG
J = BCEFG
G = ABCD
H = ACEF
J = CDEF
F = BCDE
G = ACDE
H = ABDE
/ = ABCE
E = SC
f = BCD
G = ACZ>
7=
H =
JK=

ABCD
ABCG
ACDE
+ACDF

Tabla 8 -1 4

(continuacin)

Nmero de
factores, k

Fraccin

Nmero de
corridas

2F

64

2v-5

32

2n

16

2 -5

64

2y

32

2n~7

16
io

12

2[

16

13

2 1 ' 9

16

11

Generadores
del diseo
G BCDF
7/ = ACDF
/ = ABDE
= ABCE
P = +ABCD
G = ABCE
if = ABDE
/ = ACDE
a : = BCDE
= +ABC
F = BCD
G = ACD
H = ABD
J = ABCD
K = AB
G = +CDE
H = +ABCD
J = ABF
K BDEF
L = +ADEF
F = +ABC
G = BCD
H = CDE
J = ACD
K = ADE
L = BDE
E = ABC
F = BCD
G = ACD
H = ABD
J = ABCD
K = AB
L = AC
E = ABC
F = +ABD
G = ACD
H = BC,D
J = ABCD
K = AB
L = AC
M = AD
E = ABC
F = ABD
G = ACD
H = BCD
J = ABCD
K = AB

330

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Tabla 8-1 4

(continuacin)

Nmero de
factores, k

Fraccin

Nmero de
corridas

Generadores
del diseo
L = AC
M = AD
N = BC

14

2};-10

16

E = ABC

F = ABD
G = ACD
H - BCD
J = :tABCD
K = AB
L = AC
Af = AD
N = BC
O = BD
15

16

E = ABC

F = ABD
G = ACD
H = BCD
J = ABCD
K = AB
L = AC
M = AD
N = BC
O = BD
P = CD

Tabla 8-15

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Un diseo factorial fraccionado 2]v 3

Diseo bsico
B
C

+
+
-

+
-

G =ACD
+

+
+
+

+
+

+
+
+
+
+
+
+
+

+
+

+
_

+
+

+
+

+
+

+
+

F = BCD
-

+
+
+
+

E = ABC

+
+
+
+

+
+

+
_

+
+

8-4 EL DISEO FACTORIAL FRACCIONADO

GENERAL

331

Proyeccin del diseo factorial fraccionado 2k-t'


El diseo 2*"*se reduce a un factorial com pleto o bien a un factorial fraccionado en cualquier subconjunto
de r < k - p de los factores originales. Esos subconjuntos de factores que producen diseos factoriales
fraccionados son subconjuntos que aparecen como palabras en la relacin de definicin completa. Esto
resulta de particular utilidad en los experim entos de tam izado cuando se sospecha desde el principio del
experim ento que la mayora de los factores originales tendrn efectos pequeos. El diseo factorial frac
cionado 2*'p puede proyectarse entonces en un factorial com pleto, p or ejemplo, en los factores de mayor
inters. Las conclusiones a que se llegue con diseos de este tipo debern considerarse tentativas y some
terse a anlisis adicional. Por lo general es posible encontrar explicaciones alternativas de los datos que
intervienen en interacciones de rdenes superiores.
Como un ejemplo, considere el diseo 23 del ejemplo 8-5. Se trata de un diseo con 16 corridas en
el que intervienen siete factores. Se proyectar en un factorial com pleto en cuatro cualesquiera de los sie
te factores originales que no sean una palabra de la relacin de definicin. Hay 35 subconjuntos de cuatro
factores, siete de los cuales aparecen en la relacin de definicin com pleta (ver la tabla 8-15). Por lo tanto,
hay 28 subconjuntos de cuatro factores que form aran diseos 24. U na combinacin que es obvia al ins
peccionar la tabla 8-15 es A , B, C y D.
Para ilustrar apropiadam ente la utilidad de esta proyeccin, suponga que se realiza un experim ento
p ara m ejorar la eficiencia de un molino de bolas y los siete factores son los siguientes:
1.
2.
3.
4.
5.
6.
7.

Velocidad del m otor


M uesca
M odo de alimentacin
Tkmao de la alim entacin
Tipo de m aterial
ngulo de la criba
Nivel de vibracin de la criba

Se tiene u na certeza razonable de que la velocidad del m otor, el tam ao de la alim entacin y el tipo de
m aterial afectarn la eficiencia y que adems estos factores pueden interactuar. Se sabe m enos del papel
de los otros tres factores, pero es probable que sean insignificantes. U na estrategia razonable sera asig
nar la velocidad del m otor, el modo de aum entacin, el tam ao de la alim entacin y el tipo de m aterial a
las columnas A , B, C y D , respectivam ente, de la tabla 8-15. L a muesca, el ngulo de la criba y el nivel de
vibracin de la criba se asignaran a las columnas E, F y G, respectivam ente. Si se est en lo correcto y las
variables m enores E, F y G son insignificantes, quedar un diseo 24 com pleto en las variables clave del
proceso.
Separacin en bloques de diseos factoriales fraccionados
Ocasionalm ente, un diseo factorial fraccionado requiere tantas corridas que no es posible realizarlas to
das bajo condiciones hom ogneas. En estas situaciones, los diseos factoriales fraccionados pueden con
fundirse o mezclarse en bloques. La tabla X II del apndice contiene los arreglos recom endados para la
separacin en bloques de varios de los diseos factoriales fraccionados de la tabla 8-14. El tam ao m ni
mo de los bloques p ara estos diseos es de ocho corridas.
Para ilustrar el procedim iento general, considere el diseo factorial fraccionado 2 ^ 2 con la relacin
de definicin / = A B C E = BC D F = A D E F que se m uestra en la tabla 8-10. Este diseo fraccionado con
tiene 16 com binaciones de tratam ientos. Suponga que quiere correrse este diseo en dos bloques con
ocho com binaciones de tratam ientos cada uno. Al seleccionar una interaccin para confundirla con los
bloques, se observa por el examen de la estructura de los alias de la tabla X II(f) del apndice que hay dos

332

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Bloque 1

Bloque 2

(1)

ae

abf

acf

cef

bef

abce

bc

abef

df

bde

abd

acd

cde

bcdf

abcdef

El diseo
Figura 8-18
en dos bloques con ABD con
fundida.

series de alias que incluyen nicam ente interacciones de tres factores. La tabla sugiere seleccionar ABD
(y sus alias) para confundirla con los bloques. Se obtendran as los dos bloques que se m uestran en la fi
gura 8-18. Observe que el bloque principal contiene las combinaciones de tratam ientos que tienen un n
m ero igual de letras en comn con A B D . Son tam bin las combinaciones de tratam ientos para las que
L = jcj + x 2 + x 4 = 0 (m od 2).

EJEMPLO 8 - 6 ....................................................................................................................................
Se usa una m quina CNC de cinco ejes para m aquinar un propulsor utilizado en un m otor de turbina. Los
perfiles de los labes son una caracterstica im portante de la calidad. Especficam ente, es de inters la
desviacin del perfil del labe del perfil especificado en el plano de ingeniera. Se corre un experim ento
p ara determ inar cules son los parm etros de la m quina que afectan la desviacin del perfil. Los ocho
factores seleccionados en el diseo son los siguientes:

Factor

A = desviacin en el eje* (0.001 pulg)


B desviacin en el eje_y (0.001 pulg)
C = desviacin en el e je z (0.001 pulg)
D - fabricante de la herram ienta
E = desviacin del eje a (0.001 grados)
F = velocidad del arem etro (%)
G = altura de la plantilla sujetadora (0.001 pulg)
H = velocidad de alimentacin (%)

Nivel bajo (-)


0
0
0
1
0
90
0
90

Nivel alto ( + )
15
15
15
2
30
110
15
110

Se selecciona un labe de prueba en cada pieza p ara inspeccionarlo. L a desviacin del perfil se mide utili
zando una m quina de medicin coordenada, y la desviacin estndar de la diferencia entre el perfil real y
el perfil especificado se usa como la variable de respuesta.
La m quina tiene cuatro arem etros. Puesto que puede haber diferencias en los arem etros, los in
genieros del proceso piensan que stos debern tratarse como bloques.
Los ingenieros se sienten confiados de que las interacciones de tres o ms factores no son muy im por
tantes, pero estn renuentes a ignorar las interacciones de dos factores. Por la tabla 8-14, inicialm ente dos

8-4 EL DISEO FACTORIAL FRACCIONADO 2M GENERAL

333

diseos parecen ser apropiados: el diseo 2 ^ 4 con 16 corridas y el diseo 2 ^ 3 con 32 corridas. L a tabla
X II(l) del apndice indica que si se usa el diseo con 16 corridas, habr un nm ero considerable de alias
con interacciones de dos factores. Adems, este diseo no puede correrse en cuatro bloques sin confundir
cuatro interacciones de dos factores con los bloques. P or lo tanto, los experim entadores deciden usar el
diseo 2 ^ 3 en cuatro bloques. E n este diseo se confunden con los bloques una cadena de alias de in
teracciones de tres factores y una interaccin de dos factores (EH ) y sus alias de interacciones de tres fac
tores. La interaccin E H es la interaccin entre la desviacin del eje a y la velocidad de alim entacin, y los
ingenieros consideran que u n a interaccin entre estas dos variables es altam ente improbable.
L a tabla 8-16 contiene el diseo y las respuestas resultantes en trm inos de desviacin estndar x 103
pulg. Puesto que la variable de respuesta es una desviacin estndar, con frecuencia es m ejor efectuar el
anlisis despus de u na transform acin logartmica. E n la tabla 8-17 se m uestran las estim aciones de los
efectos. L a figura 8-19 es una grfica de probabilidad norm al de las estim aciones de los efectos, utilizando
ln (desviacin estndar x 103) como la variable de respuesta. Los nicos efectos grandes son A = desvia
cin del eje x, B = desviacin del eje y, y la cadena de alias que incluye A D + B G . A hora bien, A D es la in-

El diseo 2a-3 en cuatro bloques del ejemplo 8-6

Tabla 8-16

irrid a
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

Diseo bsico
A B
C D E

+
+

+
+

+
+

+
+
+
+

+
+

+
+

+
+
+
+

+
+
+
+
+
+
+
+

+
+

+
+

+
+

+
+
+
+

+
+

+
-

+
+

F = A B C G = ABD H = BCDE

+
+
+
+
+
+

+
+
h
+

+
+
+
+

+
+
+
+
+
+
+
+

+
+

+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+

+
+

+
+

+
-

+
+

+
+

+
+
+
+
-

+
+

+
+

+
+

+
+

Bloque de las corridas


18
3
2
16
4
29
4
1
1
6
4
26
2
14
3
22
1
8
32
4
15
2
3
19
3
24
2
11
4
27
1
3
2
10
21
3
1
7
4
28
4
30
1
2
3
17
2
13
4
25
1
1
3
23
2
12
2
9
3
20
1
5
4
31

(X HPpi
2.76
6.18
2.43
4.01
2.48
5.91
2.39
3.35
4.40
4.10
3.22
3.78
5.32
3.87
3.03
2.95
2.64
5.50
2.24
4.28
2.57
5.37
2.11
4.18
3.96
3.27
3.41
4.30
4.44
3.65
4.41
3.40

CAPTULO 8

334

Tabla 8-17

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Estimaciones de los efectos, coeficientes de regresin y sumas de cuadrados del ejemplo 8-6

Variable
A
B
C
D
E
F
G
H
Variable"
Promedio global
A
B
C
D
E
F
G
H
AB + CF + DG
AC + BF
AD + BG
AE
A F + BC
A G + BD
AH
BE
BH
CD + FG
CE
CG + DF
CH
DE
DH
EF
EG
EH
FH
GH
ABE
ABH
ACD

Nombre
Desviacin del eje at
Desviacin del eje y
Desviacin del ejez
Fabricante de la herramienta
Desviacin del eje a
Velocidad del aremetro
Altura de la plantilla sujetadora
Velocidad de alimentacin
Coeficiente de regresin
1.28007
0.14513
-0.10027
-0.01288
0.05407
-2.531E-04
-0.01936
0.05804
0.00708
-0.00294
-0.03103
-0.18706
0.00402
-0.02251
0.02644
-0.02521
0.04925
0.00654
0.01726
0.01991
-0.00733
0.03040
0.00854
0.00784
-0.00904
-0.02685
-0.01767
-0.01404
0.00245
0.01665
-0.00631
-0.02717

"Slo los efectos principales y las interacciones de dos factores.

Nivel -1
0
0
0
1
0
90
0
90
Efecto estimado
0.29026
-0.20054
-0.02576
0.10813
-5.063E-04
-0.03871
0.11608
0.01417
-0.00588
-0.06206
-0.37412
0.00804
-0.04502
0.05288
-0.05042
0.09851
0.01309
0.03452
0.03982
-0.01467
0.06080
0.01708
0.01569
-0.01808
-0.05371
-0.03534
-0.02808
0.00489
0.03331
-0.01261
-0.05433

Nivel +1
15
15
15
2
30
110
15
110
Suma de cuadrados
0.674020
0.321729
0.005310
0.093540
2.050E-06
0.011988
0.107799
0.001606
2.767E-04
0.030815
1.119705
5.170E-04
0.016214
0.022370
0.020339
0.077627
0.001371
0.009535
0.012685
0.001721
0.029568
0.002334
0.001969
0.002616
0.023078
0.009993
0.006308
1.914E-04
0.008874
0.001273
0.023617

8-4 EL DISEO FACTORIAL FRACCIONADO 2 ^ GENERAL

335

Estimaciones de los efectos

Figura 8-19 Grfica de probabilidad normal de las estimaciones de los efectos


del ejemplo 8-6.

teraccin desviacin del eje jc-fabricante de la herram ienta, y B G es la interaccin desviacin del eje
_y-altura de la plantilla sujetadora, y como estas dos interacciones son alias es imposible separarlas con
base en los datos del experim ento en curso. Puesto que ambas interacciones incluyen un efecto principal
grande, tam bin es difcil aplicar cualquier simplificacin lgica obvia en esta situacin. Si se contara
con algn conocim iento de ingeniera o del proceso que arrojara luz sobre la situacin, entonces quiz po
dra hacerse u na eleccin entre las dos interacciones; en caso contrario, se necesitarn ms datos p ara se
p arar estos dos efectos (el problem a de agregar corridas en un diseo factorial fraccionado p ara separar
los alias de las interacciones, se estudia en la seccin 8-5 y en el m aterial suplem entario de este captulo).
Suponga que el conocim iento del proceso sugiere que posiblem ente la interaccin apropiada sea A D .
La tabla 8-18 es el anlisis de varianza resultante p ara el m odelo con los factores A , B, D y A D (el factor D
se incluy p ara preservar el principio de jerarqua). Observe que el efecto del bloque es pequeo, lo cual
sugiere que los arem etros de la m quina no son muy diferentes.
L a figura 8-20 es una grfica de probabilidad norm al de los residuales de este experim ento. E sta gr
fica sugiere la presencia de colas ligeram ente ms gruesas que las norm ales, p or lo que posiblem ente de-

Tabla 8-18

Anlisis de varianza del ejemplo 8-6

Suma de
G rados de
Fuente de variacin_________ cuadrados________ libertad

A
B
D
AD
Bloques
E rror
Tbtal

0.6740
0.3217
0.0935
1.1197
0.0201
0.4099
2.6389

1
1
1
1
3
24
31

C uadrado
medio
0.6740
0.3217
0.0935
1.1197
0.0067
0.0171

F0

Valor P

39.42
18.81
5.47
65.48

<0.0001
0.0002
0.0280
<0.0001

336

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

001 x d

Residuales

Figura 8-20

Grfica de probabilidad normal de los residuales del ejemplo 8-6.

Desviacin del eje i (A)


F igura 8-21

G rfica d e la in teraccin A D para e l ejem plo 8-6.

8-5 DISEOS DE RESOLUCIN DI

1.247

337

1.273

Figura 8-22 El diseo 2^.3 del ejemplo 8-6 proyectado en cuatro


rplicas de un diseo 23 en los factores A, B y D.

ban considerarse otras transform aciones. La grfica de la interaccin A D se presenta en la figura 8-21.
Observe que el fabricante de la herram ienta (D ) y la m agnitud de la desviacin del eje je (A ) tienen un im
pacto profundo en la variabilidad, del perfil del labe, de las especificaciones de diseo. C o rre r en el ni
vel bajo (0 desviacin) y com prar las herram ientas al fabricante 1 produce los m ejores resultados. En la
figura 8-22 se m uestra la proyeccin de este diseo 2 ^ 3 en cuatro rplicas de un diseo 23 en los factores
A , B y D. La m ejor com binacin de las condiciones de operacin es A en el nivel bajo (0 desviacin), B en
el nivel alto (0.015 en desviacin) y D en el nivel bajo (fabricante de herram ientas 1).

8-5

DISEOS DE RESOLUCIN III

Como se seal anteriorm ente, el uso secuencial de los diseos factoriales fraccionados es muy til, lle
vando con frecuencia a una gran economa y eficiencia de la experim entacin. Se ilustran ahora estas
ideas utilizando la clase de los diseos de resolucin III.
Es posible construir diseos de resolucin III para investigar hasta k = N - 1 factores en slo N corri
das, donde N es un mltiplo de 4. Con frecuencia estos diseos son tiles en la experim entacin indus
trial. Los diseos en los que N es una potencia de 2 pueden construirse con los m todos presentados
anteriorm ente en este captulo, y stos se presentan prim ero. D e particular im portancia son los diseos
que requieren 4 corridas para hasta 3 factores, 8 corridas para hasta 7 factores y 16 corridas p ara hasta 15
factores. Si k = N - 1, se dice que el diseo factorial fraccionado est saturado.
U n diseo para analizar hasta tres factores en cuatro corridas es el diseo 2 ^ ', el cual se present en
la seccin 8-2. O tro diseo factorial fraccionado saturado muy til es el diseo para estudiar siete factores
en ocho corridas, es decir, el diseo 2 n 4 . Este diseo es una fraccin un dieciseisavo del diseo 27. Puede
construirse apuntando prim ero los niveles positivos y negativos de un diseo 23 com pleto en A , B y C
como el diseo bsico, y asociando despus los niveles de cuatro factores adicionales con las interacciones
de los tres factores originales de la siguiente m anera: D = A B , E = A C ,F = B C y G = A B C . Por lo tanto,
los generadores de este diseo son I = A B D , I = A C E , I BC F e / = A B C G . El diseo se m uestra en la ta
bla 8-19.

338
Tabla 8-19

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DO S NIVELES

El diseo 27
m 4 con los generadores 1 ABD, I = ACE, J = BCF e I = ABCG
Diseo bsico

Corrida

D =AB

E=AC

F = BC

1
2
3
4
5
6
7
8

+
+

+
+

+
+
+
+

+
+

+
+

G=ABC
-

+
+

def
afg
beg
abd
cdg
ace
bcf
abcdefg

La relacin de definicin com pleta de este diseo se obtiene m ultiplicando entre s los cuatro genera
dores ABD, A C E , B C F yA B C G de dos en dos, de tres en tres y los cuatro a la vez, de donde se obtiene
/ = A B D = A C E = BC F = A B C G = BC D E = AC D F = CDG
= A B E F = B E G = A F G - D EF = A D E G = CEFG= BDFG = ABC D EFG
Para encontrar los alias de cualquier efecto, sim plemente se multiplica el efecto por cada palabra de la re
lacin de definicin. Por ejemplo, los alias de B son
B = A D = A B C E = C F = A C G = C D E= A B C D F = B C D G - A E F = E G
= A B F G = BD EF = A B D E G = BCEFG = D FG = AC D EFG
Este diseo es una fraccin un dieciseisavo, y como los signos elegidos p ara los generadores son posi
tivos, se trata de la fraccin principal. Es tam bin de resolucin III porque el nm ero m enor de letras de
cualquier palabra de la definicin de contraste es tres. C ualquiera de los 16 diferentes diseos 2^4 de esta
familia podra construirse utilizando los generadores con 1 de los 16 arreglos posibles de los signos en
I = A B D , I = A C E , I = BC F, I = A B C G .
Los siete grados de libertad de este diseo pueden usarse para estim ar los siete efectos principales.
C ada uno de estos efectos tiene 15 alias; sin embargo, si se supone que las interacciones de tres o ms fac
tores son insignificantes, se consigue entonces una simplificacin considerable en la estructura de los alias.
Estableciendo este supuesto, cada una de las com binaciones lineales asociadas con los siete efectos
principales de este diseo es en realidad una estim acin del efecto principal y las tres interacciones de dos
factores:
t A * A + B D + C E + F G
B -* B + A D + C F + E G
l c ~*C + AE+ BF+ D G
l D -* D + A B + C G + E F

(8-1)

i E -* E + A C + B G + D F
p - F + B C + A G + D E
ea

G+CD+BE+AF

Estos alias se encuentran en la tabla X II(h) del apndice, ignorando las interacciones de tres factores y de
rdenes superiores.

8-5 DISEOS DE RESOLUCIN III

339

El diseo saturado 2 7~4 de la tabla 8-19 puede usarse para obtener diseos de resolucin III para es
tudiar m enos de siete factores en ocho corridas. Por ejemplo, para generar un diseo para seis factores en
ocho corridas, sim plemente se elimina cualquiera de las columnas de la tabla 8-19, digamos la G. Se obtie
ne as el diseo que se m uestra en la tabla 8-20.
Es sencillo verificar que este diseo es tam bin de resolucin III; de hecho es un diseo
3, o una
fraccin un octavo, del diseo 26. La relacin de definicin del diseo 2fn3 es igual a la relacin de defini
cin del diseo 2,7 4 original, con las palabras que incluyen la letra G eliminadas. Por lo tanto, la relacin
de definicin del nuevo diseo es
/ = A B D = A C E = BCF = BCDE = A C D F = A B E F = D EF
E n general, cuando se elim inan d factores para producir un nuevo diseo, la nueva relacin de definicin
se obtiene de las palabras de la relacin de definicin original que no contienen ninguna de las letras eli
m inadas. Cuando se construyen diseos con este m todo, deber prestarse atencin para obtener el m e
jo r arreglo posible. Si se eliminan las columnas B, D , F y G de la tabla 8-19, se obtiene un diseo para tres
factores en ocho corridas, no obstante que las com binaciones de tratam ientos corresponden a dos rpli
cas de un diseo 2 \ Probablem ente el experim entador preferira correr un diseo 23 com pleto en^4, Cy E.
Tkmbin es posible obtener un diseo de resolucin III para estudiar hasta 15 factores en 16 corridas.
E ste diseo 2 m11 saturado puede generarse apuntando prim ero las 16 combinaciones de tratam ientos
asociadas con un diseo 24 en A , B, C y D e igualando despus 11 nuevos factores con las interacciones de
dos, tres y cuatro factores de los cuatro factores originales. En este diseo, cada uno de los 15 efectos prin
cipales es alias de siete interacciones de dos factores. Puede usarse un procedim iento similar para el dise
o 2 ^ 26, lo cual perm ite el estudio de hasta 31 factores en 32 corridas.

Ensamblaje secuencial de fracciones para separar efectos


M ediante la combinacin de diseos factoriales fraccionados en los que se han intercam biado ciertos sig
nos, es posible aislar de m anera sistemtica los efectos de inters potencial. A este tipo de experim ento
secuencial se le llam a doblez o plegado (fold over) del diseo original. La estructura de los alias de cual
quier fraccin con los signos de uno o ms de los factores invertidos se obtiene haciendo el cambio de sig
no apropiado en los factores de la estructura de los alias de la fraccin original.

Tabla 8-20
C orrida
1
2
3

El diseo 2{j,3 con los generadores I = ABD, I = ACE e I = BCF

Diseo bsico
B
C

+
-

5
6
7
8

+
+

+
+

+
+
+
+

D - AB

E =AC

F = BC

+
+

+
+

+
+

+
+

+
+

def
af
be
abd
cd
ace
bcf
abcdef

340

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Considere el diseo 2 7B~4 de la tabla 8-19. Suponga que junto con esta fraccin principal se corre tam
bin un segundo diseo fraccionado con los signos invertidos en la columna del factor D. Es decir, la co
lum na de D de la segunda fraccin es
-+ + ++Los efectos que pueden estim arse a partir de la prim era fraccin se m uestran en la ecuacin 8-1, y a partir
de la segunda fraccin se obtiene
l'A -+ A - B D + C E + F G
i'B -* B - A D + C F + E G
i'c -> C + A E + B F - D G
es decir,

t D- D -A B -C G -E F
l D - -D + A B + C G + E F
t 'E E + A C + B G - D F

i'F - F + B C + A G - D E
l'c G - C D + B E + A F
suponiendo que no son significativas las interacciones de tres factores y de rdenes superiores. A hora
bien, a p artir de las dos combinaciones lineales de los efectos j( + ') y \ ( t - f ,) se obtiene

*_________ Dej(<i + 4)_________Pe K* ~


A
B
C
D
E
F
G

A + CE + FG
B + CF + E G
C+ AE+ BF
D
E + A C + BG
F + BC+AG
G + BE+AF

t )

BD
AD
DG
A B + CG +EF
DF
DE
CD

Por lo tanto, se ha aislado el efecto principal de D y todas sus interacciones de dos factores. E n gene
ral, si a un diseo fraccionado de resolucin III o mayor se le agrega una fraccin adicional con los signos
de un solo factor invertidos, entonces el diseo com binado producir las estim aciones del efecto principal
de ese factor y sus interacciones de dos factores.
Suponga ahora que a un diseo fraccionado de resolucin III se le agrega una segunda fraccin en la
que los signos de todos los factores estn invertidos. Este tipo de doblez (llamado en ocasiones doblez com
pleto o reflexin) rom pe los vnculos de alias entre los efectos principales y las interacciones de dos facto
res. Es decir, puede usarse el diseo combinado para estim ar todos los efectos principales quitados de
todas las interacciones de dos factores. En el siguiente ejemplo se ilustra la tcnica.

EJEMPLO 8 - 7 ........................................................................... .........................................................


U n analista de desem peo hum ano conduce un experim ento para estudiar el tiem po de enfoque del ojo y
ha construido un aparato en el que pueden controlarse varios factores durante la prueba. Los factores
que considera im portantes inicialm ente son la agudeza o claridad visual (A), la distancia del objetivo al
ojo (5), la form a del objetivo (C), el nivel de iluminacin ( D ) , el tam ao del objetivo ( ), la densidad del
objetivo (F ) y el sujeto (G). Se consideran dos niveles de cada factor. El analista sospecha que slo algu
nos de estos siete factores son de im portancia principal y que pueden omitirse las interacciones de rde-

8'5 DISEOS DE RESOLUCIN III

Tabla 8-21

341

D ise o 2 ni
^ 4 para
r ' e l ex p erim en to d el tiem p o d e en foq u e del ojo

D is e o b sic o
T ie m p o

C o rrid a

D A B

E =AC

F = BC

G = ABC

1
2
3
4
5
6
7
8

def

+
+

+
+

+
+

+
+

a fs
beg
abd
cdg
ace
bcf
a bcdefg

+
+

+
+
+
+

85.5
75.1
93.2
145.4
83.7
77.6
95.0
141.8

nes superiores entre los factores. Con base en este supuesto, el analista decide correr un experim ento de
tam izado para identificar los factores ms im portantes para despus enfocar el estudio en los mismos.
P ara explorar estos siete factores, el experim entador corre las combinaciones de tratam ientos del diseo
2 j4 de la tabla 8-19 de m anera aleatoria, obteniendo los tiem pos de enfoque en milisegundos, como se
m uestra en la tabla 8-21.
A p artir de estos datos pueden estimarse siete efectos principales y sus alias. Por la ecuacin 8-1 se
observa que los efectos y sus alias son
i A=

20.63 -* A + B D + C E + FG

eB=

38.38 * B + A D + C F + E G

i c = -0 .2 8 -* C + A E + B F + D G
t D = 28.88 -* D + A B + C G + E F
e = - 0 . 2 8 -> E + A C + B G + D F
F = 0.63 -*F + B C --A G + D E
l G = - 2.43 -*G + C D + B E + A F
P or ejemplo,
i A = i( - 8 5 .5 + 7 5 .1 - 9 2 + 1 4 5 .4 - 8 3 .7 + 7 7 .6 - 95.0+141.8)= 20.63
Los tres efectos ms grandes son
La interpretacin ms simple de los datos es que los efectos
principales de A , B y D son todos significativos. Sin embargo, esta interpretacin no es nica, ya que otra
conclusin lgica sera q u e A ^ y Ia interaccinAB, o quiz B ,D y la interaccin BD, o tal v e z A , D y la in
teraccin A D son los verdaderos efectos.
Observe que ABD es una palabra en la relacin de definicin de este diseo. Por lo tanto, este diseo
2 7m A no se proyecta en un factorial 23 en ABD; en cambio, se proyecta en dos rplicas de un diseo 23_1,
como se ilustra en la figura 8-23. Puesto que el diseo 23"1 es de resolucin III, A ser alias de BD, B ser
alias de AD y D ser alias de A , por lo que no es posible separar las interacciones de los efectos principa
les. E n este caso, quiz el analista haya tenido m ala suerte. Si hubiera asignado el nivel de iluminacin a C
en lugar de aD , el diseo se habra proyectado en un diseo 23 completo, y la interpretacin podra haber
sido ms sencilla.
Para separar los efectos principales y las interacciones de dos factores, se corre una segunda fraccin
con todos los signos invertidos. Este doblez del diseo se m uestra en la tabla 8-22, junto con las respuestas
observadas. N ote que cuando se hace el doblez de un diseo de resolucin III de esta m anera, de hecho se

342

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DO S NIVELES

Figura 8-23 El diseo 2


proyectado en
dos rplicas de un diseo 2 ^ ' m A ,B y D .

cambian los signos de los generadores que tienen un nm ero im par de letras. Los efectos estimados por
esta fraccin son
t A = - 17.68 - + A - B D - C E - FG
t'B =

37.73 - B - A D - C F - E G

l'c = -3.33 -* C A E B F D G
e'D = 29.88 -* D - A B - C G E F
t'E =

0.53 ^ E - A C - B G - D F

e'F =

1.63 - F B C - A G D E

l'G =

2.68 - G - C D B E - A F

Al com binar esta segunda fraccin con la original se obtienen las siguientes estim aciones de los efectos:
i

D e * ( / , + / ', )

A
B
C
D
E
F
G

A
B
C
D
E
F
G

=
1.48
= 38.05
= -1 .8 0
= 29.38
=
0.13
=
0.50
=
0.13

BD
AD
AE
AB
AC
BC
CD

D e \ ( . - * '< )
19.15
0.33
1.53
- 0 .5 0
- 0 .4 0
-1 .5 3
-2 .5 5

+
+
+
+

+ FG =
+ EG =
+ DG
+EF
+ DF =
+ DE =
+AF

CE
CF
BF
CG
+ BG
+ AG
+ BE

Un doblez del diseo 2a 4 en el experimento del tiempo de enfoque del ojo

Tabla 8-22

Diseo bsico
Corrida
1
2
3
4

5
6
7
8

+
+
+
+
-

+
+
+
+
-

+
+
+
+
-

D = -A B

E = -A C

F -B C

G =ABC

+
+
+
+
-

+
+
+
+
-

+
+
+
+
-

+
+
+
-

Tiempo
abcg
bcde
acdf
cefg
abef
bdfg
adeg
(1)

9 1 .3
1 3 6 .7
8 2 .4
7 3 .4
9 4 .1
1 4 3 .8
8 7 .3
7 1 .9

8-5 DISEOS DE RESOLUCIN III

343

Los dos efectos ms grandes son B y D. Adems, el tercer efecto ms grande es BD + CE + FG, por lo
que parece razonable atribuir esto a la interaccin BD. El analista us los dos factores, distancia (B) y ni
vel de iluminacin (D ), en experim entos subsecuentes con los dem s facto res^, C, E y F en ajustes estn
dar, y verific los resultados obtenidos aqu. Decidi usar los sujetos como bloques en estos nuevos
experim entos en lugar de ignorar el efecto potencial del sujeto debido a que fue necesario utilizar varios
sujetos diferentes p ara com pletar el experimento.

La relacin de definicin para u n diseo de doblez


L a combinacin de diseos factoriales fraccionados por m edio de un doblez, como la que se hizo en el
ejemplo 8-7, es una tcnica muy til. Con frecuencia es de inters conocer la relacin de definicin del di
seo combinado. Puede determ inarse con facilidad. Cada fraccin separada tendr L + U palabras usa
das como generadores: L palabras con el mismo signo y U palabras con signos diferentes. E n el diseo
com binado se usarn L + U - 1 palabras como generadores. Estas sern lasL palabras con el mismo signo
y las U - 1 palabras que constan de productos pares independientes de las palabras que tienen signos dife
rentes. (Los productos pares son las palabras tom adas de dos en dos, de cuatro en cuatro, etctera.)
Para ilustrar este procedim iento, considere el diseo del ejem plo 8-7. Para la prim era fraccin, los ge
neradores son
I = ABD,

I = AC E,

1 = BCF

7 = ABCG

y para la segunda fraccin son


I = ABD,

1 = -A C E ,

I = -B C F

1= ABCG

Observe que en la segunda fraccin se han intercam biado los signos de los generadores con un nm ero
im par de letras. Asimismo, observe que L + i 7 = l + 3 = 4. El diseo com binado te n d r / = A B C G (la p a
labra con el mismo signo) como generador y dos palabras que son productos pares independientes de las
palabras con signos diferentes. Por ejemplo, tm ese / = A B D e I = A C E; entonces I = (ABD )(AC E) =
B C D E es un generador del diseo combinado. Asimismo, tm ese / = A B D e I = BC F; entonces
I = (ABD )(BCF) = A C D F es un generador del diseo combinado. La relacin de definicin com pleta
p ara el diseo com binado es
I = A B C G = BC D E = A C D F = A D E G = BDFG = A B E F = CEFG
Diseos de Plackett-Burman
Estos diseos, atribuidos a Plackett y Burman, son diseos factoriales fraccionados de dos niveles para es
tudiar k = N - 1 variables en N corridas, donde N es un mltiplo de 4. Si ATes una potencia de 2, estos dise
os son idnticos a los que se presentaron anteriorm ente en esta seccin. Sin embargo, para N = 12,20,
24,28 y 36, los diseos de Plackett-Burm an en ocasiones son de inters. Puesto que estos diseos no p ue
den representarse como cubos, en ocasiones se les llam a diseos no geomtricos.
E n la m itad superior de la tabla 8-23 se presentan los renglones de signos positivos y negativos que se
usan para construir los diseos de Plackett-Burm an para N = 1 2 ,2 0 ,24 y 36, m ientras que en la m itad in
ferior de la tabla se presentan los bloques de signos positivos y negativos para construir el diseo para N =
28. Los diseos para N = 12, 20, 24 y 36 se obtienen escribiendo el rengln apropiado de la tabla 8-23
como una colum na (o rengln). Entonces se genera una segunda colum na (o rengln) a p artir de la pri
m era moviendo los elem entos de la columna (o rengln) hacia abajo (o hacia la derecha) una posicin y
colocando el ltim o elem ento en la prim era posicin. U na tercera colum na (o rengln) se produce a p ar
tir de la segunda de m anera similar, y el proceso se contina hasta que se genera la colum na (o rengln) k.

344
Tabla 8-23

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Signos positivos y negativos para los diseos de Plackett-Burman

fc = 11, JV = 12+ + - + + + ------ + 1


+
+
1
1
1
1
1
1
+
1
+
1
1
1
+
1
1
1
+
1
1
+

1
+
1
1
+
+

* = 27, N = 28

+1

+
+
+
1

k =19, iV = 20 + + - - + + + + - + - +
k =23, N = 24 + + + + + - + - + + - - + +
k = 35 N = 36 1-----I-+ H---------- 1-+ + + +

+ - + + + + -----+ + + + H-------- + + + + + ----------- + - + + + +


+ H---- h + +
-------- + + + + +
+ + + ------ + - +
+ + + ------ + + + + + -------- + +

+ +-+-++-+
-+ + ++-++H ---- 1---+ H ---- h +
+-+ ++-+-+
++ --+ + + + -+ ++ -+ -+ +
+-+ +-++++ + -+ + --+ +
-+ + -+++-+

----+ + - - + - 1
+
1
1
+
1
1
1
+
1

+
1
+
1
1

+ -------- + + ---1
+
1
1
1
+
1
+
1
1
+
1
+
1
1
+
1
1
+ ----+ --------- +
t

!
+

Despus se agrega un rengln de signos negativos, com pletndose as el diseo. P ara AT = 28, los tres blo
ques X, Y y Z se apuntan en el orden
X

Y Z

Z X

Y Z X
y se agrega un rengln de signos negativos a estos 27 renglones. El diseo para TV = 12 corridas y k = 11
factores se m uestra en la tabla 8-24.
Los diseos no geom tricos de Plackett-Burm an para TV= 12,20,24,28 y 36 tienen estructuras de los
alias muy intrincadas. Por ejemplo, en el diseo de 12 corridas, todos los efectos principales son alias p a r
ciales de cada una de las interacciones de dos factores en los que no estn incluidos. Por ejemplo, la in
teraccin A B es alias de los nueve efectos principales C, D, ..., K. Adems, cada uno de los efectos
principales son alias parciales de 45 interacciones de dos factores. E n diseos ms grandes, la situacin es
todava ms compleja. Se recom ienda al experim entador usar estos diseos con mucho cuidado.

Tabla 8-24

Diseo de Plackett-Burman para N = 12, k = 11

Corrida

1
2
3
4
5
6
7
8
9
10
11
12

+
+

+
+

+
+
+

+
+

+
+
+

+
+

+
+
+

+
+
+

+
+
-

+
+
+

+
+
+

+
+
-

+
+

+
+
+

+
+

+
+

+
+

+
+
+

+
+
+
-

+
+

8'5 DISEOS DE RESOLUCIN III

345

o) Proyeccin en tres factores

i Proyeccin en cuatro factores

Figura 8-24 Proyeccin del diseo de Plackett-Burman de 12 corridas


en diseos de tres y cuatro factores.

Las propiedades proyectivas de los diseos no geom tricos de Plackett-Burm an no son avasalladora
m ente atractivas. Por ejemplo, considere el diseo de 12 corridas de la tabla 8-24. E ste diseo se proyecta
r en tres rplicas de un diseo 22com pleto en dos cualesquiera de los 11 factores originales. Sin embargo,
en tres factores, el diseo proyectado es un diseo 23com pleto ms un factorial fraccionado 2 j1 (ver la fi
gura 8-24a). Por lo tanto, el diseo de Plackett-Burm an de resolucin III tiene proyectividad 3, lo cual sig
nifica que se plegar en un diseo factorial com pleto en cualquier subconjunto de tres factores. E l diseo
2 kj^p slo tiene proyectividad 2. Las proyecciones de cuatro dimensiones se m uestran en la figura 8-24fe.
Observe que estas proyecciones de tres y cuatro factores no son diseos balanceados.

EJEMPLO 8 - 8 ................................................................................................. ..................................


Se ilustrarn algunas de las dificultades potenciales asociadas con los diseos de Plackett-Burm an utili
zando el diseo de 11 variables con 12 corridas y un conjunto de datos simulados. Se supondr que el p ro
ceso tiene tres efectos principales significativos (A, B, D ) y dos interacciones significativas de dos factores
(AB y A D ). El m odelo es
_y= 2 0 0 + 8 ^ + 1 0 a;2 + 1 2 x 4 - 1 2 * ^

+ 9 ^ ^ +e

donde cada*; es una variable codificada definida en el intervalo -1 , +1 y e es un trm ino NID (0, 9) del
erro r aleatorio. Por lo tanto, tres de los k = 11 factores son grandes, y hay dos interacciones grandes; la si
tuacin no est fuera de razn.
E n la tabla 8-25 se presenta el diseo de Plackett-Burm an con 12 corridas y las respuestas simuladas.
E ste diseo luce diferente al diseo de 12 corridas de la tabla 8-24 porque se construy utilizando el ren-

346

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Tabla 8-25 Diseo de Plackett-Burman para el ejemplo 8-8


Corrida
A
B
C
D
E
F
1
2
3
4
5
6
7
8
9
10
11
12

Respuesta

+
+

+
+

+
+

231
207
230
217
175
176
183
185
181
220
229

168

+
+

+
+

+
+

+
+

+
+
+

+
+
+

+
-

+
+
+

+
+

+
+

+
+
-

+
+

+
-

+
+
+

+
+

+
+
+

+
+
+

+
+
+

+
+

gln de signos para k = 11, N = 12 de la tabla 8-23 como rengln. E n la tabla 8-26 se m uestran las estim a
ciones de los efectos. Observe que hay siete efectos grandes: A , B, C, D, E, J y K ( y , dpsde luego, sus alias).
No es evidente de inm ediato que algunos de estos efectos podran ser interacciones. P arte de esta ambi
gedad podra resolverse haciendo el doblez del diseo. Con esto p or lo general se resolvern los efectos
principales, pero con frecuencia sigue dejando al experim entador con la incertidum bre acerca de los efec
tos de las interacciones.

L a dificultad para interpretar un diseo de Plackett-Burm an, ilustrada en el ejemplo anterior, ocurre
con m ucha frecuencia en la prctica. Si la eleccin est entre un diseo geom trico 2 1^ 1 con 16 corridas o
un diseo de Plackett-Burm an con 12 corridas que quiz tenga que doblarse (para lo cual se requeriran
24 corridas), el diseo geomtrico puede resultar una m ejor eleccin. Para mayores detalles ver M ontgo
mery, B orror y Stanley [81]. Bajo ciertas condiciones, los alias de un diseo no geom trico de Plac-

Tabla 8-26 Estimaciones de los efectos, coeficientes de regresin y sumas de cuadrados del ejemplo 8-8
Variable0
Prom edio global

A
B
C
D
E
F
G
H
J
K
L

Coeficiente de regresin
200.167
6.333
6.667
6.833
17.000
6.833
0.500
-1.167
1.500
-6.333
-5.833
-0.167

Efecto estimado

Suma de cuadrados

12.667
13.333
12.667
34.000
13.667
1.000
-2.333
3.000
-12.667
-11.667
-0.333

481.333
533.333
560.333
3468.000
560.333
3.000
16.333
27.000
481.333
408.333
0.333

Todos los efectos principales son alias parciales de 45 interacciones de dos factores.

8-6 DISEOS DE RESOLUCIN IV Y V

347

kett-B urm an pueden desenredarse utilizando tcnicas de construccin de modelos de regresin. Esto se
analiza en H am ada y W u [53].

8*6

DISEOS DE RESOLUCIN IV Y V

U n diseo factorial fraccionado 2*~p es de resolucin IV si los efectos principales estn separados de las
interacciones de dos factores y algunas interacciones de dos factores son alias entre s. Por lo tanto, si se
suprim en las interacciones de tres factores y de rdenes superiores, los efectos principales pueden esti
m arse directam ente en un diseo 2 \p . U n ejem plo es el diseo 2 ^ 2 de la tabla 8-10. Adems, las dos
fracciones combinadas del diseo 2 n 4 del ejem plo 8-7 producen un diseo 2j3.
C ualquier diseo 2 ^ P debe incluir al m enos 2k corridas. A los diseos de resolucin IV que contie
nen exactam ente 2k corridas se les llam a diseos m nim os. Los diseos de resolucin IV pueden o bte
nerse a p artir de diseos de resolucin III por el proceso de doblado. R ecuerde que para hacer el doblez
de un diseo 2 ku~p , sim plem ente se agrega a la fraccin original u n a segunda fraccin con todos los sig
nos invertidos. E ntonces los signos positivos en la colum na identidad I de la prim era fraccin podran
intercam biarse en la segunda fraccin, y el factor (k + l)-sim o podra asociarse con esta colum na. El
resultado es un diseo factorial fraccionado 2k^ ~ p . E l proceso se m uestra en la tabla 8-27 p ara el diseo
2 \ Es sencillo verificar que el diseo resultante es un diseo 2 ^v 1 con la relacin de definicin
I = ABCD.
Tkmbin es posible hacer el doblez de diseos de resolucin IV para separar las interacciones de dos
factores que son alias entre s. M ontgom ery y R unger [83c] hacen n otar que un experim entador puede te
ner varios objetivos al hacer el doblez de un diseo de resolucin IV, como 1) rom per tantas cadenas de
alias de interacciones de dos factores como sea posible, 2) rom per las interacciones de dos factores en una
cadena de alias especfica, o 3) rom per las interacciones de dos factores que incluyen un factor especfico.
U na m anera de hacer el doblez de un diseo de resolucin IV es corriendo una segunda fraccin en la que
se invierte el signo de todos los generadores del diseo que tienen un nm ero im par de letras. Para ilus
trar, considere el diseo 2 ^ 2 usado en el experim ento del m oldeo por inyeccin del ejem plo 8-4. Los ge
neradores del diseo de la tabla 8-10 son I = A B C E e / = BCDF, L a segunda fraccin usara los

la b ia 8-27

Diseo

obtenido por doblez

D
I___________A ____________ B_____________C
Diseo
orginal con J = ABC
+

+
+
+
+
+
+
+
+
+
Segundo diseo 2 ^ ' con los signos intercambiados
+
+
-

348

CAPTULO 8 DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

generadores / = -A B C E e l = -BC D F, y el generador nico p ara el diseo com binado sera / = AD EF.
P o r lo tanto, el diseo com binado sigue siendo un diseo factorial fraccionado de resolucin IV. Sin em
bargo, las relaciones de los alias sern mucho ms sencillas que en el diseo 2 ^ 2 original. D e hecho, las
nicas interacciones de dos factores que tendrn alias son A D = EF, A E = D F y A F = D E. Todas las de
ms interacciones de dos factores pueden estim arse a partir del diseo combinado.
Como otro ejemplo, considere el diseo 2 ^ 3 con 32 corridas. L a tabla 8-14 indica que el m ejor con
junto de generadores para este diseo es I = ABCF, I = A B D G e l = BCDEH. E n la tabla X II(m ) del
apndice se m uestran los alias p ara este diseo. Observe que hay seis pares de interacciones de dos facto
res y un grupo de tres interacciones de dos factores que son alias. Si se hace el doblez de este diseo, la se
gunda fraccin tendra los generadores I = -ABCF, I = -A B D G e l = BCDEH. El diseo combinado tiene
los generadores / = CDFG e / = BCDEH, y la relacin de definicin com pleta es

1= CDFG= B C D EH = BEFG H

E l diseo com binado es de resolucin IV, pero las nicas interacciones de dos factores que siguen tenien
do alias son CD = FG, CF = D G y CG = DF. Se trata de una simplificacin considerable de los alias de la
fraccin original.
Observe que cuando se em pieza con un diseo de resolucin III, el procedim iento de doblez garanti
za que el diseo com binado ser de resolucin IV, con lo cual se asegura que todos los efectos principales
pueden separarse de sus alias en interacciones de dos factores. Cuando se hace el doblez de un diseo de
resolucin IV, no necesariam ente se separarn todas las interacciones de dos factores. D e hecho, si la
fraccin original tiene una estructura de los alias con ms de dos interacciones de dos factores en cual
quier cadena de alias, el doblez no separar com pletam ente todas las interacciones de dos factores.
Ambos ejemplos anteriores, el 2\~l y el 23, tienen al menos una de tales cadenas de alias de interaccio
nes de dos factores. M ontgom ery y R unger [83c] dan una tabla de diseos hechos doblez recom endados
p ara fracciones de resolucin IV con 6 ^ k < 10 factores.
Los diseos de resolucin V son factoriales fraccionados en los que los efectos principales y las in
teracciones de dos factores no tienen como alias otros efectos principales u otras interacciones de dos fac
tores. Estos diseos son muy poderosos, perm itiendo la estimacin nica de todos los efectos principales
y las interacciones de dos factores, siempre que todas las interacciones de tres factores y de rdenes supe
riores sean insignificantes. L a palabra ms pequea de la relacin de definicin de tal diseo debe tener
cinco letras. E l diseo 25"1con la relacin de definicin / = A B C D E es de resolucin V. O tro ejemplo es el
diseo 2y~ 2 con las relaciones de definicin/ = A B C D G e l = ABEFH . Ejem plos adicionales de estos di
seos se presentan en Box y H unter [17c].
Debido a que los diseos estndar de resolucin V son diseos grandes cuando el nm ero de factores
es m oderadam ente grande, existe cierto inters prctico en los diseos factoriales fraccionados irregula
res de resolucin V. Se cuenta con diseos tiles para 4 < k < 9 factores. El diseo de 24 corridas para
k = 5 factores se m uestra en la tabla 8-28. Puesto que se trata de un diseo de resolucin V, es posible esti
m ar los cinco efectos principales y las 10 interacciones de dos factores, suponiendo que las interacciones
de tres factores y rdenes superiores son insignificantes. El diseo para k = 4 factores tiene 12 corridas y
se com enta en el problem a 8-22. Para k = 6 ,7 y 8, estos diseos tienen 48 corridas, y el diseo de nueve
factores tiene 96 corridas. El paquete de software Design-Expert contiene todos estos diseos.
Por ltimo, cabe sealar que un doblez com pleto de un diseo de resolucin IV o V suele ser innece
sario. E n general, slo hay una o dos (o muy pocas) interacciones con alias que son de inters potencial.
Los alias de estas interacciones pueden por lo general separarse agregando un nm ero pequeo de corri-

8-7 RESUMEN

349

Tabla 8-28 La fraccin irregular de


resolucin V para cinco factores
en 24 corridas

i + +

_
1
_

+
+

+
+

+
+
+

+
+
+
+
+

+
+

+
+
+
-

_
i_
T
_
-

_L
T

das a la fraccin original. E sta tcnica se denom ina en ocasiones doblez parcial. P ara form arse una idea
de cmo se hace esto, referirse al ejemplo 10-5 y al m aterial suplem entario del texto de este captulo.

8-7

RESUMEN

E n este captulo se introdujo el diseo factorial fraccionado 2*~\ Se h a hecho hincapi en el uso de estos
diseos en experim entos de tam izado para identificar de m anera rpida y eficaz el subconjunto de facto
res que estn activos, as como para proporcionar cierta inform acin sobre las interacciones. L a propie
dad de proyeccin de estos diseos hace posible en m uchos casos examinar los factores activos con mayor
detalle. El ensamblaje secuencial de estos diseos p or m edio de un doblez es una m anera muy eficaz de
obtener inform acin adicional acerca de las interacciones que pueden identificarse como de posible im
portancia en un experim ento inicial.
E n la prctica, los diseos factoriales fraccionados 2fc"p con N = 4 ,8 ,1 6 y 32 corridas son muy tiles.
E n la tabla 8-29 se resum en estos diseos, identificando cuntos factores pueden usarse con cada diseo
p ara obtener diferentes tipos de experim entos de tamizado. Por ejemplo, el diseo de 16 corridas es un
factorial com pleto para 4 factores, una fraccin un m edio p ara 5 factores, una fraccin de resolucin IV
p ara 6 u 8 factores y una fraccin de resolucin III p ara 9 a 15 factores. Tbdos estos diseos pueden cons
truirse utilizando los m todos explicados en este captulo, y muchas de sus estructuras de los alias se
m uestran en la tabla X II del apndice.

350

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Tabla 8-29 Diseos factoriales y factoriales fraccionados tiles del


sistema 2H>. Los nmeros en las celdas son el nmero
de factores del experimento
Nmero de corridas
4
8
16
32
Tipo de diseo
Factorial completo
2
3
4
5
Fraccin un medio
3
4
5
6

4
6-8
7-16
Fraccin de resolucin IV
5-7
9-15 17-31
Fraccin de resolucin III
3

8-8
8-1.

8-2.
8-3.
8-4.

8-5.

8-6.

PROBLEMAS

------------- ------------------------------------------------------------------------------

Suponga que en el experimento del desarrollo del proceso qumico descrito en el problema 6-7 slo pudo co
rrerse una fraccin un medio del diseo 24. Construir el diseo y llevar a cabo el anlisis estadstico utilizando
los datos de la rplica I.
Suponga que en el problema 6-15 slo pudo correrse una fraccin un medio del diseo 24. Construir el diseo
y llevar a cabo el anlisis utilizando los datos de la rplica I.
Considere el experimento del grabado con plasma del problema 6-18. Suponga que slo pudo correrse una
fraccin un medio del diseo. Establecer el diseo y analizar los datos.
En el problema 6-21 se describe el estudio para mejorar un proceso durante la manufactura de un circuito in
tegrado. Suponga que slo pudieron hacerse ocho corridas de este proceso. Establecer un diseo 25-2 apro
piado y encontrar la estructura de los alias. Utilizar las observaciones apropiadas del problema 6-21 como las
observaciones de este diseo y estimar los efectos de los factores. Qu conclusiones pueden sacarse?
Continuacin del problema 8-4. Suponga que ha hecho las ocho corridas del diseo 25 2 del problema 8-4.
Qu corridas adicionales se necesitaran para identificar los efectos de los factores que son de inters?
Cules son las relaciones de los alias en el diseo combinado?
R.D. Snee (Experimentacin con un nmero grande de variables, en Experiments in Industry: Design,
Analysis and Interpretation of Results, de R.D. Snee, L.B. Hare y J.B. Tout, editores, ASQC) describe un ex
perimento en el que se us un diseo 2s-1con I = ABCDE para investigar los efectos de cinco factores sobre
el color de un producto qumico. Los factores son^4 = solvente/reactivo, B = catalizador/reactivo, C = tem
peratura, D = pureza del reactivo y E = pH del reactivo. Los resultados obtenidos fueron los siguientes:
e = -0.63
a = 2.51
b = -2.68
abe = 1.66
c = 2.06
ace = 1.22
bce = -2.09
abe = 1.93

8-7.

d = 6.79
ade = 5.47
bde = 3.45
abd 5.68
cde =5.22
acd = 4.38
bed = 4.30
abede = 4.05

a) Construir una grfica de probabilidad normal de los efectos. Qu efectos parecen estar activos?
b) Calcular los residuales. Construir una grfica de probabilidad normal de los residuales y graficar los resi
duales contra los valores ajustados. Comentar las grficas.
c) Si algunos de los factores son insignificantes, plegar el diseo 2S_1 a un diseo factorial completo en los
factores activos. Comentar el diseo resultante e interpretar los resultados.
En un artculo de J.J. Pignatiello, Jr. y J.S. Ramberg del Journal o f Quality Technology (vol. 17, pp. 198-206) se
describe el uso de un diseo factorial fraccionado con rplicas para investigar el efecto de cinco factores so
bre la altura Ubre de los resortes de hojas utilizados en una aplicacin automotriz. Los factores son/1 = tem-

8-8 PROBLEMAS

351

peratura del homo, B = tiempo de calentamiento, C = tiempo de transferencia, D = tiempo de retencin y


E = temperatura del aceite de templado. Los datos se presentan a continuacin:
A

+
+

+
+

+
+
+
+

+
+
+
+
+
+
+
+

+
+

+
+

+
+

+
+
+
+

+
-

8-8.

+
+

+
-

7.78
8.15
7.50
7.59
7.54
7.69
7.56
7.56
7.50
7.88
7.50
7.63
7.32
7.56
7.18
7.81

Altura libre
7.78
8.18
7.56
7.56
8.00
8.09
7.52
7.81
7.25
7.88
7.56
7.75
7.44
7.69
7.18
7.50

7.81
7.88
7.50
7.75
7.88
8.06
7.44
7.69
7.12
7.44
7.50
7.56
7.44
7.62
7.25
7.59

a) Escribir la estructura de los alias de este diseo. Qu resolucin tiene este diseo?
b) Analizar los datos. Qu factores influyen en la altura libre promedio?
c) Calcular el rango y la desviacin estndar de la altura libre para cada corrida. Hay algn indicio de que
cualquiera de estos factores afecta la variabilidad de la altura libre?
d) Analizar los residuales de este experimento y comentar los resultados.
e) Este diseo es el mejor posible para cinco factores en 16 corridas? Especficamente, es posible encon
trar un diseo fraccionado para cinco factores en 16 corridas con una resolucin ms alta que la de este
diseo?
En un artculo de Industrial and Engineering Chemistry (Informacin adicional acerca de la planeacin de
experimentos para aumentar la eficiencia de la investigacin) se utiliza un diseo 25 2para investigar el efec
to de A temperatura de condensacin, B = cantidad del material 1, C = volumen del solvente, D = tiempo
de condensacin y E = cantidad del material 2 sobre el rendimiento. Los resultados obtenidos son los si
guientes:
e = 23,2
ab = 15.5
a)
b)
c)
d)

ad =16.9
fcc =16.2

cd = 23.8
ace = 23.4

We =16.8
abcde = 18.1

Verificar que los generadores que se utilizaron en el diseo fueron I = ACE e / = BDE.
Apuntar la relacin de definicin completa y los alias de este diseo.
Estimar los efectos principales.
Elaborar la tabla del anlisis de varianza. Verificar que las interacciones^^ y AD estn disponibles para
usarlas como erTor.
e) Graficar los residuales contra los valores ajustados. Construir tambin la grfica de probabilidad normal
de los residuales. Comentar los resultados.
8-9. Considere el experimento con el resorte de hojas del problema 8-7. Suponga que el factor (temperatura del
aceite de templado) es muy difcil de controlar durante la manufactura, Cul sera el ajuste de los factores
A, B, C y D para reducir la variabilidad de la altura libre tanto como sea posible, independientemente de la
temperatura del aceite de templado usada?
8-10. Construir un diseo 27~2seleccionando dos interacciones de dos factores como los generadores independien
tes. Apuntar la estructura de los alias completa de este diseo. Delinear la tabla del anlisis de varianza.
Cul es la resolucin de este diseo?

352
8-11.

8-12.
8-13.
8-14.
8-15.
8-16.
8-17.
8-18.
8-19.

8-20.

8-21.

8-22.

8-23.

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Considere el diseo 25del problema 6-21. Suponga que slo pudo correrse una fraccin un medio. Adems
se requirieron dos das para hacer las 16 observaciones, y fue necesario confundir el diseo 25-1en dos blo
ques. Construir el diseo y analizar los datos.
Analizar los datos del problema 6-23 como si provinieran de un diseo 2j* con I ~ ABCD. Proyectar el dise
o en un factorial completo en el subconjunto de los cuatro factores originales que parecen ser significativos.
Repetir el problema 8-12 utilizando / = -ABCD. El uso de la fraccin alterna modifica la interpretacin de
los datos?
Proyectar el diseo 2 ^ del ejemplo 8-1 en dos rplicas de un diseo 22en los factores^ y B. Analizar los da
tos y sacar conclusiones.
Construir un diseo 2 ^ 3. Determinar los efectos que pueden estimarse si se corre una segunda fraccin de
este diseo con todos los signos invertidos.
Considere el diseo 2J3del problema 8-15. Determinar los efectos que pueden estimarse si se corre una se
gunda fraccin de este diseo con los signos del factor A invertidos.
Hacer el doblez del diseo 2jJ4 de la tabla 8-19 para producir un diseo de ocho factores. Verificar que el di
seo resultante sea 2 ^ 4. Se trata de un diseo mnimo?
Hacer el doblez de un diseo 2f2para producir un diseo de seis factores. Verificar que el diseo resultante
sea 2 62. Comparar este diseo con el diseo 2 ^ 2 de la tabla 8-10.
Un ingeniero industrial realiza un experimento utilizando un modelo de simulacin Montecarlo de un siste
ma de inventario. Las variables independientes de su modelo son la cantidad del pedido (A), el punto de un
nuevo pedido (5), el costo de organizacin (C), el costo del refrendo de pedidos (D) y la tarifa de transporta
cin (E). La variable de respuesta es el costo anual promedio. Para ahorrar tiempo de computadora, el inge
niero decide investigar estos factores utilizando un diseo 2 ^ 2 con / = ABD e I = BCE. Los resultados que
obtiene son de = 95, ae = 134, b 158, abd = 190, cd = 92, ac = 187, bce = 155 y abede 185.
a) Verificar que las combinaciones de tratamientos dadas sean correctas. Estimar los efectos suponiendo
que las interacciones de tres factores y de rdenes superiores son insignificantes.
b) Suponga que se agrega una segunda fraccin a la primera, por ejemplo, ade = 136, e = 93, ab = 187, bd =
153, acd = 139, c = 99, abce = 191 y bcde = 150. Cmo se obtuvo esta segunda fraccin? Incorporar es
tos datos a la fraccin original y estimar los efectos.
c) Suponga que se corri la fraccinate = 189, ce = 96, bed = 154, acde = 135, abe = 193, bde 152, ad =
137 y (1) = 98. Cmo se obtuvo esta fraccin? Incorporar estos datos en la fraccin original y estimar
los efectos.
Construir un diseo 2s*1. Indicar cmo puede correrse el diseo en dos bloques de ocho observaciones cada
uno. Alguno de los efectos principales o de las interacciones de dos factores estn confundidos con los blo
ques?
Construir un diseo 27-2. Indicar cmo puede correrse el diseo en cuatro bloques de ocho observaciones
cada uno. Alguno de los efectos principales o de las interacciones de dos factores estn confundidos con los
bloques?
Fracciones irregulares del diseo 2k (John [61d]). Considere un diseo 24. Tienen que estimarse los cuatro efec
tos principales y las seis interacciones de dos factores, pero no puede correrse el factorial 24 completo. El ta
mao del bloque ms grande posible contiene 2 corridas. Estas 12 corridas pueden obtenerse de las cuatro
rplicas un cuarto definidas por / = AB = ACD = BCD omitiendo la fraccin principal. Indicar cmo
pueden combinarse las tres fracciones 2^2restantes para estimar los efectos requeridos, suponiendo que las
interacciones de tres factores y de rdenes superiores son insignificantes. Este diseo podra considerarse
como una fraccin tres cuartos.
Los nodos de carbono utilizados en un proceso de fundicin se fabrican en un homo anular. Se corre un ex
perimento en el horno para determinar cules son los factores que influyen en el peso del material de empa
que que se adhiere a los nodos despus de la coccin. Seis variables son de inters, cada una con dos niveles:
A = relacin paso/finos (0.45,0.55), B = tipo de material de empaque (1,2), C = temperatura del material de
empaque (ambiente, 325C), D = localizacin de la chimenea (adentro, afuera), E = temperatura del foso
(ambiente, 195C) y F = tiempo de retraso antes del empaque (cero, 24 horas). Se corre un diseo 2e-3 y se

8-8 PROBLEMAS

8-24.

353

obtienen tres rplicas en cada uno de los puntos del diseo. El peso del material de empaque adherido a los
nodos se mide en gramos. Los datos en el orden de las corridas son los siguientes: abd = (984, 826, 936);
abcdef = (1275, 976,1457); be = (1217,1201, 890); a f = (1474,1164,1541); def = (1320,1156, 913); cd =
(765,705,821); ace = (1338,1254,1294) y bcf = (1325,1299,1253). Se desea minimizar la cantidad de mate
rial de empaque adherido.
a) Verificar que las ocho corridas correspondan a un diseo 2 3. Cul es la estructura de los alias?
b) Usar el peso promedio como respuesta. Qu factores parecen tener influencia?
c) Usar el rango de los pesos como respuesta. Qu factores parecen tener influencia?
d) Qu recomendaciones podran hacerse a los ingenieros del proceso?
Se corri un experimento de 16 corridas en una planta de manufactura de semiconductores para estudiar los
efectos de seis factores sobre la curvatura o combadura de los dispositivos del sustrato producidos. Las seis
variables y sus niveles se presentan a continuacin:

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Tbmperatura de
laminacin
(C)
55
75
55
75
55
75
55
75
55
75
55
75
55
75
55
75

Tiempo de
laminacin
(*)
10
10
25
25
10
10
25
25
10
10
25
25
10
10
25
25

Presin de
laminacin
(tn)
5
5
5
5
10
10
10
10
5
5
5
5
10
10
10
10

Temperatura
de coccin
(C)
1580
1580
1580
1580
1580
1580
1580
1580
1620
1620
1620
1620
1620
1620
1620
1620

Duracin
del ciclo de
coccin
(h)
17.5
29
29
17.5
29
17.5
17.5
29
17.5
29
29
17.5
29
17.5
17.5
29

Punto de
roco de
la coccin
(C)
20
26
20
26
26
20
26
20
26
20
26
20
20
26
20
26

Se hicieron cuatro rplicas de cada corrida, y se hizo una medicin de la combadura del sustrato. Los datos se
presentan enseguida:

Corrida
1
2
3
4
5
6
7
8
9
10

Combadura por rplica (pulg/pulg)


1
2
3
4
0.0167
0.0062
0.0041
0.0073
0.0047
0.0219
0.0121
0.0255
0.0032
0.0078

0.0128
0.0066
0.0043
0.0081
0.0047
0.0258
0.0090
0.0250
0.0023
0.0158

0.0149
0.0044
0.0042
0.0039
0.0040
0.0147
0.0092
0.0226
0.0077
0.0060

0.0185
0.0020
0.0050
0.0030
0.0089
0.0296
0.0086
0.0169
0.0069
0.0045

Total
(10-4 pulg/pulg)
629
192
176
223
223
920
389
900
201
341

Media
(10-4 pulg/pulg)
157.25
48.00
44.00
55.75
55.75
230.00
97.25
225.00
50.25
85.25

Desviacin
estndar
24.418
20.976
4.083
25.025
22.410
63.639
16.029
39.42
26.725
50.341

354

CAPTULO 8

Corrida
11
12
13
14
15
16
a)
b)
c)
d)

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

Combadura por rplica (pulg/pulg)


1
2
3
4
0.0027
0.0028
0.0043
0.0028
0.0186
0.0137
0.0158
0.0159
0.0110
0.0086
0.0101
0.0158
0.0065
0.0071
0.0109
0.0126
0.0158
0.0145
0.0155
0.0145
0.0093
0.0133
0.0124
0.0110

Tbtal
(10-4 pulg/pulg)
126
640
455
371
603
460

Media
(1(H pulg/pulg)
31.50
160.00
113.75
92.75
150.75
115.00

Desviacin
estndar
7.681
20.083
31.12
29.51
6.75
17.45

Qu tipo de diseo utilizaron los experimentadores?


Cules son las relaciones de los alias en este diseo?
Alguna de las variables del proceso afecta la combadura promedio?
Alguna de las variables del proceso afecta la variabilidad de las mediciones de la combadura?

Tabla 8-30 Datos para el problema 8-25_____________________________________________________ ____


A
B
C
D
E
F
Espesor del recubrimiento protector
Corrida Volumen Lote Tiempo, s Velocidad Aceleracin Cubierta Izq.
Centro Per. Prom. Rango
Sin
4531 4531 4515 4525.7 16
14
7350
5
Lote 2
5
1
Sin
4446 4464 4428 4446
36
6
7350
2
5
Lote 1
5
4452 4490 4452 4464.7 38
Lote 1
5
Sin
6
6650
3
3
Sin
4316 4328 4308 4317.3 20
14
7350
3
Lote 2
20
4
Sin
4307 4295 4289 4297
18
14
7350
3
Lote 1
5
5
Sin
4470 4492 4495 4485.7 25
6
6650
6
5
Lote 1
20
Lote 1
5
Con
4496 4502 4482 4493.3 20
6
7350
7
3
4542
4547 4538 4542.3
20
Sin
9
14
6650
8
5
Lote 2
4621 4643 4613 4625.7 30
Lote 1
5
Sin
14
6650
9
5
4653 4670 4645 4656
25
Lote 1
5
Con
14
6650
10
3
4478.7
4480
16
4486 4470
Lote 2
20
Con
14
6650
11
3
4223.7
4221
16
4233 4217
20
Sin
6
7350
12
3
Lote 1
4626.7
4620
22
4641 4619
Lote 1
5
Con
6
6650
13
5
4455 4480 4466 4467
25
Lote 1
20
Con
6
6650
14
3
4243
4262
Con
4255
45
14
7350
4288
5
Lote 2
20
15
4515.7
4490
44
4534
4523
Lote
2
5
Con
6
7350
16
5
4540
4535
Con
4514
37
4551
14
7350
3
Lote
2
5
17
4494
4503
4496
4497.7
Sin
9
14
6650
3
Lote
1
20
18
4293
13
4306
4302
4300.3
Lote
2
20
Sin
6
7350
5
19
4534 4545 4512 4530.3 33
Lote 2
5
Sin
6
7350
20
3
4460 4457 4436 4451
24
Lote 1
20
Con
14
6650
21
5
4650 4688 4656 4664.7 38
Lote 2
5
Con
6
6650
22
3
4231 4244 4230 4235
14
Lote 1
20
Sin
14
7350
23
5
4225 4228 4208 4220.3 20
20
Con
6
7350
24
3
Lote 2
Con
4381 4391 4376 4382.7 15
Lote 1
5
14
7350
25
5
Sin
4533 4521 4511 4521.7 22
Lote 2
20
6
6650
26
3
Con
4194 4230 4172 4198.7 58
14
7350
3
Lote 1
20
27
Sin
4666 4695 4672 4677.7 29
6
6650
5
Lote 2
5
28
Con
4180 4213 4197 4196.7 33
7350
5
Lote 1
20
6
29
4465 4496 4463 4474.7 33
Lote 2
20
Con
6
6650
30
5
Con
4653 4685 4665 4667.7 32
14
6650
5
Lote
2
5
31
Sin
4683 4712 4677 4690.7 35
14
6650
3
Lote
2
5
32

8-8 PROBLEMAS

8-25.

3 55

e) Si es importante reducir la combadura tanto como sea posible, qu recomendaciones se haran?


Se usa un revestimiento por centrifugado para aplicar un recubrimiento fotoprotector en una oblea de silicio
natural. Esta operacin suele hacerse en las fases iniciales del proceso de fabricacin de semiconductores, y
el espesor promedio del recubrimiento protector y la variabilidad del espesor del mismo tienen un impacto
importante en los pasos subsecuentes de manufactura. Seis variables se usan en el experimento. Las varia
bles y sus niveles alto y bajo se presentan a continuacin:

Factor
Velocidad de centrifugado final
Indice de aceleracin
Volumen de recubrimiento protector aplicado
Tiempo del centrifugado
Variacin del lote del recubrimiento protector
Presin de descarga

Nivel bajo
7350 rpm
5
3 cc
14 s
Lote 1
Sin cubierta

Nivel alto
6650 rpm
20
5 cc
6s
Lote 2
Con cubierta

El experimentador decide usar un diseo 26"1y hacer tres lecturas del espesor del recubrimiento protector en
cada oblea de prueba. Los datos se muestran en la tabla 8-30.
a) Verificar que se trata de un diseo 26-1. Discutir las relaciones de los alias de este diseo.
b) Qu factores parecen afectar el espesor promedio del recubrimiento protector?
c) Considerando que el volumen del recubrimiento protector aplicado tiene un efecto reducido sobre el es
pesor promedio, tiene esto alguna implicacin prctica importante para los ingenieros del proceso?
d) Proyectar este diseo en un diseo menor que incluya nicamente los factores significativos. Presentar
los resultados grficamente. Ayuda esto en la interpretacin?
e) Usar el rango del espesor del recubrimiento protector como variable de respuesta. Hay algn indicio de
que alguno de estos factores afecte la variabilidad del espesor del recubrimiento protector?
f) Dnde se recomendara que corrieran el proceso los ingenieros?
8-26, Harry y Judy Peterson-Nedry (dos amigos del autor) son propietarios de un viedo y una fbrica vincola en
Newberg, Oregon, Cultivan varias variedades de uvas y fabrican vino. Harry y Judy han usado diseos facto
riales para el desarrollo de procesos y productos en el segmento de fabricacin vincola de su negocio. Este
problema describe el experimento realizado para su Pinot Noir 1985. Originalmente se estudiaron ocho va
riables, las cuales se muestran en este experimento:

Variable
A = Clon de Pinot Noir
B Tipo de roble
C = Edad de la barrica
D = Levadura/contacto con la piel
E = Vapores
F = Tostado de las barricas
G = Racimos completos
H = Temperatura de fermentacin

Nivel bajo (-)


Pommard
Allier
Vieja
Champagne
Ninguno
Ligero
Ninguno
Baja (75F mx.)

Nivel alto (+)


Wadenswil
Tronais
Nueva
Montrachet
Tbdos
Medio
10%
Alta (92F mx.)

Harry y Judy decidieron usar un diseo 2 ^ 4 con 16 corridas. El vino fue catado por un panel de expertos el 8
de marzo de 1986. Cada experto calific las 16 muestras de vino catadas, siendo la calificacin 1 la mejor. El
diseo y los resultados del panel de catadores se muestra en la tabla 8-31,
a) Cules son las relaciones de los alias en el diseo seleccionado por Harry y Judy?
b) Usar las calificaciones promedio (y) como variable de respuesta. Analizar los datos y sacar conclusiones.
Se encontrar til examinar una grfica de probabilidad normal de las estimaciones de los efectos.

356
Tabla 8-31

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Diseo y resultados del experimento de la prueba del vino


Variable
D
E
F
G
A
B
C

+
+

+
+

+
+
+
+

+
+

+
+
+
+

'+

+
+

+
+

+
+

+
+
+
+

+
+

+
+

+
+
+
+
+
+
+
+

+
+

+
+

+
+

+
+

Calificaciones del panel


HPN JPN CAL DCM RGB
12
13
10
7
6
14
14
9
10
7
11
14
13
10
15
9
9
9
12
7
8
8
11
8
10
16
16
12
15
16
6
5
3
6
5
14
16
15
15
16
2
1
2
3
3
11
4
7
6
7
12
8
13
3
8
1
1
4
3
5
2
2
4
5
10
2
1
4
4
1
6
11
5
15
9
11
14
12
13
13

Resumen
y
9,6
10.8
12.6
9.2
9.0
15.0
5.0
15.2
2.2
7.0
8.8
2.8
9.6
2.4
9.2
12.6

s
3.05
3.11
2.07
1.79
1.41
1.73
1.22
0.84
0.84
2.55
3.96
1.79
3.29
1.52
4.02
1.14

8-8 PROBLEMAS

357

c) Usar la desviacin estndar de las calificaciones (o alguna transformacin apropiada tal como log s)
como variable de respuesta. Qu conclusiones pueden sacarse acerca de los efectos de las ocho varia
bles sobre la variabilidad de la calidad del vino?
d) Despus de mirar los resultados, Harry y Judy coincidieron en que uno de los miembros del panel
(DCM) saba ms de cerveza que de vino, por lo que decidieron eliminar su calificacin. Qu efecto
tendra esto en los resultados y las conclusiones de los incisos b y c?
e) Suponga que justo antes de empezar el experimento, Harry y Judy se enteraron de que las ocho nuevas
barricas que ordenaron de Francia para usarlas en el experimento no llegaran a tiempo, y que las 16 co
rridas tendran que hacerse con las barricas viejas. Si Harry y Judy simplemente eliminan la columna C
de su diseo, qu ocurre con las relaciones de los alias? Es necesario que empiecen de nuevo y cons
truyan otro diseo?
f) Harry y Judy saben por experiencia que es improbable que algunas de las combinaciones de tratamientos
produzcan buenos resultados. Por ejemplo, la corrida con las ocho variables en el nivel alto generalmen
te resulta en un vino con una calificacin baja. Esto se confirm el 8 de marzo de 1986 en la prueba del
vino. Quieren establecer un nuevo diseo para su Pinot Noir 1986 utilizando estas mismas ocho varia
bles, pero no quieren correr el experimento con los ocho factores en el nivel alto. Qu diseo sugerira
el lector?
8-27. En un artculo de Quality Engineering (Una aplicacin de los diseos experimentales factoriales fracciona
dos, vol. 1, pp. 19-23) M.B. Kilgo describe un experimento para determinar el efecto de la presin del C 0 2
(A), la temperatura del C 0 2(B), la humedad del cacahuate (C), la velocidad de flujo del C 0 2(D) y el tamao
de las partculas de cacahuate (E ) sobre el rendimiento total del aceite por lote de cacahuates (y). Los niveles
que us para estos factores son los siguientes:

Nivel
codificado
-1
1

A,
presin
(bar)
415
550

B,
temperatura
CC)
25
95

c,

humedad
(% por peso)
5
15

D,
flujo
(litros/min)
40
60

E,
tamao de las
partculas (mm)
1.28
4.05

Kilgo realiz el experimento factorial fraccionado con 16 corridas que se muestra a continuacin.

A
415
550
415
550
415
550
415
550
415
550
415
550
415
550
415
550

B
25
25
95
95
25
25
95
95
25
25
95
95
25
25
95
95

C
5
5
5
5
15
15
15
15
5
5
5
5
15
15
15
15

D
40
40
40
40
40
40
40
40
60
60
60
60
60
60
60
60

E
1.28
4.05
4.05
1.28
4.05
1.28
1.28
4,05
4.05
1,28
1.28
4,05
1.28
4.05
4.05
1,28

63
21
36
99
24
66
71
54
23
74
80
33
63
21
44
96

358

8-28.

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

a) Qu tipo de diseo se ha utilizado? Identificar la relacin de definicin y las relaciones de los alias.
b) Estimar los efectos de los factores y usar una grfica de probabilidad normal para hacer la identificacin
tentativa de los factores importantes.
c) Efectuar el anlisis estadstico apropiado para probar las hiptesis de que los factores identificados en el
inciso b anterior tienen un efecto significativo sobre el rendimiento del aceite de cacahuate.
d) Ajustar un modelo que pueda usarse para predecir el rendimiento del aceite de cacahuate en trminos
de los factores que se han identificado como importantes.
e) Analizar los residuales de este experimento y comentar la adecuacin del modelo.
Los ingenieros de la planta Essex Aluminum de Ford Motor Company llevaron a cabo un experimento facto
rial fraccionado en 10 factores con 16 corridas para el vaciado en arena de tubos mltiples para motor, el cual
se describe en el artculo Estudio del proceso de vaciado evaporativo para mltiples de admisin de 3.0 li
tros Poor SandfilT, de D. Becknell (Fourth Symposium on Taguchi Methods, American Supplier Institute,
Dearborn, MI, pp. 120-130). El objetivo fue determinar cules de los 10 factores tienen un efecto sobre la
proporcin de vaciados defectuosos. El diseo y la proporcin resultante de vaciados no defectuosos p que
se observaron en cada corrida se presentan enseguida. Se trata de una fraccin de resolucin III con genera
dores E CD, F BD, G = BC, H = AC, J = AB y K = ABC. Suponga que el nmero de vaciados hechos en
cada corrida del diseo es 1000.

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

A
+
+
+
+
+
+
+
+

B
+
+
+
+
+
+
+
-t-

C
+
+
+
+

+
+
+
+

D
~
+
+
+
+
+
+
+
+

E
+
+
+
-
+
+
+
+

F
+
+
+
+
+
+
+
+

G
+
+
+
+
+
+
+
+

/
H
+ +
+
+
+
+
+
+
+
+
+
+
+
+
+

K
+
+
+
+
+
+
+
+

P
0.958
1.000
0.977
0.775
0.958
0.958
0.813
0.906
0.679
0.781
1.000
0.896
0.958
0.818
0.841
0.955

arcsenJ p
1.364
1.571
1.419
1.077
1.364
1.364
1.124
1.259
0.969
1.081
1.571
1.241
1.364
1.130
1.161
1.357

Modificacin
deF&T
1.363
1.555
1.417
1.076
1.363
1.363
1.123
1.259
0.968
1.083
1.556
1.242
1.363
1.130
1.160
1.356

) Encontrar la relacin de definicin y las relaciones de los alias de este diseo.


b) Estimar los efectos de los factores y usar una grfica de probabilidad normal para hacer la identificacin
tentativa de los factores importantes.
c) Ajustar el modelo apropiado utilizando los factores identificados en el inciso b anterior.
, d) Graficar los residuales de este modelo contra la proporcin predicha de vaciados no defectuosos. Cons
truir tambin una grfica de probabilidad normal de los residuales. Comentar la adecuacin de estas gr
ficas.
e) El lector habr notado en el inciso d un indicio de que la varianza de la respuesta no es constante (consi
derando que la respuesta es una proporcin, esto debera haberse anticipado). La tabla anterior tambin
muestra una transformacin de p, arcsen de la raz cuadrada de p, que es de uso generalizado como
transformacin para estabilizar la varianza de los datos de la proporcin (referirse a la discusin de las
transformaciones para estabilizar la varianza del captulo 3). Repetir los incisos a al d anteriores utilizan

8-8 PROBLEMAS

f)

359

do la respuesta transformada y comentar los resultados. Especficamente, son mejores ahora las grfi
cas de los residuales?
Hay una modificacin de la transformacin arcsen de la raz cuadrada, propuesta por Freeman y Tkey
(Transformaciones relacionadas con ngulos y la raz cuadrada, Annals of Mathematical Statistics, vol.
21, pp. 607-611) que mejora su desempeo en las colas. La modificacin de F&T es:
[sLicsenJnp I (n+ 1) + arcsen J ( n p + l ) / ( + l ) ] / 2

8-29.

Resolver de nuevo los incisos a al d utilizando esta transformacin y comentar los resultados. (Para una
interesante discusin y anlisis de este experimento, referirse a Anlisis de experimentos factoriales con
defectos Opartes defectuosas como respuesta, de S. Bisgaard y H.T. Fuller, Quality Engineering, vol. 7,
pp. 429-443.)
Un experimento factorial fraccionado en nueve factores y 16 corridas fue conducido por el departamento
Chrysler Motors Engineering y se describe en el artculo Mejoramiento del proceso compuesto de moldeo
de planchas, de P.I. Hsieh y D.E. Goodwin (Fourth Symposium on Taguchi Methods, American Supplier
Institute, Dearborn, MI, pp. 13-21). El objetivo era reducir el nmero de defectos en el acabado de rejillas de
planchas moldeadas de recuadros abiertos. El diseo y el nmero resultante de defectos, c, observados en
cada corrida se muestran a continuacin. Se trata de una fraccin de resolucin III con generadores = BD,
F = BCD, G = AC, H - ACD y J = AB.

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

+
+

+
+

+
+

+
+
+
+
+
+
+
+

+
+

+
+
+
+

+
+
+
+

G
+
-

F
-

+
+

E
+
+

+
+
+
+

+
+

H
-

J
+

+
+

+
+

+
+

+
+

+
+

+
+

+
+

+
+

c
56
17
2
4
3
4
50
2
1
0
3
12
3
4
0
0

7.48
4.12
1.41
2.00
1.73
2.00
7.07
1.41
1.00
0.00
1.73
3.46
1.73
2.00
0.00
0.00

Modificacin
de F&T
7.52
4.18
1.57
2.12
1.87
2.12
7.12
1.57
1.21
0.50
1.87
3.54
1.87
2.12
0.50
0.50

a) Encontrar la relacin de definicin y las relaciones de los alias de este diseo.


b) Estimar los efectos de los factores y usar una grfica de probabilidad normal para hacer la identificacin
tentativa de los factores importantes.
c) Ajustar un modelo apropiado utilizando los factores identificados en el inciso b anterior.
d) Graficar los residuales de este modelo contra el nmero predicho de defectos. Asimismo, construir una
grfica de probabilidad normal de los residuales. Comentar la adecuacin de estas grficas.

360

CAPTULOS

DISEOS FACTORIALES FRACCIONADOS DE DOS NIVELES

e) El lector habr notado en el inciso d un indicio de que la varianza de la respuesta no es constante (consi
derando que la respuesta es un conteo, esto debera haberse anticipado). La tabla anterior tambin in
cluye una transformacin de c, la raz cuadrada, que es una transformacin para estabilizar la varianza de
uso generalizado con datos de conteos (referirse a la exposicin de las transformaciones para estabilizar
la varianza del captulo 3). Repetir los incisos a al d utilizando la respuesta transformada y comentar los
resultados. Especficamente, han mejorado ahora las grficas de los residuales?
f) Hay una modificacin de la transformacin de la raz cuadrada, propuesta por Freeman y Tukey
(Transformaciones relacionadas con ngulos y raz cuadrada, Annals o f Mathematical Statistics, vol.
21, pp. 607-611) que mejora su desempeo. La modificacin de F&T de la transformacin de la raz
cuadrada es:
[4c + J (c + ) ] / 2

8-30.

Resolver de nuevo los incisos a al d utilizando esta transformacin y comentar los resultados. (Para una
interesante discusin y anlisis de este experimento, referirse a Anlisis de experimentos factoriales con
defectos o partes defectuosas como respuesta, de S. Bisgaard y H.T. Fuller, Quality Engineering, vol. 7,
pp. 429-443.)
Se corre un experimento en una fbrica de semiconductores para investigar el efecto de seis factores sobre la
amplificacin del transistor. El diseo seleccionado es el
que se muestra a continuacin:

Orden
Orden de
estndar las corridas
1
2
2
8
5
3
4
9
5
3
6
14
7
11
8
10
15
9
10
13
11
1
12
6
12
13
14
4
15
7
16
16

a)
b)
c)
d)
8-31.

A
+

C D E

+
+ +
-

+
+ +

+
+
+
+

+
+

+
-

+
+

+
+

+
+ .+
+ + +

+
+
+ +
+ +

F Amplificacin

1455
- 1511
+
1487
+
1596
+
1430
+
1481
1458
1549
1454
+
+
1517
1487
1596
1446
1473
+
1461
+
1563

Usar una grfica normal de los efectos para identificar los factores significativos.
Conducir las pruebas estadsticas apropiadas para el modelo identificado en el inciso a.
Analizar los residuales y comentar los resultados.
Es posible encontrar un conjunto de condiciones de operacin que produzca una amplificacin de 1500
25?
El tratamiento trmico es de uso comn para carbonizar piezas metlicas, como engranes. El espesor de la
capa carbonizada es una variable de salida crtica de este proceso, y suele medirse realizando un anlisis de
carbono del paso del engrane (la cara superior del diente del engrane). Se estudiaron seis factores en un dise
o 2 ^ 2:A = temperatura del horno, B = duracin del ciclo, C = concentracin de carbono, D = duracin del

8-8 PROBLEMAS

361

ciclo de carbonizacin, E concentracin de carbono del ciclo difuso y F = duracin del ciclo difuso. El ex
perimento se presenta a continuacin:

Orden
estndar
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

8-32.

Orden de
las corridas
5
7
8
2
10
12
16
1
6
9
14
13
11
3
15
4

C D

+
+

+
+
+
+
+
+
+
+

+
+

+
+
+

+
+*+
-

+
+

+
+

+
+
+
+

+
+
+
+

+
+

+
+

Paso
74
190
133
127
115
101
54
144
121
188
135
170
126
175
126
193

a) Estimar los efectos de los factores y representarlos en una grfica de probabilidad normal. Seleccionar
un modelo tentativo.
b) Efectuar las pruebas estadsticas apropiadas en el modelo.
c) Analizar los residuales y comentar la adecuacin del modelo.
d) Interpretar los resultados de este experimento. Suponer que es deseable un espesor de la capa de entre
140 y 160.
Se estudian cinco factores en el diseo factorial fraccionado irregular de resolucin V mostrado enseguida:

Orden
Orden de
estndar las corridas
1
1
10
2
5
3
4
4
15
5
19
6
16
7
8
7
8
9
3
10
11
13
12
11
13
12
14
20
9
15

+
'+

+
+
+

+
+
+

+
+
+
+
+
+
-

+
+

+
+
+

+
+

+
+
+

y
16.33
18.43
27.07
16.95
14.58
19.12
18.96
23.56
29.15
15.74
20.73
21.52
15.58
21.03
26.78

362

CAPTULO 8

DISEOS FACTORIALES FRACCIONADOS DE DO S NIVELES

Orden
Orden de
estndar las corridas
22
16
17
21
18
6
23
19
20
18
21
24
22
17
2
23
14
24

A
+
-

+
-

B
-

+
+
-

+
+

C
+
+
+
-

+
+
+

D
-

+
+
+
+
+
+

E
+
+
+
+
+
+
+
+
+

y
13.39
18.63
19.01
17.96
20.49
29.31
17.62
16.03
21.42

a) Analizar los datos de este experimento, Qu factores influyen en la respuesta y l


b) Analizar los residuales. Comentar la adecuacin del modelo.

Diseos factoriales y
factoriales fraccionados
con tres niveles y con
niveles mixtos

Las series con dos niveles de los diseos factoriales y factoriales fraccionados que se com entaron en los
captulos 6 ,7 y 8 son de uso generalizado en la investigacin y el desarrollo industrial. Hay algunas exten
siones y variantes de estos diseos que en ocasiones son tiles, como los diseos para los casos en que to
dos los factores estn presentes con tres niveles. Estos diseos 3k se analizan en este captulo. Se
consideran tam bin los casos en que algunos de los factores tienen dos niveles y otros factores tienen ya
sea tres o cuatro niveles.

9-1
9-1.1

DISEO FACTORIAL 3*
Notacin y motivacin del diseo 3k

Se estudia ahora el diseo factorial 3*; es decir, un arreglo factorial de k factores que tienen tres niveles
cada uno. Se usarn letras maysculas p ara denotar los factores y las interacciones. Se har referencia a
los tres niveles de los factores como bajo, interm edio y alto. Hay varias notaciones diferentes que se usan
p ara representar estos niveles de los factores; una posibilidad es representar los niveles de los factores
con los dgitos 0 (bajo), 1 (interm edio) y 2 (alto). Cada com binacin de tratam ientos del diseo 3k se de
n o tar p or k dgitos, donde el prim er dgito indica el nivel del factor A , el segundo dgito indica el nivel del
factor B , ..., y el dgito fc-simo indica el nivel del factorK. Por ejemplo, en un diseo 32, 00 d e n o tala com
binacin de tratam ientos correspondiente a.A y B ambos en el nivel bajo, y 01 denota la com binacin de
tratam ientos correspondiente slA en el nivel bajo y B en el nivel interm edio. E n las figuras 9-1 y 9-2 se
m uestra la representacin geom trica de los diseos 32y 33, respectivam ente, utilizando esta notacin.
Este sistem a de notacin pudo haberse usado en los diseos 2k presentados anteriorm ente, utilizando
0 y 1 en lugar del 1 negativo y el 1 positivo, respectivam ente. E n el diseo 2k se prefiri la notacin 1 por
que facilita la vista geom trica del diseo y porque puede aplicarse directam ente al m odelado de regre
sin, la separacin en bloques y la construccin de factoriales fraccionados.
E n el sistem a de los diseos 3k, cuando los factores son cuantitativos, es com n denotar los niveles
bajo, interm edio y alto con - 1 ,0 y +1, respectivam ente. Con esto se facilita el ajuste de un modelo de re-

363

364

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS C O N TRES NIVELES

02

12

01

11

00

10

20

Factor A

Figura 9-1 Combinaciones de tratamientos en un


diseo 32.

gresin que relaciona la respuesta con los niveles de los factores. P or ejemplo, considere el diseo 32 de la
figura 9-1, y sea que*! represente al factor A y q u e^ 2 represente al factor B . U n m odelo de regresin que
relaciona la respuesta y con
y x 2 que se basa en este diseo es
y = 0 + lx l + /? 2 'c 2 ^ n x ix i

u x i ^ v .x i

(9*1)

Observe que la adicin de un tercer nivel de los factores perm ite que la relacin entre la respuesta y los
factores del diseo se m odele como un m odelo cuadrtico.
El diseo 3* es ciertam ente una eleccin posible para un experim entador que se preocupa por la cur
vatura en la funcin de respuesta. Sin embargo, es necesario tom ar en consideracin dos puntos:
1. El diseo 3k no es la form a ms eficiente de m odelar una relacin cuadrtica; los diseos de su
perficie de respuesta que se exponen en el captulo 11 son alternativas superiores.

Factor A
F igura 9-2

C om binaciones de tratam ientos en un dise o 33,

9-1 DISEO FACTORIAL 3l

2.

365

El diseo 2* aum entado con los puntos centrales, como se analiz en el captulo 6, es una form a
excelente de obtener una indicacin de la curvatura. Perm ite conservar reducido el tam ao y la
complejidad del diseo y al mismo tiem po perm ite obtener cierta proteccin contra la curvatura.
Entonces, si la curvatura es im portante, el diseo de dos niveles puede aum entarse con corridas
axiales para obtener un diseo central compuesto, como se ilustra en la figura 6-36. E sta estrate
gia secuencial de experim entacin es ms eficiente, por mucho, que correr un diseo factorial 3*
con factores cuantitativos.

9-1.2

El diseo 32

El diseo ms simple del sistem a 3* es el diseo 32, el cual tiene dos factores, cada uno con tres niveles. Las
combinaciones de tratam ientos de este diseo se m ostraron en la figura 9-1. Puesto que estn presentes
32 = 9 combinaciones de tratam ientos, hay ocho grados de libertad entre estas com binaciones de trata
mientos. Los efectos principales de A y B tienen dos grados de libertad cada uno, y la interaccin>15 tiene
cuatro grados de libertad. Si hay n rplicas, habr 32- 1 grados de libertad totales y 3\ n - 1 ) grados de li
bertad del error.
Las sumas de cuadrados de^4, B y A B pueden calcularse m ediante los m todos usuales para los dise
os factoriales analizados en el captulo 5. Cada efecto principal puede representarse con un com ponente
lineal y uno cuadrtico, cada uno con un solo grado de libertad, como se observa en la ecuacin 9-1. D esde
luego, esto slo tiene sentido si el factor es cuantitativo.
L a particin de la interaccin de dos factores A B puede hacerse de dos m aneras. El prim er m todo
consiste en subdividir A B en los cuatro com ponentes con un solo grado de libertad que corresponden a
A B L * l ,A B l x q ,A B q L y A B g * Q. Esto puede hacerse ajustando los trm inos i& fr ivxix 2 > u ^ i^ h Y
U22x i x l , respectivam ente, como se indic en el ejem plo 5-5. P ara los datos de la vida de la herram ienta
de ese ejemplo se obtiene SSABl xL = 8.00, S S ^ xQ = 42.67, SS A B q x 1 = 2.67y S S ^ xQ = 8.00. Puesto que
se trata de u na particin ortogonal de A S , observe que S S ^ = SSM l xL + SSABl xQ + S S ^ xL + SSMqxQ
61.34.
E l segundo m todo se basa en los cuadrados latinos ortogonales. C onsidere los totales de las combi
naciones de los tratam ientos para los datos del ejem plo 5-5. Estos totales se m uestran en la figura 9-3
como los nm eros encerrados en crculos dentro de los cuadrados. Los dos factores A y B corresponden a
los renglones y las columnas, respectivam ente, de un cuadrado latino 3 x 3. E n la figura 9-3 se m uestran
dos cuadrados latinos 3 x 3 particulares, superpuestos en los totales de las celdas.
Estos dos cuadrados latinos son ortogonales; es decir, si uno de los cuadrados se superpone en el otro,
cada letra del prim er cuadrado aparecer exactam ente una vez con cada letra del segundo cuadrado. Los
totales de las letras en el cuadrado a son Q = 18, R = - 2 y S = 8, y la suma de cuadrados entre estos totales
Factor B

Factor B

s *
- s e
s , *
a)

. s
s . *
. s .
6)

Figura 9-3 Totales de las combinaciones de los tratamientos del ejemplo 5-5
con dos cuadrados latinos superpuestos.

366

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS C O N TRES NIVELES

es [182 + (-2 )2 + 82]/(3)(2) - [242/(9)(2)] = 33.34, con dos grados de libertad. D e m anera similar, los to ta
les de las letras en el cuadrado b son Q = Q,R = 6 y S = 18, y la sum a de cuadrados entre estos totales es [O2
+ 62 + 182]/(3)(2) - [242/(9)(2)] = 28.00, con dos grados de libertad. Observe que la suma de estos dos
com ponentes es
33.34+ 28.00= 61.34=
con 2 + 2 = 4 grados de libertad.
E n general, a la suma de cuadrados calculada con el cuadrado a se le llam a el componente A de la in
teraccin, y a la suma de cuadrados calculada con el cuadrado b se le llam a el componente A B 2 de la inte
raccin. C ada uno de los com ponentes A B y A B 2 tiene dos grados de libertad. Se usa esta term inologa
porque si los niveles (0 ,1 ,2 ) de A y B se denotan por*! y x 2, respectivam ente, entonces se encuentra que
las letras ocupan celdas de acuerdo con el siguiente patrn:

Cuadrado a
0 (mod 3)
R : x 1 + x 2 = 1 (mod 3)
S : xt + x2 ~ 2 (mod 3)
Q : x + x 2 =

Cuadrado b
Q: x1+ 2 x 2 0 (mod 3)
S : x, + 2 x 2 = 1 (mod 3)
R : x + 2 x 2 = 2 (mod 3)

Por ejemplo, en el cuadrado b se observa que la celda de en m edio corresponde a,x1 = 1 y x 2 = 1; por lo
tanto,*! + 2x 2 = 1 + (2)(1) = 3 = 0 (m od 3), y Q ocupara la celda de en medio. Cuando se consideran ex
presiones de la form a^ 5 , se establece la convencin de que el nico exponente perm itido en la prim era
letra es 1. Si el exponente de la prim era letra no es 1, la expresin com pleta se eleva al cuadrado y los ex
ponentes se reducen al m dulo 3. Por ejemplo, A 2B es lo mismo que A B 2 porque
A 2B = ( A 2B ) 2 = A * B 2 = A B 2
Los com ponentes A B y A B 2 de la in t e r a c c i n ^ no tienen significado real y p o r lo general no se in
cluyen en la tabla del anlisis de varianza. Sin em bargo, esta particin en gran m edida arbitraria de la
interaccin A B en dos com ponentes ortogonales con dos grados de libertad es muy til para construir di
seos ms complicados. Adems, no hay relacin entre los com ponentes A B y A B 2 de la interaccin y las
sumas de cuadrados de A B L x L, A B L x Q, A B Q x L y A B Q x Q.
Los com ponentesA B y A B 2 de la interaccin pueden calcularse de otra m anera. Considere los totales
de las combinaciones de los tratam ientos en cualquiera de los cuadrados de la figura 9-3. Si se hace la
suma de los datos en las diagonales hacia abajo de izquierda a derecha, se obtienen los totales -3 + 4 - 1 =
0, -3 + 10 - 1 = 6 y 5 + 11 + 2 = 18. La suma de cuadrados entre estos totales es 28.00 (AB2). E n form a si
milar, los totales de la diagonal hacia abajo de derecha a izquierda son 5 + 4-1 = 8, -3 + 2-1 = -2 y -3 +
11 + 10 = 18. L a suma de cuadrados entre estos totales es 33.34 (AB). Yates llam a estos com ponentes
de la interaccin los componentes / y / de la interaccin, respectivam ente. Se usarn aqu indistintam ente
las dos notaciones; es decir,
I(A B )= A B 2
J ( A B )= A B

9-1 DISEO FACTORIAL 3k

9-1.3

367

El diseo 33

Suponga ahora que hay tres factores (A, B y C) bajo estudio, y que cada factor tiene tres niveles dispuestos
en un experim ento factorial. Se trata de un diseo factorial 33, y la disposicin experim ental y la notacin
de las com binaciones de los tratam ientos se presentaron anteriorm ente en la figura 9-2. Las 27 com bina
ciones de tratam ientos tienen 26 grados de libertad. Cada efecto principal tiene 2 grados de libertad, cada
interaccin de dos factores tiene 4 grados de libertad y la interaccin de tres factores tiene 8 grados de li
bertad. Si se hacen n rplicas, hay n33- 1 grados de libertad totales y 33(re - 1 ) grados de libertad del error.
Las sumas de cuadrados pueden calcularse utilizando los m todos estndares para los diseos facto
riales. Adems, si los factores son cuantitativos, es posible hacer la particin de los efectos principales en
un com ponente lineal y uno cuadrtico, cada uno con un solo grado de libertad. Las interacciones de dos
factores pueden descom ponerse en efectos lineal x lineal, lineal X cuadrtico, cuadrtico X lineal y cua
drtico x cuadrtico. Por ltimo, puede hacerse la particin de la interaccin de tres factores A B C en
ocho com ponentes con un solo grado de libertad que corresponden a lineal x lineal x lineal, lineal x li
neal x cuadrtico, etctera. E sta descomposicin de la interaccin de tres factores no es por lo general de
gran utilidad.
Tambin es posible hacer la particin de las interacciones de dos factores en sus com ponentes I y J.
stos se designaran A B , A B 2, A C , A C 2, B C y B C 1, y cada com ponente tendra dos grados de libertad.
Como en el diseo 32, estos com ponentes no tienen significacin fsica.
Es posible hacer la particin de la interaccin de tres fa.ctore.sABC en cuatro com ponentes ortogona
les con dos grados de libertad, a los que suele denom inarse los com ponentes W,X, Y y Z de la interaccin.
Ikm bin se hace referencia a ellos como los com ponentes A B 2C2, A B 2C, A B C 1 y A B C de la interaccin
A B C , respectivam ente. Las dos notaciones se usan indistintam ente; es decir,
W ( A B C ) = A B 2C 2
X (A B C ) = A B 2C
Y (A B C )= A B C 2
Z (A B C )= A B C
Observe que ninguna de las prim eras letras puede tener un exponente diferente de 1. Al igual que los
com ponentes I y J, los com ponentes W, X, Y y Z no tienen ninguna interpretacin prctica. Sin embargo,
son tiles p ara construir diseos ms complejos.
E JE M P L O 9 - 1 ...........................................................................................................................................................
Se usa una m quina para llenar contenedores m etlicos de 5 galones con jarabe p ara una bebida gaseosa.
L a variable de inters es la cantidad de jarabe perdida debido al espumeo. Se piensa que tres factores in
fluyen en el espumeo: el diseo de la boquilla (A), la velocidad del llenado (B ) y la presin de operacin
(C). Se seleccionan tres boquillas, tres velocidades de llenado y tres presiones, y se corren dos rplicas de
un experim ento factorial 33. E n la tabla 9-1 se m uestran los datos codificados.
El anlisis de varianza de los datos de la prdida de jarabe se m uestra en la tabla 9-2: Las sumas de
cuadrados se calcularon con los m todos usuales. Se observa que la velocidad de llenado y la presin de
operacin son estadsticam ente significativas. Las tres interacciones de dos factores tam bin son signifi
cativas. E n la figura 9-4 se analizan grficam ente las interacciones de dos factores. El nivel interm edio de
la velocidad produce el m ejor desem peo, m ientras que las boquillas tipo 2 y 3, y la presin baja (10 psi) o
bien alta (20 psi) parecen ser las ms efectivas para reducir la prdida de jarabe.

368
Tabla 9-1

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Datos de la prdida de jarabe del ejemplo 9-1 (las unidades son centm etros cbicos - 70)

Tipo de boquilla (A)


2
Velocidad (en rpm) (B)
100 120 140
20
17 -65
4
24 -58
110
55 -55
44
120 -44
-23 -64 -20
-5
-62 -31

1
Presin (en psi) (C)
10
15
20

100
-35
-25
110
75
4
5

120
-45
-60
-10
30
-40
-30

140
-40
15
80
54
31
36

3
100
-39
-35
90
113
-30
-55

120
-55
-67
-28
-26
-61
-52

140
15
-30
110
135
54
4

El ejemplo 9-1 ilustra una situacin en la que el diseo de tres niveles suele encontrar cierta aplica
cin; uno o ms de los factores es cualitativo, asum iendo desde luego tres niveles, y los dem s factores son
cuantitativos. E n este ejemplo, suponga que slo hay tres diseos de la boquilla que son de inters. Se tra
ta evidentem ente, entonces, de un factor cualitativo que requiere tres niveles. La velocidad de llenado y ia
presin de operacin son factores cuantitativos. Por lo tanto, podra ajustarse un m odelo cuadrtico
como el de la ecuacin 9-1 en los dos factores, velocidad y presin, con cada nivel del factor boquilla.
E n la tabla 9-3 se m uestran estos modelos de regresin cuadrticos. L as de estos m odelos se estim a
ron usando un program a de com putadora de regresin lineal estndar. (E n el captulo 10 se analizar con
mayor detalle la regresin de mnimos cuadrados.) E n estos modelos, las variables^ y x 2estn codificadas
en los niveles -1 ,0 , +1, como se estudi anteriorm ente, y se supusieron los siguientes niveles naturales
para la presin y la velocidad:

Nivel codificado

Velocidad (rpm)

Presin (psi)

-L

100

10

0
+1

120
140

15
20

E n la tabla 9-3 se presentan estos modelos tanto en trm inos de estas variables codificadas como en tr
minos de los niveles naturales de la velocidad y la presin.

labia 9-2 Anlisis de varianza de los datos de la prdida de jarabe


Suma de
Grados de
Cuadrado
Fuente de
variacin
libertad
medio
cuadrados
496.89
2
A , boquilla
993.77
2
30,595.17
B, velocidad
61,190.33
2
34,552.67
69,105.33
C, presin
1,575.22
4
AB
6,300.90
1,878.47
4
7,513.90
AC
3,213.58
4
12,854.34
BC
578.60
8
4,628.76
ABC
426.50
27
11,515.50
Error
53
Total
174,102.83

F0
1.17
71.74
81.01
3.69
4.40
7.53
1.36

Valor P
0.3256
<0.0001
<0.0001
0.0383
0.0222
0.0025
0.2737

9-1 DISEO FACTORIAL 3l

400

400

369

C - 15

B -140
200

200

B = 100

C = 20
a -200

-200

C-10

B = 120
-400

-400

Tipo de boquilla (A)

Tipo de boquilla (A)

61

a)

Velocidad en rpm (B )
c)

Figura 9-4

Interacciones de dos factores del ejemplo 9-1.

Tabla 9-3 Modelos de regresin para el ejemplo 9-1


xx = velocidad (5), x2 = Presin (P) en unidades codificadas
Tipo de boquilla
= 22.1 + 3.5*, + 16.3*2+ 51.7^ - 71.&C* + 2.9xix1
1

f =1217.3 - 31.2565 + 86.017P+0.1291752 - 2.8733Z2+ 0.028755P


j> = 25.6-22.8x! -12.3x2+ 14.1^ - 5 6 .9 ^ -0 .7 ^ x 2
S>= 180.1 -9.4755+ 66.75/+ (X03553 - 2.2767/1 -0.0075SP
P = 15.1 + 20.3xj + 5.9*2 + 75.8*1 94-9 x + lO.Sx^

$ = 194ai 40.0585+102.48/+ ai895853 - 3.7967P2+ 0.105SP

370

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS C O N TRES NIVELES

E n la figura 9-5 se m uestran las grficas de contorno de las superficies de respuesta de la prdida de
jarabe constante, como una funcin de la velocidad y la presin para cada tipo de boquilla. Estas grficas
revelan inform acin de considerable utilidad acerca del desem peo de este sistema de llenado. Puesto
que el objetivo es minimizar la prdida de jarabe, se preferira la boquilla tipo 3, ya que los contornos ob
servados ms pequeos (-60) slo aparecen en esta grfica. D ebern usarse la velocidad de llenado cerca
del nivel interm edio de 120 rpm y el nivel de presin ya sea bajo o alto.
Cuando se construyen grficas de contorno para un experim ento que tiene una mezcla de factores
cuantitativos y cualitativos, no es raro encontrar que las formas de las superficies de respuesta de los fac
tores cuantitativos son muy diferentes en cada nivel de los factores cualitativos. Esto puede observarse en
cierta m edida en la figura 9-5, donde la forma de la superficie para la boquilla tipo 2 es considerablem ente
alargada en com paracin con las superficies de las boquillas tipo 1 y 3. Cuando esto ocurre, implica que
las condiciones de operacin ptimas (y otras conclusiones im portantes) en trm inos de los factores
cuantitativos son muy diferentes en cada nivel de los factores cualitativos.
Es sencillo m ostrar la particin num rica de la interaccin ABC en sus cuatro com ponentes ortogo
nales con dos grados de libertad utilizando los datos del ejemplo 9-1. El procedim iento general h a sido
descrito p or Cochran y Cox [26] y Davies [36]. Prim ero se seleccionan dos cualesquiera de los tres facto
res, por ejemplo A , y se calculan los totales / y / de la interaccin A en cada nivel del tercer factor C.
Estos clculos se presentan a continuacin:

Tbtales

3.

100
120
140

-60
-105
-25

41
-123
24

-7 4
-122
-15

-198
-106
-155

-222

10

15

100
120
140

185
20
134

175
-99
154

203
-54
245

331
255
377

238
440
285

20

100
120
140

9
-70
67

-28
-126
-51

-85
-113
58

-59
-74
-206

-144
^0
-155

-79
-158

Despus, los totales /(A ) y /(A ) se arreglan en una tabla de dos vas con el factor C, y se calculan los to
tales de las diagonales / y / de esta nueva disposicin:

Tbtales

C
10
15
20

1(AB)
-198
331
-59

-106
255
-74

-155
377
-206

Totales

-149
212
102

41
19
105

10
15
20

J(AB)
-222
238
-144

-79
440
-40

-158
285
-155

63
62
40

138
4
23

Los totales de las d iag o n ales/y /calcu lad o s arriba son en realidad los totales que representan las cantida
d es/[/(A S ) x C] = A B 2C2,J[I(AB) x C] = A B 2C, I[J(AB) x C] = A B C 2 y J[J(AB) x C] = A B C , o los
com ponentes W, X, Y y Z deA C . Las sumas de cuadrados se encuentran de la m anera usual; es decir,

9'1 DISEO FACTORIAL 3k

Velocidad
a) Boquilla tipo 1

Velocidad

b) Boquilla tipo 2

Velocidad
e) Boquilla tipo 3

Figura 9-5 Contornos de la prdida de jarabe constante


(unidades: cc - 70) como una funcin de la velocidad y la
presin para las boquillas tipo 1, 2 y 3, ejemplo 9-1,

3 71

372

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

I [ I ( A B ) x C ] = A B 2C 2 = W (A B C )
(149)2 + (2 1 2 )2 +(102)2
-------------------18

(165)2
54 - 3804.11

/ [ / ( A B ) x C] = A B 2C = X (A B C )
= (41)2 + (1 9 )2 +(105)2
18
I[ J (A B )x C ] = A B C 2 = Y (A B C )
(63)2 + (6 2 )2 + (4 0 )2
--------------- 8
J [J (A B ) x C] = A B C = Z (A B C )
.. (138)2 + ( 4 ) 2 + (2 3 )2
""
18

(165)2
54
(165)2
54 _ 1 8 ' 77
(165)2
54 -

A un cuando se trata de una particin ortogonal de SSABC, se seala de nuevo que no se acostum bra p re
sentarla en la tabla del anlisis de varianza. E n secciones subsecuentes se analiza la necesidad ocasional
de calcular uno o ms de estos componentes.

9-1.4

El diseo general 3k

Los conceptos utilizados en los diseos 32y 33 pueden extenderse de inm ediato al caso de k factores, cada
uno con tres niveles, es decir, a un diseo factorial 3k. Se em plea la notacin digital usual para las combi
naciones de tratam ientos, por lo que 0120 representa una combinacin de tratam ientos en un diseo 34
con A y D e n los niveles bajos, B en el nivel interm edio y C en el nivel alto. Hay 3k combinaciones de trata
mientos, con 3 * -1 grados de libertad entre ellas. Estas com binaciones de tratam ientos perm iten deter
m inar las sumas de cuadrados de k efectos principales, cada uno con dos grados de libertad; (^)
interacciones de dos factores, cada una con cuatro grados de lib e rta d ;...; y una interaccin de k factores
con 2k grados de libertad. E n general, u na interaccin de h factores tiene 2h grados de libertad. Si se h a
cen n rplicas, hay n3k - 1 grados de libertad totales y 3k(n - 1) grados de libertad del error.
Las sumas de cuadrados de los efectos y las interacciones se calculan con los m todos usuales para los
diseos factoriales. D e m anera tpica, no se hace ninguna descomposicin adicional de las interacciones
de tres factores y de rdenes superiores. Sin embargo, cualquier interaccin de h factores tiene 2_1 com
ponentes ortogonales con dos grados de libertad. Por ejemplo, la interaccin de cuatro factores A B C D
tiene 241 = 8 com ponentes ortogonales con dos grados de libertad, denotados por A B C D 2, ABC?D,
A B 2C D ,A B C D ,A B C 2D 2,A B 2C1D ,A B 2CD2 y A B 2C2D 2. Al escribirse estos com ponentes, observe que el
nico exponente perm itido en la prim era letra es 1. Si el exponente de la prim era letra no es 1, entonces la
expresin com pleta debe elevarse al cuadrado y los exponentes deben reducirse al m dulo 3. Para ilustrar
lo anterior, considere
A 2BCD = ( A 2BC D )2 = A 4B 2C 2D 2 = A B 2C 2D 2
Estos com ponentes de la interaccin no tienen ninguna interpretacin fsica, pero son tiles p ara cons
tru ir diseos ms complejos.
E l tam ao del diseo se increm enta rpidam ente con k. Por ejemplo, un diseo 33tiene 27 com bina
ciones de tratam ientos por rplica, un diseo 34 tiene 81, un diseo 35 tiene 243, etctera. Por lo tanto, con
frecuencia slo se considera una sola rplica del diseo 3k, y las interacciones de rdenes superiores se
com binan para proporcionar una estimacin del error. Como una ilustracin, si las interacciones de tres

9-2 CONFUSIN EN EL DISEO FACTORIAL 3k

3 73

factores y de rdenes superiores son insignificantes, entonces una sola rplica del diseo 33proporciona 8
grados de libertad del error, y una sola rplica del diseo 34 proporciona 48 grados de libertad del error.
Estos diseos siguen siendo grandes para k 3 y, por consiguiente, son de escasa utilidad.

9-2

CONFUSIN EN EL DISEO FACTORIAL 3k

Incluso cuando se considera una sola rplica del diseo 3*, sta requiere tantas corridas que es im proba
ble que puedan hacerse las 3* corridas bajo condiciones uniformes. Por lo tanto, con frecuencia es necesa
rio hacer la confusin (o m ezclado) en bloques. El diseo 3k puede confundirse en y bloques
incompletos, dondep < k. Por lo tanto, estos diseos pueden confundirse en tres bloques, nueve bloques,
etctera.

9-2.1

El diseo factorial 3ken tres bloques

Suponga que se quiere confundir el diseo 3* en tres bloques incompletos. Estos tres bloques tienen dos
grados de libertad entre ellos; por lo tanto, debe haber dos grados de libertad confundidos con los blo
ques. R ecuerde que en la serie factorial 3k cada efecto principal tiene dos grados de libertad. Adems,
cada interaccin de dos factores tiene cuatro grados de libertad y puede descom ponerse en dos com po
nentes de la interaccin (por ejemplo, A B y A B 2), cada uno con dos grados de libertad; cada interaccin
de tres factores tiene ocho grados de libertad y puede descomponerse en cuatro com ponentes de la in
teraccin (por ejemplo, ABC, A C 2, A B 2C y A B 2C2), cada uno con dos grados de libertad; y as sucesiva
m ente. Por lo tanto, es conveniente confundir un com ponente de interaccin con los bloques.
El procedim iento general consiste en construir una definicin de contrastes
L a^xl + a 1x 2 + + a kx k

(9-2)

donde a representa el exponente del factor i-simo en el efecto que va a confundirse yx es el nivel del fac
tor -simo en una combinacin de tratam ientos particular. Para la serie 3* se tiene a = 0,1 o 2, donde la
prim era a diferente de cero es la unidad, yx, = 0 (nivel bajo), 1 (nivel interm edio) o 2 (nivel alto). Las
com binaciones de tratam ientos del diseo 3k se asignan a los bloques con base en el valor de L (mod 3).
Puesto q u eL (m od 3) slo puede asumir los valores 0,1 o 2, tres bloques estn definidos de m anera nica.
Las combinaciones de tratam ientos que satisfacen L = 0 (m od 3) constituyen el bloque principal. Este
bloque incluir siempre la combinacin de tratam ientos 00 ...0.
Por ejemplo, suponga que quiere construirse un diseo factorial 32 en tres bloques. C ualquiera de los
com ponentes de la interaccin A B , A B o A B 2, puede confundirse con los bloques. Al elegir arbitrariam en
te A B 2, se obtiene la definicin de contrastes
L = x 1+ 2 x1
El valor de L (mod 3) de cada combinacin de tratam ientos puede encontrarse de la siguiente m anera:

00
01

02

10

L=
L=
L=
L=

1 (0 )+ 2 (0 )=
1 (0 )+ 2 (1 )=
l(0 )+ 2 ( 2 )=
1(1)+2(0) =
20:

0 = 0 (m od 3) 11: L = 1(1 )+ 2 (1 )=
2 = 2 (m o d 3) 21: L = 1 (2 )+ 2 (1 )=
4 = 1 (m od 3) 12: L = 1 (1 )+ 2 (2 )=
1 = 1 (m o d 3) 22: L = l(2 ) + 2 ( 2 ) =
L = 1 (2 )+ 2 (0 )= 2 = 2 (m od 3)

E n la figura 9-6 se m uestran los bloques.

3=
4=
5=
6=

0 ( m o d 3)
1 (m o d 3)
2 (m od 3)
0 ( m o d 3)

374

CAPTULO 9
Bloque 1

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Bloque 2

Bloque 3

00

10

11
22

21
02

01
12
20

a) Asignacin de las combinaciones


de tratamiento a los bloques

2
o 1

02

21

11

i----------------

00

22

12

>- ---------- -i i

01

I
u_

-----------<t20

- Bloque 1
O - Bloque 2
O - Bloque 3

10

2
FactorA

6) Vista geomtrica

Figura 9-6
fundida.

El diseo 32en tres bloques con A B 2 con

Los elem entos del bloque principal forman un grupo con respecto a la adicin mdulo 3. Con refe
rencia a la figura 9-6, se observa que 11 + 11 = 22 y 11 + 22 = 00. Las combinaciones de tratam ientos de
los otros dos bloques pueden generarse sumando, en mdulo 3, cualquier elem ento del nuevo bloque con
los elem entos del bloque principal. Por lo tanto, p ara el bloque 2 se usa 10 para obtener
10+00=10

10+11 = 21

10+22=02

01+11 = 12 y

01+22=20

Para generar el bloque 3, al utilizar 01, se encuentra


01+00=01

EJEMPLO 9 - 2 ....................................................................................................................................
El anlisis estadstico del diseo 32 confundido en tres bloques se ilustra em pleando los datos siguientes,
los cuales provienen de la rplica nica del diseo 32 que se m uestra en la figura 9-6.
Bloque 1
00= 4
11 = - 4
22= 0
TbtaJes de los bloques =

Bloque 2
10 = 2
21 = 1
02 = 8

Bloque 3
01 = 5
12 = - 5
20= 0

Al aplicar los m todos convencionales para el anlisis de factoriales, se encuentra que SSA = 131.56 y
SSB = 0.22.

9-2 CONFUSIN EN EL DISEO FACTORIAL 3l


Tabla 9 - 4

375

A n lisis d e varianza de lo s d a to s d el
ejem plo 9-2

Fuente de
variacin
Bloques (AB2)
A
B
AB
Tbtal

Grados de
libertad

Suma de
cuadrados

2
2
2
2
8

10.89
131.56
0.22
2.89
145.56

Se encuentra tam bin que


$s _

. . M

io

) 1 _ ( 2 1 = 1 0 .89

Sin embargo, SSBloques es exactam ente igual al com ponente A S 2 de la interaccin. Para ver esto, las obser
vaciones se escriben de la siguiente m anera:

Factor A

0
1
2

0
4
-2
0

Factor B
1
5
-A
1

2
8
-5
0

Recuerde, por la seccin 9-1.2, que el com ponente I o A B 2 de la interaccin A puede encontrarse calcu
lando la sum a de cuadrados entre los totales de la diagonal de izquierda a derecha de la representacin
anterior. Se obtiene as
^

= f f l l 0 L _ ( 2 l = ia89

valor que es idntico a SSBlotjues.


El anlisis de varianza se presenta en la tabla 9-4. Puesto que hay una sola rplica, no puede hacerse
una prueba formal. No es una buena idea utilizar el com ponente A de la interaccin como una estim a
cin del error.
Se considera ahora un diseo un poco ms complicado; un diseo factorial 33 confundido en tres blo
ques con nueve corridas cada uno. E l com ponente A 2C? de la interaccin de tres factores se confundir
con los bloques. L a definicin de contrastes es
L = x 1 + 2 x 2 + 2x 3
Es sencillo verificar que las combinaciones de tratam ientos 000, 012 y 101 se encuentran en el bloque
principal. Las corridas restantes del bloque principal se generan de la siguiente m anera:
(1) 000

(4) 101 +101 = 202

(7) 101 + 021 = 122

(2) 012 (5) 012+ 012 = 021

(8) 012 + 202 = 211

(3) 101

(9) 021 + 2 0 2 = 2 2 0

(6) 1 0 1+ 012= 110

376

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS C O N TRES NIVELES

Para encontrar las corridas de otro bloque se observa que la com binacin de tratam ientos 200 no est en
el bloque principal. Por lo tanto, los elem entos del bloque 2 son

(1) 200+ 000=200


(2) 200+ 012=212

(4) 200 + 202= 102

(7) 200 + 1 2 2 = 0 2 2

(5) 200+021 = 221

(8) 200+211 = 111

(3) 200+101 = 001

( 6) 200+ 110=010

(9) 200 + 2 2 0 = 1 2 0

Observe que todas estas corridas satisfacen!, = 2 (m od 3). El ltim o bloque se encuentra observando que
100 no pertenece al bloque 1 ni al bloque 2. Al usar 100 como arriba, se obtiene

(1) 100+ 000=100


(2) 100+ 012=112

(4) 100 + 202 = 002

(7) 1 0 0+ 122= 222

(5) 100+021 = 121

(8) 100+211 = 011

(3) 100+101 = 201

( 6 ) 100 + 110= 210

(9) 1 0 0 + 2 2 0 = 0 2 0

Los bloques se ilustran en la figura 9-7.


Bloque 1

Bloque 2

Bloque 3

000
012
101
202
021
110
122
211
220

200
212
001
102
221
010
022
111
120

100
112
201
002
121
210
222
011
020

a) Asignacin de las combinaciones de


tratamientos a ios bloques

Factor A

b) Vista geomtrica
Figura 9-7

El diseo 33 en tres bloques con A B 2C2 confundida.

9-2 CONFUSIN EN EL DISEO FACTORIAL 3l


Tabla 9-5

377

Anlisis de varianza de un diserto 33


con AB2C Zconfundida

Fuente de variacin
Bloques (AB2C?)
A
B
C
AB
AC
BC
Error (ABC + AB 2C +ABC1)
Total

Grados de
libertad
2
2
2
2
4
4
4
6
26

E n la tabla 9-5 se presenta el anlisis de varianza de este diseo. Al utilizar este esquem a de confusin
(o mezclado), se cuenta con inform acin acerca de todos los efectos principales y las interacciones de dos
factores. Los com ponentes restantes de la interaccin de tres factores (A B C ,A B 2C y A B C 2) se combinan
como una estimacin del error. L a sum a de cuadrados de esos tres com ponentes podra obtenerse por
sustraccin. E n general, para el diseo 3* en tres bloques se seleccionara siem pre un com ponente de la
intraccin de orden ms alto para confundirlo con los bloques. Los dems com ponentes de esta interac
cin que no estn confundidos pueden obtenerse calculando la interaccin de k factores de la m anera
usual y restando de esta cantidad la suma de cuadrados de los bloques.

9-2.2

El diseo factorial 3* en nueve bloques

E n algunas situaciones experim entales puede ser necesario confundir el diseo 3* en nueve bloques. Por
lo tanto, ocho grados de libertad se confundirn con los bloques. Para construir estos diseos se eligen dos
com ponentes de interaccin y, como resultado, dos ms se confundirn autom ticam ente, produciendo
los ocho grados de libertad requeridos. Estos dos son las interacciones generalizadas de los dos efectos
elegidos originalm ente. E n el sistema 3*, las interacciones generalizadas de dos efectos (es decir, P y Q) se
definen como PQ y PQ2 (o P2Q).
Los dos com ponentes de interaccin elegidos inicialmente producen dos definiciones de contrastes
L l = a 1X i+ a 2x 2 -\------bcc^x^ = u (m od 3)

u= 0 , 1 ,2

L2 =

h = 0, 1, 2

+ 2x 2 + \-kx k - h (m od 3)

donde {a,} y {fi} son los exponentes de la prim era y la segunda interacciones generalizadas, respectiva
m ente, con la convencin de que las prim eras a y diferentes de cero son la unidad. Las definiciones de
contrastes de la ecuacin 9-3 implican nueve ecuaciones sim ultneas especificadas por el p ar de valores
para L i y L 2. Las combinaciones de tratam ientos que tienen el mismo p ar de valores para (L h L 2) se asig
nan al mismo bloque.
El bloque principal consta de las combinaciones de tratam ientos que satisfacenL x = L 2 = 0 (m od 3).
Los elem entos de este bloque form an un grupo con respecto a la adicin m dulo 3; por lo tanto, el esque
m a presentado en la seccin 9-2.1 puede usarse para generar los bloques.

378

CAPTULO 9 DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Como un ejemplo, considere el diseo factorial 34 confundido en nueve bloques con nueve corridas
cada uno. Suponga que se elige confundir A B C y A B 2D 2. Sus interacciones generalizadas
(A B C )( A B 2D 2) = A 2B 3C D 2 = ( A 2B i CD 2) 2 = A C 2D
( A B C )( A B 2D 2) 2 = A 3B s CD* = B 2CD = ( B 2C D )2 = B C 2D 2
tam bin estn confundidas con los bloques. Las definiciones de contrastes de A B C y A B 2D 2 son
A

= X1

L2 ~

+X 2

* " A:3

( 9 -4 )

xi + 2 x 2 + 2 x 4

Los nueve bloques pueden construirse utilizando las definiciones de contrastes (ecuacin 9-4) y la propie
dad de la teora de grupos del bloque principal. El diseo se m uestra en la figura 9-8.
Para el diseo 3k en nueve bloques habr cuatro com ponentes de interaccin confundidos. Los dems
com ponentes de estas interacciones que no estn confundidos pueden determ inarse restando la suma de
cuadrados del com ponente confundido de la sum a de cuadrados de la interaccin completa. El m todo
descrito en la seccin 9-1.3 puede ser til para calcular los com ponentes de interaccin.

9 -2 .3

El d iseo factorial

3k

en

3 P bloques

El diseo factorial 3k puede confundirse en bloques con 3k~p observaciones cada uno, donde p < k. El
procedim iento consiste en seleccionar p efectos independientes que habrn de confundirse con los blo
ques. Como resultado, exactam ente otros (3F - 2 p - l)/2 efectos se confunden de m anera autom tica.
E stos efectos son las interacciones generalizadas de los efectos elegidos originalm ente.
Como una ilustracin, considere un diseo 37que va a confundirse en 27 bloques. Puesto quep = 3, se
seleccionaran tres com ponentes de interaccin independientes y se confundiran autom ticam ente otros
[33- 2(3) - 1]/2 = 10. Suponga que se eligen ABC2>G, B C E 2F2G y BDEFG. A partir de estos efectos pue-

Bloque 1 - Bloque 2

3loque 3

Bloque 4

Bloque 5

Bloque 6

3loque7

Bloque 8

Bloque 9

0000

0001

2000

0200

0020

0010

1000

0100

0002

0122

0120

2122

0022

0112

0102

1122

0222

0121

0211

0212

2211

0111

0201

0221

1211

0011

0210

1001

2021

1121

1020

1021

1022

0021

0221

1011

1110

1111

0110

1010

1100

1120

2110

1210

1112

1202

1200

0202

1102

1222

1212

2202

1002

1201

2012

2010

1012

2212

2002

2022

0012

2112

2011

1101

2001

2121

2111

0101

2201

2100
2222

(0,2)

2101

2012

2220

2221

1220

2120

2210

2200

0220

2020

- (0,0)

(0,1)

(2,2)

(2,0)

(2,1)

(1,2)

(1,1)

(1,0)

Figura 9-8

El diseo 3* en nueve bloques con ABC, AB2D 2, A C 2D y BC2D 2 confundidas.

9-3 RPLICAS FRACCIONADAS DEL DISEO FACTORIAL 3l

379

den construirse tres definiciones de contrastes, y los 27 bloques pueden generarse con los m todos descri
tos anteriorm ente. Los otros 10 efectos confundidos con los bloques son
(A B C 2D G )(B C E 2F 2G) = A B 2D E 2F 2G 2
(A B C 2D G )(B C E 2F 2G )2 = A B 3C 4D E 4F *G 3 = AC D E F
(A B C 2D G )(B D E F G )= A B 2C 2D 2E F G 2
(A B C 2D G )(B D E F G )2 = A B 3C 2D 3E 2F 2G 3 = A C 2E 2F 2
(B C E 2F 2G )(BD EFG )= B 2C D E3F 3G 2 = B C 2D 2G
(B C E 2F 2G )(BD EFG )2 = B 3C D 2E 4F 4G 3 = CD 2E F
(A B C 2D G )(B C E 2F 2G)(BDEFG) = A B 3C 3D 2E 3F 3G 3 = A D 2
(A B C 2D G )2 (B C E 2F 2G)(BDEFG) = A 2B * C 5D 3G 4 = A B 2CG 2
(A B C 2D G )(B C E 2F 2G )2(BD EFG) = A B C D 2E 2F 2G
(A B C 2D G )(B C E 2F 2G )(BD EFG )2 = A B C 3D 3E *F *G 4 = A B E F G
Se trata de un diseo enorm e que requiere 37 = 2187 observaciones dispuestas en 27 bloques con 81 ob
servaciones cada uno.

9-3

RPLICAS FRACCIONADAS DEL DISEO FACTORIAL 3k

E l concepto de rplica fraccionada puede extenderse a los diseos factoriales 3*. D ebido a que una rplica
com pleta del diseo 3k puede requerir un nm ero bastante grande de corridas incluso para valores m ode
rados de k, las rplicas fraccionadas de estos diseos son de inters. Sin embargo, como se ver ms ade
lante, algunos de estos diseos tienen estructuras de alias complicadas.

9-3.1

La fraccin un tercio del diseo factorial 3l

L a fraccin ms grande del diseo 3* es la fraccin un tercio que contiene 3*_1 corridas. Por consiguiente,
se hace referencia a l como el diseo factorial fraccionado 3*'1. P ara construir un diseo factorial fraccio
nado 3*'1 se selecciona un com ponente de interaccin con dos grados de libertad (generalm ente, la in
teraccin de orden ms alto) y se hace la particin del diseo 3k completo en tres bloques. C ada uno de los
tres bloques resultantes es un diseo fraccionado 3*1 y puede seleccionarse cualquiera de los bloques
p ara usarlo. Si A B ai C 3K 1 es el com ponente de interaccin utilizado p ara definir los bloques, enton
ces a I = A B ai C 3K k se le llam a la relacin de definicin del diseo factorial fraccionado. C ada efec
to principal o com ponente de interaccin estim ado a partir del diseo 3*1 tiene dos alias, los cuales
pueden encontrarse multiplicando el efecto tanto por I como por l 2 m dulo 3.
Como un ejemplo, considere una fraccin un tercio del diseo 33. Puede seleccionarse cualquiera de
los com ponentes de la interaccin A B C para construir el diseo, es decir, A B C , A B 2C, A B C 2 oA B ^C 1. Por
lo tanto, hay en realidad 12 fracciones un tercio diferentes del diseo 33 definidas por
x + a 2x 2 + a 3x 3 = u (m od 3)
donde a = l o 2 y = 0, l o 2. Suponga que se selecciona el com ponente deA B 2^ . Cada fraccin del dise
o 33-1 resultante contendr exactam ente 32 = 9 com binaciones de tratam ientos que deben satisfacer
j + 2 * j +2jc3 = u (m od 3)

380

CAPTULO 9 DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

donde u = 0,1 o 2. Es sencillo verificar que las tres fracciones un tercio son las que se m uestran en la figu
ra 9-9.
Si se corre cualquiera de los diseos 33-1 de la figura 9-9, la estructura de los alias resultante es
A = A ( A B 2C 2)= A 2B 2C 2 = A B C
A = A ( A B 2C 2) 2 = A 3B 4C 4 = B C
B = B (A B 2C 2) - A B 3C 2 = A C 2
B = B (A B 2C 2) 2 = A 2B 5C 4 = A B C 2
C = C (A B 2C 2)= A B 2C 3 = A B 2
C = C ( A B 2C 2) 2 = A 2B 4C 5 = A B 2C
A B = A B ( A B 2C 2) = A 2B 3C 2 = A C
A B = A B (A B 2C 2) 2 = A 3B SC 4 = B C 2
Por consiguiente, los cuatro efectos que en realidad se estim an a partir de los ocho grados de libertad
del diseo son A + B C + A B C , B + A C 2 + A B C 2, C + A B 2 + A B 2C y A B + A C + B C 2. Este diseo slo
tendra valor prctico si todas las interacciones fueran pequeas en com paracin con los efectos principa
les. Puesto que los efectos principales son alias de las interacciones de dos factores, se trata de un diseo
de resolucin m. Observe lo complejas que son las relaciones de los alias en este diseo. C ada efecto
principal es alias de un componente de interaccin. Si, por ejemplo, la interaccin de dos factores B C es
grande, esto distorsionar potencialm ente la estim acin del efecto principal de A y har que sea muy
complicada la interpretacin del efecto de A B + A C + B C 2. Es muy difcil ver cmo este diseo podra ser
de utilidad, a m enos que se suponga que todas las interacciones son insignificantes.
Diseo 1

u =0

Diseo 1
U 1

Diseo 1
u 2

000
012
101
202
021
110
122
211
220

100
112
201
002
121
210
222
011
020

200
212
001
102
221
010
022
111
120

a) Combinaciones de tratamientos

/ i
!
>
/ --*
//
--------- 1y

/ n
A
i
>

6) Vista geomtrica
F igura 9-9

Las tres fracciones un tercio del d ise o 33 con la relacin de definicin I = A B K ? .

9-3 RPLICAS FRACCIONADAS DEL DISEO FACTORIAL 3k

381

A ntes de dejar el diseo 3 ^ , observe que para el diseo con u - 0 (ver la figura 9-9), si se hace que A
denote el rengln y B la columna, entonces el diseo puede escribirse como

000

012

021

101

110

122

202 211

220

que es un cuadrado latino 3 x 3. El supuesto de las interacciones insignificantes requerido para la inter
pretacin nica del diseo 3j,7l tiene su paralelo en el diseo del cuadrado latino. Sin embargo, los dos di
seos surgen p or motivos diferentes, uno como consecuencia de la rplica fraccionada y el otro de las
restricciones sobre la aleatorizacin. Por la tabla 4-13 se observa que slo hay 3 x 3 cuadrados latinos y
que cada uno corresponde a uno de los doce diferentes diseos factoriales fraccionados 33"1.
Las com binaciones de tratam ientos en un diseo 3*'1 con la relacin de definicin
I = A B 2C 3 Kl pueden construirse utilizando un m todo similar al que se em ple en la serie 2k~p.
Prim ero se escriben las 3*'1corridas p ara un diseo factorial de tres niveles completo en k - 1 factores, con
la notacin comn 0 ,1 ,2 . ste es el diseo bsico en la term inologa del captulo 8. D espus se introduce
el factor /c-simo igualando sus xk niveles con el com ponente apropiado de la interaccin de orden ms
alto, por ejem plo A B 02C 3 - (.K l ) **1, m ediante la relacin
** = M

+ l X2 + - + k - l Xk-l

i 9' 5)

d o n d e # = (3- a k)a (m od 3) p ara 1 s i s / c - l . S e obtiene as un diseo con la resolucin ms alta posible.


Como una ilustracin, se usa este m todo para generar el diseo 3 ^ con la relacin de definicin
I = A B 2CD que se m uestra en la tabla 9-6. Es sencillo verificar que los tres prim eros dgitos de cada com
binacin de tratam ientos de esta tabla son las 27 corridas de un diseo 33 completo. Se trata del diseo b
sico. ParaA B 2CD se tiene a x = a 3 = 4 = 1 y a 2 = 2. Esto implica que/j = (3 - l ) a 1(mod 3) = (3 - 1)(1) =
2, i = ( 3 - 1)2 (m od 3) = (3 - 1)(2) = 4 = 1 (m od 3) y/?3 = (3 - 1 )a 3 (m od 3) = (3 - 1)(1) = 2. Por lo tan
to, la ecuacin 9-5 queda como
x A = l x i + x 2 + 2xi

(9-6)

Los niveles del cuarto factor satisfacen la ecuacin 9-6. Por ejemplo, se tiene 2(0) + 1(0) + 2(0) = 0,2(0)
+ 1(1) + 2(0) = 1, 2(1) + 1(1) + 2(0) = 3 = 0, etctera.
El diseo 3j1 resultante tiene 26 grados de libertad que pueden usarse p ara calcular las sumas de
cuadrados de los 13 efectos principales y los com ponentes de las interacciones (y sus alias). Los alias

Tabla 9-6

Un diseo 3 ^ con
= AB2CD

0000
0101
1100
1002
0202
1201
2001
2102
2200

0012
0110
0211
1011
1112
1210
2010
2111
2212

2221
0021
0122
0220
1020
1121
1222
2022
2120

382

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

de cualquier efecto se encuentran de la m anera usual; por ejemplo, los alias de A son A (AB2CD) ~
ABC?D2 y A (A B 2CD)2 = B C 2D 2. P uede verificarse que los cuatro efectos principales estn separados de
cualquier com ponente de interacciones de dos factores, pero que algunos com ponentes de interacciones
de dos factores son alias entre s. U na vez ms se observa la complejidad de la estructura de los alias. Si
cualquiera de las interacciones de dos factores es grande, probablem ente ser muy difcil aislarla con este
diseo.
El anlisis estadstico de un diseo 3kA se lleva a cabo con los procedim ientos usuales del anlisis de
varianza p ara experim entos factoriales. Las sumas de cuadrados de los com ponentes de interacciones
pueden calcularse como en la seccin 9-1. Cuando interprete los resultados, recuerde que los com ponen
tes de las interacciones no tienen ninguna interpretacin prctica.

9-3.2

Otros diseos factoriales fraccionados 3t_p

P ara m oderar los valores grandes de k , es deseable un fraccionamiento todava mayor del diseo 3 k. En
general, puede construirse una fraccin ( y del diseo 3k para p < k , donde la fraccin contiene 3t_p corri
das. A este diseo se le llam a el diseo factorial fraccionado 3*^. Por lo tanto, un diseo 3k~2 es una frac
cin un noveno, un diseo 3*-3 es una fraccin un veintisieteavo, etctera.
El procedim iento para construir un diseo factorial fraccionado 3k~p consiste en seleccionar/ com po
nentes de interacciones y usar estos efectos para hacer la particin de las 3 k combinaciones de tratam ien
tos en y bloques. Entonces cada bloque es un diseo factorial fraccionado 3k^ . L a relacin de definicin I
de cualquier fraccin consta de los p efectos elegidos inicialm ente y sus (3 p - 2 p - 1)/2 interacciones gene
ralizadas. El alias de cualquier efecto principal o com ponente de interaccin se obtiene con la multiplica
cin m dulo 3 del efecto por / e I2.
Las corridas que definen un diseo factorial fraccionado 3fc_p tam bin pueden generarse anotando
prim ero las com binaciones de tratam ientos de un diseo factorial 3 k~p com pleto e introduciendo despus
los p factores adicionales igualndolos con los com ponentes de las interacciones, como se hizo en la sec
cin 9-3.1.
El procedim iento se ilustrar construyendo un diseo 3*~2, es decir, una fraccin un noveno del dise
o 34. Sean AB2C y BC D los dos com ponentes de interacciones elegidos para construir el diseo. Sus in
teracciones generalizadas son (AB2C)(BCD) = A C 2D y (AB2C)(BCD )2 - A B D 2. Por lo tanto, la relacin
de definicin de este diseo es / = A B 2C = BC D = A C 2D = A B D 2, y el diseo es de resolucin III. Las
nueve combinaciones de tratam ientos del diseo se encuentran apuntando un diseo 32 en los fa cto res^
y B , y agregando despus dos nuevos factores haciendo
x 3 = 2x1+ x 2
x 4 = 2x 2 + 2 x s

Tabla 9-7 Un diseo 372


con! = ABZC
_________e I=BCP_______
0000

0111

1021

1102

0222
1210

2012

2120

2201

9-4 DISEOS FACTORIALES CON NIVELES MIXTOS


Tabla 9-8

E structura d e los alias d e l d ise o 3 jf 2 de la tabla 9-7

Efecto

Alias
I

A
B
C
D

383

ABC2

ABCD ACD2

AC

BC2D2 ABC2D

AB2C2 BC2D

AD

P
AB2C2L>2 CD2

BD2

AB2D

BC2

a b 2d 2

ABC

CD

AB2C2D AD2

ABCD2

AB2

BD

ACD

ABC2D2

A B 2CD2 BC

AC 2

ABD

AB2CD BCD2 A C 2D2 AB

Esto es equivalente a usar A B2C y BC D para hacer la particin del diseo 34 com pleto en nueve bloques y
luego seleccionar uno de estos bloques como la fraccin deseada. El diseo com pleto se m uestra en la ta
bla 9-7.
E ste diseo tiene ocho grados de libertad que pueden usarse para estim ar cuatro efectos principa
les y sus alias. Los alias de cualquier efecto pueden encontrarse m ultiplicando el efecto m dulo 3 por
A B 2C, B C D ,A C 2D ,A B D 2 y sus cuadrados. En la tabla 9-8 se presenta la estructura de los alias com pleta
del diseo.
Por la estructura de los alias se observa que este diseo slo es til en ausencia de interacciones. A de
ms, si A denota los renglones y B las columnas, entonces al examinar la tabla 9-7 se observa que el diseo
3,2 tam bin es un cuadrado grecolatino.
El escrito de Connor y Zelen [28] contiene una extensa seleccin de diseos para 4 < k 10. Este escri
to se elabor para la National Bureau of Standards y es la tabla ms completa disponible de los planes 3k~p.
E n esta seccin se ha hecho n otar en varias ocasiones la com plejidad de las relaciones de los alias de
los diseos factoriales fraccionados 3k~p. E n general, si k es m oderadam ente grande, p or ejem plo k > 4 o
5, el tam ao del diseo 3* llevar a muchos experim entadores a considerar fracciones bastante pequeas.
D esafortunadam ente, estos diseos tienen relaciones de alias que incluyen alias parciales de com ponen
tes de interacciones con dos grados de libertad. Esto, a su vez, resulta en un diseo cuya interpretacin
ser difcil, si no imposible, si las interacciones no son insignificantes. Adems, no hay esquem as de au
m ento simples (como el doblez) que puedan usarse para com binar dos o ms fracciones a fin de aislar las
interacciones significativas. El uso del diseo 3k suele sugerirse cuando hay curvatura presente. Sin em
bargo, hay alternativas ms eficientes (ver el captulo 11). Por estas razones, se puede concluir que los di
seos factoriales fraccionados 3k~p son soluciones que causan problem as; no son, en general, buenos
diseos.

9-4

DISEOS FACTORIALES CON NIVELES MIXTOS

Se han resaltado los diseos factoriales y factoriales fraccionados en los que todos los factores tienen el
mismo nm ero de niveles. El sistema con dos niveles revisado en los captulos 6 ,7 y 8 es de particular utili
dad. El sistem a de tres niveles presentado en este captulo es de utilidad m ucho m enor debido a que los
diseos son relativam ente grandes incluso para un nm ero m odesto de factores, y la mayora de las frac
ciones pequeas tienen relaciones de alias complejas que requeriran supuestos muy restrictivos respecto
de las interacciones para ser tiles.
Estam os convencidos de que los diseos factoriales y factoriales fraccionados de dos niveles debern
ser la piedra angular de la experim entacin industrial para el desarrollo de productos y procesos, detec
cin de defectos y m ejoram iento. Sin embargo, existen situaciones en las que es necesario incluir un fac
to r (o algunos factores) que tiene ms de dos niveles. Esto suele ocurrir cuando hay factores tanto
cuantitativos como cualitativos en el experimento, y el factor cualitativo tiene (por ejem plo) tres niveles.

384

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Tabla 9-9

Uso de factores con dos niveles para formar


un factor con tres niveles
Factores con tres niveles

Factores con dos niveles

+
+

+
+

*2
*2
*3

Si todos los factores son cuantitativos, entonces debern usarse diseos de dos niveles con puntos centra
les. En esta seccin se indica cmo pueden incorporarse factores con tres y cuatro niveles en un diseo 2k.

9-4 .1

F actores c o n dos y tres niveles

Los diseos en los que algunos factores tienen dos niveles y otros tres niveles pueden derivarse de la tabla
de signos positivos y negativos del diseo 2k usual. El procedim iento general se ilustra m ejor con un ejem
plo. Suponga que se tienen dos variables, donde A tiene dos niveles y X tres. C onsidere la tabla de signos
positivos y negativos del diseo 23 usual con ocho corridas. Los signos de las columnas B y C tienen el p a
trn que se m uestra en el lado izquierdo de la tabla 9-9. Sea que los niveles d e X estn representados por
x l,x 1y x 3. E n el lado derecho de la tabla 9-9 se m uestra cmo se com binan los patrones de los signos de B y
C para form ar los niveles del factor con tres niveles.
Entonces el factorX tiene dos grados de libertad, y si el factor es cuantitativo, es posible hacer su p ar
ticin en un com ponente lineal y uno cuadrtico, con cada com ponente teniendo un grado de libertad. E n
la tabla 9-10 se m uestra un diseo 23 con las columnas rotuladas para indicar los efectos reales que esti
man, donde Xj, y X Qdenotan los efectos lineal y cuadrtico, respectivam ente, deX . Observe que el efecto
lineal d e X es la suma de las estim aciones de los dos efectos calculadas a partir de las columnas asociadas
generalm ente c o n y C, y que el efecto de A slo puede calcularse a partir de las corridas donde X est en
el nivel bajo o bien en el alto, es decir, las corridas 1,2, 7 y 8. D e m anera similar, el e fe c to ^ x X L es la
suma de los dos efectos que se habran calculado a p artir de las columnas rotuladas generalm ente A B y

Tabla 9-10

Un factor con dos niveles y un factor con tres niveles en un diseo 23

Corrida
1
2
3
4
5
6
7
8

XL

XL

A________B
C
+
+
+
+
+
+
- +
+
+
+
+ +

A x XL

A x XL

Xq

A x Xq

AB
+
-

AC
+
+
+
+

BC
+
+
+
+

ABC A
+
+
+
+

+
+
+

Combinaciones de
tratam ientos reales

X
Bajo
Alto
Bajo
Alto
Bajo
Alto
Bajo
Alto

Bajo
Bajo
Intermedio
Intermedio
Intermedio
Intermedio
Alto
Alto

9-4 DISEOS FACTORIALES CON NIVELES MIXTOS


Tabla 9-11

385

Anlisis de varianza del diseo de la tabla 9-10

Suma de Grados de Cuadrado


medio
cuadrados libertad
1
MSa
A
ssA
SSX
2
m sb
X (X L + X Q)
A X (A x X L + A x X Q)
2
MSm
ssM
SSE
2
m se
Error (a partir de las corridas 3 y 5
y de las corridas 4 y 6)
Total
SST
7
Fuente de
variacin

A C . Adems, observe que las corridas 3 y 5 son rplicas. Por lo tanto, puede hacerse una estimacin del
erro r con un grado de libertad del error utilizando estas dos corridas. D e m anera similar, las corridas 4 y 6
son rplicas, y esto llevara a una segunda estimacin del error con un grado de libertad. L a varianza pro
m edio de estos dos pares de corridas podra usarse como cuadrado m edio del erro r con dos grados de li
bertad. E n la tabla 9-11 se resum e el anlisis de varianza completo.
Si se est dispuesto a suponer que las interacciones de dos factores y de rdenes superiores son insig
nificantes, el diseo de la tabla 9-10 puede convertirse en una fraccin de resolucin III con hasta cuatro
factores con dos niveles y un solo factor con tres niveles. Esto se conseguira asociando los factores de dos
niveles con las columnas A , A B , A C y A B C . La colum na 5 C no puede usarse para un factor de dos niveles
porque contiene el efecto cuadrtico del factor X de tres niveles.
P uede aplicarse el mismo procedim iento en los diseos 2* de 16,32 y 64 corridas. Para 16 corridas es
posible construir factoriales fraccionados de resolucin V con dos factores de dos niveles y con dos o tres
factores de tres niveles. Tkmbin puede obtenerse una fraccin con 16 corridas de resolucin V con 3 fac
tores de dos niveles y un factor de tres niveles. Si se incluyen cuatro factores de dos niveles y un solo factor
de tres niveles en 16 corridas, el diseo ser de resolucin III. Los diseos de 32 y 64 corridas perm iten
arreglos similares. Para un estudio adicional de algunos de estos diseos, ver A ddlem an [Ib].

9-4.2

Factores con dos y cuatro niveles

Es muy sencillo incorporar un factor con cuatro niveles en un diseo 2k. El procedim iento para hacerlo
implica el uso de dos factores con dos niveles para representar el factor con cuatro niveles. Por ejemplo,
suponga que A es un factor de cuatro niveles con los niveles j, a2,a 3y a 4. Considere dos colum nas de la ta
bla usual de signos positivos y negativos, por ejemplo las columnas P y Q. El patrn de los signos de estas
dos columnas se m uestra en el lado izquierdo de la tabla 9-12. El lado derecho de esta tabla m uestra cmo
estos cuatro patrones de signos corresponderan con los cuatro niveles del factor A . Los efectos represen-

la b ia 9-12

Corrida
1

El factor A con cuatro niveles expresado como dos


factores con dos niveles

Factores con dos niveles Factores con cuatro niveles


P
Q
A
a

+
+

a3
a4

386
la b ia 9-13
C orrida

1
2

Un factor con cuatro niveles y 2 factores con dos niveles en 16 corridas

(A

+
+
+

+
+
+
+

3
4
5

10
11
12
13
14
15
16

B)

=X

+
+
-

*3
*4

+
+
+
+
+
+

*2
*1
*2
*3

X4

*1

x2
*3
*4

*1

X2
x3
x4

- '
+
+
+
+
-

+
+
+
+

AB
+
+
+
-

AC

BC

ABC

AD

BD

+
+
+
+
+
+
+

+
+
+
+
+
+
-

+
+
+
+
+
+
+

+
+

+
+
+
- +
+ .
+
+

+
+
+
+
+
+
-

+
+
+
+
+
+

+
+

+
+
+
+
+
+
+
+'

+
+
+
+
-

ABD

CD
+
+
+
+
+
+
+
+

ACD

+
+
+
+
+
+
+
-

BCD

+
+
+
+
+
+
-

ABCD
+
-

+
+
+
-

+
+
+

+
+

9-5 PROBLEMAS

387

tados por las columnas P y Q y la interaccin PQ son m utuam ente ortogonales y corresponden al efecto de
A con tres grados de libertad.
Para ilustrar esta idea con mayor detalle, suponga que se tiene un factor de cuatro niveles y dos facto
res de dos niveles y que es necesario estim ar todos los efectos principales y las interacciones en las que in
tervienen estos factores. Esto puede hacerse con un diseo de 16 corridas. E n la tabla 9-13 se presenta la
tabla usual de signos positivos y negativos del diseo 24 con 16 corridas, donde las columnas yl y B se usan
p ara form ar el factor de cuatro niveles, por ejem ploX , con los nivelesXj, x2, x 3y x 4. Se calcularan las sumas
de cuadrados de cada colum na A , B , ...,ABC D exactam ente igual que en el sistema 2k usual. D espus las
sumas de cuadrados de todos los factoresX , C ,D y sus interacciones se form an de la m anera siguiente:
S S X = S S A + SSB + 5 5 ^

(3 grados de libertad)

SSC SSC

(1 grado de libertad)

SSD = SSD

(1 grado de libertad)

S S CD = S S CD

(1 grado de libertad)

S S XC = S S AC + SSBC

(3 grados de libertad)

S S m = S S ^ + SSBD + SS jjh,
= S S ACD + SSBCD + S S ^

(3 grados de libertad)
(3 grados de libertad)

A este diseo podra llam rsele 4 x 22. Si uno est dispuesto a ignorar las interacciones de dos factores,
pueden asociarse hasta nueve factores adicionales de dos niveles con la colum na de la interaccin de dos
factores (excepto A ), la columna de la interaccin de tres factores y la colum na de la interaccin de cua
tro factores.

9-5
9-1.

PROBLEMAS

-------------------------------------------------------------------------------------------

Se estudian los efectos de la fuerza del revelador (A) y el tiempo de revelado (B ) sobre la densidad de la pel
cula de placa fotogrfica. Se usan tres fuerzas y tres tiempos, y se corren cuatro rplicas de un experimento
factorial 32. Los datos de este experimento se presentan a continuacin. Analizar los datos utilizando los m
todos estndares para experimentos factoriales.

Fuerza del revelador


1
2
3

9-2.
9-3.

10
0
5
4
7
7
8

2
4
6
5
10
7

Tiempo de revelado (minutos)


14
2
1
3
4
2
4
8
9
6
7
8
7
12
10
10
9
8
7

18

Calcular los componentes I y / de la interaccin de dos factores del problema 9-1.


Se llev a cabo un experimento para estudiar el efecto de tres tipos diferentes de botellas de 32 onzas (A) y
tres tipos diferentes de aparadores de venta (B) anaqueles permanentes lisos, aparadores al final del pasi
llo con anaqueles enrejados y refrigeradores para refrescos sobre el tiempo que toma acomodar diez cajas
de 12 botellas en los aparadores. Se usaron tres empleados (factor C) en el experimento, y se corrieron dos
rplicas de un diseo factorial 33. Los datos del tiempo observado se muestran en la tabla siguiente. Analizar
los datos y sacar conclusiones.

388

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Tipo de
Empleado
botella
Permanente
Plstico
3.45
1
Vidrio de 28 mm
4.07
4.20
Vidrio de 38 mm
Plstico
4.80
2
Vidrio de 28 mm
4.52
Vidrio de 38 mm
4.96
Plstico
4.08
3
4.30
Vidrio de 28 mm
4.17
Vidrio de 38 mm
9-4.

Un investigador mdico estudia el efecto de la lidocana sobre el nivel de enzimas en el msculo cardiaco de
perros beagle. En el experimento se usan tres marcas comerciales de lidocana (A), tres dosis (B) y tres perros
(C), y se corren dos rplicas de un diseo factorial 33. Los niveles de enzimas observados se presentan a conti
nuacin. Analizar los datos de este experimento.

Marca de
lidocana
1

9-5.
9-6.

Rplica I
Rplica II
Final del
Final del
pasillo Refrigerador Permanente
pasillo Refrigerador
4.14
5.80
3.36
4.19
5.23
4.38
4.26
5.48
3.52
4.85
5.67
4.26
4.37
5.58
3.68
5.22
6.21
4.40
4.70
5.88
5.15
4.65
6.25
4.44
6.20
6.03
5.17
4.75
6.38
4.39
5.14
3.94
4.08
3.65
4.49
4.99
4.04
4.53
4.08
4.59
4.85
3.88
4.86
4.48
4.90

Fuerza de
la dosis
1
2
3
1
2
3
1
2
3

1
96
94
101
85
95
108
84
95
105

Rplica I

Rplica II

Perro
2

Perro
2

84
99
106
84
98
114
83
97
100

3
85
98
98
86
97
109
81
93
106

1
84
95
105
80
93
110
83
92
102

85
97
104
82
99
102
80
96
111

3
86
90
103
84
95
100
79
93
108

Calcular los componentes / y / de las interacciones de dos factores del ejemplo 10-1.
Se realiza un experimento en un proceso qumico utilizando un diseo factorial 31. Los factores del diseo
son la temperatura y la presin, y la variable de respuesta es el rendimiento. Los datos que resultan de este
experimento se presentan a continuacin:

Temperatura, C
80
90
100

100
47.58, 48.77
51.86, 82.43
71.18, 92.77

Presin, psig
120
64.97, 69.22
88.47, 84.23
96.57, 88.72

140
80.92, 72.60
93.95, 88.54
76.58, 83.04

a) Analizar los datos de este experimento conduciendo un anlisis de varianza. Qu conclusiones pueden
sacarse?
b) Analizar grficamente los residuales. Hay algn motivo de preocupacin respecto de los supuestos sub
yacentes o de la adecuacin del modelo?

9-5 PROBLEMAS

389

c) Verificar que si se hace que los niveles bajo, intermedio y alto de ambos factores de este diseo asuman
los niveles -1,0 y +1, entonces un ajuste de mnimos cuadrados de un modelo de segundo orden del ren
dimiento es
j>= 86.81 + 1 0 .4 ^ + 8 .4 2 ^ - 7 .1 7 ^ - 7.86x - 7.69x,x2
d) Confirmar que e) modelo del inciso c puede escribirse en trminos de las variables naturales la tempe
ratura (T) y la presin (P) como
5>=-1 3 3 5 .6 3 + 1 8 .5 6 T + 8 .5 9 P -0.072T2 0.0196.P2 -0 .0 3 8 4 7 P

9-7.

9-8.
9-9.

9-10.
9-11.
9-12.
9-13.
9-14.
9-15.
9-16.
9-17.
9-18,
9-19.
9-20.

9-21.

9-22.

e) Construir una grfica de contorno del rendimiento como una funcin de la presin y la temperatura.
Con base en el examen de esta grfica, dnde se recomendara operar este proceso?
a) Confundir un diseo 33en tres bloques utilizando el c o m p o n e n te ^ B C 2 de la interaccin de tres factores.
Comparar los resultados obtenidos con el diseo de la figura 9-7.
b) Confundir un diseo 33en tres bloques utilizando el componente AB2C de la interaccin de tres factores.
Comparar los resultados con el diseo de la figura 9-7.
c) Confundir un diseo 33en tres bloques utilizando el componente ABC de la interaccin de tres factores.
Comparar los resultados obtenidos con el diseo de la figura 9-7.
d) Despus de observar los diseos de los incisos a ,b ycy\a figura 9-7, qu conclusiones pueden sacarse?
Confundir un diseo 34en tres bloques utilizando el componente^fi2C) de la interaccin de cuatro factores.
Considere los datos de la primera rplica del problema 9-3. Suponiendo que no fue posible hacer las 27 ob
servaciones el mismo da, establecer un diseo para conducir el experimento en tres das con A B 2C confundi
da con los bloques. Analizar los datos.
Delinear la tabla del anlisis de varianza del diseo 34en nueve bloques. Se trata de un diseo prctico?
Considere los datos del problema 9-3. SiABC est confundida en la rplica I yABC1est confundida en la r
plica II, realizar el anlisis de varianza.
Considere los datos de la rplica I del problema 9-3. Suponga que slo se corre una fraccin un tercio de este
diseo con / = ABC. Construir el diseo, determinar la estructura de los alias y analizar los datos.
Por el examen de la figura 9-9, qu tipo de diseo quedara si despus de completar las nueve primeras co
rridas pudiera eliminarse uno de los tres factores?
Construir un diseo 3^' con / = ABCD. Escribir la estructura de los alias de este diseo.
Verificar que el diseo del problema 9-14 es un diseo de resolucin IV.
Construir un diseo 35-2con I ABC e / = CDE. Escribir la estructura de los alias de este diseo. Cul es la
resolucin de este diseo?
Construir un diseo 39-4 y verificar que es un diseo de resolucin III.
Construir un diseo 4 x 23confundido en dos bloques con 16 observaciones cada uno. Delinear el anlisis de
varianza de este diseo.
Delinear la tabla del anlisis de varianza de un diseo factorial 2232. Comentar la manera en que este diseo
puede confundirse en bloques.
Empezando con un diseo 24 de 16 corridas, indicar cmo pueden incorporarse dos factores de tres niveles
en este experimento. Cuntos factores de dos niveles pueden incluirse si se quiere cierta informacin sobre
las interacciones de dos factores?
Empezando con un diseo 24 de 16 corridas, indicar cmo pueden incorporarse un factor con tres niveles y
tres factores con dos niveles, de tal modo que siga siendo posible la estimacin de las interacciones de dos
factores.
En el problema 8-26 el lector conoci a Harry y Judy Peterson-Nedry, dos amigos del autor que son propieta
rios de un viedo y una fbrica vincola en Newberg, Oregon. En ese problema se describi la aplicacin de
diseos factoriales fraccionados de dos niveles en su producto Pinot Noir 1985. En 1987 quisieron conducir
otro experimento Pinot Noir. Las variables de este experimento fueron

390

CAPTULO 9

DISEOS FACTORIALES Y FACTORIALES FRACCIONADOS CON TRES NIVELES

Niveles
Wadenswil, Pommard
Pequeo, grande
80F, 85F, 90/80F, 90F
Ninguno, 10%
10 das, 21 das
Assmanhau, Champagne
H-onais, Allier

Variable
Clon de Pinot Noir
Tamao de la uva
Temperatura de fermentacin
Uva completa
Tiempo de maceracin
Tipo de levadura
Tipo de roble

Harry y Judy decidieron usar un diseo factorial fraccionado de dos niveles con 16 corridas, tratando los cua
tro niveles de la temperatura de fermentacin como dos variables de dos niveles. Como en el problema 8-26,
utilizaron las calificaciones de un panel de catadores como variable de respuesta. El diseo y las calificacio
nes promedio resultantes se presentan enseguida:
Corrida Clon
1
2
+
3
4
+
5
6
+
7
8
+
9
10
+
11
12
+
13
14
+
15
16
+

9-23.

lmao
de la uva
+
+
-

+
+
-

+
+
-

+
+-

Temperatura de
Uva
Tiempo de
fermentacin completa maceracin
+
+
+
+
+
+
+
4+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+

+
+
+
+
+
+
+

Tipo de
levadura

Tipo de
roble

+
+

+
+

+
+

+
+

+
+

Calificacin
promedio
4
10
6
9
11
1
15
5
12
2
16
3
8
14
7
13

a) Describir los alias de este diseo.


t) Analizar los datos y sacar conclusiones.
c) Qu comparaciones pueden hacerse entre este experimento y el experimento del Pinot Noir 1985 del
problema 8-26?
En un artculo de W.D. Baten publicado en el volumen de 1956 de Industrial Quality Control se describe un
experimento para estudiar el efecto de tres factores sobre la longitud de unas barras de acero. Cada barra se
someti a uno de dos procesos de tratamiento trmico y se cort en una de cuatro mquinas en una de tres
horas durante el da (8 a.m., 11 a.m. o 3 p.m.). Los datos de la longitud codificada son los siguientes:
Hora del
da

Proceso de
tratamiento trmico

1
8 a.m.

_________________ Mquina_________________
1
2
3
4
"

1
4
0

3
6
1

5
6

5
5

0
-1
0

4
0
1

^6

3
5
4

4
5

9-5 PROBLEMAS

Hora del
da

Mquina

Proceso de
tratamiento trmico
1

11 a.m.

3 p.m.

391

1
6
1
3
1
5
9
6
3

2
3
-1
1
-2
4
6
0
7

8
4
6
1
10
6
8
10

3
7
8
4
3
11
4
7
0

3
1
2
-1
-1
6
0
4

2
0
0
1
2
1
-2
-4

7
11
9
6
10
4
4
7

9
6
4
3
5
8
3
0

a) Analizar los datos de este experimento suponiendo que las cuatro observaciones de cada celda son rpli
cas.
b) Analizar los residuales de este experimento. Existe algn indicio de que hay un punto atipico en una de
las celdas? Si se encuentra un punto atipico, eliminarlo y repetir el anlisis del inciso a. A qu conclusio
nes se llega?
c) Suponga que las observaciones de las celdas son las longitudes (codificadas) de barras que se procesaron
conjuntamente en el tratamiento trmico y despus se cortaron secuencialmente (es decir, en orden) en
las cuatro mquinas. Analizar los datos y determinar los efectos de los tres factores sobre la longitud pro
medio.
d) Calcular la varianza logartmica de las observaciones de cada celda. Analizar esta respuesta. Qu con
clusiones pueden sacarse?
e) Suponga que la hora en que se corta una barra en realidad no puede controlarse durante la produccin
rutinaria. Analizar la longitud promedio y la varianza logartmica de la longitud de cada una de las 12 ba
rras cortadas en cada combinacin mquina/proceso de tratamiento trmico. Qu conclusiones pueden
sacarse?

Ajuste de
modelos de
regresin

10-1

INTRODUCCIN

E n muchos problem as hay dos o ms variables relacionadas, y el inters se centra en m odelar y explorar
esta relacin. Por ejemplo, en un proceso qumico el rendim iento del producto est relacionado con la
tem peratura de operacin. Quiz el ingeniero qumico quiera construir un m odelo que relacione el rendi
m iento con la tem peratura para usarlo despus como herram ienta de prediccin o bien de optimizacin o
control del proceso.
E n general, suponga que hay una sola variable dependiente o de respuesta y que depende de k varia
bles independientes o regresores, por ejemplo, x lr x 2, ...,xk. La relacin que existe entre estas variables se
caracteriza p o r un m odelo m atem tico llamado modelo de regresin. Dicho m odelo se ajusta a un con
junto de datos mustrales. E n ocasiones el experim entador conoce la form a exacta de la verdadera rela
cin funcional entre y y x 1;x 2,
por ej em ploy = <>(x,x 2 ...,xk). Sin embargo, en la mayora dlos casos
no se conoce la verdadera relacin funcional, y el experim entador elige una funcin apropiada para apro
ximar <p. Los modelos polinomiales de orden inferior son de uso generalizado como funciones de aproxi
macin.
Existe una fuerte relacin recproca entre el diseo de experim entos y el anlisis de regresin. A lo
largo de este libro se ha destacado la im portancia de expresar cuantitativam ente los resultados de un ex
perim ento, en trm inos del modelo emprico, a fin de facilitar su comprensin, interpretacin e implementacin. Los modelos de regresin constituyen la base para conseguirlo. Se h a presentado en mltiples
ocasiones el m odelo de regresin que representaba los resultados de un experim ento. E n este captulo se
presentan algunos aspectos del ajuste de estos modelos. Presentaciones ms completas de la regresin se
encuentran en M ontgomery y Peck [82] y Myers [84].
Los mtodos de regresin se utilizan con frecuencia para analizar datos de experim entos no p lanea
dos, como podra ser el caso de la observacin de fenm enos no controlados o de registros histricos. Los
m todos de regresin tam bin son muy tiles en experim entos diseados cuando algo sali m al. En
este captulo se ilustran algunas de estas situaciones.

392

10-2 MODELOS DE REGRESIN LINEAL

10-2

393

MODELOS DE REGRESIN LINEAL

L a atencin se centrar en el ajuste de modelos de regresin lineal. Para ilustrar, suponga que quiere de
sarrollarse un m odelo emprico que relacione la viscosidad de un polmero con la tem peratura y la veloci
dad de alim entacin del catalizador. U n m odelo que podra describir esta relacin es
C10' 1)

y = 0 + i xi + i x i + E

donde y representa la viscosidad, x, la tem peratura y x 2 la velocidad de alim entacin del catalizador. Se
trata de un modelo de regresin lineal mltiple con dos variables independientes. Es com n llam ar a las
variables independientes variables predictoras o regresores (variables de regresin). Se utiliza el trm i
no lineal porque la ecuacin 10-1 es una funcin lineal de los parm etros desconocidos 0, l y 2. El m o
delo describe un plano en el espacio bidim ensionale, x 2. El parm etro 0 define la interseccin del plano
con el eje de las ordenadas. E n ocasiones xy 2 se denom inan los coeficientes de regresin parcial, porque
x mide el cambio esperado en y para cada cambio unitario de x 1 cuando x 2 se m antiene constante, y 2
m ide el cambio esperado en y para cada cambio unitario de x 2 cuando x t se m antiene constante.
E n general, la variable de respuesta y puede relacionarse con k regresores. Al m odelo
y = 0 + 1x 1+ 2x 2 + - - + kx k +E

(10-2)

se le llam a modelo de regresin lineal mltiple con k regresores. A los parm etros p j = 0 ,1 ,..., k se les lla
m a los coeficientes de regresin. E ste m odelo describe un hiperplano en el espacio de k dimensiones de los
regresores {x; }. E l parm etro /S; representa el cambio esperado en la respuesta y para un cambio unitario
en x cuando las variables independientes restantes x (i * j) se m antienen constantes.
Con frecuencia los modelos cuya apariencia es ms compleja que la ecuacin 10-2 pueden tam bin
analizarse m ediante tcnicas de regresin lineal m ltiple. Por ejemplo, considere la incorporacin de un
trm ino de interaccin en el m odelo de prim er orden en dos variables, por ejemplo
y = 0 + l Xl + 2X2 + l 2* 1* 2 +*

(103)

Si se hace jc3 = XjX2 y 3 = l2, entonces la ecuacin 10-3 puede escribirse como
y = o + i x i + 2x 2 + i x i + e

(10-4)

que es un m odelo de regresin lineal mltiple estndar con tres regresores. R ecuerde que en algunos
ejemplos de los captulos 6,7 y 8 se presentaron varios modelos empricos similares a las ecuaciones 10-2 y
10-4 para expresar cuantitativam ente los resultados de un diseo factorial de dos niveles. Como otro
ejemplo, considere el modelo de superficie de respuesta de segundo orden en dos variables:
y = q + ^X^ + 2X 2 + # 11^1 + 22X2

l 2X\X2 + *

(1 0 -5 )

Si se hacex3 = x ,x 4 = x 2,x 5 = x ]x2, 3 = n , 4 = 22y 5 = n , entonces esta expresin queda como


y = o + l Xl + z X 2 + i X 3 + * X A + 5 x 5 +

(10'6)

que es un m odelo de regresin lineal. Este m odelo se ha visto tam bin en ejemplos anteriores de este li
bro. E n general, cualquier m odelo de regresin que es lineal en los parm etros (los valores ) es un m ode
lo de regresin lineal, independientem ente de la form a de la superficie de respuesta que genera.
E n este captulo se resum irn los m todos para estim ar los parm etros de los modelos de regresin li
neal mltiple. A este procedim iento suele llamrsele el ajuste del modelo. Se analizarn tam bin los m
todos para probar hiptesis y para construir intervalos de confianza para estos modelos, as como para

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

394

verificar la adecuacin del ajuste del m odelo. L a atencin se centra en los aspectos del anlisis de regre
sin que son tiles en los experim entos diseados. Para presentaciones ms com pletas de la regresin, re
ferirse a M ontgom ery y Peck [82] y M yers [84].

10-3

ESTIMACIN DE LOS PARMETROS EN MODELOS


DE REGRESIN LINEAL

E l m todo de m nim os cuadrados se usa de manera tp ica para estim ar los coeficientes de regresin de un
m odelo de regresin lin eal m ltiple. Suponga que se cuenta con n > k observaciones de la variable de res
puesta, p or ejem plo,y lsy2, , y n- Junto con cada respuesta observada^, se tendr una observacin de cada
uno de los regresores, y sea que x tj denote la observacin o nivel i-sim o de lavariab le x. Lo s datos apare
cern com o en la tabla 10-1. Se supone que el trm ino del error e del m odelo tiene E ( e ) = 0 y V ( e ) = a Ly
que las {,} son variables aleatorias no correlacionadas.
L a ecuacin del m odelo (ecuacin 10-2) puede escribirse en trm inos de las observaciones de la tabla
10-1 como

y ~ a "I" i x n ~^2Xi2
a

~^kx ik "*"

(10-7)

= o + 2 j j x H + i
]=i

1= 1 ,2 ,..., n

E l m todo de m nim os cuadrados consiste en elegir las de la ecuacin 10-7 de tal m odo que la suma de
cuadrados de los errores, se m inim ice. L a fu ncin de m nim os cuadrados es

1=1
n

=2

( 10-8)
i

y . - o - ' Z ,x >

L a funcin L debe m inim izarse con respecto a n, v ..., k. Lo s estim adores de m nim os cuadrados, por
ejem plo 0 , x, . . . , k , deben satisfacer
dL
.

= - 2

y - .-i. fy

= 0

(10-9a)

;'=i

v , i ,>k

dL

(1 0 -9 b )
j=l

a . i ..... I

Tabla 10-1

Datos de una regresin lineal mltiple

y ___________ * i

x 2__________ .________ Xj,

3^i

'*11

xn

y 2

X 21

X 22

yn

X riL

X n2

x ik

X 2k

X nk

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

395

A l sim plificar la ecuacin 10-9, se obtiene

xn

+ l ^ Xi2
i-l
n

X*

+ 02 2

=i
o2

i=i

-i

rt

o 2

i=l

Xf c ^ i 2

i=l

i-l

+ " + 3 * 2 **
i-l

- 2
1=1

x a x a + -" + k 2

i=l

Xn x ik = 2
x ayt
t- 1

(10-10)

n
^fc^il + $2 2 X!kXil + " + * 2 x *
i=l
/-i

= 2 x *yi
=l

Estas ecuaciones se denom inan ecuaciones norm ales de m n i m o s cuadrados. Observe que hayp = k + 1
ecuaciones norm ales, una para cada uno de los coeficientes de regresin desconocidos. L a solucin de las
ecuaciones norm ales sern los estim adores de m nim os cuadrados de los coeficientes de regresin

hEs ms sencillo resolver las ecuaciones norm ales si se expresan en la notacin m atricial. A continua
cin se presenta el desarrollo m atricial de las ecuaciones norm ales que es anlogo al desarrollo de la
ecuacin 10-10. E l m odelo en trm inos de las observaciones, ecuacin 10-7, puede escribirse en notacin
m atricial com o
y = X + e
donde
1 *11 *12

yi

y=

yi

x =

Xlk

X2l *22 ' ' ' X2k

yn.
' o

i
=

e =

Ia J
E n general, y es un vector ( n x 1) de las observaciones, X es una m atriz ( t i x p ) de los niveles de las varia
bles independientes,/ es un vector ( p x 1) de los coeficientes de regresin, y e es un vector ( n x 1) de los
errores aleatorios.
Q uiere encontrarse el vector de los estim adores de m nim os cuadrados, , que m inim ice

l -

e? = 'e = ( y - x

0 ) '( y - x /J )

Observe que L puede expresarse com o


L = y ' y - 'X 'y y 'X + 'X 'X

( 10- 11)

= y 'y - 2 ' X ' y + ' X X

ya que/?'X 'y es una m atriz (1 x 1), o un escalar, y su transpuesta ( ' X ' y ) ' = y ' X es el mism o escalar. L o s
estim adores de m nim os cuadrados deben satisfacer

396

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN


dL

= 2X'y + 2X'X0=O

d
cuya simplificacin es

X'= X'y
(10-12)
La ecuacin 10-12 es la forma matricial de las ecuaciones normales de mnimos cuadrados. Es idntica a
la ecuacin 10-10. Para resolver las ecuaciones normales, ambos miembros de la ecuacin 10-12 se multi
plican por la inversa de X'X. Por lo tanto, el estimador de mnimos cuadrados de es
= (X'X)_1 X'y
(10-13)
Es sencillo ver que la forma matricial de las ecuaciones normales es idntica a la forma escalar. Al de
sarrollar en detalle la ecuacin 1 0 - 1 2 , se obtiene
n

i.l

x a

i-1
n

x *

x S2i

2
i 1
n

2
1
rt

i= 1

i=l

2
1=1

X * X tl

rt

*12

2
2

' K

1=1

X ik X i2

1=1

x n y

i=1

i- 1

i=l

x *y t

_=i

Si se efecta la multiplicacin matricial indicada, se obtendr la forma escalar de las ecuaciones normales
(es decir, la ecuacin 10-10). En esta forma es sencillo ver que X'X es una matriz simtrica (p x p) y que
X'y es un vector columna (p X 1). Observe la estructura especial de la matriz X'X. Los elementos de la
diagonal de X'X son las sumas de cuadrados de los elementos de las columnas de X, y los elementos que
no estn en la diagonal son las sumas de los productos cruzados de los elementos de las columnas de X.
Adems, observe que los elementos de X'y son las sumas de los productos cruzados de las columnas de Xy
las observaciones {y,}.
El modelo de regresin ajustado es
= 3$
(10-14)
En notacin escalar, el modelo ajustado es

9 , = h + Z ^ i xQ

= 1 , 2 , . . . ,

1=1

La diferencia entre la observacin real y y el valor ajustado correspondiente


y . El vector (n x 1) de los residuales se denota por

es el residual, es decir,

e = y

e = y -

(10-15)

Estimacin de o2
Por lo general tambin es necesario estimar a2. Para desarrollar un estimador de este parmetro, conside
re la suma de cuadrados de los residuales, por ejemplo
s s E

=5-i

( y - % ) 2

=2?
=1

= e'e

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

397

Al sustituir e = y - y = y - X, se tiene
SSE = ( y - X & ) ( y - X )
= y ' y - X ' y - y X+'X'X
= y'y-2'X'y+'X'X
Puesto que X'X=X'y, esta ltima ecuacin queda como
SS = y'y-'X'y

(10-16)

A la ecuacin 10-16 se le llama la suma de cuadrados residual o del error, y tiene n - p grados de libertad
asociados con ella. Puede demostrarse que
E(SS ) = o \ n - p )
por lo que un estimador insesgado de o2 est dado por
2 = n-p

(10-17)

Propiedades de los estimadores


El mtodo de mnimos cuadrados produce un estimador insesgado del parmetro del modelo de regre
sin lineal. Esto puede demostrarse fcilmente tomando el valor esperado de de la siguiente manera:
E( )= [(X 'X ^ X y ]

= [(X'X)-, (V + )]
= ftX'X^X'Xp-ffX'X^X'e]
=
ya que E(e) = 0 y (X'X^X'X = I. Por lo tanto, es un estimador insesgado de .
La propiedad de la varianza de se expresa en la matriz de covarianza:
CoM) = E { [ - E()][fi- E(fo]'}

(10-18)

que es una matriz simtrica cuyo elemento t-simo de la diagonal principal es la varianza del coeficiente
de regresin individual n y cuyo elemento (z))-simo es la covarianza entre . y r La matriz de cova
rianza de es
Cav() = o 2(X'X ) - 1

(10-19)

EJEMPLO 10-1 ................................................................................................................................


En la tabla 10-2 se muestran 16 observaciones de la viscosidad de un polmero (y) y dos variables del pro
ceso: la temperatura de reaccin (xj) y la velocidad de alimentacin del catalizador (x2). Se ajustar el mo
delo de regresin lineal mltiple
y o

i*2

398

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Tabla 10-2

Datos de la viscosidad del ejemplo 10-1 (viscosidad en


centistokes @ 100C)
Tem peratura

Observacin

1
2

3
4
5
6

7
8

9
10
11
12

13
14
15
16

(*i.C)
80
93

Velocidad de alimentacin
del catalizador (x2, lb/h) Viscosidad

9
10
12
11
8
8
10
12
11

100

82
90
99
81
96
94
93
97
95

13
11
8
12

100

85
86

87

12

a estos datos. La matriz X y el vector y son


'1
80
1
93
1 100
1
82
1
90
1
99
1
81
1
96
1
94
1
93
1
97
1
95
1 100
1
85
1
86
1
87

La matriz X'X es

8 '
9
10
12
11
8
8
10
12
11
13
11
8
12
9
12

'2256
2340
2426
2293
2330
2368
2250
2409
y = 2364
2379
2440
2364
2404
2317
2309
2328

2256
2340
2426
2293
2330
2368
2250
2409
2364
2379
2440
2364
2404
2317
2309
2328

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

16
1458
164

399

1458
164
132^560 14,946
14,946 1,726

y el vector X'y es

2256
1 1
1 2340
87
X'y= 80 93
. 8 9 12
2328
=

37,577'
^429,550
38S562

La estimacin de mnimos cuadrados de es


$ = (X'X)- 1 X'y

14.176004 -0.129746
-3
-0.129746
-0.223453 -4.763947x10 - 5

-0.223453
2222381x10

-5
-2

37,577
3^429,550
385^562

1566.07777'
7.62129
8.58485

El ajuste de mnimos cuadrados, con los coeficientes de regresin expresados con dos cifras decimales, es
labia 10-3 Valores predichos, residuales y otros diagnsticos del ejemplo 10-1
srvacin
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

y
2256
2340
2426
2293
2330
2368
2250
2409
2364
2379
2440
2364
2404
2317
2309
2328

Valor predicho

2244.5
2352.1
2414.1
2294.0
2346.4
2389.3
2252.1
2383.6
2385.5
2369.3
2416.9
2384.5
2396.9
2316.9
2298.8
2332.1

Residual
e,
11.5
-12.1
11.9
-1.0
-16.4
-21.3
-2.1
25.4
-21.5
9.7
23.1
-20.5
7.1
0.1
10.2
-4.1

K
0.350
0.102
0.177
0.251
0.077
0.265
0.319
0.098
0.142
0.080
0.278
0.0%
0.289
0.185
0.134
0.156

Residual
studentizado
0.87
-0.78
0.80
-0.07
-1.05
-1.52
-0.15
1.64
-1.42
0.62
1.66
-1.32
0.52
0.01
0.67
-0.28

A
0.137
0.023
0.046
0.001
0.030
0.277
0.004
0.097
0.111
0.011
0.354
0.062
0.036
0.000
0.023
0.005

.R-studen
0.87
-0.77
0.79
-0.07
-1.05
-1.61
-0.15
1.76
-1.48
0.60
1.80
-1.36
0.50
<0.01
0.66
-0.27

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

402

la b ia 10-4

Salida de M initab para el modelo de regresin de la viscosidad, ejemplo 10-1

Anlisis de regresin
The r e g r e s s i o n e q u a t i o n
V i s c o s i t y = 1566 + 7 .6 2

S =

16.36

Analysis

R-Sq
of

9 2 .7%

Feed

Rate

T
25.43
12.32
3.52
R-Sq ( a d j )

P
0.000
0.000
0.004
=

S e q SS
40841
3316

68

57

Variables codificadas

Variables del proceso


Presin (psig)

Concentracin (g/l)

*1

Is

*3

Rendimiento,
y

120

40

15

_1

-1

-1

32

160

40

15

-1

-1

46

120

eo

15

-1

-1

57

160

80

15

-1

65

120

40

30

1
-1

-1

36

6
7

160

30

-1

48

120

40
B0

30

-1

57

160

BO

30

68

140

60

10

140

60

22,5
22.5

0
0

44

11

140

60

22.6

53

12

140

60

22.5

56

Temperatura 140

20
Figura 10-5

91.6%

F
82.50

MS
22079
268

SS
44157
3479
47636

t>F
2
13
15

DF
1
1

Corrida Temperatura (*C)

8.58

Variance

Source
Regression
Residual Error
Total
Source
Te mp
Feed Rat

StDev
61 . 5 9
0.6184
2.439

Coef
1566.08
7.6213
8.585

Predictor
Constant
Temp
Feed Rat

is
Temp

Presin60

"

20

Concentracin- 225

'*

Diseo experimental del ejemplo 10-2.

7.5

50

P
0.000

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

403

Ajuste de modelos de regresin en experimentos diseados

Se ha usado con frecuencia un modelo de regresin para presentar los resultados de un experimento dise
ado en una forma cuantitativa. Se ofrece ahora un ejemplo completo donde se indica cmo se hace esto.
Se presentan enseguida otros tres ejemplos breves que ilustran otras aplicaciones tiles del anlisis de re
gresin en los experimentos diseados.

EJEMPLO 1 0 -2 ..................................................................................................................................
Anlisis de regresin de un diseo factorial 23
Un ingeniero qumico est investigando el rendimiento de un proceso. Tires de las variables del proceso
son de inters: la temperatura, la presin y la concentracin del catalizador. Cada variable puede correrse
en un nivel bajo y uno alto, y el ingeniero decide correr un diseo 23 con cuatro puntos centrales. En la fi
gura 10-5 se muestra el diseo y los rendimientos resultantes, donde se presentan tanto los niveles natura
les del diseo como la notacin de variables codificadas + 1 , - 1 que se utiliza normalmente en los diseos
factoriales 2k para representar los niveles de los factores.
Suponga que el ingeniero decide ajustar un modelo que slo incluye los efectos principales, por ejemplo
+ i x2 + ixi +e

y = o

Para este modelo, la matriz X y el vector y son


"1

-1

- 1'

-1

-1

-1

X=

-1

-1

-1

1
1

' 32 '
46
57
65
36
48
y= 57

68

50
44
53
56

Es sencillo demostrar que


'1 2
0
XX =
0
0

0
8
0
0

0
0
8
0

0'
0
0
8

'612'
45
X'y = 85
9

Puesto que X'X es diagonal, el inverso que se requiere tambin es diagonal, y las estimaciones de mnimos
cuadrados de los coeficientes de regresin son
1/12
0
0
0 612'
'51.000
45
5.625
0 1/ 8
0
0
(X'X)_1 X'y =
0
0 1/8
0
85
10.625
0
0
0 1/8
9
1.125
'

El modelo de regresin ajustado es


y = 51,000 + 5.625*! +10.625*2 +1.125x3

404

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN


Com o se ha hecho uso de ellos en muchas ocasiones, los coeficientes de regresin guardan una estre

cha relacin con las estim aciones de los efectos que se obtendran por el anlisis usual de un diseo 23. Por
ejem plo, el efecto de la tem peratura es (referirse a la figura 10-5)

T = -V - >V= 56.75- 45.50


= 11.25
Observe que el coeficiente de regresin de x t es
(11.25)/ 2 = 5.625
E s decir, el coeficiente de regresin es exactamente la m itad de la estim acin usual del efecto. Esto siem
pre se cum plir para un diseo 2 k. Com o se seal antes, en los captulos 6 al 8 se em ple este resultado
para p roducir m odelos de regresin, valores ajustados y residuales en varios experim entos de dos niveles.
Este ejem plo demuestra que las estim aciones de los efectos de un diseo 2 k son estim aciones de m nim os
cuadrados.

E n el ejem plo 10-2 es sencillo obtener la m atriz inversa porque X 'X es diagonal. Intuitivam ente, esto
parece ofrecer ventajas, no slo porque los clculos se sim plifican sino tam bin porque los estim adores de
todos los coeficientes de regresin no estn correlacionados, es decir, Cov(/3 j) = 0. Si los niveles de las
variables x pueden elegirse antes de recabar los datos, quiz sea deseable disear el experim ento de tal
m odo que resulte una X 'X diagonal.
E n la prctica puede ser relativam ente sencillo conseguir esto. Se sabe que los elementos de X 'X que
estn fuera de la diagonal son las sumas de los productos cruzados de las colum nas en X . Po r lo tanto, es
necesario hacer que el producto in te rio r de las colum nas de X sean iguales a cero; es decir, estas columnas
deben ser

ortogonales. A

de regresin se les llam a

los diseos experim entales que poseen esta propiedad para ajustar un m odelo

diseos ortogonales. E n

general, el diseo factorial 2 k es un diseo ortogonal

para ajustar el m odelo de regresin lineal m ltiple.


Lo s m todos de regresin son en extremo tiles cuando algo sale m al en un experim ento diseado.
Esto se ilustra en los dos ejem plos siguientes.

EJEMPLO 1 0 -3 ..................................................................................................................................
Un diseo factorial 23 con una observacin faltante
Considere el diseo factorial 23con cuatro puntos centrales del ejem plo 10-2. Suponga que cuando se rea
liz este experim ento, falt la corrida con todas las variables en el nivel alto (la corrida 8 de la figura 10-5).
Esto puede ocu rrir por varias razones: el sistema de m edicin puede p roducir una lectura incorrecta, la
com binacin de los niveles de los factores quiz no sea la apropiada, la unidad experim ental puede estar
daada, etctera.
Se ajustar el m odelo de los efectos principales
y o + 1x 1 + 2x 2 +/?3jc3 +

utilizando las 11 observaciones restantes. L a m atriz X y el vector y son

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL


'1

-1

-1

-1

1
-1

-1

-1

-1

1
-1

1
-1

-1

-1

1
-1

1
1
1
1

405

' 32
46
57
65
36
y= 48
57
50
44
53
56

Para estimar los parmetros del modelo se forman


" 11
-1

-1

-1

-1

-1

-1

' 544
-23
X
y
=
17
7 -1
-5 9
-1
7
-1

-1

-1

-1

y entonces

/J = (X 'X )_1X'y
9.61538X10"2
1.92307 x l 0 -2
1.92307 xlO 2
1.92307 xlO 2

1.92307 XlO' 2
0.15385
2 .8 8 4 6 2 X 1 0 '2

2.88462 xlO ' 2

1.92307 X102
2.88462 xlO 2
0.15385
2.88462 xlO -2

1.92307 xlO 2 [5441


2.88462 xlO 2 -23
17
2 .8 8 4 6 2 X 1 0 2
-59
0.15385

51.25]
5.75
10.75
1.25
Por lo tanto, el modelo ajustado es
y = 51.25+5.75^ +10.75* 2 +1.25jc3
Compare este modelo con el que se obtuvo en el ejemplo 10-2, donde se usaron las 12 observaciones. Los
coeficientes de regresin son muy similares. Debido a la estrecha relacin entre los coeficientes de regre
sin y los efectos de los factores, las conclusiones no sufriran una alteracin sustancial por la observacin
faltante. Sin embargo, observe que las estimaciones de los efectos han dejado de ser ortogonales, ya que
(X'X) y su inversa ya no son diagonales.

EJEMPLO 1 0 -4 ..................................................................................................................................
N iveles im precisos de los factores del diseo

Cuando se corre un experimento diseado, en ocasiones es difcil alcanzar y mantener los niveles preci
sos de los factores requeridos por el diseo. Las discrepancias pequeas no son importantes, pero las
grandes son motivo de preocupacin potencial. Los mtodos de regresin son tiles en el anlisis de un

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

406

Tabla 10'5

Diseo experimental del ejemplo 10-4


Variables codificadas

Variables del proceso


Corrida
1
2
3
4
5
6
7
8
9
10
11
12

Tm peratura
(C)
125
158
121
160
118
163
122
165
140
140
140
140

Concentracin

Presin
(psig)
41
40
82
80
39
40
80
83
60
60
60
60

Rendim iento

x2

*i

m
14
15
15
15
33
30
30
30
22.5
22.5
22.5
22.5

-0.75
0.90
-0.95
1
-1.10
1.15
-0.90
1.25
0
0
0
0

-0.95
-1
1.1
1
-1.05
-1
1
1.15
0
0
0
0

*3

-1.133
1
-1
-1
1.14
1
1
1
0
0
0
0

32
46
57
65
36
48
57
68
50
44
53
56

experimento diseado cuando el experimentador no ha podido obtener los niveles requeridos de los
factores.
Para ilustrar, el experimento de la tabla 10-5 presenta una variacin del diseo 23del ejemplo 10-2,
donde muchas de las combinaciones de prueba no son exactamente las que se especifican en el diseo.
Las dificultades parecen haber ocurrido sobre todo con la variable temperatura.
Se ajustar el modelo de los efectos principales

y= 0+ixi+ixi+ix3+E
La matriz X y el vector y son
1
1
1

X =

-0.75
0.90
-0.95

-0.95

-1
1.1
1

1 1
1 - 1.10 -1.05
1
1.15 -1
1
1 -0.90
1

1.25

1.15

1
1
1
1

0
0
0
0

0
0
0
0

-1.133'

X
1
1

1.4

1
1
1
0
0
0
0

32'
46
57
65
36
48
y = 57

68
50

44
53
56

Para estimar los parmetros del modelo se necesitan


12
0.25
0.60
0.2670'
0.31
0.60
8.18
-0.1403
0.25
8.5375 -0.3437
0.31
0.2670 -0.1403 -0.3437 9.2437

'612
77.55
V
f
X y = 161.50
19.144

10-3 ESTIMACIN DE LOS PARMETROS EN MODELOS DE REGRESIN LINEAL

407

Entonces
= (X'X)-1X'y
-2

&37447X10
-6.09871x10
-2.33542 xlO 3
-2.59833X103

-6.09871x10
0.12289
-4.20766x10*
1.88490x10

-2.33542 XlO3
-4.20766 XlO3
0.11753
4.37851 xlO 3

-2.59833X103
1.88490 XlO3
4.37851 XlO3
0.10845

'612
'
77.55
161.50
19.144

50.36496'
5.41932
10.16672
1.07653
El modelo de regresin ajustado, con los coeficientes reportados con dos cifras decimales, es
y = 50.36+2*! +10.17*2 + 1.08x3
Al comparar este resultado con el modelo original del ejemplo 10-2, donde los niveles de los factores fue
ron exactamente los que se especificaron en el diseo, se observa muy poca diferencia. La interpretacin
prctica de los resultados de este experimento no sufrira alteraciones sustanciales por la incapacidad del
experimentador para alcanzar exactamente los niveles deseados de los factores.

EJEMPLO 1 0 -5 ............................... ..................................................................................................


Separacin de alias de interacciones en un d iseo factorial fraccionado

En el captulo 8 se seal la posibilidad de separar los alias de las interacciones de un diseo factorial
fraccionado mediante el proceso llamado doblez o plegado. Para un diseo de resolucin III, un plegado
completo se construye corriendo una segunda fraccin en la que los signos estn invertidos respecto de
los signos de la fraccin original. Entonces el diseo combinado puede usarse para separar los alias de to
dos los efectos principales de las interacciones de dos factores.
Una dificultad con el plegado es que requiere un segundo grupo de corridas de tamao idntico al del
diseo original. Por lo general es posible separar los alias de ciertas interacciones de inters aumentando
el diseo original con un nmero de corridas menor que las que se requieren en un plegado completo. Los
mtodos de regresin son una forma fcil de formular este problema y de ver cmo puede resolverse.
Para ilustrar, suponga que se ha corrido un diseo 2 . En la tabla 8-3 se muestra la fraccin princi
pal de este diseo, en la que / = ABCD. Suponga que despus de que se observaron los datos de los ocho
primeros ensayos, los efectos ms grandes fueron^, B, C, D (se ignoran las interacciones de tres factores
que son alias de estos efectos principales), y la cadena de a l i a s i + CD. Las otras dos cadenas de alias
pueden ignorarse, pero es claro que A S o CD o ambas interacciones de dos factores son grandes. Para di
lucidar cules son las interacciones importantes podra, desde luego, correrse la fraccin alterna, para lo
cual se requeriran otros ocho ensayos. Entonces las 16 corridas podran usarse para estimar los efectos
principales y las interacciones de dos factores.
Es posible separar los alias deAB y CD en un nmero de ensayos adicionales menor que ocho. Supon
ga que quiere ajustarse el modelo
y q + ^ J *1

+ ^ 3 * 3 + 4 *4 +

+ i 4 X 3X A

408

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

dondex1,x2,x3yx4 son las variables codificadas que representan a.A, B, C y D. Utilizando el diseo de la ta
bla 8-3, la matriz X de este modelo es
X,

X3

X4

-1
1
1
-1
1
-1
-1
1

X =

* 1* 2

*3X4

donde se han anotado las variables arriba de las columnas a fin de facilitar la comprensin. Observe que la
colum na*^ es idntica a la columna
(como se anticipaba, ya que AB ox:c2 es alias de CD 0 * 3X4),
lo cual implica una dependencia lineal en las columnas de X. Por lo tanto, no pueden estimarse tanto 12
como/334 en el modelo. Sin embargo, suponga que se agrega la corrida n icas = - l , x 2 = - 1 ,* 3 = -1 yx 4 =
1 de la fraccin alterna a las ocho corridas originales. Entonces la matriz X del modelo queda como
X 4 X jX 2

X =

-1
1
-1
1
-1
1
-1
1
-1

*3*4

-1
1
1
-1
1
-1
-1
1

Observe que ahora las columnas xc2y x # 4ya no son idnticas, y el modelo puede ajustarse incluyendo a
las dos interacciones* 1*2 (AB) y*c4 (CD). Las magnitudes de los coeficientes de regresin brindarn in
formacin respecto a cules son las interacciones importantes.
Aun cuando al agregar una sola corrida se separarn los alias de las interacciones A S y CD, este enfo
que tiene una desventaja. Suponga que existe un efecto de tiempo (o un efecto de bloque) entre las ocho
primeras corridas y la ltima corrida que se agreg arriba. Al agregarse una columna a la matriz X para los
bloques, se obtiene lo siguiente:
x2
-1
-1
1
1
X =

-1
-1
1
1
-1

* 4

* * * 2

* 3 * 4 blo q u es

10-4 PRUEBA DE HIPTESIS EN LA REGRESIN MLTIPLE

409

Se ha supuesto que el factor del bloque estaba en el nivel bajo o


durante las ocho primeras corridas, y
en el nivel alto o + durante la novena corrida. Es sencillo ver que la suma de los productos cruzados de
cada columna con la columna del bloque no es cero, lo cual significa que los bloques han dejado de ser or
togonales para los tratamientos, o que el efecto del bloque afecta ahora a las estimaciones de los coefi
cientes de regresin del modelo. Para conseguir la ortogonalidad de los bloques, debe agregarse un
nmero par de corridas. Por ejemplo, con las cuatro corridas
%

x2

*3

-1

-1

-1

-1

-1

1
-1
1

*4
1
-1
1
-1

se separarn los alias de A S de CD y permitirn que los bloques sean ortogonales (esto puede verse desa
rrollando la matriz X como se hizo anteriormente).
En general, suele ser directo el examen de la matriz X del modelo reducido que se obtiene de un dise
o factorial fraccionado, as como la determinacin de cules son las corridas que habrn de aumentarse
en el diseo original para separar los alias de las interacciones de inters potencial. Adems, el impacto de
las estrategias especficas para aumentar el diseo puede evaluarse utilizando los resultados generales
de los modelos de regresin que se presentan ms adelante en este captulo. Se cuenta tambin con mto
dos basados en computadora para construir diseos que pueden ser tiles en el aumento del diseo para
separar los alias de los efectos. Estos diseos generados por computadora se revisarn en el captulo si
guiente.

10-4

PRUEBA DE HIPTESIS EN LA REGRESIN MLTIPLE

En los problemas de regresin lineal mltiple, ciertas pruebas de hiptesis acerca de los parmetros del
modelo son una ayuda para medir la utilidad del modelo. En esta seccin se describen varios procedi
mientos de prueba de hiptesis importantes. Estos procedimientos requieren que los errores e del mode
lo sigan una distribucin normal e independiente con media cero y varianza a2, lo cual se abrevia
e ~ NID(0, o2). Como resultado de este supuesto, las observaciones y, tienen una distribucin normal e in
dependiente con media 0 + 'Lkj=ipcij y varianza o2.

10-4.1

Prueba de significacin de la regresin

La prueba de significacin de la regresin es un procedimiento para determinar si existe una relacin li


neai entre la variable de respuestay y un subconjunto de los regresoresxl,x2,
Las hiptesis apropia
das son
Ho'i = i = = k =
Hl : j * 0
para al menos una j

( 1 0 -2 0 )

El rechazo de H 0de la ecuacin 10-20 implica que al menos uno de los regresores*^, >xk contribuye de
manera significativa al modelo. El procedimiento de prueba incluye un anlisis de varianza en el que se

410

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

hace la particin de la suma de cuadrados total SSTen una suma de cuadrados debida al modelo (o a la re
gresin) y una suma de cuadrados debida a los residuales (o al error), es decir,
SST = SSR +SSE

(10-21)

Ahora bien, si la hiptesis nula.H0:1 = 2 = ... = k = 0 es verdadera, entonces SS^a2 se distribuye como
xl , donde el nmero de grados de libertad para/ 2 es igual al nmero de regresores del modelo. Asimis
mo, puede demostrarse que SSE/o2 se distribuye como xt-k-i Y Que $SEy SSRson independientes. El pro
cedimiento de prueba para H0:1 = 2 = - = k = 0 consiste en calcular
_
0

SSB / k

msr

(10-22)

SS / ( n - k - 1)' MSC

y en rechazar H0siF0excede a Fn > De manera alternativa, podra usarse el enfoque del valor P para
la prueba de hiptesis y, por lo tanto, rechazar H0si el valor P del estadstico F0 es menor que a. Por lo ge
neral la prueba se resume en una tabla del anlisis de varianza como la tabla 1 0 -6 .
Es sencillo encontrar una frmula para calcular SSR. En la ecuacin 10-16 se estableci una frmula
para calcular SSE; es decir,

ssE = y'y-'x'y
Ahora bien, puesto que SST = Z =1 yf
reescribirse como

- ( " =1

y ) 2 1n= y y ( 2 "=1 y, ) 2 In, la ecuacin anterior puede

'X 'y -

SSE = SST - SSR


Por lo tanto, la suma de cuadrados de regresin es

(i* '

SSR = 'X'y

(10-23)

mientras la suma de cuadrados del error es


SSE = y'y - 'X 'y

Tabla 10-6

(10-24)

Anlisis de varianza de la significacin de la regresin en una regresin mltiple_________________________


Suma de cuadrados

G rados de libertad

Cuadrado medio

F0

Regresin

SSR

MSR

MSR/MSE

E rror o residual

SSE

n -k - 1

MSE

Total

SST

n -1

Fuente de variacin

10-4 PRUEBA DE HIPTESIS EN LA REGRESIN MLTIPLE

411

y la suma de cuadrados total es

Estos clculos casi siempre se realizan con software de regresin. Por ejemplo, en la tabla 10-4 se
muestra una parte de la salida de Minitab para el modelo de regresin de la viscosidad del ejemplo 10-1.
La seccin superior de esta presentacin es el anlisis de varianza del modelo. La prueba de significacin
de la regresin en este ejemplo incluye las hiptesis
H 0: t i 0

Hi : j * 0

para al menos una j

El valor P de la tabla 10-4 para el estadstico F (ecuacin 10-22) es muy pequeo, por lo que se concluira
que al menos una de las dos variables la temperatura (j^) y la velocidad de alimentacin (*2) tiene un
coeficiente de regresin diferente de cero.
En la tabla 10-4 se presenta tambin el coeficiente de determinacin mltiple R2, donde
(10-26)
Como en los experimentos diseados, R2es una medida de la cantidad de reduccin en la variabilidad de y
que se obtiene al utilizar las variables de regresin
...,xk en el modelo. Sin embargo, como se seal
antes, un valor grande de R2 no implica necesariamente que el modelo de regresin sea adecuado. Siem
pre que se agregue una variable al modelo, R2 se incrementar, independientemente de que la variable
adicional sea estadsticamente significativa o no. Por lo tanto, es posible que los modelos que tienen valo
res grandes de R2 produzcan predicciones pobres de nuevas observaciones o estimaciones pobres de la
respuesta media.
Puesto que R2 siempre se incrementa cuando se agregan trminos al modelo, algunos constructores
de modelos de regresin prefieren usar el estadstico 2 ajustada definido como
(10-27)
En general, el estadstico R2 ajustada no siempre se incrementar cuando se agreguen variables al mode
lo. De hecho, si se agregan trminos innecesarios, el valor de i?jJustada se decrementar con frecuencia.
Por ejemplo, considere el modelo de regresin de la viscosidad. La R2 ajustada para el modelo se
muestra en la tabla 10-4. Se calcula como

= 0.915735
que est muy cerca de la R2 ordinaria. Cuando la diferencia entre R2y Rly.c,^ es considerable, existe un
buen riesgo de que se hayan incluido en el modelo trminos no significativos.

412
10-4*2

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Pruebas de los coeficientes de regresin individuales


y de grupos de coeficientes

Muchas veces el inters se centra en probar hiptesis sobre los coeficientes de regresin individuales.
Estas pruebas seran tiles para determinar el valor de cada uno de los regresores del modelo de regre
sin. Por ejemplo, el modelo podra ser ms eficaz con la inclusin de variables adicionales o quiz con la
eliminacin de una o ms de las variables que estn ya en el modelo.
Agregar una variable al modelo de regresin ocasiona siempre que la suma de cuadrados de regre
sin se incremente y que la suma de cuadrados del error se decremente. Es necesario decidir si el incre
mento de la suma de cuadrados de regresin es suficiente para garantizar el uso de la variable adicional
en el modelo. Adems, agregar una variable no importante al modelo en realidad puede incrementar el
cuadrado medio del error, reducindose as la utilidad del modelo.
Las hiptesis para probar la significacin de cualquier coeficiente de regresin individual, por ejem
plo j, son
H 0:j = 0
H ^ j*

Si H0:j = 0 no se rechaza, entonces esto indica quexy puede eliminarse del modelo. El estadstico de prue
ba para esta hiptesis es
'o =

(10-28)
ca

donde Cn es el elemento de la diagonal de (X'X)-1 correspondiente a j . La hiptesis nula H:j = 0 se re*


chaza si | f01 > tal2 n_k_. Observe que se trata en realidad de una prueba parcial o marginal, ya que el coefi
ciente de regresin j depende de todos los dems regresores x (i * j ) que estn en el modelo.
AI denominador de la ecuacin 10-28,
se le llama con frecuencia error estndar (se) del coe
ficiente de regresin r Es decir,
seC j)= ^ c:

(10-29)

Por lo tanto, una manera equivalente de escribir el estadstico de prueba de la ecuacin 10-28 es
* = -4 se(j)

(10-30)

La mayora de los programas de computadora de regresin proporcionan la prueba t para cada par
metro del modelo. Por ejemplo, considere la tabla 10-4, la cual contiene la salida de Minitab para el ejem
plo 10-1. En la seccin superior de esta tabla se da la estimacin de mnimos cuadrados de cada
parmetro, el error estndar, el estadstico t y el valor P correspondiente. Se concluira que ambas varia
bles, la temperatura y la velocidad de alimentacin, contribuyen de manera significativa en el modelo.
Tambin puede examinarse directamente la contribucin de una variable particular, por ejemplo^-, a
la suma de cuadrados de regresin, dado que otrasx variables (i ^ j) estn incluidas en el modelo. El pro
cedimiento para hacer esto es la prueba general de la significacin de la regresin o, como se denomina
con frecuencia, el mtodo de suma de cuadrados extra. Este procedimiento tambin puede usarse para
investigar la contribucin de un subconjunto de los regresores al modelo. Considere el modelo de regre
sin con k regresores:
y =

10-4 PRUEBA DE HIPTESIS EN LA REGRESIN MLTIPLE

413

donde y es ( x 1), X es ( x p ) , es(p x l),e es(n x l) y p = k + 1. Querra determinarse si el subcon


junto de regresores jc1; x2, ...,xr (r < k) contribuye significativamente al modelo de regresin. Sea que se
haga la particin del vector de los coeficientes de regresin de la siguiente manera:
=

\x
i 2 J

donde 1 es (r x 1) y 2 es [(p - r) x 1]. Quieren probarse las hiptesis


H a:fli = 0
Hi'-i * 0

(10-31)

y = X + e = X i l + X 2 2 +e

(10-32)

El modelo puede escribirse como

donde X! representa las columnas de X asociadas con xy X2 representa las columnas de X asociadas
con /Ji
para el modelo completo (incluyendo tanto a.1 como a 2) se sabe que j = (X'X)_1X'y. Adems, la
suma de cuadrados de regresin para todas las variables incluyendo la ordenada al origen es
SSR() = 'X y

(p grados de libertad)

n-p

A SSR() se le llama la suma de cuadrados de regresin debida a. Para encontrar la contribucin de los
trminos en1a la regresin, se ajusta el modelo suponiendo que la hiptesis nula H0 1 = 0 es verdadera.
El modelo reducido se encuentra a partir de la ecuacin 10-32 con x = 0:
y = X 2 2 +e

(10-33)

El estimador de mnimos cuadrados de 2 es 2 = (X^Xj^X'#, y


SSR( 2 ) = ^ X j y

( p r grados de libertad)

(10-34)

La suma de cuadrados de regresin debida a t dado que 2 est ya en el modelo es


SS*( , \ 2) = SSR( ) - SSR( 2 )

(10-35)

Esta suma de cuadrados tiene r grados de libertad. Es la suma de cuadrados extra debida a/j. Observe
que SSR(i\ 2) es el incremento en la suma de cuadrados de regresin debido a la inclusin de las varia
bles Xi, x2,
xr en el modelo.
Ahora bien, SSR(i |/J2) es independiente de MSE, y la hiptesis nula/fj = 0 puede probarse con el es
tadstico
SS ( A , ) / r
F0 =
*(PA l P
l
(10-36)
mse

Si F0 > Fa r n_pi se rechazaH0, y se concluye que al menos uno de los parmetros en^j es diferente de cero
y, por consiguiente, al menos una de las variables*!,x2, ...,x, en X! contribuye significativamente al modelo
de regresin. Algunos autores llaman a la prueba de la ecuacin 10-36 la prueba F parcial.

414

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

La prueba F parcial es muy til. Puede usarse para medir la contribucin de je, como si fuera la ltima
variable que se agreg al modelo, calculando
SSR( , \ * . i . - . j - i . w - k)
ste es el incremento en la suma de cuadrados de regresin debido a que se agrega*, a un modelo que ya
contiene axj,
+ h ...,xk. Observe que la prueba i 7 parcial de una sola variables, es equivalente a la
prueba t de la ecuacin 10-28. Sin embargo, la prueba F parcial es un procedimiento ms general por
cuanto puede medir el efecto de conjuntos de variables.

EJEMPLO 1 0 -6 ..................................................................................................................................
Considere los datos de la viscosidad del ejemplo 10-1. Suponga que se quiere investigar la contribucin de
la variable^ (velocidad de alimentacin) al modelo. Es decir, las hiptesis que quieren probarse son
H : 2 = 0
H st*

Esto requerir la suma de cuadrados extra debida a ft, o


SSR( 2\lt f t ) = S S * ( f t , f t , f t ) - S S ( f t , f t )
= ^ f tt f tj f t l f t ) ~SSR( 2\o)
Entonces, por la tabla 10-4, donde se prob la significacin de la regresin, se tiene
SSR( i . 2 1f t ) =44,157.1
a la que se llam en la tabla la suma de cuadrados del modelo. Esta suma de cuadrados tiene dos grados
de libertad.
El modelo reducido es
y = o + i* i+
El ajuste de mnimos cuadrados de este modelo es
j>= 1652.3955+ 7.6397^
y la suma de cuadrados de regresin para este modelo (con un grado de libertad) es
^ ( f t | f t ) = 40,840.8
Observe que SSR(x|ft) se muestra en la parte inferior de la salida de Minitab de la tabla 10-4 bajo el en
cabezado Seq SS. Por lo tanto,
SSR( f t | f t , f t ) = 44,157.1 - 40,840.8
3316.3
con 2 - 1 = 1 grado de libertad. ste es el incremento en la suma de cuadrados de regresin que resulta de
agregar x2 a un modelo que contena ya axb y se muestra en la parte inferior de la salida de Minitab en la
tabla 10-4. Para probar H0:2 ~ o, por el estadstico de prueba se obtiene

f - ss* ( f t I f t . f t )/ 1 =
= 123926
MS E
267.604
Observe que en el denominador de F0se usaM5Edel modelo completo (tabla 10-4). Entonces, puesto que
^ 0.05, 1,13 = 1-67, se rechazaraH0:2 = Oy se concluira que* 2 (velocidad de alimentacin) contribuye signi
ficativamente al modelo.

10-5 INTERVALOS DE CONFIANZA EN REGRESIONES MLTIPLES

415

Debido a que esta prueba F parcial incluye un solo regresor, es equivalente a la prueba t porque el
cuadrado de una variable aleatoria t con v grados de libertad es una variable aleatoria F con 1 y v grados
de libertad. Para ver esto, observe, por la tabla 10-4, que el estadstico t para// 0:/32 = 0 dio como resultado
t0 = 3.5203 y que
= (3.5203)2 = 12.3925 = F0.

10-5

INTERVALOS DE CONFIANZA EN REGRESIONES MLTIPLES

Con frecuencia es necesario construir estimaciones de intervalos de confianza para los coeficientes de re
gresin {j} y para otras cantidades de inters del modelo de regresin. El desarrollo de un procedimien
to para obtener estos intervalos de confianza requiere suponer que los errores {e} tienen una
distribucin normal e independiente con media cero y varianza o1, el mismo supuesto que se estableci en
la seccin sobre la prueba de hiptesis de la seccin 10-4.

10-5.1

Intervalos de confianza para los coeficientes de regresin individuales

Puesto que el estimador de mnimos cuadrados^es una combinacin lineal de las observaciones, se sigue
que fi tiene una distribucin normal con vector medio y matriz de covarianza o^X'X)-1. Entonces cada
uno de los estadsticos
-
-?= =

j = 0, 1, ..., k

(10-37)

se distribuye como t con n - p grados de libertad, donde Cn es el elemento (jj)-simo de la matriz (X'X)*1, y
2 es la estimacin de la varianza del error, obtenida con la ecuacin 10-17. Por lo tanto, un intervalo de
confianza de lOO(l-a) por ciento para el coeficiente de regresin s, j * 0, 1,
k, es
j - w

< j < j + t a/2^ p ^ C

(10-38)

Observe que este intervalo de confianza tambin podra escribirse como


i - K a,n-pse(j ) ^ j * j + t at2 n_pse(j )
ya que seCj) = ^ 2Cr

EJEMPLO 1 0 -7 ..................................................................................................................................
Se construir un intervalo de confianza de 95% para el parmetro l del ejemplo 10-1. Ahora bien, x =
7.62129, y puesto que 2 = 267.604 y Cn 1.429184 x 103, se encuentra que
l ~ *0.025,13
^11 l ^ l +*0.025.13
7.62129 - 216A/(267.604)(1.429184xl0-3 ) < ft
7.62129 + 2.167(267.604)(1.429184 x 10~3 )
7.62129- 2.16(0.6184) f t <; 7.62129 + 216(0.6184)
y el intervalo de confianza de 95% para f t es
6.2855s f t 8.9570

416

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

10-5.2

Intervalo de confianza para la respuesta media

Tambin puede obtenerse un intervalo de confianza para la respuesta media en un punto particular, por
ejemplo, x01, x02, ..., x0k. Se define primero el vector
1

L *o*j

La respuesta media en este punto es


f y \ia = o + l X

01

~ ^ iX

02

+ k X 0 lc =

Xo

La respuesta media estimada en este punto es


X xo) = x>
Este estimador es insesgado, ya que [5*(x0)] = E(x'0) = x'a =

(10-39
, y la varianza de (xo) es

K[Kx0)] = a 2 x;(X 'X )- 1 x 0

(10-40)

Por lo tanto, un intervalo de confianza de 100(1 - a) por ciento para la respuesta media en el puntox01,x02,
..., JCoA: eS

X * o ) - /2I,.-,V dZ* i ( X,*)" lx o

10-6

(iO-41)

PREDICCION DE NUEVAS OBSERVACIONES DE LA RESPUESTA

Es posible usar un modelo de regresin para predecir observaciones futuras de la respuesta}* que corres
ponden avalores particulares de los regresores, por ejemplo*01, je02, ...,x0k. Si x '0 = [l,x 01,x 02, e n t o n
ces una estimacin puntual de la observacin futura^ en el punto x01, x02, ...,xot: se calcula con la ecuacin
10-39:
Xxo)=x'o
Un intervalo de prediccin de lOO(l-a) por ciento para esta observacin futura es
)-W

, J 1( i + x ( x ' x y l x0 ) <

(10-42)

s X x o ) + t ali,n_ J 2(i + x ' t ( x ' x y l x 0 )


Cuando se predicen nuevas observaciones y se estima la respuesta media en un punto dadox01,x02, ...,
xm es necesario tener cuidado para no hacer una extrapolacin fuera de la regin que contiene las obser
vaciones originales. Es muy posible que un modelo que se ajuste bien en la regin de los datos originales
deje de hacerlo fuera de esa regin.

10-7

DIAGNSTICOS DEL MODELO DE REGRESIN

Como se destac en los experimentos diseados, la verificacin de la adecuacin del modelo es una parte
importante en el procedimiento del anlisis de datos. Es de igual importancia en la construccin de mo
delos de regresin y, como se ilustr en el ejemplo 1 0 - 1 , en un modelo de regresin debern examinarse

10-7 DIAGNSTICOS DEL MODELO DE REGRESIN

417

siempre las grficas de los residuales que se usaron en los experimentos diseados. En general, siempre
es necesario: 1 ) examinar el modelo ajustado para asegurarse de que proporciona una aproximacin ade
cuada del verdadero sistema y 2 ) verificar que no se infringe ninguno de los supuestos de la regresin de
mnimos cuadrados. El modelo de regresin probablemente producir resultados pobres o equivocados a
menos que sea un ajuste adecuado.
Adems de las grficas de los residuales, existen otros diagnsticos del modelo que con frecuencia
son tiles en la regresin. En esta seccin se presenta un breve resumen de estos procedimientos. Para
anlisis ms completos, ver Montgomery y Peck [82] y Myers [84].

10-7.1

Residuales escalados y PRESS

R esid u ales estandarizados y stu d e n tiia d o s

Muchos constructores de modelos prefieren trabajar con residuales escalados en lugar de los residuales
de mnimos cuadrados ordinarios. Estos residuales escalados transmiten con frecuencia ms informacin
que los residuales ordinarios.
Un tipo de residual escalado es el residual estandarizado:
dt = ^

i = 1 ,2 ,..., n

(10-43)

donde por lo general se usa = ^ MS E en los clculos. Estos residuales estandarizados tienen media cero
y varianza aproximadamente unitaria; por consiguiente, son muy tiles para buscar puntos atpicos. La
mayora de los residuales estandarizados debern localizarse en el intervalo -3 < d, < 3, y cualquier ob
servacin con un residual estandarizado que est fuera de este intervalo es potencialmente inusual con
respecto a su respuesta observada. Estos puntos atpicos debern examinarse con atencin, ya que pue
den representar algo tan simple como un error al registrar los datos o algo que sea motivo de mayor preo
cupacin, como una regin del espacio del regresor, donde el modelo ajustado es una aproximacin
pobre de la verdadera superficie de respuesta.
El proceso de estandarizacin de la ecuacin 10-43 escala los residuales al dividirlos por su desvia
cin estndar promedio aproximada. En algunos conjuntos de datos, los residuales pueden tener desvia
ciones estndar que difieren considerablemente. A continuacin se presenta una escalacin que toma en
consideracin esta situacin.
El vector de los valores ajustados y. que corresponden a los valores observados y es
y=x
= X (X 'X )-' X 'y

(10-44)

= Hy
A la matriz n X i , H = X (X 'X )_1X ' se le llama generalmente la matriz gorro porque mapea el vector de
los valores observados en un vector de los valores ajustados. La matriz gorro y sus propiedades desempe
an un papel central en el anlisis de regresin.
Los residuales del modelo ajustado pueden escribirse convenientemente en la notacin matricial
como
e = y- y

y resulta que la matriz de covarianza de los residuales es


C o v (e) = a 2 ( I - H)

(1 0 -4 5 )

La matriz I - H no es por lo general diagonal, por lo que los residuales tienen varianzas diferentes y estn
correlacionados.

418

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Por lo tanto, la varianza del residual i-simo es


V(et ) = a \ l - h M)
(10-46)
donde hues el elemento i-simo de la diagonal de H. Puesto que 0 < hu < 1, al utilizar el cuadrado medio
residual MSEpara estimar la varianza de los residuales en realidad se est sobreestimando V(e,). Adems,
puesto que hues una medida de localizacin del punto i-simo en el espacio x, la varianza de e depende de
dnde est el punto*,. En general, los residuales situados cerca del centro del espacio* tienen varianzas
ms grandes que los residuales situados en lugares ms apartados. Las violaciones de los supuestos del
modelo son ms probables en los puntos remotos, y estas violaciones pueden ser difciles de detectar por
la inspeccin de e (o d) porque sus residuales sern por lo general ms pequeos.
Se recomienda tomar en consideracin esta desigualdad de la varianza cuando se escalen los residua
les. Se sugiere graficar los residuales studentizados:
i =1 "

( 1 M7 )

con 2 = MS e en lugar de e (o d). Los residuales studentizados tienen varianza constante V(r) = 1 inde
pendientemente de la localizacin de x( cuando la forma del modelo es correcta. En muchas situaciones la
varianza de los residuales se estabiliza, en particular para conjuntos de datos grandes. En estos casos pue
de haber poca diferencia entre los residuales estandarizados y los studentizados. Por lo tanto, los residua
les estandarizados y studentizados transmiten con frecuencia informacin equivalente. Sin embargo, ya
que cualquier punto con un residual grande y una h grande tiene una influencia potencialmente conside
rable sobre el ajuste de mnimos cuadrados, suele recomendarse el examen de los residuales studentiza
dos. En la tabla 10-3 se presentan las diagonales gorro htty los residuales studentizados para el modelo de
regresin de la viscosidad del ejemplo 1 0 - 1 .
Residuales PRESS
La suma de cuadrados del error de prediccin (PRESS, del ingls Prediction Error Sum of Squares) pro
porciona una til escalacin de los residuales. Para calcular la PRESS se selecciona una observacin, por
ejemplo la i. Se ajusta el modelo de regresin a las n - 1 observaciones restantes y se usa esta ecuacin
para predecir la observacin que se aparty. Al denotar este valor predicho (l), puede encontrarse el
error de prediccin del punto i como e(;) = y, = $>(). Al error de prediccin suele llamrsele el residual
PRESS i-simo. Este procedimiento se repite para cada observacin i = 1,2,..., n, producindose un con
junto de n residuales PRESS e(1), e(2), e (n). Entonces el estadstico PRESS se define como la suma de
cuadrados de los n residuales PRESS como en
PRESS =

J(=i 4 , = J;=i

[y, - r (0 ]2

(10-48)

Por lo tanto, la PRESS utiliza cada subconjunto posible de n - 1 observaciones como un conjunto de datos
de estimacin, y se utiliza una observacin a la vez para formar un conjunto de datos de prediccin.
Inicialmente, parecera que para calcular la PRESS es necesario ajustar n regresiones diferentes. Sin
embargo, la PRESS puede calcularse a partir de los resultados de un solo ajuste de mnimos cuadrados a
las n observaciones totales. Resulta que el residual PRESS i-simo es
e () = T ^ 7

<10-4 9 >

Por lo tanto, ya que la PRESS es tan slo la suma de cuadrados de los residuales PRESS, una frmula de
clculo simple es

10'7 DIAGNSTICOS DEL MODELO DE REGRESIN

419

Por la ecuacin 10-49 es sencillo ver que el residual PRESS es slo el residual ordinario ponderado de
acuerdo con los elementos de la diagonal de la matriz gorro hu. Los puntos de los datos para los que ha es
grande tendrn residuales PRESS grandes. Estas observaciones sern por lo general puntos de alta in
fluencia. En general, una diferencia grande entre el residual ordinario y los residuales PRESS indicar un
punto donde el modelo se ajusta bien a los datos, pero un modelo construido sin dicho punto producir
predicciones pobres. En la siguiente seccin se estudiarn otras medidas de influencia.
Por ltimo, cabe sealar que la PRESS puede usarse para calcular una 2 aproximada de prediccin,
por ejemplo
d2
_
PRESS
Prediccin 1

r.

(lU O l)

yy

Este estadstico ofrece cierto indicio de la capacidad predictiva del modelo de regresin. Para el modelo
de regresin de la viscosidad del ejemplo 10-1, los residuales PRESS pueden calcularse utilizando los re
siduales ordinarios y el valor de h encontrado en la tabla 10-3. El valor correspondiente del estadstico
PRESS es PRESS = 5207.7. Entonces
PRESS
j?2
1 'w

5207.7
47,635.9
= 0.8907
1

Por lo tanto, podra esperarse que este modelo explique cerca de 89% de la variabilidad al predecir
nuevas observaciones, en comparacin con el aproximadamente 93% de la variabilidad en los datos origi
nales que explica el ajuste de mnimos cuadrados. La capacidad predictiva global del modelo basado en
este criterio parece ser muy satisfactoria.
R -student

Es comn considerar al residual studentizado r, comentado antes como el diagnstico de un punto atipi
co. Se acostumbra usar MSEcomo una estimacin de a2 en el clculo de r. Se hace referencia a este enfo
que como la escalacin interna del residual, ya que MSE es una estimacin de a2 generada internamente
que se obtiene del ajuste del modelo a las n observaciones. Otro enfoque sera usar una estimacin de a2
basada en un conjunto de datos en el que se elimina la observacin z-sima. La estimacin de o2 as obteni
da se denota por S 2^. Puede demostrarse que
p2 (i. p )MS e e 2 / ( 1 - h)
5 c> -

t 10' 52)

La estimacin de o2 de la ecuacin 10-52 se usa en lugar de MSE para producir un residual studentizado
externamente, al que es comn llamar -student, dado por
' P l f i - K )

i = 1 2" - n

( 1 0 -5 3 >

En muchas situaciones habr una ligera diferencia entre t y el residual studentizado r. Sin embargo,
si la observacin i-sima es influyente, entonces S 2} puede diferir significativamente de MSE, y por lo tan
to la -student ser ms sensible a este punto. Adems, bajo los supuestos usuales, t tiene una distribu
cin
Por lo tanto, la .R-student ofrece un procedimiento ms formal para detectar puntos atpicos a
travs de la prueba de hiptesis. En la tabla 10-3 se muestran los valores de la /?-student para el modelo de
regresin de la viscosidad del ejemplo 10-1. Ninguno de esos valores es inusualmente grande.

420

10-7.2

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

Diagnsticos de influencia

En ocasiones se encuentra que un subconjunto pequeo de los datos ejerce una influencia desproporcio
nada sobre el modelo de regresin ajustado. Es decir, las estimaciones o predicciones de los parmetros
pueden depender ms del subconjunto influyente que de la mayora de los datos. Sera conveniente loca
lizar estos puntos influyentes y valorar su impacto en el modelo. Si estos puntos influyentes son valores
malos, debern eliminarse. Por otra parte, quiz no haya nada malo con estos puntos. Pero si controlan
propiedades clave del modelo, sera deseable saberlo, ya que podra afectar el uso del modelo. En esta
seccin se describen e ilustran algunas medidas tiles de influencia.
P u n to s de ac ci n de p alan c a

La localizacin de los puntos en el espacio* es importante para detefminar las propiedades del modelo. En
particular, las observaciones apartadas tienen potencialmente acciones o brazos de palanca desproporcio
nados sobre las estimaciones de los parmetros, los valores predichos y los estadsticos de resumen usuales.
La matriz gorro H = X(X'X)_1X' es muy til para identificar las observaciones influyentes. Como ya
. se seal, H determina las varianzas y covarianzas de y e, ya que V(y) = crH y V(e) = cr(\ - H). Los ele
mentos hj de H pueden interpretarse como la cantidad de accin de palanca ejercida pory, sobre y.. Por lo
tanto, la inspeccin de los elementos de H puede revelar puntos que son potencialmente influyentes en
virtud de su localizacin en el espacio *. La atencin suele centrarse en los elementos de la diagonal hu.
Puesto que Z "=1 h H = rango(H) = rango(X) = p , el tamao promedio de los elementos de la diagonal de la
matriz H es p i n . Como gua aproximada, entonces, si un elemento h de la diagonal es mayor que 2p i n , la
observacin i es un punto con accin de palanca alta. Para aplicar lo anterior al modelo de la viscosidad
del ejemplo 10-1, observe que T p ln = 2(3)/16 = 0.375. En la tabla 10-3 se dan las diagonales gorro hpara
el modelo de primer orden; puesto que ninguna de las huexcede 0.375, se concluira que no hay puntos de
accin de palanca en estos datos.
In flu e n c ia sobre los co eficientes de regresin

Las diagonales gorro identificarn los puntos potencialmente influyentes debido a su localizacin en el
espacio*. Es deseable considerar la localizacin del punto y la variable de respuesta cuando se mide la in
fluencia. Cook [32a, b] ha sugerido el uso de una medida del cuadrado de la distancia entre la estima
cin de mnimos cuadrados basada en todos los n puntos y la estimacin obtenida al eliminar el punto i,
por ejemplo ^. Esta medida de la distancia puede expresarse como
C(,) - ) ' X ' X 0 {i)- )
D =

u cS E
pM

-------

= !. 2> - >

( 10-5 4 )

Un valor de referencia razonable para D es la unidad. Es decir, en general las observaciones para las que
D( > 1 se consideran influyentes.
El estadstico D se calcula en realidad a partir de

V(e,)

Observe que, aparte de la constantep, D es el producto del cuadrado del residual studentizado /-simo y
hu/(l-hu). Puede demostrarse que este cociente es la distancia del vector \ al centroide de los datos res
tantes. Por lo tanto, D est compuesto por un componente que refleja la medida en que el modelo ajusta

10-8 PRUEBA DE FALTA DE AJUSTE

421

la observacin /-simay, y un componente que mide qu tan alejado est ese punto del resto de los datos.
Cualquiera de los componentes (o ambos) puede contribuir a un valor grande de D.
En la tabla 10-3 se muestran los valores de D para el ajuste del modelo de regresin a los datos de la
viscosidad del ejemplo 10-1. Ninguno de estos valores de D excede 1, por lo que no hay evidencia slida
de observaciones influyentes en estos datos.

10-8

PRUEBA DE FALTA DE AJUSTE

En la seccin 6 -6 se indic cmo agregar puntos centrales a un diseo factorial 2k le permite al experimen
tador obtener una estimacin del error experimental puro. Esto permite hacer la particin de la suma de
cuadrados de los residuales SSE en dos componentes; es decir,
SSE = SSFE + SSL0F
donde SSPEes la suma de cuadrados debida al error puro y SSL0Fes la suma de cuadrados debida a la falta
de ajuste.
Puede presentarse un desarrollo general de esta particin en el contexto de un modelo de regresin.
Suponga que se tienen n observaciones de la respuesta en el nivel i-simo de los regresores x i = 1 ,2 , ...,
m. Sea quey,y denota la observaciny-sima de la respuesta en x i = 1,2,
= 1,2,...,,. Hay = 2 ^
n observaciones en total. El residual (y)-simo puede escribirse como
y,, -

&

(y i, - y ,

) + ( > ,- -

(io - 5 6 )

donde y, es el promedio de las n observaciones en x,. Al elevar al cuadrado ambos miembros de la ecua
cin 10-56 y hacer la operacin suma sobre i y j se obtiene
m H;

m n

2 2 O, -y,)2= 1 2 Ov-3>,)2+ 2 n .O - h ) 1
=1

1
=1 j = l

(10-57)

i=1

El primer miembro de la ecuacin 10-57 es la suma de cuadrados de los residuales ordinaria. Los dos
componentes del segundo miembro miden el error puro y la falta de ajuste. Se observa que la suma de
cuadrados del error puro
s s PE = ' Z ^ ( y , - y , ) 2

(10-58)

/=1 ;=1

se obtiene calculando la suma de cuadrados corregida de las observaciones repetidas en cada nivel de x y
haciendo despus la agrupacin en los m niveles de x. Si se satisface el supuesto de la varianza constante,
sta es una medida independiente del modelo del error puro, ya que para calcular SSPEslo se usa la varia
bilidad de las y en cada nivel x. Puesto que hay n - 1 grados de libertad del error puro en cada nivel x el
nmero total de grados de libertad asociados con la suma de cuadrados del error puro es
m

(n-l) = n -m

(10-59)

1=1

La suma de cuadrados de la falta de ajuste


m

5 ^

2
1=1

, a

-* ) 2

(10-60)

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

422

es una suma ponderada de los cuadrados de las desviaciones entre la respuesta media , en cada nivel x, y
el valor ajustado correspondiente. Si los valores ajustados y, estn cerca de las respuestas promedio y, co
rrespondientes, entonces hay un fuerte indicio de que la funcin de regresin es lineal. Si las y se desvan
mucho de las y,, entonces es probable que la funcin de regresin no sea lineal. Hay m - p grados de liber
tad asociados con SSLOFporque hay m niveles de x, y se pierden p grados de libertad porque deben esti
marse p parmetros para el modelo. En lo que a los clculos se refiere, por lo general SSL0F se obtiene
restando SSPE de SSB.
El estadstico de prueba para la falta de ajuste es
F - SSLOF ! ( m - p ) _ MS LOF
0

yjrt -x
K ' )

SSPE/ ( n - m ) ~ MS pe

El valor esperado de MSPE es o2, y el valor esperado de MSL0F es

2 .

E(MSL0F) = a 2 +

*0

0 0 -2

i =i

j xn
(10-62)

m -2

Si la verdadera funcin de regresin es lineal, entonces E(y)= 0 +Hk_1 jxij, y el segundo trmino de la
ecuacin 10-62 es cero, dando como resultado E(MSLOF) = a2. Sin embargo, si la verdadera funcin de re
gresin no es lineal, entonces E( yt ) * Q+ X k^1 jxi] y E(MSLOF) > o2. Adems, si la verdadera funcin de
regresin es lineal, entonces el estadstico F0sigue la d i s t r i b u c i n P o r lo tanto, para probar la falta
de ajuste, se calculara el estadstico de prueba Fq y se concluira que la funcin de regresin no es lineal si
* 0

> Fa,

m-p, n~m *

Es sencillo incorporar este procedimiento de prueba en el anlisis de varianza. Si se concluye que la


funcin de regresin no es lineal, entonces el modelo tentativo habr de abandonarse y debern hacerse
intentos para encontrar una ecuacin ms apropiada. De manera alternativa, si F0no excede Fa m^, n^, no
existe evidencia slida de falta de ajuste y MSPEy MSL0F se combinan con frecuencia para estimar o2. El
ejemplo 6 -6 es una ilustracin muy completa de este procedimiento, donde las rplicas de las corridas son
puntos centrales de un diseo factorial 2 2.

10-9

PROBLEMAS

------------------------ ------------------- ---------------------------------------------

10-1. L a resistencia a la tensin de un producto de papel se relaciona con la cantidad de m adera dura en la pulpa.
Se producen 10 m uestras en la planta piloto y los datos obtenidos se presentan en la siguiente tabla.
Resistencia

Porcentaje de m adera dura

Resistencia

Porcentaje de m adera dura

160
171
175
182
184

10
15
15
20
20

181
188
193
195
200

20
25
25
28
30

a) A justar un modelo de regresin lineal que relacione la resistencia con el porcentaje de m adera dura.

b) Probar el modelo del inciso a para la significacin de la regresin.


c) E ncontrar un intervalo de confianza de 95% p ara el parm etro v
10-2. E n una planta se destila aire lquido p ara producir oxgeno, nitrgeno y argn. Se piensa que el porcentaje de
im purezas en el oxgeno se relaciona linealm ente con la cantidad de im purezas en el aire, m edida por el

10-9 PROBLEMAS

423

conteo de contam inacin en partes por milln (ppm ). U n a m uestra de los datos de operacin de la planta
se presenta a continuacin:

P ureza (% )

93.3

C onteo de contaminacin (ppm)

1.10

93.1

93.2

0.99

10-3.
10-4.
10-5.
10-6.

92.0
1.45
92.9

0.83

1.22

92.4
1.36
92.2
1.47

91.7
1.59
91.3
1.81

94.0
1.08
90.1
2.03

94.6

93.6

0.75
91.6

1.20
91.9

1.75

1.68

a ) A justar un m odelo de regresin lineal a los datos.


b ) Probar la significacin de la regresin.
c) E ncontrar un intervalo de confianza de 95% p ara v
G raficar los residuales del problem a 10-1 y com entar la adecuacin del modelo.
G raficar los residuales del problem a 10-2 y com entar la adecuacin del modelo.
U tilizando los resultados del problem a 10-1, p ro b ar el m odelo de regresin p ara la falta de ajuste.
Se realiz un estudio sobre el desgaste y de u n cojinete y su relacin con*! = viscosidad del aceite yx2 = car
ga. Se obtuvieron los siguientes datos:

y
193
230
172
91
113
125

*2
1.6
15.5
22.0
43.0
33.0
40.0

851
816
1058
1201
1357
1115

a ) A justar un m odelo de regresin lineal m ltiple a los datos.


b) P robar la significacin de la regresin.
c) Calcular el estadstico t para cada parm etro del modelo. Q u conclusiones pueden sacarse?
10-7. Se piensa que la potencia al freno desarrollada por el m otor de u n automvil en u n dinam m etro es un a fun
cin de la rapidez del m otor en revoluciones p o r m inuto (rpm ), el octanaje del com bustible y la com presin
del m otor. Se llev a cabo un experim ento en el laboratorio y los datos colectados fueron:

Potencia al freno

rpm

O ctanaje

225
212
229
222
219
278
246
237
233
224
223
230

2000
1800
2400
1900
1600
2500
3000
3200
2800
3400
1800
2500

90
94
88
91
86
96
94
90
88
86
90
89

Com presin
100
95
110
96
100
110
98
100
105
97
100
104

424

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

a) A justar un m odelo de regresin m ltiple a estos datos.


b) Probar la significacin de la regresin. Q u conclusiones pueden sacarse?
c) Con base en las pruebas t, son necesarios los tres regresores en el m odelo?
10-8. A nalizar los residuales del modelo de regresin del problem a 10-7. C om entar la adecuacin del modelo.
10-9. El rendim iento de un proceso qumico se relaciona con la concentracin del reactivo y la tem p eratu ra de
operacin. Se realiza un experim ento con los siguientes resultados:

Rendimiento

Concentracin

"temperatura

81
89
83
91
79
87
84
90

1.00
1.00
2.00
2.00
1.00
1.00
2.00
2.00

150
180
150
180
150
180
150
180

a) Suponga que quiere ajustarse un modelo de los efectos principales a estos datos. E stablecer la m atriz
X 'X utilizando los datos exactam ente como aparecen en la tabla.

b) La m atriz que se obtuvo en el inciso a es diagonal? C om entar la respuesta.


c) Suponga que el modelo se escribe en trm inos de las variables codificadas usuales

Concentracin -1 .5
0.5

x, = -----------------------------1

Temperatura -1 6 5
15

x- -------------------------------2

Establecer la m atriz X 'X p ara el m odelo en trm inos de estas variables codificadas. E sta m atriz es dia
gonal? C om entar la respuesta.
d) D efinir un nuevo conjunto de variables codificadas

Concentracin-1.0
Xl~ ~

lo

'

Temperatura -1 5 0
*2 - ~

l o

E stablecer la m atriz X 'X para el modelo en trm inos de este conjunto de variables codificadas. E sta
m atriz es diagonal? C om entar la respuesta.
e) Resum ir lo que se haya aprendido acerca de la codificacin de variables con este problem a.
10-10. Considere el experim ento factorial 24 del ejem plo 6-2. Suponga que falta la ltim a observacin. Volver a ana
lizar los datos y sacar conclusiones. Cmo se com paran estas conclusiones con las del ejemplo original?
10-11. Considere el experim ento factorial 24 del ejem plo 6-2. Suponga que faltan las dos ltim as observaciones.
Volver a analizar los datos y sacar conclusiones. C ul es el resultado de la com paracin de estas conclusio
nes con las del ejem plo original?
10-12. D ados los datos siguientes, ajustar el m odelo de regresin polinom ial de segundo orden

2 X2 ~^~nXi

10-9 PROBLEMAS

Xl

26
24
175
160
163
55
62
100
26
30
70
71

1.0
1.0
1.5
1.5
1.5
0.5
1.5
0.5
1.0
0.5
1.0
1.5

425

*2
1.0
1.0
4.0
4.0
4.0
2.0
2.0
3.0
1.5
1.5
2.5
2.5

D espus de que se haya ajustado el modelo, probar la significacin de la regresin.


10-13. a) Considere el m odelo de regresin cuadrtico del problem a 10-12. Calcular los estadsticos t de cada uno
de los parm etros del m odelo y com entar las conclusiones a que se llega a partir de estas cantidades.
b) U sar el m todo de la suma de cuadrados extra para evaluar el valor de los trm inos cuadrticos x, xl y
x-c, del modelo.
10-14. Relacin entre el anlisis de varianza y el anlisis de regresin. Cualquier m odelo del anlisis de vari anza puede
expresarse en trm inos del m odelo lineal general y = x + e, donde la m atriz X se com pone de ceros y unos.
D em ostrar que el modelo con un solo fa c to ry = f i + r, + e , i = 1 ,2 ,3 , j 1 ,2 ,3 ,4 puede escribirse en la for
m a del m odelo lineal general. Despus
a) Escribir las ecuaciones norm ales (X'X)/!} = X'y y com pararlas con las ecuaciones norm ales que se encon
traro n en el captulo 3 para este modelo.

b) E ncontrar el rango de X'X. Es posible obtener (X 'X )-1?


c) Suponga que se elimina la prim era ecuacin norm al y se agrega la restriccin 2f=1n = 0. Tiene solu
cin el sistema de ecuaciones resultante? D e ser as, encontrarla. H allar la sum a de cuadrados de regre
sin Tiy y com pararla con la suma de cuadrados de los tratam ientos del m odelo con un solo factor.
10-15. Suponga que se est haciendo el ajuste de una lnea recta y se desea hacer la varianza de f t ta n pequea como
sea posible. Al trabajar con la restriccin de un nm ero par de puntos experim entales, dnde debern colo
carse estos puntos para minimizar K (ft )? (Nota: usar el diseo que se pide en este ejercicio con sumo cuida
do, ya que, aun cuando minimiza V(t), tiene propiedades indeseables; ver, por ejemplo, Myers y
M ontgom ery [85a]. nicam ente si se tiene una gran seguridad de que la verdadera relacin funcional es li
neal deber considerarse el uso de este diseo.)
10-16. Mnimos cuadrados ponderados. Suponga que se est ajustando la lnea recta y = 0 + ^c + e, pero la varianza
de las y depende ahora del nivel de x; es decir,
2

V(y\ x . ) = f f 2 = ^ -

= 1 ,2 ,...,

donde las w son constantes desconocidas, llam adas con frecuencia ponderaciones. D em ostrar que si se eli
gen las estim aciones de los coeficientes de regresin para m inim izar la suma de cuadrados de los errores
n

ponderados dada por ^ ( ^ ~ a ~ \xi )2>las ecuaciones norm ales de mnimos cuadrados resultantes son
n

a Z wt
1=1

K Z
t= 1

=1

w'x' =

/1

w , x , + f i h xf = Z
i= l

i= l

wyt

426

CAPTULO 10 AJUSTE DE MODELOS DE REGRESIN

10-17. C onsidere el diseo 2 ^ analizado en el ejem plo 10-5.


a) Suponga que se opta por aum entar el diseo con la corrida nica seleccionada en ese ejemplo. E ncontrar
las varianzas y las covarianzas de los coeficientes de regresin del m odelo (ignorando los bloques):
y = o + l Xl + ^ 2*2 + ^ 3*3 + ^ 4*4

1 2 ^ $4X3X4
b)
c)

H ay otras corridas de la fraccin alterna que separaran los alias AB de CD1


Suponga que el diseo se aum enta con las cuatro corridas sugeridas en el ejem plo 10-5. E ncontrar las va
rianzas y las covarianzas de los coeficientes de regresin (ignorando los bloques) p ara el m odelo del
inciso a.
d ) C onsiderando los incisos a y c, qu estrategia de aum ento se preferira y p o r qu?
10-18. Considere un diseo 2u4. Suponga que despus de correr el experim ento, los efectos observados m s gran
des sonyl + BD, B + A D y D + AB. Q uiere aum entarse el diseo original con un grupo de cuatro corridas
p ara separar los alias de estos efectos.
a) Cules son las cuatro corridas que se haran?
b ) E ncontrar las varianzas y las covarianzas de los coeficientes de regresin del modelo

y a + xx t + 2x 2 + 4x 4 + i 2 x ix 2 ~t'uX1x 4

lAX2X4 "*"
c)

Es posible separar los alias de estos efectos con m enos de cuatro corridas adicionales?

Mtodos de superficies
de respuesta y otros
enfoques para la
optimizacin de
procesos

1M

INTRODUCCIN A LA METODOLOGA DE SUPERFICIES DE RESPUESTA

La metodologa de superficies de respuesta, o MSR, es una coleccin de tcnicas matemticas y estadsti


cas tiles en el modelado y el anlisis de problemas en los que una respuesta de inters recibe la influencia
de diversas variables y donde el objetivo es optimizar esta respuesta. Por ejemplo, suponga que un inge
niero qumico quiere encontrar los niveles de temperatura fo ) y presin (x2) que maximicen el rendimien
to (y) de un proceso. El rendimiento del proceso es una funcin de los niveles de la temperatura y la
presin, por ejemplo,
y = fix,, x2)+

donde e representa el ruido o error observado en la respuesta y. Si la respuesta esperada se denota por
E(y) = f(xu x2) = r, entonces a la superficie representada por
t ] = f ( x v x2)
se le llama superficie de respuesta.
Por lo general la superficie de respuesta se representa grficamente como en la figura 11-1, donde r
se grafica contra los niveles de*! yx2. Se han visto ya grficas de superficie de respuesta como sta, parti
cularmente en los captulos sobre diseos factoriales. Para ayudar a visualizar la forma de una superficie
de respuesta, con frecuencia se grafican los contornos de la superficie de respuesta, como se muestra en
la figura 11-2. En la grfica de contorno se trazan las lneas de respuesta constante en el p lan os,x2*Cada
contorno corresponde a una altura particular de la superficie de respuesta. Tkmbin se ha visto antes
la utilidad de las grficas de contorno.
En la mayora de los problemas MSR, la forma de la relacin entre la respuesta y las variables inde
pendientes es desconocida. Por lo tanto, el primer paso de la MSR es encontrar una aproximacin ade
cuada de la verdadera relacin funcional entre y y el conjunto de variables independientes. Por lo general
se emplea un polinomio de orden inferior en alguna regin de las variables independientes. Si la respues
ta est bien modelada por una funcin lineal de las variables independientes, entonces la funcin de apro
ximacin es el modelo de primer orden
y = 0 + 1x1+ 2x2 +
\-kxk +s
427

428

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Figura 11-1 Superficie de respuesta tridimensional donde se indica el rendi


miento esperado (r) como una funcin de la temperatura (xj) y la presin (x2).

Figura 11-2

Grfica de contorno de una superficie de respuesta.

11-1 INTRODUCCIN A LA METODOLOGA DE SUPERFICIES DE RESPUESTA

429

Si hay curvatura en el sistema, entonces debe usarse un polinomio de orden superior, tal como el modelo
de segundo orden

?= 0 +2
1= 1

i x<+2

1= 1

+Ei<Xj

vxxi + s

(11_2)

En casi todos los problemas MSR se usa uno de estos modelos, o ambos. Desde luego, es probable que un mo
delo polinomial sea una aproximacin razonable de la verdadera relacin funcional en el espacio completo de
las variables independientes, pero para una regin relativamente pequea suelen funcionar bastante bien.
El mtodo de mnimos cuadrados, estudiado en el captulo 10, se usa para estimar los parmetros de
los polinomios de aproximacin. Despus se realiza el anlisis de la superficie de respuesta utilizando la
superficie ajustada. Si la superficie ajustada es una aproximacin adecuada de la verdadera funcin de la
respuesta, entonces el anlisis de la superficie ajustada ser un equivalente aproximado del anlisis del
sistema real. Los parmetros del modelo pueden estimarse de manera ms eficiente cuando se emplean
los diseos experimentales apropiados para recolectar los datos. Los diseos para ajustar superficies de
respuesta se denominan diseos de superficie de respuesta. Estos diseos se revisan en la seccin 11-4.
La MSR es un procedimiento secuencial. Muchas veces, cuando se est en un punto de la superficie
de respuesta que est apartado del ptimo, como en el caso de las condiciones de operacin actuales de la
figura 11-3, el sistema presenta una curvatura moderada y el modelo de primer orden ser apropiado. El
objetivo en este caso es llevar al experimentador de manera rpida y eficiente por la trayectoria del mejo
ramiento hasta la vecindad general del ptimo. Una vez que se ha encontrado la regin del ptimo, puede
emplearse un modelo ms elaborado, como el de segundo orden, y llevarse a cabo un anlisis para locali
zar el ptimo. En la figura 11-3 se puede ver que el anlisis de una superficie de respuesta puede conside
rarse como el ascenso a una colina, donde la cima de sta representa el punto de la respuesta mxima.
Si el verdadero ptimo es un punto de respuesta mnima, entonces la situacin puede considerarse como
el descenso a un valle.
El objetivo ltimo de la MSR es determinar las condiciones de operacin ptimas del sistema o de
terminar una regin del espacio de los factores en la que se satisfagan los requerimientos de operacin.

Figura 11-3

El carcter secuencial de la MSR.

430

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Anlisis ms detallados de la MSR se encuentran en Myers y Montgomery [85a], Khuri y Cornell [67] y
Box y Draper [16b],

11-2

MTODO DEL ASCENSO MS PRONUNCIADO

Frecuentemente la estimacin inicial de las condiciones de operacin ptimas del sistema estarn lejos
del ptimo real. En tales circunstancias, el objetivo del experimentador es pasar con rapidez a la vecindad
general del ptimo. Para ello desea usarse un procedimiento experimental econmico y eficiente. Cuan
do se est muy lejos del ptimo, por lo general se supone que un modelo de primer orden es una aproxi
macin adecuada de la verdadera superficie en una regin pequea de las x.
El mtodo del ascenso ms pronunciado es un procedimiento para moverse secuencialmente sobre la
trayectoria del ascenso ms pronunciado, es decir, en la direccin del incremento mximo de la respuesta.
Desde luego, si lo que se pretende es una minimizacin, entonces esta tcnica se llama mtodo del descen
so ms pronunciado. El modelo ajustado de primer orden es
k

i 11' 3)

i= l

y la superficie de respuesta de primer orden, es decir, los contornos de y, es una serie de lneas paralelas
como las que se muestran en la figura 11-4. La direccin del ascenso ms pronunciado es aquella en la que
p se incrementa con mayor rapidez. Esta direccin es paralela a la normal de la superficie de respuesta
ajustada. Por lo general se toma como la trayectoria del ascenso ms pronunciado a la recta que pasa por
el centro de la regin de inters y que es normal a la superficie ajustada. Por lo tanto, los pasos sobre la

Figura 11-4 Superficie de respuesta de primer orden y trayectoria del ascenso ms pronunciado.

11-2 MTODO DEL ASCENSO MS PRONUNCIADO

431

trayectoria son proporcionales a los coeficientes de regresin {/?,} El tamao real del paso lo determina
el experimentador con base en el conocimiento del proceso o de otras consideraciones prcticas.
Se conducen experimentos sobre la trayectoria del ascenso ms pronunciado hasta que deja de obser
varse un incremento adicional en la respuesta. Entonces puede ajustarse un nuevo modelo de primer or
den, determinarse una nueva trayectoria del ascenso ms pronunciado y el procedimiento contina. En
ltima instancia, el experimentador llegar a la vecindad del ptimo. En general, la falta de ajuste del mo
delo de primer orden indica que se ha llegado a ella. En este momento se realizan experimentos adiciona
les para obtener una estimacin ms precisa del ptimo.

EJEMPLO 1 1 -1 ...........................................................................................................................
Un ingeniero qumico est interesado en determinar las condiciones de operacin que maximizan el ren
dimiento de un proceso. Dos variables controlables influyen en el rendimiento del proceso: el tiempo de
reaccin y la temperatura de reaccin. El ingeniero opera actualmente el proceso con un tiempo de reac
cin de 35 minutos y una temperatura de 155F, que dan como resultado rendimientos de cerca de 40%.
Puesto que es improbable que esta regin contenga el ptimo, el ingeniero ajusta un modelo de primer
orden y aplica el mtodo del ascenso ms pronunciado.
El ingeniero decide que la regin de exploracin para ajustar el modelo de primer orden deber ser
(30,40) minutos de tiempo de reaccin y (150,160)F. Para simplificar los clculos, las variables indepen
dientes se codificarn en el intervalo usual (-1,1). Por lo tanto, si denota la variable natural tiempo y g2
la variable natural temperatura, entonces las variables codificadas son
1 ,- 3 5

| 2 155
y

*2

El diseo experimental se muestra en la tabla 11-1. Observe que el diseo usado para recabar estos datos
es un factorial 22 aumentado con cinco puntos centrales. Las rplicas del centro se usan para estimar el
error experimental y permitir la verificacin de la adecuacin del modelo de primer orden. Adems, el di
seo est centrado alrededor de las condiciones de operacin actuales del proceso.
Es posible ajustar un modelo de primer orden a estos datos por el procedimiento de mnimos cuadra
dos. Aplicando los mtodos para diseos de dos niveles se obtiene el siguiente modelo en las variables co
dificadas:
5>= 40.44 + 0.775^ +0.325x2

la b ia 11-1
Variables
naturales

Datos del proceso para ajustar el modelo de


primer orden
Variables
codificadas

Respuesta

Il

il

Xl

*2

30
30
40
40
35
35
35
35
35

150
160
150
160
155
155
155
155
155

-1
-1
1
1
0
0
0
0
0

-1
1
-1
1
0
0
0
0
0

39.3
40.0
40.9
41.5
40.3
40.5
40.7
40.2
40.6

432

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Antes de explorar a lo largo de la trayectoria del ascenso ms pronunciado, deber investigarse la


adecuacin del modelo de primer orden. El diseo 22 con puntos centrales permite al experimentador
1. Obtener una estimacin del error.
2. Verificar las interacciones (o trminos de productos cruzados) del modelo.
3. Verificar los efectos cuadrticos (curvatura).
Las rplicas del centro pueden usarse para calcular una estimacin del error de la siguiente manera:
2

(40.3)2 +(40.5)2 +(40.7)2 +(40.2)2 +(40.6)2 -(202.3 ) 2 /5


4
= 0.0430

En el modelo de primer orden se supone que las variables yx2tienen un efecto aditivo sobre la respues
ta. La interaccin entre las variables se representara por el coeficiente n del trmino de un producto
cruzado xc2sumado al modelo. La estimacin de mnimos cuadrados de este coeficiente es simplemente
la mitad del efecto de la interaccin que se calcula como en un diseo factorial 2 2 ordinario, o
12 = {[(1 x 39.3)+(l x 4 1 .5 )+ (-1 x 4 0 .0 )+ (-l x 40.9)]
= i(-o .i)

= -0.025
La suma de cuadrados de la interaccin con un solo grado de libertad es
55 Interaccin

= 0.0025
Al comparar 55lnteraccin con 2 se obtiene el estadstico para la falta de ajuste
cc

T?

^ In te ra c c i n

T1
0.0025
0.0430
* 0.058
que es pequeo, lo cual indica que la interaccin es insignificante.
Otra verificacin de la adecuacin del modelo de lnea recta se obtiene aplicando la verificacin del
efecto de curvatura cuadrtica pura de la seccin 6 -6 . Recuerde que sta consiste en comparar la respues
ta promedio en los cuatro puntos de la porcin factorial del diseo, por ejemplo yF = 40.425, con la res
puesta promedio en el centro del diseo, por ejemplo yc 40.46. Si existe curvatura cuadrtica en la
verdadera funcin de la respuesta, entonces yF- y c es una medida de esta curvatura. Si/?n y/J22 son los coe
ficientes de los trminos cuadrticos puros * 2 y x \ , entonces^ - y c es una estimacin de n + 22. En el
ejemplo tratado aqu, una estimacin del trmino cuadrtico puro es
u ^ n = Pf ~ c
= 40.425- 40.46
= -0.035

11-2 MTODO DEL ASCENSO MS PRONUNCIADO


Tabla 11-2

433

Anlisis de varianza del modelo de primer orden

Fuente de variacin

Suma de
cuadrados

G rados de
libertad

C uadrado
medio

^0

Valor P

M odelo (v 2)
Residual
(Interaccin)
(Cuadrtico puro)
(E rror puro)
Tbtal

2.8250
0.1772
(0.0025)
(0.0027)
(0.1720)
3.0022

2
6

1.4125

47.83

0.0002

0.0025
0.0027
0.0430

0.058
0.063

0.8215
0.8142

1
1
4
8

La suma de cuadrados con un solo grado de libertad asociada con la hiptesis nula, H0:n + 22 = 0, es
c

_ nFnc O F - c
Cuadrtica pura

rip ~rHc

_ (4)(5)(-0.035)2
4+5
= 0.0027
donde nFy n c son el nmero de puntos de la porcin factorial y el nmero de puntos centrales, respectiva
mente. Puesto que
SS Cuadrtica pura

0.0027
~ 0.0430
= 0.063
es pequeo, no hay indicios de un efecto cuadrtico puro.
En la tabla 11*2 se resume el anlisis de varianza de este modelo. Las verificaciones de la interaccin
y la curvatura no son significativas, mientras que la prueba F de la regresin global es significativa. Ade
ms, el error estndar de pj y 2 es
[M S j
dr
[00430 nirt
5e^ ) = V ^ _ = 'V T = ' V ^ = 0 1 0

. ,
1 = 1,2

Ambos coeficientes de regresin x y 2 son grandes en comparacin con sus errores estndar. En este
punto no hay razn para cuestionar la adecuacin del modelo de primer orden.
Para apartarse del centro del diseo el punto ('xt = 0,x2 = 0) sobre la trayectoria del ascenso ms
pronunciado, se hara un movimiento de 0.775 unidades en la direccin*! por cada 0.325 unidades en la
direccin x2. Por lo tanto, la trayectoria del ascenso ms pronunciado pasa por el punto
= 0,x2 = 0) y
tiene pendiente 0.325/0.775. El ingeniero decide usar 5 minutos de tiempo de reaccin como tamao bsi
co del paso, Al utilizar la relacin entre yx1; se observa que 5 minutos de tiempo de reaccin es equiva
lente a un paso en la variable codificada jq de A*! = 1. Por lo tanto, los pasos sobre la trayectoria del
ascenso ms pronunciado son A*! = 1.0000 y Ax2 = (0.325/0.775)
= 0.42.
El ingeniero calcula puntos sobre esta trayectoria y observa los rendimientos en los mismos hasta que
se nota un decremento en la respuesta. En la tabla 11-3 se muestran los resultados tanto en variables codi
ficadas como naturales. Aun cuando la manipulacin matemtica de las variables codificadas es ms sen
cilla, deben usarse las variables naturales cuando se corre el proceso. En la figura 11-5 se grafica el

CAPITULO 11 METODOS DE SUPERFICIES DE RESPUESTA

434

Tabla 11-3

Experimento del ascenso ms pronunciado para el ejemplo 11-1


Variables naturales

Variables codificadas
Pasos
Origen
A
O rigen
O rigen
Origen
O rigen
O rigen
O rigen
O rigen
Origen
Origen
O rigen
O rigen
Origen

+
+
+
+
+
+
+
+
+

A
2A
3A
4A
5A
6A
7A
8A
9A
+ 10A
+ 11A
+ 12A

xt .

x2

li

la

0
1.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.00
9.00
10.00
11.00
12.00

0
0.42
0.42
0.84
1.26
1.68
2.10
2.52
2.94
3.36
3.78
4.20
4.62
5.04

35
5
40
45
50
55
60
65
70
75
80
85
90
95

155
2
157
159
161
163
165
167
169
171
173
175
179
181

Respuesta
y

41.0
42.9
47.1
49.7
53.8
59.9
65.0
70.4
77.6
80.3
76.2
75.1

rendimiento en cada paso de la trayectoria del ascenso ms pronunciado. Se observan incrementos de la


respuesta hasta el dcimo paso; sin embargo, todos los pasos despus de este punto resultan en un decre
mento del rendimiento. Por lo tanto, deber ajustarse otro modelo de primer orden en la vecindad gene
ral del punto
= 85, 2 = 175).
Se ajusta un nuevo modelo de primer orden alrededor del punto (j = 85, | 2 = 175). La regin de ex
ploracin para
es [80, 90] y para 2 es [170, 180]. Por lo tanto, las variables codificadas son
,- 8 5
*1 =

Figura 11-5 Rendimiento contra pasos sobre la trayectoria


del ascenso ms pronunciado para el ejemplo 1 1 - 1 .

xn =

$ 2 -1 7 5

11-2 MTODO DEL ASCENSO MS PRONUNCIADO

Tabla 11-4

Datos para el segundo modelo de primer


orden

Variables
naturales
f,
80
80
90
90
85
85
85
85
85

4 35

Variables
codificadas

Xl

170
180
170
180
175
175
175
175
175

-1
-1
1
1
0
0
0
0
0

*2
-1
1
-1
1
0
0
0
0
0

y
76.5
77.0
78.0
79.5
79.9
80.3
80.0
79.7
79.8

De nueva cuenta se usa un diseo 22 con cinco puntos centrales. El diseo experimental se muestra en la
tabla 11-4.
El ajuste del modelo de primer orden a las variables codificadas de la tabla 11-4 es
y = 7 8 .9 7 + 1 .0 0 ^ ! + 0 .5 0 jc2

En la tabla 11-5 se presenta el anlisis de varianza de este modelo, incluyendo las verificaciones de la
interaccin y del trmino cuadrtico puro. Las verificaciones de la interaccin y del trmino cuadrtico
puro implican que el modelo de primer orden no es una aproximacin adecuada. Esta curvatura en la ver
dadera superficie puede indicar que el experimentador se encuentra cerca del ptimo. En este punto es
necesario hacer anlisis adicionales para localizar el ptimo con mayor precisin.

Por el ejemplo 11-1 se observa que la trayectoria del ascenso ms pronunciado es proporcional a los sig
nos y magnitudes de los coeficientes de regresin del modelo ajustado de primer orden
k

$= h+ 'Z

i=i

fa,

Es sencillo dar un algoritmo general para determinar las coordenadas de un punto sobre la trayectoria del
ascenso ms pronunciado. Suponga que el punto*, = x2 = ... = xk = 0 es la base o punto origen. Entonces
1. Se elige el tamao del paso en una de las variables del proceso, por ejemplo Ax. En general, se se
leccionara la variable de la que se tenga mayor informacin, o se seleccionara la variable que
tiene el coeficiente de regresin absoluto | f} | ms grande.
Tabla 11-5

Anlisis de varianza del segundo modelo de primer orden

Suma de
G rados de
Cuadrado
Fuente de variacin___________________ cuadrados__________ libertad____________medio__________F0
Regresin
Residual
(Interaccin)
(Cuadrtico puro)
(E rror puro)
Total

5.00
11.1200
(0.2500)
(10.6580)
(0.2120)
16.1200

Valor P

2
6
1
1
4
8

0.2500
10.6580
0.0530

4.72
201.09

0.0955
0.0001

436

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

2. El tamao del paso de las otras variables es

Ax , = ^ j/AX;

i = , 2,

k;

i^j

3. Se convierten las Ax de variables codificadas a variables naturales.


Para ilustrar, considere la trayectoria del ascenso ms pronunciado calculada en el ejemplo 11-1.
Puesto quex, tiene el coeficiente de regresin ms grande, se selecciona el tiempo de reaccin como la va
riable del paso 1 del procedimiento anterior. Cinco minutos de tiempo de reaccin es el tamao del paso
(con base en el conocimiento del proceso). En trminos de las variables codificadas, ste es Ax1 = 1.0. Por
lo tanto, por el lincamiento 2 , el tamao del paso de la temperatura es
a p 5 _ _ 0.42

f t /Ai,

(0.775/1.0)

Para convertir los tamaos de Jos pasos codificados (Axt = 1.0 y Ax2 = 0.42) a las unidades naturales de
tiempo y temperatura, se usan las relaciones
A?!

Ax,=

A*2 =

A2

que dan como resultado


A |j = ^ ( 5 ) = 1.0(5) = 5 min

M 2 = A x 2 (5 ) = 0 .4 2 ( 5 ) = 2 F

11-3

ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

Cuando el experimentador se encuentra relativamente cerca del ptimo, por lo general se requiere un
modelo que incorpore la curvatura para aproximar la respuesta. En la mayora de los casos, el modelo de
segundo orden
k
k

y=0+'Z ixi+Z uxf+i m axix1+


I= J

1= 1

(n -4)

i< j

es adecuado. En esta seccin se indicar cmo usar este modelo ajustado para encontrar el conjunto pti
mo de condiciones de operacin para las*, as como para caracterizar la naturaleza de la superficie de res
puesta.

11'3.1

Localizacin del punto estacionario

Suponga que quieren encontrarse los niveles d c x 1,x 1, ...,xk que optimizan la respuesta predicha. Este pun
to, en caso de existir, ser el conjunto de las x lf x2, ..., xk para las que las derivadas parciales dy/ dx1 =
d / dx2 = = d / d x t = 0. A este punto, por ejemplo jc15,x 2,5. ,xk, se le llama punto estacionario. El pun
to estacionario podra representar 1 ) un punto de respuesta mxima, 2 ) un punto de respuesta mnima, o
3) un punto silla. Estas tres posibilidades se ilustran en las figuras 11-6 a 11-8.
Las grficas de contorno desempean un papel muy importante en el estudio de las superficies de
respuesta. Mediante la generacin de grficas de contorno utilizando software de computadora para el

11'3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

-0.50
- 0 .5 0

- 1.00 * - 1.00
a) Superficie de respuesta

6) Grfica de contorno

Figura 11-6

Superficie de respuesta y grfica de contorno que ilustran una superficie con un mximo.

438

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

1.00

- 0 .5 0

- 1.00 * - 1.00
a) Superficie de respuesta

6) Grfica de contorno

Figura 11-7

Superficie de respuesta y grfica de contomo que ilustran una superficie con un mnimo.

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

al Superficie de respuesta

*1
6) Grfica de contorno

Figura 11-8

Superficie de respuesta y grfica de contorno que ilustran una superficie con un punto siila (o minimax).

440

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

anlisis de superficie de respuesta, el experimentador puede por lo general caracterizar la forma de la su


perficie y localizar el ptimo con una precisin razonable.
Es posible obtener una solucin matemtica general para la localizacin del punto estacionario. Al
escribir el modelo de segundo orden en notacin matricial, se tiene
y =

/30 +x'b + x'Bx

(11-5)

donde
V

x?

b= h

'n , n j % - , h / 2
22?
2k / 2
B=
sim tric a

i
c

_x k_

'K

Es decir, b es un vector (k x 1) de los coeficientes de regresin de primer orden y B es una matriz sim
trica (k x k) cuyos elementos de la diagonal principal son los coeficientes cuadrticos puros ( ) y cu
yos elem entos que estn fuera de la diagonal son la mitad de los coeficientes cuadrticos mixtos
(a > * ^ /) La derivada de y con respecto a los elementos del vector x igualada con 0 es
= b + 2Bx = 0

(11-6)

dx

El punto estacionario es la solucin de la ecuacin 11-6, o


x s = ~ 2 B_1b

(11-7)

Adems, al sustituir la ecuacin 11-7 en la 11-5, la respuesta predicha en el punto estacionario puede en
contrarse como
ys =

11-3.2

( 1 1 -8 )

Caracterizacin de la superficie de respuesta

Una vez que se ha encontrado el punto estacionario, generalmente es necesario caracterizar la superficie
de respuesta en la vecindad inmediata de este punto. Por caracterizar se entiende determinar si el punto
estacionario es el punto de una respuesta mxima, mnima o un punto silla, Por lo general tambin se de
sea estudiar la sensibilidad relativa de la respuesta a las variables jcj, x2,
xk.
Como ya se seal, la forma ms directa de hacer esto es examinando una grfica de contorno del
modelo ajustado. Si slo hay dos o tres variables en el proceso (lasx), la construccin e interpretacin de
esta grfica de contorno es relativamente sencilla. Sin embargo, incluso cuando hay un nmero relativa
mente reducido de variables, un anlisis ms formal, llamado anlisis cannico, puede ser til.
Es conveniente transformar primero el modelo en un nuevo sistema de coordenadas con el origen en
el punto estacionario x, y despus hacer la rotacin de los ejes de este sistema hasta que sean paralelos a
los ejes principales de la superficie de respuesta ajustada. Esta transformacin se ilustra en la figura 11-9.
Puede demostrarse que se obtiene as el modelo ajustado
5) = P s +A 1 h'12

+A2^ + -+A,w

(11-9)

donde las {w,} son las variables independientes transformadas y las {A,} son constantes. A la ecuacin
11-9 se le llama la forma cannica del modelo. Adems, las {A} son slo eigenvalores o races caracters
ticas de la matriz B.

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

441

*2

Figura 11-9
orden.

Forma cannica del modelo de segundo

La naturaleza de la superficie de respuesta puede determinarse a partir del punto estacionario y de


los signos y magnitudes de las {A,}. Primero suponga que el punto estacionario est dentro de la regin de
exploracin para ajustar el modelo de segundo orden. Si todas las {A,} son positivas, x, es un punto de res
puesta mnima; si todas las {A;} son negativas, x, es un punto de respuesta mxima; y si las {A,} tienen sig
nos diferentes, es un punto silla. Adems, la superficie presenta una inclinacin mayor en la direccin
w para la que |X | es el mximo. Por ejemplo, la figura 11-9 describe un sistema para el que x, es un mxi
mo (Aj y A2 son negativas) con |Aa| > |A2|.

EJEMPLO 1 1 -2 ......................................................... ........................................................................


Se continuar el anlisis del proceso qumico del ejemplo 11-1. No es posible ajustar un modelo de segun
do orden en las variables*! y x2 utilizando el diseo de la tabla 11-4. El experimentador decide aumentar
este diseo con puntos suficientes para ajustar un modelo de segundo orden.1 Obtiene cuatro observacio
nes en (*! = 0,x2 = 1.414) y (x, = 1.414, * 2 = 0). El experimento completo se muestra en la tabla 11-6, y
el diseo se ilustra en la figura 11-10. A este diseo se le llama diseo central compuesto (o DCC), el cual
se estudiar con mayor detalle en la seccin 11-4.2. En esta segunda fase del estudio, dos respuestas adi
cionales fueron de inters, la viscosidad y el peso molecular del producto. Las respuestas tambin se
muestran en la tabla 1 1 -6 .
La atencin se centrar en el ajuste de un modelo cuadrtico para la respuesta rendimiento y 1 (las
otras respuestas se analizarn en la seccin 11-3.4). Por lo general se utiliza software de computadora
para ajustar una superficie de respuesta y construir las grficas de contorno. La tabla 11-7 contiene la sali
da de Design-Expert. Al examinar la tabla se observa que este paquete de software calcula primero las su
mas de cuadrados extra o secuenciales de los trminos lineales, cuadrticos y cbicos del modelo (hay un
mensaje de advertencia referente a los alias del modelo cbico, ya que el DCC no contiene corridas sufi
cientes para apoyar un modelo cbico completo). Con base en el valor P pequeo de los trminos cuadr1 El ingeniero corri las cuatro observaciones adicionales aproximadamente en el mismo periodo en que corri las nueve observacio
nes originales. Si hubiera transcurrido un lapso grande entre las dos series de corridas, habra sido necesaria la separacin en bloques.
La separacin en bloques en los diseos de superficie de respuesta se revisa en la seccin 11-4.3.

442

CAPTULO 11

Tabla 11-6

MTODOS DE SUPERFICIES DE RESPUESTA

Diseo central compuesto para el ejmplo 11-2


Respuestas

Variables naturales
fi

80
80
90
90
85
85
85
85
85
92.07
77.93
85
85

170
180
170
180
175
175
175
175
175
175
175
182.07
167.93

Variables codificadas
-1
-1
1
1
0
0
0
0
0
1.414
-1.414
0
0

x2

yi

yi

y3

(rendim iento)

(viscosidad)

(peso molecular)

-1
1
-1
1
0
0
0
0
0
0
0
1.414
-1.414

76.5
77.0
78.0
79.5
79.9
80.3
80.0
79.7
79.8
78.4
75.6
78.5
77.0

62
60
66
59
72
69
68
70
71
68
71
58
57

2940
3470
3680
3890
3480
3200
3410
3290
3500
3360
3020
3630
3150

ticos, se decide ajustar un modelo de segundo orden a la respuesta rendimiento. La salida de


computadora muestra el modelo final en trminos tanto de las variables codificadas como de los niveles
naturales o reales de los factores.
En la figura 11-11 se muestra la grfica de la superficie de respuesta tridimensional y la grfica de
contorno para la respuesta rendimiento en trminos de las variables del proceso tiempo y temperatura.
Es relativamente sencillo ver por el examen de estas figuras que el ptimo se encuentra muy cerca de
175F y 85 minutos de tiempo de reaccin y que la respuesta est en un mximo en este punto. Por el exa
men de la grfica de contorno se observa que el proceso puede ser ligeramente ms sensible a los cambios
en el tiempo de reaccin que a los cambios en la temperatura.

*2

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

Salida de computadora de Design-Expert para ajustar un modelo a la respuesta


rendimiento del ejemplo 11-2

Tabla 11-7

Response: yield
WARNING: The Cubic Model is Aliased!***
Sequential Model Sum of Squares
Sum of
Source
Squares
DF
Mean
Linear
2FI
Quadratic
Cubic
Residual
Total

80062.16
10.04
0.25
17.95
2.042E-003
0.49
80090.90

1
2
1
2
2
5
13

Mean
Square
80062.16
5.02
0.25
8.98
1.02 IE -003
0.099
6160.84

F
Value

Prob > F

2.69
0.12
126.88
0.010

0.1166
0.7350
<0.0001
0.9897

Suggested
Aliased

Suma de cuadrados de! modelo secuenciaf : se selecciona el polinomio de orden ms alto


cuando los trminos adicionales son significativos.

Lack of Fit Tests


Source

Sum of
Squares

DF

Mean
Square

F
Value

Prob > F

Linear
2FI
Quadratic
Cubic
Pure Error

18.49
18.24
0.28
0.28
0.21

6
5
3
1
4

3.08
3.65
0.094
0.28
0.053

58.14
68.82
1.78
5.31

0.0008
0.0006
0.2897
0.0826

Suggested
Aliased

"Pruebas de falta de ajuste" : se quiere que el modelo seleccionado no tenga falta de ajuste
significativa.

Model Summary Statistics


Std.
Source Dev. R-Squared
Linear
2FI
Quadratic
Cubic

1.37
1.43
0.27
0.31

0.3494
0.3581
0.9828
0.9828

Adjusted
R-Squared

Predicted
R-Squared

PRESS

0.2193
0.1441
0.9705
0.9588

-0 .0 4 3 5
-0 .2 7 3 0
0.9184
0.3622

29.99
36.59
2 .35
18.33

Suggested
Aliased

Estadsticos de resumen del modelo-. se enfocan en el modelo que minimiza TRESS o, de


manera equivalente, que maximiza la "R CUADRADA DE PREDICCION"

Response: yield
ANOVA for Response Surface Quadratic Model
Analysis of variance table [Partial sum of squares]
Mean
Sum of
Square
Squares
DF
Source
Model
A
B
A2
B2
AB
Residual
Lack o f Fit
Pure Error
Cor Total
Std. Dev.
Mean
C.V.
PRESS

28.25
7.92
2.12
13.18
6.97
0.25
0.50
0.28
0.21
28.74
0.27
78.48
0.34
2.35

5
1
1
1
1
1
7
3
4
12

5.65
7.92
2.12
13.18
6.97
0.25
0.071
0.094
0.053

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision

F
Value

Prob > F

79.85
111.93
30.01
186.22
98.56
3.53

<0.0001
<0.0001
0.0009
<0.0001
<0.0001
0.1022

1.78

0.2897

0.9828
0.9705
0.9184
23.018

443

444

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Tabla 11-7

Factor

(continuacin)

Coefficient
Estimate

DF

Standard
Error

95% Cl
Low

95% Cl
High

VIF

79.94
0.99
0.52
- 1 .3 8
- 1 .0 0
0.25

1
1
1
1
1
1

0.12
0.094
0.094
0.10
0.10
0.13

79.66
0.77
0.29
-1 .6 1
-1 .2 4
-0 .0 6 4

80.22
1.22
0.74
-1 .1 4
-0 .7 6
0.56

1.00
1.00
1.02
1.02
1.00

Intercept
A-tim e
B-temp
A2
B2
AB

Final Equation in Terms of Coded Factors:


yield
+7 9 .9 4
+ 0.99
+ 0.52
-1 .3 8
-1 .0 0
+ 0.25

=
*
*
*
*
*

A
B
A2
B2
A * B

Final Equation in Terms of Actual Factors:


yield
-1 4 3 0 .5 2 2 8 5
+7.80749
+ 13.27053
-0 .0 5 5 0 5 0
-0 .0 4 0 0 5 0
+0.010000

=
*
*
*
*
*

tim e
tem p
tim e2
tem p2
tim e * tem p

Diagnostics Case Statistics


Student
Cook's Outlier
Run Standard Actual Predicted
t
Order Value
Value Residual Leverage Residual Distance
Order
8
6
9
11
12
10
7
1
5
3
13
2
4

1
2
3
4
5
6
7
8
9
10
11
12
13

76.50
78.00
77.00
79.50
75.60
78.40
77.00
78.50
79.90
80.30
80.00
79.70
79.80

76.30
77.79
76.83
79.32
75.78
78.59
77.21
78.67
79.94
79.94
79.94
79.94
79.94

0.20
0.21
0.17
0.18
-0 .1 8
-0 .1 9
-0 .2 1
-0 .1 7
-0 .0 4 0
0.36
0.060
-0 .2 4
-0 .1 4

0.625
0.625
0.625
0.625
0.625
0.625
0.625
0.625
0.200
0.200
0.200
0.200
0.200

1.213
1.275
1.027
1.089
-1 .1 0 7
-1 .1 9 5
-1 .2 8 3
-1 .0 1 9
-0 .1 6 8
1.513
0.252
-1 .0 0 9
-0 .5 8 8

0.409
0.452
0.293
0.329
0.341
0.396
0.457
0.289
0.001
0.095
0.003
0.042
0.014

1.264
1.347
1.032
1.106
-1 .1 2 9
-1 .2 4 0
-1 .3 5 8
-1 .0 2 3
-0 .1 5 6
1.708
0.235
-1 .0 1 0
-0 .5 5 9

La localizacin del punto estacionario tambin podra encontrarse utilizando la solucin general de
la ecuacin 11-7. Observe que
0.1250
_ ro.995]
n r~i. 376
[0.515
0. 1250 -1.001
y, por la ecuacin 11-7, el punto estacionario es
x . = - i B _1b

-0.7345 -0.0917 [0.995


0917 -1.0096 [0.515

0.3891
0.306

11-3 ANLISIS DE LINA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

445

182.1
179.7

77.93

80.29

82.64

85.00

87.36

89.71

92.07

Tiempo
a) La grfica de contorno

Figura 11-11 Grficas de contorno y de superficie de respuesta de


la respuesta rendimiento, ejemplo 11-2.

Es decir, jcl s = 0.389 yx2,s = 0.306. En trminos de las variables naturales, el punto estacionario es
0.389 =

5
5
de donde se obtiene *= 86.95 =87 minutos de tiempo de reaccin y | 2 = 176.53 176.5F. Este valor est
muy cerca del punto estacionario que se encontr por examen visual en la grfica de contorno de la figura
11-11. Al utilizar la ecuacin 11-8, la respuesta predicha en el punto estacionario puede encontrarse
como % = 80.21.

446

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

El anlisis cannico que se describe en esta seccin tambin puede usarse para caracterizar la super
ficie de respuesta. Primero es necesario expresar el modelo ajustado en la forma cannica (ecuacin
11-9). Los eigenvalores y k2 son las races de la ecuacin de determinantes
IB AI| =

-1.376 - X
0.1250
0.1250
- 1 .0 0 1 - A

que se reduce a
X2 + 2.3788A + 1.3639=0
Las races de esta ecuacin cuadrtica son
modelo ajustado es

= -0.9641 yA2 = -1.4147. Por lo tanto, la forma cannica del

y = 80.21 - 0.9641h-!2 - 1.4147w22


Puesto que tanto Aj como A, son negativas y el punto estacionario est en la regin de exploracin, se con
cluye que el punto estacionario es un mximo.

En algunos problemas MSR puede ser necesario encontrar la relacin entre las variables cannicas
{w} y las variables del diseo {*,}. Esto es particularmente cierto cuando es imposible operar el proceso
en el punto estacionario. Como una ilustracin, suponga que en el ejemplo 11-2 el proceso no pudo ope
rarse en ti = 87 minutos y 2 = 176.5F debido a que esta combinacin de factores resulta en un costo ex
cesivo. Se quiere regresar ahora del punto estacionario a un punto con un costo menor sin incurrir en
prdidas considerables en el rendimiento. La forma cannica del modelo indica que la superficie es me
nos sensible a la prdida de rendimiento en la direccin wv La exploracin de la forma cannica requiere
convertir los puntos del espacio (tv w2) en puntos del espacio (*,, x2).
En general, las variables x se relacionan con las variables cannicas w por
w = M'(x - xs)
donde M es una matriz ortogonal ( k x k). Las columnas de M son los eigenvectores normalizados asocia
dos con {A}. Es decir, si m es la columna /-esima de M, entonces m, es la solucin de
(B

A ,I ) m , =

(11-10)

para la que Z*=1 m? = 1 .


El procedimiento se ilustra usando el modelo de segundo orden ajustado del ejemplo 11-2. Para A,! =
-0.9641, la ecuacin 11-10 queda como
"(-1-376+0.9641)
0.1250
A i
0.1250
(-1.001 + 0.9641) .m 2i.

'0
0

-0.4129wn +0.1250/ti21 = 0
0.1250mn - 0.0377m21 = 0
Quiere obtenerse la solucin normalizada de estas ecuaciones, es decir, aquella para la que
+m 21 = 1.
No existe una solucin nica para estas ecuaciones, por lo que lo ms conveniente es asignar un valor ar-

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

447

bitrario a una de las incgnitas, resolver el sistema y normalizar la solucin. Al hacer m j, = 1, se encuentra
m'u = 0.3027. Para normalizar esta solucin, m'n y m 21 se dividen entre
V(mi)2 +(m*i) 2 = V(0.3027)2 +(1 ) 2 = 1.0448
Se obtiene as la solucin normalizada
m'u
1.0448

m,
1.0448

0.3027
= 0.2897
1.0448

1.0448

= 0.9571

que es la primera columna de la matriz M.


Utilizando A2 - -1.4147 puede repetirse el procedimiento anterior, obtenindose m l2 = -0.9574 y
m22 = 0.2888 como la segunda columna de M. Por lo tanto, se tiene
0.2897 -0.95741
M = 0.9571
0.2888J
La relacin entre las variables w y x es
V
H-2 _

' 0.2897
-0.9574

x , - 0.389'
x2 - 0.306

= 0.2897(x1- 0.389)+0.9571(*2 - 0.306)


IV2 = -0.9574(x 1 - 0.389)+0.2888(*2 - 0.306)
Si quisiera explorarse la superficie de respuesta en la vecindad del punto estacionario, podran determi
narse los puntos apropiados en los cuales hacer las observaciones en el espacio (wj, vv2) y usar despus la
relacin anterior para convertir estos puntos en el espacio
para que puedan realizarse las corridas.

11-3.3

Sistemas de cordilleras

No es raro encontrar variaciones de las superficies de respuesta con mximos o mnimos puros o con pun
tos silla estudiadas en la seccin anterior. Los sistemas de cordilleras, en particular, son muy comunes.
Considere la forma cannica del modelo de segundo orden presentado anteriormente en la ecuacin
11-9:
y= %

+ a 2w 2 + + x kwl

Suponga ahora que el punto estacionario Xj est dentro de la regin de experimentacin; adems, sea que
una o ms de las A, sean muy pequeas (por ejemplo, X - 0). Entonces la variable de respuesta es muy in
sensible a las variables w multiplicadas por las pequeas.
En la figura 11-12 se presenta una grfica de contorno en la que se ilustra esta situacin para k = 2 va
riables con A, = 0. (En la prctica, A, estara cerca de cero pero no sera exactamente igual a cero.) En teo
ra, el modelo cannico para esta superficie de respuesta es
y = y s + 2w

448

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

u>2

*2

Figura 11-13 Grfica de contorno de un sistema de


cordilleras crecientes.

de cordilleras estacionarias.

c o n l 2 negativa. Observe que el marcado estiramiento en la direccin w, ha resultado en una lnea de cen
tros en y = 70 y el ptimo puede tomarse en cualquier lugar a lo largo de esta lnea. A este tipo de superfi
cie de respuesta se le llama sistema de cordilleras estacionarias.
Si el punto estacionario est muy apartado de la regin de exploracin para el ajuste del modelo de
segundo orden y una A, (o ms) est cerca de cero, entonces la superficie puede ser un sistema de cordille
ras crecientes. En la figura 11-13 se ilustra una cordillera creciente para k = 2 variables con!, cerca de
cero yA2 negativa. En este tipo de sistema de cordilleras no pueden hacerse inferencias acerca de la verda
dera superficie o del punto estacionario porque x, est fuera de la regin donde se ha ajustado el modelo.
Sin embargo, la exploracin adicional est garantizada en la direccin wv Si A2 hubiera sido positiva, este
sistema se habra llamado cordillera descendente.

11 -3.4

Respuestas mltiples

Muchos problemas de superficies de respuesta incluyen el anlisis de varias respuestas, como en el ejem
plo 11-2, donde el experimentador midi tres. En dicho ejemplo, el proceso se optimiz nicamente con
respecto a la respuesta rendimiento
La consideracin simultnea de respuestas mltiples requiere construir primero un modelo de super
ficie de respuesta apropiado para cada respuesta y despus intentar encontrar un conjunto de condicio
nes de operacin que optimice en cierto sentido todas las respuestas o que al menos las mantenga en los
rangos deseados. Un estudio completo del problema de las respuestas mltiples se ofrece en Myers y
Montgomery [85 a],
En el ejemplo 11-2 pueden obtenerse modelos para las respuestas viscosidad y peso molecular (y2 yy3,
respectivamente) de la siguiente manera:
y2 = 70.000.16*! 0.95a;2 0.69x 2 6.69xj 1.25x1x2
% = 3386.2+205.1*! +17.4*2
En trminos de los niveles naturales del tiempo (t) y la temperatura (f2), estos modelos son
y2 = -9030.74+11393^ + 97.7082
- Z75X10' 2 - 0.26757^2 - 5 x l0 2
y

= - 6308. 8 + 41.02^

+ 35.4732

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

449

En las figuras 11-14 y 11-15 se presentan las grficas de contomo y superficie de respuesta para estos modelos.
Un enfoque relativamente directo para optimizar varias respuestas que funciona bien cuando slo
hay pocas variables en el proceso es la superposicin de las grficas de contorno de cada respuesta. En la
figura 11-16 se muestra una grfica de superposicin para las tres respuestas del ejemplo 1 1 -2 , con los
contornos para los quey, (rendimiento) a 78.5,62 < y2(viscosidad) 68 , yy3 (peso molecular Mn) < 3400.
Si estos lmites representan condiciones importantes que el proceso debe satisfacer, entonces, como se
muestra en la porcin no sombreada de la figura 11-16, existen varias combinaciones del tiempo y la tem
peratura que resultarn en un proceso satisfactorio. El experimentador puede hacer el examen visual de
182.1
179.7
177.4
2

3
5a 175.0

172.6
170.3
167.9
77.93

80.29

82.64

85.00

87.36

89.71

92.07

Tiempo

a) La grfica de contorno

6) La grfica de la superficie de respuesta

Figura 11-14 Grfica de contorno y grfica de la superficie de


respuesta de la viscosidad, ejemplo 1 1 -2 ,

450

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Tiempo

a) La grfica de contorno

6) La grfica de la superficie de respuesta

Figura 11-15 Grfica de contomo y grfica de la superficie de


respuesta del peso molecular, ejemplo 11 -2 .

la grfica de contorno para determinar las condiciones de operacin apropiadas. Por ejemplo, es posible
que el experimentador est ms interesado en la regin ms grande de las dos regiones factibles que se
muestran en la figura 11-16.
Cuando hay ms de tres variables del diseo, se hace muy complicada la superposicin de las grficas
de contorno, ya que la grfica de contorno es bidimensional, y k - 2 de las variables del diseo deben man
tenerse constantes para construir la grfica. Con frecuencia se necesita una gran cantidad de ensayo y
error para determinar cules son los factores que deben mantenerse constantes y qu niveles seleccionar
para obtener la mejor vista de la superficie. Por lo tanto, existe inters prctico en mtodos de optimiza
cin ms formales para las respuestas mltiples.

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

4 51

182.1

179 .7

Tiempo

Figura 11-16 Regin del ptimo encontrada superponiendo las su


perficies de respuesta del rendimiento, la viscosidad y el peso molecular,
ejemplo 11-2.

Un enfoque popular consiste en formular y resolver el problema como un problema de optimizacin


restringida. Para ilustrar este enfoque utilizando el ejemplo 11-2, el problema podra formularse como
Mx
sujeto a
62 < y2 < 68
y3 < 3400
Se cuenta con varias tcnicas numricas que pueden usarse para resolver este problema. En ocasiones se
hace referencia a estas tcnicas como mtodos de programacin no lineal. El paquete de software
Design-Expert resuelve esta versin del problema utilizando un procedimiento de bsqueda directa. Las
dos soluciones encontradas son
tiempo = 83.5

temperatura = 177.1

yl = 79.5

tiempo = 86.6
temperatura = 172.25
% = 79.5
Observe que la primera solucin es la regin factible superior (la ms pequea) del espacio del diseo
(referirse a la figura 11-16), mientras que la segunda solucin es la regin ms grande. Ambas soluciones
estn muy cerca de los lmites de las restricciones.
Otro enfoque til para la optimizacin de respuestas mltiples es usar la tcnica de optimizacin si
multnea popularizada por Derringer y Suich [37]. Su procedimiento hace uso de las funciones con condi
cin de deseable. El enfoque general consiste en convertir primero cada respuesta y, en una funcin con
condicin de deseable individual d que vara en el rango
0 <di < 1
donde si la respuesta y, est en su meta u objetivo, entonces d = 1 , y si la respuesta est fuera de una regin
aceptable, d = 0. Despus las variables del diseo se eligen para maximizar la condicin de deseable global
D = ( d r d 2 .......dmf m
donde hay m respuestas.

452

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Las funciones con condicin de deseable individual estn estructuradas como se indica en la figura
11-17. Si el objetivo T para la respuesta y es un valor mximo,
0
y<L
d=

'y-LX
T-L

I s y<T

( 1 1 -1 1 )

y>T

1,

cuando la ponderacin r = 1, la funcin con condicin de deseable es lineal. Al elegir r > 1 se pone ms
inters en estar cerca del valor objetivo, y cuando se elige 0 < r < 1 esto tiene menos importancia. Si el ob
jetivo para la respuesta es un valor mnimo,
1
y<T
d=

(U-yX

U-T

T<y< U

(11-12)

y>U

La funcin con condicin de deseable de dos colas que se muestra en la figura ll-17c supone que el obje
tivo se localiza entre los lmites inferior (L) y superior (U), y se define como
y< L

d=

y~Lv
T-Lj

L<y<T

U-y
U-T

T<y<U

v2

(11-13)

y>U

Se us el paquete de software Design-Expert para resolver el ejemplo 11-2 utilizando el enfoque de la


funcin con condicin de deseable. Se eligi T = 80 como el objetivo para la respuesta rendimiento, U =
70, y se fij la ponderacin de esta condicin de deseable individual igual a la unidad. Se hizo T = 65 para
la respuesta viscosidad con L = 62 y U = 68 (para ser consistente con las especificaciones), con ambas
ponderaciones rl = r2 1. Por ltimo, se indic que cualquier peso molecular abajo de 3400 era acepta
ble. Se encontraron dos soluciones.
Solucin 1:
Tiempo = 86.5
5>i - 78.8

Temperatura = 170.5
y2 = 65

D = 0.822
y, = 3287

Solucin 2:
Tiempo = 82
= 78.5

Temperatura = 178.8
h = 65

D = 0.792
% = 3400

La solucin 1 tiene la condicin de deseable global ms alta. Observe que resulta en una viscosidad acor
de con el objetivo y en un peso molecular aceptable. Esta solucin est contenida en Ja ms grande de las
dos regiones de operacin de la figura 11-16, mientras que la segunda solucin est contenida en la regin
ms pequea. En la figura 11-18 se muestran las grficas de la superficie de respuesta y de contorno de la
funcin con condicin de deseable global D.

11-3 ANLISIS DE UNA SUPERFICIE DE RESPUESTA DE SEGUNDO ORDEN

a) El objetivo (blanco) es m axim izar y

b) El objetivo (blanco) es m inim izar y

c) El objetivo (blanco) es que y est tan cerca com o sea posible de la especificacin

Figura 11-17 Funciones con condicin de deseables individuales para la optimiza


cin simultnea.

CAPTULO

11

MTODOS DE SUPERFICIES DE RESPUESTA

Condicin d deseable

454

a ) Superficie de respuesta

Tiempo
6) Grfica de contorno

Figura 11-18 Grfica de la superficie de respuesta y de contomo de la fundn con con


dicin de deseable del ejemplo 1 1 -2 .

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

11-4

455

DISEOS EXPERIMENTALES PARA AJUSTAR


SUPERFICIES DE RESPUESTA

El ajuste y anlisis de superficies de respuesta se facilita en gran m edida con la eleccin apropiada del di
seo experimental. En esta seccin se revisan algunos aspectos de la seleccin del diseo apropiado para
ajustar superficies de respuesta.
Cuando se selecciona un diseo de superficie de respuesta, algunas de las caractersticas deseables en
el diseo son las siguientes:
1. Proporciona una distribucin razonable de los puntos de los datos (y en consecuencia inform a
cin) en toda la regin de inters.
2. Perm ite que se investigue la adecuacin del modelo, incluyendo la falta de ajuste.
3. Perm ite que los experim entos se realicen en bloques.
4. Perm ite que los diseos de orden superior se construyan secuencialmente.
5. Proporciona una estimacin interna del error.
6. Proporciona estimaciones precisas de los coeficientes del modelo.
7. Proporciona un buen perfil de la varianza de prediccin en toda la regin experimental.
8. Proporciona una robustez razonable contra los puntos atpicos o los valores faltantes.
9. No requiere un gran nm ero de corridas.
10. No requiere dem asiados niveles de las variables independientes.
11. Asegura la simplicidad del clculo de los parm etros del modelo.
Estas caractersticas entran en conflicto en ocasiones, por lo que con frecuencia debe aplicarse la discrecionalidad al seleccionar un diseo. Para mayor inform acin sobre la eleccin de un diseo de superficie
de respuesta, referirse a Myers y M ontgom ery [85a], Box y D raper [16b] y Khuri y Cornell [67].

11-4.1

Diseos para ajustar el modelo de primer orden

Suponga que quiere ajustarse el m odelo de prim er orden en k variables


y = a + ^ i x i +
1=1

(1 1 -1 4 )

Hay una clase nica de diseos que minimizan la varianza de los coeficientes de regresin {y?,}. Se trata
de los diseos de primer orden ortogonales. Un diseo de prim er orden es ortogonal si todos los elem en
tos que estn fuera de la diagonal de la matriz (X'X) son cero. Esto implica que la suma de los productos
cruzados de las columnas de la m atriz X sea cero.
L a clase de los diseos de prim er orden ortogonales incluye los factoriales 2 k y las fracciones de la se
rie 2 k en las que los efectos principales no son alias entre s. Al usar estos diseos se supone que los niveles
bajo y alto de los k factores estn codificados en los niveles usuales 1.
El diseo 2k no perm ite la estim acin del error experim ental a m enos que se hagan rplicas de algu
nas corridas. U n m todo com n de incluir las rplicas en el diseo 2k es aum entar el diseo con varias ob
servaciones en el centro (el punto*, = 0, i = 1, 2 ,..., k). L a adicin de puntos centrales al diseo 2k no
influye en las {$} para i > 1, pero la estimacin de 0 se convierte en el gran prom edio de todas las obser
vaciones. Adems, la adicin de puntos centrales no altera la propiedad de ortogonalidad del diseo. En

456

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Figura 11-19 El diseo simplex para


a) k 2 variables y b) k = 3 variables.

el ejemplo 11-1 se ilustra el uso de un diseo 22 aum entado con cinco puntos centrales para ajustar u n m o
delo de prim er orden.
O tro diseo de prim er orden ortogonal es el diseo simplex. El diseo simplex es una figura de lados
regulares con A: + 1 vrtices en k dimensiones. Por lo tanto, el diseo simplex para k = 2 es un tringulo
equiltero, y para k = 3 es un tetraedro regular. E n la figura 11-19 se m uestran diseos simplex de dos y
tres dimensiones.

11-4.2

Diseos para ajustar el modelo de segurado orden

E n el ejemplo 11-2 se hizo la introduccin inform al (e incluso antes en el ejem plo 6-6) del diseo central
compuesto o DCC p ara ajustar un m odelo de segundo orden. Se tra ta de la clase ms p opula de diseos
usados p ara ajustar estos modelos. E n general, el DCC consta de un factorial 2k (o de un factorial fraccio
nado de resolucin V) con nF corridas, 2k corridas axiales o estrella y n c corridas centrales. E n la figura
11-20 se m uestra el D C C p ara k = 2 y k = 3 factores.
E l despliegue prctico de un DCC surge con frecuencia a travs de la experimentacin secuencial,
como en los ejemplos 11-1 y 11-2. Es decir, se ha usado un diseo 2k para ajustar un m odelo de prim er o r
den, este m odelo ha presentado falta de ajuste, y despus se agregaron las corridas axiales para perm itir la
incorporacin de los trm inos cuadrticos en el modelo. El D CC es un diseo muy eficiente para ajustar
el m odelo de segundo orden. Hay dos parm etros en el diseo que deben especificarse: la distancia a de
las corridas axiales al centro del diseo y el nm ero de puntos centrales n c. A continuacin se analiza la
eleccin de estos dos parm etros.

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

45 7

*3
*2

(0,a)
(+1.+1)

(- 1.+ 1)

(-a, 0)

(0,0)

(-1,-1)

(a, 0)
( + 1. - 1)

(0,-0)

Figura 11-20 Diseos centrales compuestos para k = 2 y A; = 3.

Rotabilidad
Es im portante que el m odelo de segundo orden proporcione buenas predicciones en toda la regin de in
ters. U na m anera de definir buenas es requerir que el m odelo tenga una varianza razonablem ente
consistente y estable de la respuesta predicha en los puntos de inters x. Recuerde, p or la ecuacin 10-40,
que la varianza de la respuesta predicha en algn punto x es
K [ X x ) ] = a 2x '(X 'X j-1x
B oxy H unter [17a] propusieron que un diseo de superficie de respuesta de segundo orden debe ser rotable. Esto significa que la V[5>(x)] es la misma en todos los puntos x que estn a la misma distancia dl cen
tro del diseo. Es decir, la varianza de la respuesta predicha es constante en esferas.
E n la figura 11-21 se m uestran los contornos de V P ^ x )] constante p ara el ajuste del m odelo de se
gundo orden utilizando el D CC en el ejemplo 11-2. Observe que los contornos de desviacin estndar
constante de la respuesta predicha son crculos concntricos. U n diseo con esta propiedad dejar la va
rianza de 5*sin cambio cuando el diseo se rota alrededor del centro (0 ,0 ,..., 0), de ah el nom bre de dise
o rotable.
L a rotabilidad es una base razonable para la seleccin de un diseo de superficie de respuesta. Puesto
que la finalidad de la M SR es la optimizacin, y la localizacin del ptim o se desconoce antes de correr el
experim ento, tiene sentido el uso de un diseo que proporcione una precisin de estimacin igual en to
das las direcciones (puede dem ostrarse que cualquier diseo de prim er orden ortogonal es rotable).
U n diseo central com puesto se hace rotable m ediante la eleccin de a. El valor de a para la rotabili
dad depende del nm ero de puntos en la porcin factorial del diseo; de hecho, a = (nF)w produce un di
seo central com puesto rotable, donde nF es el nm ero de puntos usados en la porcin factorial del
diseo.
El DCC esfrico
La rotabilidad es una propiedad esfrica; es decir, tiene mayor sentido como criterio de diseo cuando la
regin de inters es una esfera. Sin embargo, no es im portante tener una rotabilidad exacta para tener un
buen diseo. D e hecho, para una regin esfrica de inters, la m ejor eleccin de a desde el punto de vista
de la varianza de prediccin para el D CC es hacer a = Ve. Este diseo, llam ado DCC esfrico, coloca to
dos los puntos factoriales y axiales del diseo sobre la superficie de una esfera de radio Ve. Para una expo
sicin ms amplia del tem a, ver Myers y M ontgomery [85a].

458

CAPTULO

11

MTODOS DE SUPERFICIES DE RESPUESTA

0 .3 0 1 9

0 .3 4 8 4

Tiempo
a) Contornos deV V'[v(x)]

b) La grfica de la superficie de respuesta

Figura 11-21 Contornos de desviacin estndar cons


tante de la respuesta predicha para el DCC rotable, ejem
plo 11-2.

Corridas centrales en el DCC

La eleccin de a en el DCC est dictada principalm ente por la regin de inters. Cuando esta regin es
una esfera, el diseo debe incluir corridas centrales para proporcionar una varianza razonablem ente es
table de la respuesta predicha. E n general, se recom iendan de tres a cinco corridas centrales.
El diseo de Box-behnken
Box y Behnken [13] han propuesto algunos diseos de tres niveles para ajustar superficies de respuesta.
Estos diseos se form an com binando factoriales 2k con diseos de bloques incompletos. Los diseos re-

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

459

Tabla 11-8 Diseo de Box-Behnken


para tres variables
Corrida
*2
*3
1
1
-1
0
-1
2
1
0
3
1
-1
0
4
1
1
0
-1
-1
5
0
-1
6
0
1
-1
7
1
0
8
1
0
1
-1
-1
9
0
-1
1
10
0
-1
11
0
1
12
1
1
0
13
0
0
0
14
0
0
0
0
15
0
0

sultantes suelen ser muy eficientes en trm inos del nm ero requerido de corridas, y son rotables o casi re
tables.
E n la tabla 11-8 se m uestra el diseo de Box-Behnken para tres variables. El diseo tam bin se ilustra
geom tricam ente en la figura 11-22. Observe que el diseo de Box-Behnken es un diseo esfrico, con to
dos los puntos localizados en una esfera de radio V2. Asimismo, el diseo de Box-Behnken no contiene
ningn punto en los vrtices de la regin cbica creada por los lmites superior e inferior de cada variable.
Esto podra ser una ventaja cuando los puntos de los vrtices del cubo representan combinaciones de los
niveles de los factores cuya prueba es prohibitivam ente costosa o imposible debido a restricciones fsicas
del proceso.
Regin cuboidal de inters
Existen muchas situaciones en las que la regin de inters es cuboidal en lugar de esfrica. E n estos casos,
una variante til del diseo central com puesto es el diseo central compuesto con centros en las caras o el
cubo con centros en las caras, en el que a = 1. E n este diseo los puntos axiales o estrella se localizan en
los centros de las caras del cubo, como se m uestra en la figura 11-23 para k = 3. E sta variante del diseo
central com puesto se usa en ocasiones debido a que slo requiere tres niveles de cada factor, y en la prc-

Figura 11-22
factores.

Diseo de Box-Behnken para tres

r " -U '
Figura 11-23 Diseo central compuesto con centros
en las caras para k - 3.

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

(a) Superficie de respuesta

(6) Grfica de contorno

Figura H-24 Desviacin estndar de la respuesta predicha ^F[(x)] para el cubo con
centros en las caras con k = 3, nc = 3 y x3 = 0.

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

461

Figura 11-25 Diseos equirradiales para dos variables, a) Hexgono, b) Pen


tgono.

tica con frecuencia es difcil cambiar los niveles de los factores. Sin embargo, observe que los diseos cen
trales com puestos no son rotables.
El cubo con centros en las caras no requiere tantos puntos centrales como el D C C esfrico. E n la
prctica, nc = 2 o 3 es suficiente p ara proporcionar una buena varianza de prediccin en toda la regin ex
perim ental. Cabe sealar que en ocasiones se em plearn ms corridas centrales para dar una estimacin
razonable del error experim ental. E n la figura 11-24 se m uestra la raz cuadrada de la varianza de predic
cin V K ^ x )] del cubo con centros en las caras para k = 3 con n c = 3 puntos centrales (jc3 = 0). Observe
que la desviacin estndar de la respuesta predicha es razonablem ente uniform e en una porcin relativa
m ente larga del espacio del diseo.
Otros diseos
Existen muchos otros diseos de superficie de respuesta que en ocasiones son tiles en la prctica. Para
dos variables, podran usarse diseos com puestos de puntos cuya separacin en un crculo es igual y que
form an polgonos regulares. Puesto que los puntos del diseo son equidistantes del origen, a estos arre
glos con frecuencia se les llam a diseos equirradiales.
Para k = 2, un diseo equirradial rotable se obtiene com binando n 2 5 puntos con una separacin
igual en un crculo con/ij > 1 punto en el centro del crculo. Diseos de particular utilidad parafe = 2 son
el pentgono y el hexgono. Estos diseos se m uestran en la figura 11-25. O tros diseos tiles incluyen el
diseo compuesto pequeo, el cual consiste en un factorial fraccionado en el cubo de resolucin IIP (los
efectos principales son alias de las interacciones de dos factores y ninguna de las interacciones de dos fac
tores es alias entre s) y las corridas axiales y centrales usuales, y la clase de los diseos hbridos. Estos di
seos pueden ser de valor considerable cuando es im portante reducir el nm ero de corridas tanto como
sea posible.
E n la tabla 11-9 se m uestra un diseo com puesto pequeo para k = 3 factores. Este diseo usa la frac
cin un m edio estndar del diseo 23 en el cubo, ya que satisface los criterios de la resolucin III*. El dise
o tiene cuatro corridas en el cubo y seis corridas axiales, y debe incluir al m enos un punto central. Por lo
tanto, el diseo tiene un mnimo de N = 11 ensayos, y el m odelo de segundo orden en k = 3 variables tiene
p ~ 10 parm etros por estim ar, por lo que se trata de un diseo muy eficiente con respecto al nm ero de
corridas. El diseo de la tabla 11-9 tiene n c = 4 corridas centrales. Se seleccion a = 1.73 para obtener un
diseo esfrico debido a que el diseo com puesto pequeo no puede hacerse rotable.
E n la tabla 11-10 se m uestra un diseo hbrido p ara k = 3. Algunos de estos diseos tienen niveles
irregulares, y esto puede ser un factor limitante para su aplicacin. Sin embargo, se trata de diseos muy

462

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Tabla 11*9 Diseo compuesto pequeo


para k = 3 factores
Orden
xt
X,
estndar
*3
1
1.00
1.00
-1.00
2
1.00 -1.00
1.00
3
1.00
-1.00
1.00
4
-1.00
-1.00
-1.00
5
0.00
-1.73
0.00
0.00
6
1.73
0.00
7
-1.73
0.00
0.00
8
1.73
0.00
0.00
9
0.00
0.00
-1.73
0.00
10
0.00
1.73
0.00
11
0.00
0.00
12
0.00
0.00
0.00
13
0.00
0.00
0.00
14
0.00
0.00
0.00

pequeos, y poseen excelentes propiedades de la varianza de prediccin. P ara mayores detalles acerca de
los diseos compuestos pequeos y los diseos hbridos, referirse a Myers y M ontgom eiy [85a].

11-4.3

Formacin de bloques en los diseos de superficie de respuesta

Cuando se usan diseos de superficie de respuesta, con frecuencia es necesario considerar la formacin
de bloques para elim inar las variables perturbadoras. Por ejemplo, este problem a puede ocurrir cuando
un diseo de segundo orden se ensam bla secuencialm ente a partir de un diseo de prim er orden, como se
ilustr en los ejemplos 11-1 y 11-2, P uede transcurrir tiem po considerable entre que se corre el m odelo de
prim er orden y se corren los experim entos com plem entarios requeridos p ara construir un diseo de se-

Tabla 11-10 Diseo hbrido para k = 3


factores
Orden
estndar
*i
x 2
xi
1
0.00
1.41
0.00
2
0.00
0.00
-1.41
3
-1.00
-1.00
0.71
-1.00
4
1.00
0.71
1.00
5
-1.00
0.71
1.00
6
1.00
0.71
0.00
7
1.41
-0.71
8
-1.41
0.00
-0.71
1.41
9
0.00
-0.71
10
0.00
-1.41
-0.71
0.00
11
0.00
0.00

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

463

gundo orden, y durante este tiem po las condiciones de prueba pueden cambiar, haciendo necesaria la for
macin de bloques.
Se dice que un diseo de superficie de respuesta se forma de bloques ortogonales si se divide en blo
ques tales que sus efectos no afecten las estimaciones de los parm etros del m odelo de superficie de res
puesta. Si se usa un diseo 2k o 2k^ como un diseo de superficie de respuesta de prim er orden, pueden
usarse los m todos del captulo 7 para disponer las corridas en 2r bloques. Los puntos centrales de estos
diseos debern asignarse por igual entre los bloques.
Para hacer la formacin de bloques ortogonales de un diseo de segundo orden, deben satisfacerse
dos condiciones. Si hay nb observaciones en el bloque -simo, entonces estas condiciones son

1. Cada bloque debe ser un diseo ortogonal de prim er orden; es decir,


Z

x iux ju = 0

* = o, 1, -, k

Para toda b

donde xiu y xu son los niveles de las variables z-sima y y-sima en la corrida w-sima del experi
m ento con Xqu = \ para toda u.
2. La fraccin de la sum a de cuadrados total p ara cada variable con que contribuye cada bloque,
d ebe ser igual a la fraccin de las observaciones totales que estn contenidas en el bloque;
es decir,

i = 1, 2, ..., k

para toda b

xl

donde N es el nm ero de corridas del diseo.


Como un ejemplo de la aplicacin de estas condiciones, considere un diseo central com puesto rotable en k = 2 variables con N = 1 2 corridas. Los niveles x 1 y x 2 de este diseo pueden escribirse en la m atriz
del diseo
*1
[ -1

1
-1
1
0
0
D=
1.414
-1.414
0
0
0
0

x2
-1
-1
1
1

0
0
0
0
1.414
-1.414
0
0

Bloque 1

Bloque 2

Observe que el diseo se ha dispuesto en dos bloques, con el prim er bloque consistiendo en la porcin
factorial del diseo ms dos puntos centrales y el segundo bloque consistiendo en los puntos axiales ms

464

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

dos puntos centrales adicionales. Es claro que la condicin 1 se satisface; es decir, ambos bloques son di
seos de prim er orden ortogonales. P ara investigar la condicin dos, considere prim ero el bloque 1 y ob
serve que
U=1
N

Por lo tanto
71,

M=1
N

N
4^6_
8

12

As, la condicin 2 se satisface en el bloque 1. Para el bloque 2 se tiene

U= 1

Por lo tanto,

uL
N

8 _ 12
Puesto que la condicin 2 tambin se satisface en el bloque 2, este diseo est formado de bloques ortogonales.
E n general, el diseo central com puesto siempre puede construirse p ara hacer la formacin de blo
ques ortogonales en dos bloques con el prim er bloque consistiendo en nF puntos factoriales ms nCFpun
tos centrales y el segundo bloque consistiendo en nA = 2k puntos axiales ms n CA puntos centrales. La
prim era condicin de la formacin de bloques ortogonales se cum plir siem pre independientem ente del
valor que se use para a en el diseo. Para que la segunda condicin se cumpla,

(11-15)

u
El m iem bro izquierdo de la ecuacin 11-15 es 2a 2/nF, y despus de sustituir esta cantidad, la ecuacin para
el valor de a que resultar en la formacin de bloques ortogonales puede resolverse como
nF{nA + n CA)
2(n F + n cjr )

1/2

( 1 1 -1 6 )

11'4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

465

E ste valor de a no dar como resultado, en general, un diseo rotable o esfrico. Si se requiere que el
diseo tam bin sea rotable, entonces a = (nf )1/4 y

No siem pre es posible encontrar un diseo que satisfaga exactam ente la ecuacin 11-17. Por ejemplo, si
k = 3, nF. = 8 y nA = 6, la ecuacin 11-17 se reduce a
i _ 8 ( 6 + ^ )
=
2 (8 + n CF)

(8)

2.83 =

48+8^
1 6 + 2 n CF

Es imposible encontrar valores de n CAy n CFque satisfagan exactam ente esta ltim a ecuacin. Sin em bar
go, observe que si n CF = 3 y nc:A = 2, entonces el segundo m iem bro es
48+ 8(2)
1 6 + 2 (3 )

'

por lo que el diseo se separa en bloques casi ortogonales. E n la prctica podra relajarse un tanto el re
querim iento de la rotabilidad o bien el de la formacin de bloques ortogonales sin ninguna prdida im
portante de informacin.
El diseo central com puesto es muy verstil en cuanto a su capacidad p ara incorporar la formacin
de bloques. Si k es lo suficientem ente grande, la porcin factorial del diseo puede dividirse en dos o ms
bloques. (El nm ero de bloques factoriales debe ser una potencia de 2, con la porcin axial form ando un
solo bloque.) E n la tabla 11-11 se presentan varias disposiciones tiles de la form acin de bloques para el
diseo central compuesto.
Tabla 11-11 Algunos diseos centrales compuestos rotables y casi rotables que se separan en bloques ortogonales
5
6
7
k
2
3
4
5
^Rep.
6
iRep.
7
^Rep.
Bloque(s) factorial(es)
4
8
16
32
16
64
32
128
64
nF
Nmero de bloques
1
2
2
4
1
8
2
8
16
Nmero de puntos en cada
bloque
4
4
8
8
16
8
16
8
8
Nmero de puntos centrales
en cada bloque
3
2
2
2
6
1
4
1
1
Nmero total de puntos en
cada bloque
7
6
10
10
22
9
20
9
9
Bloque axial
nA
C4
Nmero total de puntos en el
bloque axial
Nmero total de puntos N del
diseo

4
3

6
2

8
2

10
4

10
1

12
6

12
2

14
11

14
4

10

14

11

18

14

25

18

14

20

30

54

33

90

54

169

80

Valores de a
Separacin en bloques ortogonales
Rotabilidad

1.4142 1.6330 2.0000 2.3664 2.0000 2.8284 2.3664 3.3636 2.8284


1.4142 1.6818 2.0000 2.3784 2.0000 2.8284 2.3784 3.3333 2.8284

466

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Cabe destacar dos puntos im portantes acerca del anlisis de varianza cuando el diseo de superficie
de respuesta se ha corrido en bloques. El prim ero se refiere al uso de los puntos centrales para calcular
una estimacin del error puro. Slo los puntos centrales que se corren en el mismo bloque pueden consi
derarse como rplicas, por lo que el trm ino del error puro slo puede calcularse dentro de cada bloque.
Si la variabilidad es consistente en todos los bloques, entonces estas estimaciones del error puro podran
agruparse. El segundo punto se refiere al efecto de bloque. Si el diseo se form a de bloques ortogonales
en m bloques, la suma de cuadrados de los bloques es
m

n2

>=i
donde B b es el total de las nb observaciones en el bloque ft-simo y G es el gran total de las N observaciones
en los m bloques. Cuando los bloques no son exactamente ortogonales, puede usarse la prueba general de
significacin de la regresin (el m todo de la suma de cuadrados extra) que se describi en el captulo 10.

11-4.4

Diseos (ptimos) generados por computadora

Los diseos estndares de superficie de respuesta estudiados en las secciones anteriores, como el diseo
central com puesto y el diseo de Box-Behnken y sus variantes (como el cubo con centros en las caras), son
de uso generalizado porque son diseos bastante generales y flexibles. Si la regin experim ental es un
cubo o u na esfera, de m anera tpica existe un diseo de superficie de respuesta que ser aplicable al p ro
blema. Sin embargo, ocasionalm ente un experim entador se encuentra con una situacin en la que el dise
o estndar de superficie de respuesta puede no ser una eleccin obvia. Los diseos generados por
com putadora son una alternativa por considerar en estos casos.
H ay tres situaciones en las que puede ser apropiado algn tipo de diseo generado por com putadora.
1. Una regin experimental irregular. Si la regin de inters del experim ento no es un cubo o una esfera,
los diseos estndares quiz no sean la mejor eleccin. Las regiones de inters irregulares ocurren con
bastante frecuencia. Por ejemplo, un experim entador est investigando las propiedades de un adhesivo
particular. E l adhesivo se aplica a dos piezas y despus se cura a una tem peratura elevada. Los dos facto
res de inters son la cantidad de adhesivo aplicada y la tem peratura de curado. E n los rangos de estos dos
factores, tom ados como -1 a +1 en la escala de la variable codificada usual, el experim entador sabe que si
se aplica muy poco adhesivo y la tem peratura de curado es muy baja, las piezas no se pegarn satisfacto
riam ente. E n trm inos de las variables codificadas, esto lleva a una restriccin sobre las variables del dise
o, por ejemplo
- 1 .5 < X) + x 2
donde*! representa la cantidad aplicada de adhesivo y x 2 la tem peratura. Adems, si la tem peratura es de
m asiado elevada y se aplica mucho adhesivo, las piezas resultarn daadas por la fatiga trm ica o bien
ocurrir un pegado inadecuado. Por lo tanto, hay otra restriccin sobre los niveles de los factores

+x2 < 1
E n la figura 11-26 se m uestra la regin experim ental que resulta de aplicar estas restricciones. Observe
que las restricciones elim inan de hecho dos de los vrtices del cuadrado, produciendo una regin experi-

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

467

Figura 11-26 Regin restringida del diseo en dos variables.


m ental irregular (en ocasiones a estas regiones irregulares se les llam a latas abolladas). No existe nin
gn diseo de superficie de respuesta estndar que se ajuste exactam ente a esta regin.
2. Un modelo no estndar. Por lo general, un experim entador elige un m odelo de superficie de respues
ta de prim er o de segundo orden, consciente de que este modelo em prico es una aproximacin del verda
dero m ecanismo subyacente. Sin embargo, en ocasiones el experim entador puede tener un conocimiento
o idea especial acerca del proceso bajo estudio que puede sugerir un m odelo no estndar. Por ejemplo, el
m odelo

y= o

+ l Xl +

2X 2

+ n Xl X

+ l l Xl + l l Xl

~ ^ m Xl X 2 + lU 2Xl X 2 + e

puede ser de inters. El experim entador estara interesado en obtener un diseo eficiente para ajustar
este m odelo reducido de cuarto grado. Como otra ilustracin, en ocasiones se encuentran problem as de
superficie de respuesta en los que algunos de los factores del diseo son variables categricas. No hay di
seos de superficie de respuesta estndares para esta situacin (referirse a Myers y M ontgom ery [85a]
para un estudio de las variables categricas en problem as de superficie de respuesta).
3. Requerimientos inusuales para el tamao de la muestra. Ocasionalm ente, un experim entador quiz
necesite reducir el nm ero de corridas requeridas en un diseo estndar de superficie de respuesta. Por
ejemplo, suponga que se pretende ajustar un m odelo de segundo orden en cuatro variables. El diseo
central com puesto para esta situacin requiere entre 28 y 30 corridas, dependiendo del nm ero de puntos
centrales seleccionados. Sin embargo, el m odelo slo tiene 15 trm inos. Si las corridas tienen un costo
muy elevado o se llevan m ucho tiem po, el experim entador querr un diseo con menos ensayos. Aun
cuando los diseos generados por com putadora pueden usarse para este fin, p or lo general se cuenta con
enfoques mejores. Por ejemplo, puede construirse un diseo com puesto pequeo para cuatro factores

468

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

con 20 corridas, incluyendo cuatro puntos centrales, y tam bin se cuenta con un diseo hbrido con ape
nas 16 corridas. stas son en general elecciones superiores al uso de un diseo generado por com putado
ra para reducir el nm ero de ensayos.
G ran p arte del desarrollo de los diseos generados por com putadora se deriva del trabajo de Kiefer
[65a, b] y Kiefer y Wolfowitz [66] en la teora de los diseos optimales. Por diseo optimal se entiende un
diseo que es m ejor con respecto a algn criterio. Se requieren program as de com putadora para cons
truir estos diseos. El enfoque usual es especificar un m odelo, determ inar la regin de inters, seleccio
nar el nm ero de corridas que debern hacerse, especificar el criterio de optim alidad y despus elegir los
puntos del diseo de un conjunto de puntos candidatos que el experim entador considerara usar. D e m a
nera tpica, los puntos candidatos son una matriz de puntos distribuidos en la regin factible del diseo.
Hay varios criterios de optim alidad populares. Quiz el de uso ms generalizado es el criterio de opti
m alidad D. Se dice que un diseo es optimal D si
l ( x 'x ) - 1!
se minimiza. O curre que un diseo optimal D minimiza el volum en de la regin de confianza conjunta
para el vector de los coeficientes de regresin. U na m edida de la eficiencia relativa del diseo 1 respecto
del diseo 2 de acuerdo con el criterio D est dada por
D =

(11-19)
IW x j-

donde X 1 y X2 son las matrices X de los dos diseos y p es el nm ero de parm etros del modelo.
El criterio de optimalidad^ slo se ocupa de las varianzas de los coeficientes de regresin. U n diseo
es optim aM si minimiza la suma de los elem entos de la diagonal principal de (X'X)-1 [a sta se le llam a la
traza de (X'X)-1, denotada generalm ente como tr(X 'X )1]. Por lo tanto, un diseo o p tim a le minimiza la
suma de las varianzas de los coeficientes de regresin.
Puesto que muchos experim entos de superficie de respuesta se refieren a la prediccin de la respues
ta, los criterios de la varianza de prediccin son de gran inters prctico. Quizs el ms popular de estos
criterios sea el criterio de optimalidad G. Se dice que un diseo es optimal G si m inimiza la varianza de
prediccin escalada mxima en la regin del diseo. Es decir, si el valor mximo de
JVF[X*)]
a2
en la regin del diseo es un mnimo, donde N es el nm ero de puntos del diseo. S el m odelo tienep p a
rm etros, la eficiencia G de un diseo es precisam ente
G-

j o (,o ]
m ax ----- ,
o

<n -20>

El criterio V considera la varianza de prediccin en un conjunto de puntos de inters en la regin del dise
o, por ejemplo x x2, ..., x,. El conjunto de puntos podra ser el conjunto de candidatos del que se selec
cion el diseo, o podra ser alguna o tra coleccin de puntos que tienen un significado especfico p ara el
experim entador. U n diseo que minimiza la varianza de prediccin promedio en este conjunto de m pun
tos es un diseo optimal V.
E n conjunto, a los criterios de diseo que se han venido estudiando suele llamrseles criterios d op
timalidad alfabtica. Existen algunas situaciones en las que el diseo optimal alfabtico se conoce o bien

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA

469

puede construirse analticam ente. U n buen ejemplo es el diseo 2k, que es optim al D, A, G y V para ajus
tar el m odelo de prim er orden en k variables o para ajustar el m odelo de prim er orden con interaccin.
Sin embargo, en la m ayora de los casos el diseo optimal no se conoce y debe em plearse un algoritmo ba
sado en com putadora para encontrar un diseo. Muchos paquetes de software de estadstica que sopor
tan experim entos diseados cuentan con esta capacidad. La mayora de los procedim ientos para construir
diseos se basan en el algoritm o de intercam bio. En esencia, el experim entador selecciona una m atriz de
puntos candidatos y un diseo inicial (quiz al azar) a partir de este conjunto de puntos. Entonces el algo
ritm o intercam bia los puntos que estn en la matriz, pero no en el diseo, con los puntos que estn actual
m ente en el diseo, en un esfuerzo por m ejorar el criterio de optim alidad seleccionado. D ebido a que no
se evalan explcitamente todos los diseos posibles, no hay garanta de que se ha encontrado un diseo
optimal, pero el procedim iento de intercam bio suele asegurar que se obtiene un diseo que est cerca
del optimal. Algunas im plementaciones repiten varias veces el proceso de construccin del diseo, em pe
zando con diseos iniciales diferentes, para increm entar la posibilidad de que se obtendr un diseo final
que est muy cerca del optimal.
Para ilustrar algunas de estas ideas, considere el experim ento del adhesivo expuesto anteriorm ente y
que llev a la regin experim ental irregular de la figura 11-26. Suponga que la respuesta de inters es la
fuerza de desprendim iento y que quiere ajustarse un m odelo de segundo orden para esta respuesta. E n la
figura 11-27a se m uestra un diseo central com puesto con cuatro puntos centrales (12 corridas en total)
inscrito dentro de esta regin. Se trata de un diseo que no es rotable, pero es el DCC ms grande que
puede ajustarse dentro del espacio del diseo. Para este diseo | (X 'X )'11 = 1.852 E -2, y la traza de (X'X)-1
es 6.375. En la figura ll-2 7 a tam bin se m uestran los contornos de desviacin estndar constante de la
respuesta predicha, calculada suponiendo que a = 1. E n la figura 11-276 se m uestra la grfica de superfi
cie de respuesta correspondiente.
E n la figura 11-28 y en la tabla 11-12 se m uestra un diseo optim al D de 12 corridas para este proble
ma, generado con el paquete de software Design-Expert. Para este diseo, | (X'X)-11 = 2.153 E -4. Observe
que el criterio D es considerablem ente m ejor para este diseo que el D CC inscrito. La eficiencia relativa
del D C C inscrito con respecto al diseo optimal D es
D. =

| ( x ; x 2) - |
U ( x ; x ,) -

1/6

0.0002153V
= 0.476
0.01852

Es decir, el DCC inscrito tiene una eficiencia de slo 47.6% que la del diseo optim al/?. Esto implica que
tendran que hacerse 1/0.476 = 2.1 rplicas del D C C (o aproxim adam ente el doble) para tener la misma
precisin de la estim acin de los coeficientes de regresin que la que se consigue con el diseo optimal D.
L a traza de (X'X)-1 es 2.516 para el diseo optimal D, lo cual indica que la sum a de las varianzas de ls
coeficientes de regresin es considerablem ente ms pequea para este diseo que para el DCC. E n las fi
guras 11-28 y b se m uestran tam bin los contornos de desviacin estndar constante de la respuesta p re
dicha y la grfica de la superficie de respuesta asociada (suponiendo que o = 1). E n general, los contornos
de la desviacin estndar de la prediccin son ms bajos para el diseo optim al D que para el D CC inscri
to, particularm ente cerca de los lmites de la regin de inters, donde el D C C inscrito no incluye ninguno
de los puntos del diseo.
En la figura 11-29a se m uestra un tercer diseo, creado al tom ar las dos rplicas de los vrtices de la
regin en el diseo optimal D y pasarlas al centro del diseo. Esto podra ser una idea til, ya que la figura
11-286 m uestra que la desviacin estndar de la respuesta predicha se increm enta ligeram ente cerca del
centro de la regin del diseo para el diseo optimal D . En la figura ll-2 9 se m uestran tam bin los con
tornos de desviacin estndar constante de la prediccin para este diseo optim al D modificado, y en la fi-

470

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

1.00

0.60

h
"

0.00

0.60

1.00
-

1.00

0.60

0.00

0.60

1.00

*1

VvTiiv

(a) El diseo y los contornos de W((M|l/o* constante

(b)

La grfica de superficie de respuesta

Figura 11-27 Un diseo central compuesto inscrito para la regin restringida del diseo
de la figura 11-26,

11-4 DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA


2

(a) El diseo y loe contornos de Vvi(x)l/o2constante

Figura 11-28 Un diseo optimal D para la regin restringida del diseo de la figura
11-26.

471

472

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Tabla 11-12 Diseo optimal D para la


regin restringida de la
figura 11-26
Orden
estndar
xi
x 2
1
-0.50
-1.00
2
1.00
0.00
3
-0.08
-0.08
4
-1.00
1.00
5
1.00
-1.00
0.00
1.00
6
7
-1.00
0.25
8
0.25
-1.00
9
-1.00
-0.50
10
1.00
0.00
0.00
1.00
11
12
-0.08
-0.08
gura 11-296 se m uestra la grfica de la superficie de respuesta. El criterio D para este diseo es | (X 'X )11
= 3.71 E ^ l, y la eficiencia relativa es
D, =

K X ^ n f
i( x x ,n ]

(0.0002153y/6 = 091
0.000371 i

Es decir, este diseo es casi tan eficiente como el diseo optimal D. La traza de (X'X)1 es 2.448 para este
diseo, un valor ligeram ente mayor que el que se obtuvo para el diseo optimal D. Los contornos de des
viacin estndar constante de la prediccin para este diseo dan la im presin visual de ser al menos tan
buenos como los del diseo optimal D, particularm ente en el centro de la regin.
Los diseos generados por com putadora con base en los criterios de optim alidad alfabtica pueden
ser ciertam ente tiles en situaciones en las que la regin experim ental no es ni esfrica ni cuboidal. Sin
embargo, no son sustitutos de los diseos estndares en la m ayora de los problemas. Los diseos optim a
les alfabticos se generan apegndose estrictam ente a un solo criterio y, como se seal al principio de la
seccin 11-4, donde se enlistaron varios criterios para diferentes diseos, incluyen varios que son de ca
rcter un tanto cualitativo o subjetivo. En problem as experim entales reales, por lo general hay muchos
criterios que es necesario evaluar para seleccionar un diseo. Para un estudio ms amplio de este tema,
referirse a Myers y M ontgom ery [85a, captulo 8].

11-5

EXPERIMENTOS CON MEZCLAS

E n las secciones anteriores se presentaron diseos de superficie de respuesta p ara aquellas situaciones en
las que los niveles de cada factor son independientes de los niveles de otros factores. E n los experimentos
con mezclas, los factores son los com ponentes o ingredientes de una mezcla y, por consiguiente, sus nive
les no son independientes. Por ejemplo, six 1; x 2, ...,xp denota las proporciones d e p com ponentes de una
mezcla, entonces
0<*,. < 1

/ = 1, 2,

x 1 + x 2 -I------= 1

(es decir, 100%)

11-5 EXPERIMENTOS CON MEZCLAS


1.00

0 .5 0

h"

0.00

- 0 .5 0

1.00
- 1 ,0 0

- 0 ,5 0

0 .0 0

0 .5 0

1 .0 0

(a) El diseo y los contornos de Vv lUll/a3 constante

(6) La grfica de superficie de respuesta

Figura 11-29 Un diseo optimal D modificado para la regin restringida del diseo de la fi
gura 11-26.

474

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Figura 11-30 Espacio de los factores


restringidos para mezclas con a ) p = 2
componentes y b)p = 3 componentes.

Figura 11-31 Sistema coordenado trlineal.

Estas restricciones se ilustran grficam ente en la figura 11-30 p a ra p 2 y p = 3 com ponentes. Para dos
com ponentes, el espacio de los factores del diseo incluye todos los valores de los dos com ponentes que
estn sobre el segmento de recta*! + x 2 = 1, con cada com ponente siendo acotado por 0 y 1. Con tres
com ponentes, el espacio de la mezcla es un tringulo con vrtices que corresponden a las formulaciones
que son mezclas puras (mezclas que son 100% de un solo com ponente).
Cuando hay tres com ponentes en la mezcla, la regin experim ental restringida puede representarse
convenientem ente en papel milimtrico trilineal, como se m uestra en la figura 11-31. C ada uno de los
tres lados de la grfica de la figura 11-31 representa una mezcla que no contiene nada de alguno de los
tres com ponentes (el com ponente indicado en el vrtice opuesto). Las nueve lneas de graduacin en
cada direccin m arcan increm entos de 10% en el com ponente respectivo.
Los diseos simplex se usan para estudiar los efectos de los com ponentes de una m ezcla sobre la va
riable de respuesta. U n diseo simplex reticular {p, ra} para;? com ponentes consta de los puntos defini
dos p or los siguientes arreglos de las coordenadas: las proporciones asumidas por cada com ponente
tom an los ra + 1 valores que estn separados por una distancia igual de 0 a 1,
= 0

,
1
rara

i = l,2,...,p

( 11- 21)
v

y se usan todas las combinaciones posibles (mezclas) de las proporciones de la ecuacin 11-21. Como un
ejemplo, sean p = 3 y ra = 2. Entonces
x i

= 0 ,1 ,1

i = 1 ,2 ,3

11-5 EXPERIMENTOS CON MEZCLAS

475

Figura 11-32 Algunos diseos simplex reticulares para p = 3 y p = 4 componentes.

y el diseo simplex reticular consta de las seis corridas siguientes:


( X l, * 2, * 3 ) = ( 1 ,0 ,0 ) , ( 0 ,1 ,0 ) , ( 0 ,0 ,1 ) , ( i , i , 0 ), ( i , 0, ), (0 , i

E n la figura 11-32 se ilustra este diseo. Los tres vrtices (1 ,0 ,0 ), (0 ,1 ,0 ) y (0 ,0 ,1 ) son las mezclas puras,
m ientras que los puntos (y, y, 0), (y, 0, y) y (0, y, y) son mezclas binarias o mezclas de dos com ponentes lo
calizadas en los puntos m edios de los tres lados del tringulo. E n la figura 11-32 se m uestran tam bin los
diseos simplex reticulares {3,3}, {4,2} y {4,3}. E n general, el nm ero de puntos en un diseo simplex
reticular { p ,m } es
(p + m -\)\
m \ ( p - 1)!
U na alternativa del diseo simplex reticular es el diseo simplex de centroide. E n un diseo simplex
de centroide conp com ponentes, hay 2 P puntos, que corresponden a lasp perm utaciones de (1 ,0 ,0 ,...,
0), las ( l ) perm utaciones de (, y, 0,..., 0), las ( 3 ) perm utaciones de (y, , , 0,..., 0),..., y el centroide glo
bal ( j, j , ..., ~). E n la figura 11-33 se m uestran algunos diseos simplex de centroide.

Figura 11-33

Diseos simplex de centroide con a)p = 3 componentes y b)p = 4 componentes.

476

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

U na crtica a los diseos simplex descritos antes es que la mayora de las corridas ocurren en la fron
tera de la regin y, por consiguiente, incluyen slop - 1 de losp com ponentes. Suele ser deseable aum en
tar el diseo simplex reticular o de centroide con puntos adicionales en el interior de la regin donde las
mezclas estarn form adas por la totalidad de losp com ponentes. Para un estudio ms amplio, ver Cornell
[33] y Myers y M ontgom ery [85a].
Los modelos para mezclas difieren de los polinomios usuales em pleados en los diseos de superficie
de respuesta debido a la restriccin
= 1. Las formas estndares de los modelos p ara mezclas que se
usan am pliam ente son
Lineal:
(11-22)

E (y ) = ix i
i=l
Cuadrtico:
E (y )= Z

ix i + Z Z

nx x j

(11-23)

x'< j

= i

Cbico completo:

E(y)=Z ixi+ZZ axxi


i<j

= 1

p
+ 2

) E

0 f X X j ( X i ~ X j )

+ E S E

(11-24)

m x x i x k

/< } <k

Cbico especial:
E ( y ) = Z ix i + Z Z v x x i
-i
i<
+ X X S

(11-25)

i*x ix i x k

i< j < k

Los trm inos de estos modelos tienen interpretaciones relativam ente simples. E n las ecuaciones
11-22 a 11-25, el parm etro t representa la respuesta esperada para la mezcla pura*, = 1 yx = 0 cuando
j * i. A la porcin
se le llam a porcin de mezcla lineal. Cuando hay curvatura derivada de una
mezcla no lineal entre pares de componentes, los parm etros tj representan una mezcla sinergica o bien
antagnica. Los trm inos de rdenes superiores suelen ser necesarios en los modelos para mezclas por
que 1) los fenm enos estudiados pueden ser complejos y 2) la regin experim ental con frecuencia es la re
gin de operabilidad com pleta y, en consecuencia, es grande y requiere un m odelo elaborado.

EJEMPLO 1 1 -3 ..................................................................................................................................
U n a m ezcla de tres com ponentes
C om ell [33] describe el experim ento con una mezcla en el que se com binaron tres com ponentes polie
tilene (Xj), poliestireno (x2) y polipropileno (x3) para hilar una fibra que se usar en cortinas. L a variable
de respuesta de inters es la elongacin del hilo en kilogramos de fuerza aplicada. Se usa un diseo simplex

11-5 EXPERIMENTOS CON MEZCLAS


Tabla 11-13

Punto del
diseo
1
2
3
4
5
6

477

El diserto simplex reticular { 3 ,2 } para el problema de la elongacin del hilo

Proporciones de los componentes


*i
1
i
0
0
0
i
2

x2
0

1
]
2
0
0

*3
0
0
0
1
2

1
1
2

Valores observados
de la elongacin
11.0,12.4
15.0,14.8,16.1
8.8,10.0
10.0,9.7,11.8
16.8,16.0
17.7,16.4,16.6

Valor promedio
de la elongacin (y)
11.7
15.3
9.4
10.5
16.4
16.9

reticular para estudiar el producto. El diseo y las respuestas observadas se m uestran en la tabla 11-13.
Observe que todos los puntos del diseo incluyen mezclas puras o binarias; es decir, nicam ente se usan
a lo sumo dos de los tres com ponentes en cualquier form ulacin del producto. Tam bin se corren rplicas
de las observaciones, con dos rplicas de cada una de las mezclas puras y tres rplicas de cada una de las
mezclas binarias. La desviacin estndar del error puede estimarse a partir de estas rplicas de las observa
ciones como d = 0.85. Com ell ajusta el polinomio de segundo grado de la mezcla a los datos, obteniendo
y = 11.7jc, + 9.4 x 2 +16.4jt3 + 19.0x1x 2 + 11.4x1 x 3 - 9.6x 1 x }
Puede dem ostrarse que este m odelo es una representacin adecuada de la respuesta. Observe que como
1 > l > 2>se concluira que el com ponente 3 (polipropileno) produce el hilo con la elongacin mxi
ma. Adems, puesto que 12 y 13 son positivos, la mezcla de los com ponentes 1 y 2 o de los com ponentes
1 y 3 produce valores ms altos de la elongacin de los que se esperaran si nos limitram os a prom ediar
las elongaciones de las mezclas puras. Se trata de un ejemplo de los efectos de mezclado sinrgicos. Los
com ponentes 2 y 3 tienen efectos de mezclado antagnicos, ya que n es negativa.
E n la figura 11-34 se grafican los contornos de la elongacin, lo cual puede ser de utilidad para inter
p retar los resultados. A l examinar la figura, se observa que si se desea la elongacin mxima, deber ele
girse la mezcla de los com ponentes 1 y 3, la cual est form ada por aproxim adam ente 80% del com ponente
3 y 20% del com ponente 1.

hilo constante en el modelo de segundo orden para la mez


cla del ejemplo 11-3.

478

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Se seal ya que los diseos simplex reticular y simplex de centroide son diseos de puntos fronte
ra . Si el experim entador quiere hacer predicciones acerca de las propiedades de mezclas com pletas, se
ra muy deseable contar con m s corridas en el interior del simplex. Se recom ienda aum entar los
diseos simplex ordinarios con corridas axiales y el centroide global (si el centroide no es ya un punto
del diseo).
El eje del com ponente i es la recta o rayo que se extiende del punto base*, = 0,x = l/(p - 1 ) , para toda
j * i, al vrtice opuesto donde*, = 1,*, = 0 para toda j * i. El punto base siem pre se localizar en el cen
troide de la frontera de (p - 2) dimensiones del diseo simplex que est opuesto al vrtice x, = 1, x = 0
para toda j * i. [A la frontera se le llam a en ocasiones el (p - 2)-llano.] La longitud del eje del com ponente
es una unidad. Los puntos axiales se sitan sobre los ejes de los com ponentes a una distancia A del cen
troide. El valor mximo de A es (p - l)/p. Se recom ienda que las corridas axiales se coloquen a la m itad en
tre el centroide del diseo simplex y cada vrtice para que A = (p - l)/2p. E n ocasiones a estos puntos se
les llam a mezclas de verificacin axial, porque es una prctica com n excluirlas cuando se ajusta el m ode
lo prelim inar de la mezcla y usar despus las respuestas en estos puntos axiales para verificar la adecua
cin del ajuste del m odelo prelim inar.
E n la figura 11-35 se m uestra el diseo simplex reticular {3, 2} aum entado con los puntos axiales.
E ste diseo tiene 10 puntos, con cuatro de ellos en el interior del diseo simplex. La retcula simplex {3,
3} soportar el ajuste del m odelo cbico completo, m ientras que la retcula simplex aum entada no lo
har; sin embargo, la retcula simplex aum entada perm itir al experim entador ajustar el m odelo cbico
especial o agregar al m odelo cuadrtico trm inos especiales de cuarto orden, como 1233x 1 x 2 x 3. La
retcula simplex aum entada es superior para estudiar la respuesta de mezclas completas en el sentido de
que puede detectar y m odelar la curvatura en el interior del tringulo que no puede tom arse en conside
racin por los trm inos del m odelo cbico completo. L a retcula simplex aum entada tiene ms potencia
para detectar la falta de ajuste que la retcula {3,3}. Esto es de particular utilidad cuando el experim enta
dor no est seguro acerca del m odelo apropiado que debe usar y tam bin planea construir un m odelo secuencialm ente em pezando con un polinomio simple (quiz de prim er orden), probar el m odelo para la

Figura 11-35

U n diseo simplex reticular aumentado.

11-5 EXPERIMENTOS CON MEZCLAS

479

falta de ajuste, despus aum entar el m odelo con trm inos de rdenes superiores, probar el nuevo m odelo
para la falta de ajuste y as sucesivamente.
E n algunos problem as de mezclas surgen restricciones sobre los com ponentes individuales. Las res
tricciones sobre la frontera inferior de la form a
1

i = l , 2 , ...,p

son muy comunes. Cuando slo estn presentes restricciones sobre la frontera inferior, la regin factible
del diseo sigue siendo un diseo simplex, pero se inscribe dentro de la regin del simplex original. E sta
situacin puede simplificarse m ediante la introduccin de pseudocomponentes, definidos como
* ; /

con

X '

(11-26)

< 1. Entonces

+*2 "-- X 'p = 1

por lo que el uso de pseudocom ponentes perm ite utilizar diseos tipo simplex cuando las fronteras infe
riores form an parte de la situacin experimental. Las formulaciones especificadas p or el diseo simplex
p ara los pseudocom ponentes se transform an en formulaciones para los com ponentes originales invirtiendo la transform acin de la ecuacin 11-26. Es decir, si* 'e s el valor asignado al pseudocom ponente /-sim o en una de las corridas del experimento, el com ponente i-simo de la mezcla original es

*.-=/.+(i~

(u-27)

Cuando los com ponentes tienen restricciones tanto sobre la frontera superior como la inferior, la re
gin factible deja de ser un diseo simplex; ser, en cambio, un politopo irregular. Puesto que la regin
experim ental no tiene una form a estndar, los diseos generados por com putadora son muy tiles para
este tipo de problem as de mezclas.

EJEMPLO 1 1 * 4 ........................................................................................................................................................
Formulacin de una pintura
U n experim entador est intentando optim izar la formulacin de una pintura autom otriz de recubrim ien
to total. Se trata de productos complejos que tienen requerim ientos de desem peo muy especficos. El
cliente quiere, en particular, que la dureza Knoop exceda de 25 y que el porcentaje de slidos est abajo
de 30. El recubrim iento total es una m ezcla de tres com ponentes, que consiste en un m onm ero (Xj), un
entrelazador (x2) y una resina ( je3) . Existen restricciones sobre las proporciones de los componentes:
x 1 + x 2 + x 3 = 100
5 < jtj < 25
25 < x 2 < 40
50 < * 3 < 70
El resultado es la regin de experim entacin restringida ilustrada en la figura 11-36. Puesto que la regin
de inters no es simplex, se usar un diseo optimal D para este problem a. Suponiendo que posiblem ente
ambas respuestas sern m odeladas con un m odelo cuadrtico de una mezcla, el diseo optim al D ilustra-

480

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA


Monmero

25.00

Entrelazador

Resina

Figura 11-36 La regin experimental restringida para


el problema de la formulacin de la pintura del ejem
plo 11-4 (mostrada en la escala real del componente).

Tabla 11-14 Diseo optimal D para el problema de la formulacin de la


___________pintura del ejemplo 11-4_________________________
Orden
Monmero Entrelazador Resina Dureza Slidos
estndar Corrida
xx
x2
x3
y2
29
2
17.50
32.50
50.00
9.539
1
1
27.33
2
26
10.00
40.00
50.00
4
15.00
25.00
60.00
29.21
3
17
4
28
13
25.00
25.00
50.00
30.46
7
5.00
25.00
74.98
5
35
70.00
3
5.00
32.50
62.50
31
31.5
6
21
6
11.25
32.50
56.25
15.59
7
11
5.00
40.00
55.00
19.2
8
20
23.44
10
29
9
18.13
28.75
53.33
14
32.49
10
25
8.13
28.75
63.13
12
25.00
25.00
50.00
19
23.01
11
14
9
15.00
25.00
60.00
41.46
12
30
5
10.00
40.00
50.00
32.98
13
25.00
70.95
14
23
8
5.00
70.00

11-5 EXPERIMENTOS CON MEZCLAS


Tabla 11-15

481

Ajuste del modelo para la respuesta dureza

Response: hardness
ANOVA for Mixture Quadratic Model
Analysis of variance table [Partial sum of squares]
Sum of
Mean
DF
Square
Source
Squares
Model
279.73
5
55.95
Linear Mixture
29.13
2
14.56
1
72.61
AB
72.61
1
179.67
AC
179.67
BC
8.26
1
8.26
8
23.58
Residual
188.63
Lack o f Fit
63.63
4
15.91
Pure Error
125.00
4
31.25
Cor Total
468.36
13
Std. Dev.
Mean
C.V.
PRESS
Component
A-Monomer
B-Crosslinker
C-Resin
AB
AC
BC

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision

4.86
24.79
19.59
638.60
Coefficient
Estimate
23.81
16.40
29.45
44.42
-44.01
13.80

DF
1
1
1
1
1
1

Standard
Error
3.36
7.68
3.36
25.31
15.94
23.32

F
Value
2.37
0.62
3.08
7.62
0.35

Prob F
0.1329
0.5630
0.1174
0.0247
0.5703

0.51

0.7354

0.5973
0.3455
-0.3635
4.975
95% Cl
Low
16.07
-1.32
21.71
-13.95
-80.78
-39.97

95% Cl
High
31.55
34.12
37.19
102.80
-7.25
67.57

Final Equation In Terms of Pseudo Components:


hardness =
+23.81 * A
+ 16.40 * B
+29.45 * C
+44.42 * A * B
-44.01 * A * C
+ 13.80 * B * C

do en la figura 11-36 puede generarse utilizando Design-Expert. Se supuso que, adems de las seis corridas
requeridas p ara ajustar el m odelo cuadrtico de una mezcla, se haran cuatro corridas diferentes adicio
nales para verificar la falta de ajuste y que se haran rplicas de cuatro de estas corridas a fin de proporcio
n ar una estim acin del error puro. Design-Expert utiliz los vrtices, los centros en los bordes, el centroide
global y las corridas de verificacin (los puntos localizados a la m itad entre el centroide y los vrtices)
como los puntos candidatos.
El diseo con 14 corridas se m uestra en la tabla 11-14 junto con las respuestas dureza y slidos. Los re
sultados del ajuste de modelos cuadrticos para ambas respuestas se resumen en las tablas 11-15 y 11-16.
Observe que los modelos cuadrticos se ajustan muy bien tanto a la respuesta dureza como a la respuesta
slidos. E n estas tablas se m uestran las ecuaciones ajustadas para ambas respuestas (en trm inos de los
pseudocomponentes). E n las figuras 11-37 y 11-38 se m uestran las grficas de contorno de las respuestas.
L a figura 11-39 es una grfica de superposicin de las dos superficies de respuesta, donde se m uestra
el contorno de la dureza Knoop de 25% y el contorno de 30% para los slidos. La regin factible para este
producto es el rea sin som brear cerca del centro de la grfica. Evidentem ente, existen varias elecciones

Tabla 11-16

A juste del modelo para la respuesta slidos

Response: solids
ANOVA for Mixture Quadratic Model
Analysis of variance table [Partial sum of squares]
Mean
Sum of
DF
Square
Squares
Source
5
859.59
4297.94
Model
2
1465.66
2931.09
Linear Mixture
1
211.20
211.20
AB
1
285.67
285.67
AC
1
1036.72
1036.72
BC
8
33.35
266.79
Residual
4
34.98
139.92
Lack o f Fit
4
31.72
126.86
Pure Error
13
4564.73
Cor Total
Std. Dev.
Mean
C.V.
PRESS
Component
A-Monomer
B-Crosslinker
C-Resin
AB
AC
BC

R-Squared
Adj R-Squared
Pred R-Squared
Adeq Precision

5.77
33.01
17.49
991.86
Coefficient
Estimate
26.53
46.60
73.23
-75.76
-55.50
-154.61

DF
1
1
1
1
1
1

Standard
Error
3.99
9.14
3.99
30.11
18.96
27.73

Final Equation in Terms of Pseudo Components:


solids =
+26.53 * A
+46.60 * B
+73.23 * C
-75.76 * A * B
-55.50 * A * C
-154.61 * B * C
Mon mero

25.00

E n tr e n a d o r

Resina

Figura 11-37 Grfica de contorno de la respuesta dureza


Knoop, ejemplo 11-4.

F
Value
25.78
43.95
6.33
8.57
31.09

Prob > F
<0.0001
<0.0001
0.0360
0.0191
0.0005

1.10

0.4633

0.9416
0.9050
0.7827
15.075
95%CI
Low
17.32
25.53
64.02
-145.19
-99.22
-218.56

95% Cl
High
35.74
67.68
82.43
-6.34
-11.77
-90.67

11-5 EXPERIMENTOS CON MEZCLAS


Monmero
25.00

Entrelazador
Figura 11-38

Resina

Grfica de contorno de la respuesta slidos,

ejemplo 11-4.

Monmero
25.00

21

45.00
Entrelazador

5.00

70.00
Resina

Figura 11-39 Grfica de contorno de las respuestas dureza


Knoop y porcentaje de slidos, donde se indica la regin factible
para la formulacin de la pintura.

483

484

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

para las proporciones del m onm ero, el entrelazador y la resina para el recubrim iento total que redunda
r en un producto que satisfaga los requerim ientos de desempeo.

11-6

OPERACIN EVOLUTIVA

Personal de investigacin y desarrollo aplica con frecuencia la m etodologa de superficies de respuesta en


operaciones de plantas piloto. Cuando se aplica a un proceso de produccin a gran escala, suele hacerse
una sola vez (o con poca frecuencia), ya que el procedim iento experim ental es relativam ente minucioso.
Sin embargo, las condiciones que fueron ptimas para la planta piloto quiz no lo sean p ara el proceso a
gran escala. L a planta piloto puede producir 2 libras de producto p or da, m ientras que el proceso a gran
escala puede generar 2000 libras diarias. Esta escalacin de la planta piloto al proceso de produccin a
gran escala da por lo general como resultado la distorsin de las condiciones ptimas. Incluso si la planta
a gran escala em pieza a operar en el ptimo, con el tiem po se desva de ese punto debido a las variacio
nes en las m aterias primas, los cambios am bientales y el personal de operacin.
Se requiere un m todo para el m onitoreo y el m ejoram iento continuo de un proceso a gran escala
cuyo objetivo sea mover las condiciones de operacin hacia el ptim o o despus de una desviacin. El
m todo no deber requerir cambios grandes o repentinos de las condiciones de operacin que pudieran
interrum pir la produccin. L a operacin evolutiva (EVOP, por sus siglas en ingls) fue propuesta por Box
[12c] como un procedim iento de operacin con estas caractersticas. E st diseado como un m todo de
operacin rutinaria en la planta que lleva a cabo el personal de m anufactura con un mnimo de asistencia
del equipo de investigacin y desarrollo.
L a E V O P consiste en introducir de m anera sistem tica pequeos cam bios en los niveles de las va
riables de operacin bajo consideracin. G eneralm ente se em plea un diseo 2k p a ra hacer esto. Se su
pone que los cam bios de las variables son lo suficientem ente pequeos p ara que no ocurran
pertu rb acio n es serias en el rendim iento, la calidad o la cantidad, pero lo suficientem ente grandes
p ara descubrir en ltim a instancia m ejoras potenciales en el desem peo del proceso. Se colectan d a
tos de las variables de resp u esta de inters en cada pu n to del diseo 2k. C uando se h a hecho u n a o b
servacin en cada punto del diseo, se dice que se h a com pletado un ciclo. E ntonces pueden
calcularse los efectos y las interacciones de las variables del proceso. F inalm ente, despus de varios
ciclos, el efecto de una o m s variables del proceso o sus interacciones sobre la respuesta puede p a re
cer significativo. E n este pu n to se debe tom ar u n a decisin p a ra m odificar las condiciones de o p e ra
cin bsicas a fin de m ejo rar la respuesta. C uando se han detectado las condiciones m ejoradas, se
dice que se h a term inado u n a fase.
Para probar la significacin de las variables e interacciones del proceso, se necesita una estimacin
del error experimental. sta se calcula a partir de los datos del ciclo. Adems, el diseo 2k se centra por lo
general en torno a las mejores condiciones de operacin actuales. M ediante la com paracin de la res
puesta en este punto con los 2 k puntos de la porcin factorial, es posible verificar la curvatura o cambio en
la m edia (CIM , por sus siglas en ingls); es decir, si el proceso en realidad se centra en el mximo, por
ejemplo, entonces la respuesta en el centro deber ser significativamente mayor que las respuestas en los
puntos perifricos del diseo 2 k.
E n teora, la EV O P puede aplicarse a it variables del proceso. E n la prctica es com n considerar slo
dos o tres variables. Se presentar un ejemplo del procedim iento para dos variables. B oxy D raper [16a]
ofrecen un estudio detallado del caso de tres variables, incluyendo las formas y hojas de trabajo necesa
rias. Myers y M ontgom ery [85a] revisan la im plem entacin en com putadora de la EVOP.

11-6 OPERACIN EVOLUTIVA

485

84.9

84.3
150

145

M1
140
245

250
(F)

25 5

Figura 11-40 Un diseo 22para la EVOP.

EJEMPLO U - 5 ..................................................................................................................................
Considere un proceso qumico cuyo rendimiento es una funcin de la tem peratura (iq) y la presin (x2). Las
condiciones de operacin actuales sonxj = 250F y x 2 = 145 psi. El procedimiento EV O P utiliza el diseo 22
ms el punto central m ostrado en la figura 11-40. El ciclo se completa corriendo cada punto del diseo en
orden numrico (1,2,3,4,5). Los rendimientos del prim er ciclo se m uestran tambin en la figura 11-40.
Los rendim ientos del prim er ciclo se anotan en la hoja de clculo EVOP, la cual se m uestra en la ta
bla 11-17. Al trm ino del prim er ciclo no puede hacerse ninguna estim acin de la desviacin estndar.
Tabla 11-17 Hoja de clculo EVOP para el ejemplo 11-5, n = 1
3
Ciclo: n = 1
2 l
Respuesta: Rendimiento

5m 4

Condiciones de operacin
(i) Suma del ciclo anterior
(h) Promedio del ciclo anterior

(1)

(iit) Nuevas observaciones

84.5

Clculo de los promedios


(2)
(3)
(4)

84.2

84.9

84.5

Fase: 1
Fecha: 1/11/00
Clculo de la
desviacin
estndar
(5)

84.3

Suma anterior S =
Promedio anterior
5=
Nueva S = rango x

fix =
(iv) Diferencias [(t) - (i)]
(v) Nuevas sumas [(i) +_(iii)]
(vi) Nuevos promedios [y, = (v)/n]

84.5
84.5

84.2
84.2

84.9
84.9

Clculo de los efectos


Efecto de la temperatura = |( 3+ i - y 2 s) = 0.45

Rango de (v)=
Nueva suma S =
84.5
84.3
Nuevo promedio S 84.5
84.3
Nueva suma S
n- 1
Clculo de los lmites de error
Para el nuevo promedio = -y=S =
V

Efecto de la presin =
+ ; - 2 4) = 0.25
Efecto de la interaccin T x P = \(y 2 + y 3 4 5 ) = 0.15

Para los nuevos efectos =S =

Efecto del cambio en la media = } (2+ 3 +

1.78
Para el cambio en la media S =
v

+ 5 - \ l ) = 0.02

y/fl

486

CAPTULO 11

Tabla 11-18

5
2

MTODOS DE SUPERFICIES DE RESPUESTA

H oja de clculo EVOP para el ejemplo 11-5, n 2


.1

Ciclo: n 2
Respuesta: Rendimiento

3
4

Fase:1
Fecha: 1/11/00
Clculo de la
desviacin
estndar

Clculo de los promedios


Condiciones de operacin
(i) Suma del ciclo anterior
(t) Promedio del ciclo anterior
(iii) Nuevas observaciones
(iv) Diferencias [(t) - (iii)]
(v) Nuevas sumas [(i) + (iii)]
(vi) Nuevos promedios \y - (v)/n]

(1 )

(2 )

(3)

(4)

(5)

84.5
84.5
84.9

84.2
84.2
84.6

84.9
84.9
85.9

84.5
84.5
83.5

84.3
84.3
84.0

-0.4
169.4
84.70

-0.4
168.8
84.40

- 1.0
170.8
85.40

+ 1.0
168.0
84.00

Clculo de los efectos


Efecto de la temperatura = -j(_v3 +

y 2 ~y) = 0.43

Suma anterior S =
Promedio anterior S =
Nueva S = rango x
/ 5 = 0.60
0.3
Rango de (iv) = 2.0
168.3
Nueva suma S = 0.60
84.15 Nuevo promedio 5 =
Nueva suma S
,
0.60
n 1
Clculo de los lmites de error

Para el nuevo promedio =

= 0.85

Efecto de la presin =
+ y ~ y 2 4) = 0.58
Efecto de la interaccin T X P = \( 2 + 3 - A- y s) = 0.83

Para los nuevos efectos - j^ S 0.85

Efecto del cambio en la media = 7 ( 2 + 3 +


-0.17

1 78
Para el cambio en la media - 7 =-S = 0.76
V

+ y 5 4y ) =

Los efecto s y la in teracci n de la te m p e ra tu ra y la p resi n se calculan de la m an era usual p a ra u n di


seo 22.
D espus se corre un segundo ciclo y los datos del rendim iento se registran en o tra hoja de clculo
EVOP, la cual se m uestra en la tabla 11-18. Al final del segundo ciclo, el error experim ental puede esti
m arse y las estim aciones de los efectos pueden com pararse con lmites aproximados de 95% (dos desvia
ciones estndar). Observe que el rango se refiere al rango de las diferencias del rengln (iv); p or lo tanto,
el rango es +1.0 - (-1.0) = 2.0. Puesto que ninguno de los efectos de la tabla 11-18 excede sus lmites de
error, probablem ente el verdadero efecto sea cero, y no se contem plan modificaciones en las condiciones
de operacin.
E n la tabla 11-19 se m uestran los resultados de un tercer ciclo. A hora, el efecto de la presin excede
su lmite de erro r y el efecto de la tem peratura es igual al lmite de error. Probablem ente ahora se justifi
que un cambio en las condiciones de operacin.
A la luz de los resultados, parece razonable em pezar una nueva fase EV O P alrededor del punto (3).
Por lo tanto, x 1 = 225F y x 2 = 150 psi seran el centro del diseo 22 en la segunda fase.
U n aspecto im portante de la EV O P es la retroalim entacin de inform acin generada por el proceso
p ara operadores y supervisores. Esto se consigue m ediante un tablero con inform acin EV O P a la vista
de todos. E n la tabla 11-20 se m uestra el tablero de inform acin para este ejemplo al final del ciclo 3.

11-6 OPERACIN EVOLUTIVA


Tabla 11-19

487

H oja de clculo EVOP para el ejemplo 11-5, n = 3

Fase: 1
Fecha: 1/11/00
Clculo de la
desviacin
estndar

Ciclo: n = 3
Respuesta: Rendimiento

z i!]*

Clculo de los promedios


Condiciones de operacin
(i) Suma del ciclo anterior
() Promedio del ciclo anterior

(1)

(i) Nuevas observaciones


(v) Diferencias [() - (i)]
(v) Nuevas sumas [ ( 1) + ( i h ) ]
( v i ) Nuevos promedios \y = (v)/]

(3)

(2)

169.4
84.70

168.8
84.40

170.8
85.40

85.0

84.0

86.6

-0.30
254.4
84.80

+0.40
252.8
84.27

-1.20
257.4
85.80

Clculo de los efectos


Efecto de la temperatura =

(4)

(5)

168.3 Suma anterior S = 0.60


168.0
84.15 Promedio anterior S =
84.00
0.60
85.2 Nueva S = rango x
84.9
/*, = 0.56
-0.90
-1.05 Rango de (iv)= 1.60
252.9
253.5 Nueva suma S ~ 1,16
84.30
84.50 Nuevo promedio S =
Nueva suma S
-----------------= 0.58
n -1
Clculo de los lmites de error
Para el nuevo promedio =

+ y 4 y 2 y ) = 0.67

=0.67

Efecto de la presin = |( 3+ 5 - y 2 - y 4) = 0,87


Efecto de la interaccin T x. P = j (p 2 + 3 4 5)
0.64

2
Para los nuevos efectos =S = 0.67
V

Efecto del cambio en la media = y(2 + 3 + yt + 5 - 4y1 ) =


-0.07

1 78
Para el cambio en la m edia-W ,S = 0.60
Jn

labia 11-20 Tablero de informacin EVOJ ciclo 3


Respuesta:

Rendimiento porcentual

Requerimiento: Maximizar

Temperatura

Lmites de error para los promedios: 0.67


Temperatura
0.67
Efectos con
Presin
0.87
lmites de error
de 95%:
TxP
0.64
Cambio en la media
0.07
Desviacin estndar
0.58

0.67
0.67
0.67
0.60

488

CAPTULO 11

Tabla 11 '2 1

Valores de fk

il

0.30
0.24
0.23

9
10

MTODOS DE SUPERFICIES DE RESPUESTA

3
0.35
0.27
0.26

5
0.38
0.30
0.29

0.37
0.29
0.28

6
0.39
0.31
0.30

7
0.40

8
0.40

0.31
0.30

0.31
0.30

9
0.40
0.32
0.31

10
0.41
0.32
0.31

La m ayora de las cantidades de la hoja de clculo EV O P se obtienen directam ente del anlisis del di
seo factorial 2k. Por ejemplo, la varianza de cualquier efecto, como
+ y-y 2 - y 4), es sim plemente cr/n,
donde o 2 s la varianza de las observaciones (y). Por lo tanto, los lmites de error de dos desviaciones es
tndar (que corresponden a 95%) para cualquier efecto seran 2 a/V. La varianza del cambio en la m e
dia es
F (C IM ) = F
1

= 25

2 ^

(2 0 W 2

= (25) ^

Por lo tanto, los lmites de error de dos desviaciones estndar para el CIM son (2V20/25)o/V =
1.78 a/V.
La desviacin estndar a se estima por el m todo del rango. Sea quey,(ra) denote la observacin en el
punto del diseo i-simo en el ciclo n, y quey,(rc) denote el prom edio correspondiente dey,(n) despus de
n ciclos. Las cantidades del rengln (iv) de la hoja de clculo E V O P son las diferencias y(n) -y (n -l). La
varianza de estas diferencias es
1+ -

(n-1)

= a2

(n -1)

E l rango de las diferencias, por ejemplo RD, se relaciona con la estim acin de la desviacin estndar de las
diferencias p o r d D = R D/d2. El factor d 2 depende del nm ero de observaciones utilizadas p ara c a lc u la r ^ .
Entonces R D/d 2 = V?i/(n - 1 ) , por lo que puede usarse

para estim ar la desviacin estndar de las observaciones, donde k denota el nm ero de puntos que se uti
lizaron en el diseo. Para un diseo 22 con un punto central se tiene k = 5, y para un diseo 23 con un pun
to central se tiene k = 9. Los valores de f k se dan en la tabla 11-21.

11-7
11-7.1

DISEO ROBUSTO
Antecedentes

A lo largo de este libro se h a hecho hincapi en la im portancia del uso de experim entos diseados estads
ticam ente en el proyecto, desarrollo y m ejoram iento de productos y procesos. A partir de la dcada de
1980, los ingenieros y cientficos han adquirido la conciencia creciente de los beneficios del uso de experi-

11-7 DISEO ROBUSTO

489

m entos diseados y, en consecuencia, ha habido muchas reas de aplicaciones nuevas. U na de las ms im


p ortantes de stas es el diseo robusto, donde la atencin se centra en uno o ms de los siguientes puntos:
1. El diseo de sistemas (productos o procesos) que no sean sensibles a factores am bientales que
puedan afectar el desem peo u na vez que el sistema se ha desplegado en el campo. U n ejemplo
es la formulacin de una pintura para exteriores que debe tener gran duracin cuando se expo
nga a una variedad de condiciones climticas. Puesto que las condiciones climticas no son del
todo predecibles, y ciertam ente no son constantes, el responsable de la formulacin del producto
quiere que ste sea robusto contra un amplio rango de factores de tem peratura, hum edad y p re
cipitacin pluvial que afectan el desgaste y acabado de la pintura.
2. El diseo de productos para que no sean sensibles a la variabilidad transm itida por los com po
nentes del sistema. U n ejemplo es el diseo de un amplificador electrnico para que el voltaje de
salida est tan cerca como sea posible del valor nominal deseado, independientem ente de la va
riabilidad de los parm etros elctricos de los resistores, transistores y fuentes de poder que son
los com ponentes del aparato.
3. El diseo de procesos para que el producto m anufacturado est tan cerca como sea posible de las
especificaciones nominales, aun cuando sea imposible controlar con toda precisin algunas va
riables del proceso (como la tem peratura) o las caractersticas de las m aterias primas.
4. D eterm inar las condiciones de operacin de un proceso para que las caractersticas crticas del
producto estn tan cerca como sea posible del valor objetivo deseado y la variabilidad en torno a
este objetivo se minimice. Ejemplos de este tipo de problem a ocurren con frecuencia. U no de
ellos sucede en la m anufactura de semiconductores, donde sera deseable que el espesor del xi
do de una oblea estuviera lo ms cerca posible del espesor objetivo prom edio, as como que la va
riabilidad del espesor a lo largo de la oblea (una m edida de uniform idad) fuese lo ms pequea
posible.
A principios de la dcada de 1980, el ingeniero japons Genichi Taguchi introdujo un enfoque para
resolver problem as de este tipo, a los que se hace referencia de m anera conjunta como el problem a del di
seo paramtrico robusto (RPD, por sus siglas en ingls) (ver Taguchi y Wu [109] y Tguchi [108a, b]). Su
enfoque se bas en la clasificacin de las variables de un proceso o producto como variables de control (o
controlables) y variables de ruido (o no controlables) para despus encontrar los ajustes de las variables
controlables que minimizan la variabilidad transm itida a la respuesta por las variables no controlables. Se
establece el supuesto de que aun cuando los factores de ruido no son controlables en el sistema a gran es
cala, pueden controlarse para los fines de un experimento. Referirse a la figura 1-1 para una ilustracin
grfica de las variables controlables y no controlables en el contexto general de un experim ento diseado.
Taguchi introdujo algunos m todos estadsticos novedosos y ciertas variantes de las tcnicas estable
cidas como parte de este procedim iento RPD, Hizo uso de diseos factoriales altam ente fraccionados y
otros tipos de diseos fraccionados obtenidos a partir de arreglos ortogonales. Su m etodologa gener
m ltiples debates y controversias. Parte de la polm ica surgi porque la m etodologa de Tkguchi fue de
fendida en Occidente inicialmente (y principalm ente) por em presarios, y la ciencia estadstica subyacente
no haba sido revisada adecuadam ente por los especialistas. Para finales de la dcada de 1980, los resulta
dos de una revisin muy com pleta indicaron que aun cuando los conceptos de ingeniera de Tkguchi y el
objetivo global del R PD tenan bases slidas, haba problem as de fondo con esta estrategia experim ental
y con los m todos para el anlisis de datos. Para detalles especficos de estos temas, ver Box [12d], Box,
Bisgaard y Fung [14], H unter [59a, b], M ontgomery [80b], Myers y M ontgomery [85a] y Pignatiello y
Ram berg [94]. M uchas de estas preocupaciones se encuentran resumidas tam bin en el amplio panel de

490

Tabla 11-22 Diseo paramtrico con arreglos tanto interior como exterior
b ) Arreglo exterior
E
F
G

Corrida
1
2
3
4
5
6
7
8
9

1
1
1
2
2
2
3
3
3

a) Arreglo interior
B
C
1
1
2
2
3
3
1
2
2
3
3
1
1
3
2
1
3
2

1
1
1

1
1
2

1
2
1

1
2
2

2
1
1

2
1
2

2
2
1

2
2
2

15.6
15.0
16.3
18.3
19.7
16.2
16.4
14.2
16.1

9.5
16.2
16.7
17.4
18.6
16.3
19.1
15.6
19.9

16.9
19.4
19.1
18.9
19.4
20.0
18.4
15.1
19.3

19.9
19.2
15.6
18.6
25.1
19.8
23.6
16.8
17.3

19.6
19.7
22.6
21.0
25.6
14.7
16.8
17.8
23.1

19.6
19.8
18.2
18.9
21.4
19.6
18.6
19.6
22.7

20.0
24.2
23.3
23.2
27.5
22.5
24.3

19.1
21.9
20.4
24.7
25.3
24.7
21.6
24.2
28.6

1
2
3
3
1
2
2
3
1

23.2
22.6

11-7 DISEO ROBUSTO

491

discusin publicado en Technometrics (ver Nair, et al. [86]). E n el m aterial suplem entario del texto de este
captulo tam bin se com entan e ilustran muchos de los problem as implcitos en los m todos tcnicos de
Taguchi.
L a m etodologa de Tguchi para el problem a R PD gira en torno al uso de un diseo ortogonal para
los factores controlables, el cual se cruza con un diseo ortogonal separado para los factores de ruido.
E n la tabla 11-22 se presenta un ejemplo de Byrne y Taguchi [23] que trata del desarrollo de un m todo
para ensam blar un conector elastom trico en un tubo de nylon que producira la fuerza de separacin re
querida. Hay cuatro factores controlables, cada uno con tres niveles (A = interferencia, B espesor de la
pared del conector, C = profundidad de insercin y D = porcentaje de adhesivo), y tres factores de ruido
o no controlables (E = tiem po de acondicionam iento, F = tem peratura de acondicionam iento y G - hu
m edad relativa del acondicionam iento). El panel a de la tabla 11-22 contiene el diseo p ara los factores
controlables. Observe que se trata de un diseo factorial fraccionado de tres niveles; especficamente, es
un diseo 3*~2. Taguchi lo llam a el diseo de arreglo interior. El panel b de la tabla 11-22 contiene un dise
o 23 para los factores de ruido, al que Taguchi llama el diseo de arreglo exterior. Entonces se realiza
cada corrida del arreglo interior para todas las com binaciones de tratam ientos del arreglo exterior, pro
ducindose las 72 observaciones de la fuerza de separacin que se m uestran en la tabla. A este tipo de di
seo se le llam a diseo de arreglo cruzado.
Ihguchi sugiri que los datos de un experim ento de arreglo cruzado se resum ieran con dos estads
ticos: el prom edio de cada observacin en el arreglo interior p ara todas las corridas del arreglo exterior
y un resum en de estadsticas que intentaba com binar inform acin acerca de la m edia y la varianza, lla
m ado relacin seal a ruido. Las relaciones seal a ruido se definen a propsito p ara que un valor mxi
mo de la relacin m inim ice la variabilidad transm itida p o r las variables de ruido. E ntonces se lleva a
cabo un anlisis p ara d eterm inar cules son los ajustes de los factores controlables que dan com o resul
tado 1) u na m edia tan prxim a com o sea posible al objetivo deseado y 2) un valor mximo de la relacin
seal a ruido.
E l examen de la tabla 11-22 revela un problem a im portante con la estrategia de diseo de Tkguchi; a
saber, el enfoque del arreglo cruzado llevar a un experim ento muy grande. E n el ejem plo tratado aqu
slo hay siete factores, pero el diseo tiene 72 corridas. Adems, el diseo de arreglo interno es un diseo
de resolucin III (ver el captulo 9 p ara un estudio de este diseo), por lo que a pesar del gran nm ero
de corridas, no es posible obtener ninguna informacin acerca de las interacciones entre las variables con
trolables. D e hecho, incluso la inform acin acerca de los efectos principales est potencialm ente corrom
pida, ya que los efectos principales tienen estrechas relaciones de alias con las interacciones de dos
factores. O curre tam bin que las relaciones seal a ruido de Ictguchi son problem ticas; al maximizarse la
relacin no se minimiza necesariam ente la variabilidad. R eferirse al m aterial com plem entario del texto
para mayores detalles.
U n punto im portante acerca del diseo de arreglo cruzado es que s proporciona inform acin acerca
de las interacciones factor controlable x factor de ruido. Estas interacciones son cruciales p ara la solu
cin de un problem a R PD . Por ejemplo, considere las grficas de las interacciones de dos factores de la fi
gura 11-41, donde x es el factor controlable y z el factor de ruido. E n la figura 11-4la no hay ninguna
interaccin x x z; p or lo tanto, no hay ningn valor de la variable controlable x que afecte la variabilidad
transm itida a la respuesta por la variabilidad enz. Sin embargo, en la figura ll-41ft hay una fuerte interac
cin X X z. Observe que cuando x se pone en el nivel bajo, hay m ucho m enos variabilidad en la variable de
respuesta que cuandox est en el nivel alto. Por lo tanto, a m enos que haya como mnimo una interaccin
factor controlable x factor de ruido, no hay ningn problem a de diseo robusto. Como se ver en la si
guiente seccin, enfocarse en la identificacin y el m odelado de estas interacciones es una de las claves de
un enfoque ms eficiente y eficaz del RPD.

492

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Figura 11-41 El papel de la interaccin control X ruido en un diseo robusto.

11-7.2

El enfoque de la superficie de respuesta para el diseo robusto

Como se seal en la seccin anterior, las interacciones entre los factores controlables y los de ruido son
la clave en un problem a de diseo robusto. Por lo tanto, es lgico usar un modelo de respuesta que incluya
tanto a los factores controlables como a los factores de ruido y suS interacciones. Para ilustrar, suponga
que se tienen dos factores controlablesx 1 y x 2 y un solo factor de ruido z. Se supone que tanto los factores
controlables como el de ruido se expresan como las variables codificadas usuales (es decir, tienen su cen
tro en cero y tienen lmites inferior y superior a ). Si quiere considerarse un m odelo de prim er orden que
incluya las variables controlables, un m odelo lgico es
y = 0 + xx x + 2 x 2 + 12 x 1 x 2 + y Lz l + < 5 ^ ^ + 21 x 2 z, +e

(11-28)

Observe que este m odelo incluye los efectos principales de ambos factores controlables, su interaccin, el
efecto principal de la variable de ruido y las dos interacciones entre las variables controlables y la de rui
do. A este tipo de m odelo, el cual incorpora a las variables controlables y las de ruido, suele llam rsele
modelo de respuesta o de reaccin. Excepto cuando al menos uno de los coeficientes de regresin n y 21
sea diferente de cero, no habr ningn problem a de diseo robusto.
U na ventaja im portante del enfoque del m odelo de respuesta es que tanto los factores controlables
como los factores de ruido pueden colocarse en un solo diseo experimental; es decir, puede evitarse la
estructura de los arreglos interior y exterior del enfoque de Taguchi. Al diseo que contiene tanto los fac
tores controlables como los de ruido suele llam rsele diseo de arreglo combinado.
Como se seal anteriorm ente, se supone que las variables de ruido son aleatorias, aun cuando son
controlables para los fines de un experimento. Especficam ente, se supone que las variables de ruido es
tn expresadas en unidades codificadas, que tienen valor esperado cero, varianza o \ , y que si hay varias
variables de ruido, tienen covarianzas cero. Bajo estos supuestos es sencillo encontrar un m odelo p ara la
respuesta m edia tom ando el valor esperado de y en la ecuacin 11-28. Se obtiene as
a

l Xl ~^i X 2

l 2 Xl X 2

donde el subndice z del operador expectativa es un recordatorio para tom ar el valor esperado con respec
to a ambas variables aleatorias de la ecuacin 11-28, z x y e. Para encontrar un m odelo de la varianza de la

11-7 DISEO ROBUSTO

493

respuesta y se usa el enfoque de la transm isin del error. Prim ero, el m odelo de respuesta de la ecuacin
11-28 se expande en una serie de Taylor de prim er orden alrededor de z 1 = 0. Se obtiene as
y = y ~ v +^ ( z i - ) +R+
= o ~^~lXl "t" l X2
H Y

+ 11*1 +

i 2XlX2

2\X 2 )Z1 + R + C

donde R es el trm ino del residuo de la serie de Tylor. Como es comn en la prctica, se ignorar el t r
mino del residuo. A hora puede obtenerse la varianza d ey aplicando el operador varianza en esta ltima
expresin (sin R ). El m odelo para la varianza resultante es
Vz(y)=oliYi

+ n * i + 21*2

+ 2

D e nueva cuenta se ha usado el subndice z en el operador varianza como recordatorio de que tanto z 1
como e son variables aleatorias.
Se han derivado modelos simples para la m edia y la varianza de la variable de respuesta de inters.
Observe lo siguiente:
1. Los modelos de la m edia y la varianza incluyen nicamente las variables controlables. Esto signi
fica que es potencialm ente posible fijar las variables controlables para alcanzar un valor objetivo
de la m edia y minimizar la variabilidad transm itida por la variable de ruido.
2. Aun cuando en el m odelo de la varianza intervienen slo las variables controlables, incluye asi
mismo los coeficientes de regresin de la interaccin entre las variables controlables y la de ruido.
Es as como la variable de ruido influye en la respuesta.
3. El m odelo de la varianza es una funcin cuadrtica de las variables controlables.
4. E l m odelo de la varianza (dejando de lado o2) es slo el cuadrado de la pendiente del m odelo de
respuesta ajustado en la direccin de la variable de ruido.
Para dar un uso operacional a estos modelos sera necesario:
1. Realizar un experim ento y ajustar un m odelo de respuesta apropiado, tal como la ecuacin
11-28.
2. Sustituir los coeficientes de regresin desconocidos en los modelos de la m edia y la varianza con
sus estimaciones de mnimos cuadrados del m odelo de la respuesta o de reaccin, y sustituir la o2
del m odelo de la varianza con el cuadrado m edio de los residuales que se encontr cuando se
ajust el m odelo de respuesta.
3. O ptim izar los modelos de la m edia y la varianza utilizando los m todos estndares de optimiza
cin de respuestas m ltiples revisadas en la seccin 11-3.4.
Es muy sencillo generalizar estos resultados. Suponga que hay A:variables controlables y/"variables de
ruido. El m odelo de respuesta general que incluye estas variables se escribir como
z) = f ( x ) +h ( x , z ) +e

(11-29)

donde /(x ) es la porcin del m odelo que incluye slo las variables controlables y h(x, z) son los trm inos
que incluyen los efectos principales de los factores de ruido y las interacciones entre los factores controla
bles y los de ruido. D e m anera tpica, la estructura de h(x, z) es

494

CAPIT ILO 11

MTODOS DE SUPERFICIES DE RESPUESTA

r
z) = 2

y / 2/ + 2

1=1

ax iz i

L a estructura de/(x) depender de cul sea el tipo de m odelo que el experim entador considere apropiado
para las variables controlables. Las elecciones lgicas son el m odelo de prim er orden con interaccin y el
m odelo de segundo orden. Si se supone que las variables de ruido tienen m edia cero, varianza a 2 y covarianzas cero, y que las variables de ruido y los errores aleatorios e tienen covarianzas cero, entonces el m o
delo de la m edia p ara la respuesta es
U jK x, z)] = / ( x )
(11-30)
y el m odelo de la varianza para la respuesta es
2

dy(x, z)
dz;

+o2

(11-31)

Myers y M ontgom ery [85a] presentan una form a un tanto ms general de la ecuacin 11-31 basada en la
aplicacin directa de un operador de varianza condicional al m odelo de respuesta.

EJEMPLO 1 1 -6 ..................................................................................................................................
Para ilustrar el procedim iento anterior, considere nuevam ente el ejemplo 6-2 en el que se estudiaron cua
tro factores en un diseo factorial 24para investigar su efecto sobre la rapidez de filtracin de un producto
qumico. Se supondr que el factor A , la tem peratura, es difcil de controlar en el proceso a gran escala,
per que puede controlarse durante el experim ento (el cual se llev a cabo en una planta piloto). Los
otros tres factores, la presin (B), la concentracin (C) y la velocidad de agitacin (D), son fciles de con
trolar. Por lo tanto, el factor de ruido z 1 es la tem peratura, y las variables controlables*!, x 2 yx3 son la p re
sin, la concentracin y la velocidad de agitacin, respectivam ente. Puesto que tanto los factores
controlables como el factor de ruido estn en el mismo diseo, el diseo factorial 24 utilizado en este ex
perim ento es un ejemplo de un diseo de arreglo combinado.
Utilizando los resultados del ejemplo 6-2, el m odelo de respuesta es
^
( 21.625\
^9.875^
/l4.625'l
Xx, z 1) ~ 70.06+
Zj +
\x2 +
-

* V^

18.125^
/16.625\
2 J ^ Z l+ [ 2 H Zl
70.06+10.81Zj +4.94*2 + 7.31*3 9.06x2z 1+ 8.31x3z 1
Utilizando las ecuaciones ll- 3 0 y ll- 3 1 ,s e encuentra que los m odelos de la m edia y la varianza son
,[X*> z j ] = 70.06 + 4.94*2 +7.31 x 33
y
K W *. *1 )] (10-81 - 9.06*2 + 8.31*3 ) 2 + a 2
= cr2 (116.91 + 82.08*2 +69.06*3 -195.88*2
+179.66*3 -150.58tc2* 3 ) + o 2
respectivam ente. Suponga ahora que los niveles bajo y alto de la variable de ruido, tem peratura, se corrie
ron a una desviacin estndar a ambos lados de su valor tpico o prom edio, de tal m odo que o \ = 1, y que
se usa o'2 = 19.51 (ste es el cuadrado m edio de los residuales obtenido al ajustar el m odelo de respuesta).
Por lo tanto, el m odelo de la varianza queda como
V z [y(x, z ,) ] = 136.42-195.88*2 +179.66*3 -150.58x2* 3 +82.08*2 +69.06x32

11-7 DISEO ROBUSTO

495

xt - Velocidad de agitacin
Figura 11-42 Contornos del ndice de filtracin medio constante, ejemplo 11-6,
con x - temperatura = 0.

E n la figura 11-42 se presenta la grfica de contorno del paquete de software Design-Expert de los
contornos de respuesta del m odelo de la media. Para construir esta grfica se fij el factor de ruido (tem
p eratura) en cero y el factor controlable no significativo (presin) tam bin en cero. Observe que la rapi
dez de filtracin prom edio se increm enta cuando tanto la concentracin como la velocidad de agitacin
se increm entan. Design-Expert constituir tam bin de m anera autom tica grficas de la raz cuadrada de
los contornos de la varianza, que denom ina propagacin del e rro r (o PO E, por sus siglas en ingls). Evi
dentem ente, la P O E no es sino la desviacin estndar de la variabilidad que se transm ite a la respuesta
com o una funcin de las variables controlables. E n la figura 11-43 se m uestra la grfica de contorno y la
grfica de superficie de respuesta tridimensional de la PO E, obtenida con Design-Expert (en esta grfica
la variable de ruido se m antiene constante en cero, como se explic anteriorm ente).
Suponga que el experim entador quiere m antener una rapidez de filtracin prom edio de cerca de 75 y
minim izar la variabilidad alrededor de este valor. E n la figura 11-44 se m uestra una grfica de superposi
cin de los contornos de la rapidez de filtracin m edia y la P O E como una funcin de la concentracin y la
velocidad de agitacin, las variables controlables significativas. Para conseguir los objetivos deseados ser
necesario m antener la concentracin en el nivel alto y la velocidad de agitacin muy cerca del nivel inter
medio.

El ejemplo 11-6 ilustra el uso de un m odelo de prim er orden con interaccin como el m odelo para los
factores controlables,/(x). Se presenta ahora un ejem plo adaptado de M ontgom ery [80b] que incluye un
m odelo de segundo orden.

496

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

= Velocidad de agitacin
a) Grfica de contorno

6) Grfica de superficie de respuesta

Figura 11-43 Grfica de contorno y superficie de respuesta de la propagacin del error


(POE) en el ejemplo 11-6, con x, = tem peratura = 0.

11-7 DISEO ROBUSTO

497

Figura 11-44 Grfica de superposicin de los contornos de la media y la FOE del

ndice de filtracin, ejemplo 11-6, con x, = temperatura = 0.

EJEMPLO 1 1 - 7 ........................................................................................................................................................
En una fbrica de semiconductores se realiz un experimento que incluy dos variables controlables y tres
variables de ruido. E n la tabla 11-23 se m uestra el diseo de arreglo combinado utilizado por los experimen
tadores. El diseo es una variante de 23 corridas de un diseo central compuesto que se cre empezando
con un D C C estndar para cinco factores (la porcin del cubo es un diseo 25 ~) y eliminando las corridas
axiales asociadas con las tres variables de ruido. Este diseo soportar un modelo de respuesta que tiene un
modelo de segundo orden en las variables controlables, los efectos principales de las tres variables de ruido
y las interacciones entre los factores controlables y los de ruido. El modelo de respuesta ajustado es
%x, z) = 3 0 .3 7 - 2,92xx - 4.13x2 + 2.60xf +2.18x + 2.87x ix 2
+ 2.732! - 2.33z 2 + 2.33z3 - 0.27x 1z 1 +0.89x1z 2 +2.5&CjZ3
+ 2.01.*;^ -1 .4 3 x 2 z 2 +1.56;t2z 3
Los modelos de la m edia y la varianza son
E z[y(x, z)] = 3 0 .3 7 - 2.92^ - 4.13*2 + 2.60x2 + 2 1 8 x 2 + 2.87Xlx 2
y
V y(x, z)]= 19.26+3.20^ +12A5x 2 + 7.52*2 + 8.52*2 + 2 .2 1 ^ ^
donde se han sustituido las estimaciones de los parm etros del m odelo de respuesta ajustado en las ecua
ciones de los modelos de la m edia y la varianza y, como en el ejem plo anterior, se supone que a \ =1. En
las figuras 11-45 y 11-46 se presentan las grficas (de Design-Expert) de contorno de la m edia y la P O E del
proceso (recuerde que la P O E es la raz cuadrada de la varianza de la superficie de respuesta) generadas a
partir de estos modelos.

498

CAPTULO 11

MTODOS DE SUPERFICIES DE RESPUESTA

Tabla 11-23 Experimento de arreglo combinado con dos variables controlables y tres variables de ruido, ejemplo 11-7
Nmero de corrida
*2
^2
y
Z\
*3
1.00
1.00
44.2
1
-1.00
-1.00
-1.00
2
1.00
-1.00
-1.00
1.00
-1.00
30.0
-1.00
30.0
3
-1.00
1.00
-1.00
-1.00
-1.00
-1.00
1.00
35.4
4
1.00
1.00
49.8
-1.00
-1.00
1.00
-1.00
-1.00
5
1.00
36.3
6
1.00
-1.00
1.00
-1.00
1.00
-1.00
1.00
41.3
7
-1.00
1.00
31.4
1.00
1.00
-1.00
-1.00
8
1.00
43.5
-1.00
-1.00
-1.00
1.00
-1.00
9
1.00
36.1
10
1.00
-1.00
-1.00
1.00
1.00
1.00
22.7
11
-1.00
1.00
-1.00
-1.00
16.0
12
1.00
1.00
-1.00
1.00
1.00
1.00
43.2
13
-1.00
-1.00
1.00
1.00
1.00
-1.00
30.3
14
1.00
-1.00
30.1
1.00
1.00
1.00
-1.00
15
-1.00
39.2
1.00
1.00
1.00
1.00
1.00
16
0.00
0.00
0.00
46.1
17
-2.00
0.00
36.1
2.00
0.00
0.00
0.00
0.00
18
0.00
0.00
0.00
47.4
0.00
-2.00
19
2.00
0.00
0.00
0.00
31.5
20
0.00
0.00
30.8
0.00
0.00
0.00
0.00
21
0.00
0.00
30.7
22
0.00
0.00
0.00
0.00
0.00
0.00
31.0
23
0.00
0.00

Figura 11-45

Grfica de contorno del modelo de la media, ejemplo 11-7.

11-7 DISEO ROBUSTO

Figura 11-46 Grfica de contomo de la POE, ejemplo 11-7.

-1.00

-0.50

0.00

0.50

1.00

*1
Figura 11-47 Superposicin de los contornos de la media y la POE para el ejem
plo 11-7, con la regin en blanco indicando condiciones de operacin satisfactorias
para la media y la varianza.

499

500

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

E n este problem a es deseable m antener la m edia del proceso abajo de 30. Al inspeccionar las figuras
11-45 y 11-46, es claro que se necesitar hacer un ajuste si se quiere hacer pequea la varianza del proce
so. Puesto que slo hay dos variables controlables, una form a lgica de llegar a este arreglo es superponer
los contornos de la respuesta m edia constante y la varianza constante, como se m uestra en la figura 11-47.
E sta grfica m uestra los contornos para los que la m edia del proceso es m enor o igual que 30 y la desvia
cin estndar del proceso es m enor o igual que 5. L a regin delim itada por estos contornos representara
u na zona de operacin tpica de respuesta m edia baja y varianza del proceso baja.

11-8

PROBLEMAS

------------------------------------------------------------------------------------------

11-1. En una planta qumica se produce oxgeno licuando aire y separndolo por destilacin fraccionada en sus ga
ses componentes. La pureza del oxgeno es una funcin de la temperatura del condensador principal y de la
relacin de la presin entre las columnas superior e inferior. Las condiciones de operacin actuales son tem
peratura (I,) = -220C y la relacin de la presin ( | 2) = 1.2. Utilizando los datos siguientes, encontrar la tra
yectoria del ascenso ms pronunciado:
Tfemperatura (,) ndice de la presin (,) Pureza
-225
1.1
82.8
-225
1.3
83.5
-215
1.1
84.7
-215
1.3
85.0
1.2
84.1
-220
1.2
84.5
-220
1.2
83.9
-220
-220
1.2
84.3
11-2. Un ingeniero industrial ha desarrollado un modelo de simulacin por computadora para un sistema de in
ventario de dos artculos. Las variables de decisin son la cantidad del pedido y el punto de reorden de cada
artculo. La respuesta que debe minimizarse es el costo total del inventario. El modelo de simulacin se usa
para producir los datos que se muestran en la tabla siguiente. Identificar el diseo experimental. Encontrar
la trayectoria del descenso ms pronunciado.

Artculo 1

Artculo 2

Cantidad del
pedido (Ij)

Punto de
reorden ( |2)

Cantidad del
pedido ( |3)

100
140
140
140
100
100
100
140
120
120
120

25
45
25
25
45
45
25
45
35
35
35

250
250
300
250
300
250
300
300
275
275
275

Punto de
reorden ( |4)
40
40
40
80
40
80
80
80
60
60
60

Costo
total
625
670
663
654
648
634
692
686
680
674
681

11-8 PROBLEMAS

501

11-3. Verificar que el siguiente diseo es simplex. Ajustar el modelo d primer orden y encontrar la trayectoria del
ascenso ms pronunciado.

*1
0
-V 2
0
V2

x2
V2
0

-41
0

X3
-1
1

-1
1

18.5
19.8
17.4
22.5

11-4. Para el modelo de primer orden


y= 6 0 + 1 .5 ^ - 0.&t2 +2.0^3
encontrar la trayectoria del ascenso ms pronunciado. Las variables estn codificadas como -1. x 1.
11-5. La regin de experimentacin de tres factores son el tiempo (40 < Tl < 80 min), la temperatura (200 < T2 <
300C) y la presin (20 < P < 50 psig). Se ha ajustado un modelo de primer orden en variables codificadas a
los datos del rendimiento de un diseo 23. El modelo es
y= 30+5^

+ 2 .5 x 2 + 3 .5 * 3

El punto T = 85, T2 325, P = 60 est en la trayectoria del ascenso ms pronunciado?


11-6. La regin de experimentacin de dos factores son la temperatura (100 < T < 300F) y la velocidad de ali
mentacin del catalizador (10 < C < 30 lb/pulg). Un modelo de primer orden con las variables codificadas
usuales 1 se ha ajustado a la respuesta peso molecular, obtenindose el modelo siguiente:
y= 2000+125*, + 40x2
a) Encontrar la trayectoria del ascenso ms pronunciado.
b) Se desea mover a una regin donde los pesos moleculares rebasen 2500. Con base en la informacin que
se tiene por la experimentacin en esta regin, aproximadamente cuntos pasos en la trayectoria del as
censo ms pronunciado se necesitan para moverse a la regin de inters?
11-7. La trayectoria del ascenso ms pronunciado suele calcularse suponiendo que el modelo es en realidad de pri
mer orden; es decir, que no hay interaccin. Sin embargo, incluso si hay interaccin, el ascenso ms pronun
ciado que se determina ignorando la interaccin seguir produciendo por lo general buenos resultados. Para
ilustrar, suponga que se ha ajustado el modelo

y = 20+5jCj - &t2 +3*,*2


utilizando variables codificadas (-1 < x < +1).
a) Trazar la trayectoria del ascenso ms pronunciado que se obtendra si se ignorara la interaccin.
b) Trazar la trayectoria del ascenso ms pronunciado que se obtendra incluyendo la interaccin en el mo
delo. Compararla con la trayectoria que se encontr en el inciso a.
11-8. Los datos que se muestran en la siguiente tabla se recolectaron en un experimento para optimizar el creci
miento de un cristal como una funcin de tres variables Xj, *2y *3- Son deseables los valores grandes de y (ren
dimiento en gramos). Ajustar un modelo de segundo orden y analizar la superficie ajustada. Bajo qu
conjunto de condiciones se alcanza el crecimiento mximo?

502

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

*1
1
-1
-1
-1
1
1
1
1
-1.682
1.682
0
0
0
0
0
0
0
0
0
0

*2
-1
-1
1
1
-1
-1
1
1
0
0
-1.682
1.682
0
0
0
0
0
0
0
0

Xi
1
1
-1
1
1
1
-1
1
0
0
0
0
-1.682
1.682
0
0
0
0
0
0

y
66
70
78
60
80
70
100
75
100
80
68
63
65
82
113
100
118
88
100
85

11-9. Un ingeniero qumico recolect los siguientes datos. La respuesta y es el tiempo de filtracin, Xj es la tempe
ratura y x 2 es la presin. Ajustar un modelo de segundo orden.

Xl
-1
-1
1
1
-1.414
1.414
0
0
0
0
0
0
0

x2
-1
1
-1
1
0
0
-1.414
1.414
0
0
0
0
0

y
54
45
32
47
50
53
47
51
41
39
44
42
40

a) Qu condiciones de operacin se recomendaran si el objetivo es minimizar el tiempo de filtracin?


b) Qu condiciones de operacin se recomendaran si el objetivo es operar el proceso con una velocidad
de filtracin media muy prxima a 46?
1110. El diseo hexagonal que se presenta a continuacin se usa en un experimento que tiene como objetivo ajus
tar un modelo de segundo orden:

11-8 PROBLEMAS

X1
1
0.5
-0.5
-1
-0.5
0.5
0
0
0
0
0

503

y
68
74
65
60
63
70
58
60
57
55
69

*2
0
V75
V75
0
-V75
-v rfe
0
0
0
0
0

a)
b)
c)
d)

Ajustar el modelo de segundo orden.


Efectuar el anlisis cannico. Qu tipo de superficie se ha encontrado?
Qu condiciones de operacin para x t y xz llevan al punto estacionario?
Dnde se correra este proceso si el objetivo es obtener una respuesta que est tan cerca de 65 como sea
posible?
11-11. Un experimentador corri un diseo de Box-Behnken y obtuvo los siguientes resultados, donde la variable
de respuesta es la viscosidad de un polmero:

Nivel
Alto
Intermedio
Bajo

Tfemperatura
200
175
150

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Velocidad de
agitacin

Presin

10.0
7.5
5.0

25
20
15

-1
+1
-1
+1
-1
+1
-1
+1
0
0
0
0
0
0
0

*2
-1
-1
+1
+1
0
0
0
0
-1
+1
-1
+1
0
0
0

*3
0
0
0
0
-1
-1
+1
+1
-1
-1
+1
+1
0
0
0

yi
535
580
596
563
645
458
350
600
595
648
532
656
653
599
620

a) Ajustar el modelo de segundo orden.


b) Efectuar el anlisis cannico. Qu tipo de superficie se ha encontrado?

+1
0
-1

*2
+1
0
-1

*3
+1
0
-1

504

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

c) Qu condiciones de operacin para x t, x 2 y x 3 llevan al punto estacionario?


d ) Qu condiciones de operacin se recomendaran si es importante obtener una viscosidad que est tan
cerca de 600 como sea posible?
11-12. Considere el diseo central compuesto de tres variables que se muestra a continuacin. Analizar los datos y
sacar conclusiones, suponiendo que se quiere maximizar la conversin (yx) con la actividad (y2) entre 55 y 60.

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Tiempo
(min)
-1.000
1.000
-1.000
1.000
-1.000
1.000
-1.000
1.000
0.000
0.000
0.000
0.000
-1.682
1.682
0.000
0.000
0.000
0.000
0.000
0.000

Tfemperatura
(C)
-1.000
-1.000
1.000
1.000
-1.000
-1.000
1.000
1.000
0.000
0.000
0.000
0.000
0.000
0.000
-1.682
1.682
0.000
0.000
0.000
0.000

Catalizador
(%)
-1.000
-1.000
-1.000
-1.000
1.000
1.000
1.000
1.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
-1.682
1.682
0.000
0.000

Conversin
(%)

Actividad

yi

yi

74.00
51.00
88.00
70.00
71.00
90.00
66.00
97.00
81.00
75.00
76.00
83.00
76.00
79.00
85.00
97.00
55.00
81.00
80.00
91.00

53.20
62.90
53.40
62.60
57.30
67.90
59.80
67.80
59.20
60.40
59.10
60.60
59.10
65.90
60.00
60.70
57.40
63.20
60.80
58.90

11-13. Un fabricante de herramientas de corte ha desarrollado dos ecuaciones empricas para la vida de la herra
mienta en horas (yt) y para el costo de la herramienta en dlares (y2)- Ambos modelos son funciones lineales
de la dureza del acero (jq) y de la fecha de fabricacin (x2). Las dos ecuaciones son
% = 10 + 5 ; ^ + 2

y2 23 + 3 x + 4

x
x

2
2

y ambas ecuaciones son vlidas en el rango-1.5 <x < 1.5. El costo unitario de la herramienta debe estar aba
jo de $27.50 y la vida debe exceder 12 horas para que el producto sea competitivo. Existe algn conjunto de
condiciones de operacin factible para este proceso? Dnde se recomendara correr este proceso?
11-14. Se corre un diseo central compuesto en un proceso de deposicin qumica por vapor y se obtienen los datos
experimentales que se muestran a continuacin. Se procesaron simultneamente cuatro unidades experi
mentales en cada corrida del diseo, y las respuestas son la media y la varianza del espesor, calculadas en las
cuatro unidades.

11-8 PROBLEMAS

x2
-1
1
-1
1
1.414
-1.414
0
0
0
0
0
0

s2
6.689
14.230
7.088
8.586
13.130
6.644
7.649
11.740
7.836
9.306
7.956
9.127

y
360.6
445.2
412.1
601.7
518.0
411.4
497.6
397.6
530.6
495.4
510.2
487.3

-1
-1
1
1
0
0
1.414
-1.414
0
0
0
0

505

a)
b)
c)
d)

11-15.
11-16.
11-17.

11-18.

Ajustar un modelo a la respuesta media. Analizar los residuales.


Ajustar un modelo a la respuesta varianza. Analizar los residuales.
Ajustar un modelo a ln(2). Este modelo es superior al que se encontr en el inciso bl
Suponga que se quiere que el espesor medio est en el intervalo 450 25. Encontrar un conjunto de con
diciones de operacin que consiga este objetivo y que al mismo tiempo minimice la varianza.
e) Comentar los aspectos de la minimizacin de la varianza del inciso d. Se ha minimizado tambin la va
rianza total del proceso?
Verificar que el diseo de primer orden ortogonal es tambin un diseo de primer orden rotable.
Demostrar que aumentar un diseo 2k con ncpuntos centrales no afecta las estimaciones de/?, ( = 1,2.....k),
pero que la estimacin de la ordenada al origen 0 es el promedio de las 2 k + nc observaciones.
E diseo central compuesto rotable. Puede demostrarse que un diseo de segundo orden es rotable si
^!=ix uXbju = 0 si a o b (o ambas) son impares y si 2"=1x* = 32"_,x^xy. Demostrar que para el diseo central
compuesto estas condiciones llevan a a - (nF)m para la rotabilidad, donde nF es el nmero de puntos en la
porcin factorial.
Verificar que el diseo central compuesto que se muestra abajo est separado en bloques ortogonales:

X!
0
0
1
1
-1
-1

Bloque 1
x2
0
0
1
-1
-1
1

Bloque 3

Bloque 2
Xi
0
0
1
-1
1
-1

Xl
0
0
1
1
-1
-1

*2
0
0
1
-1
1
-1

*3
0
0
-1
1
1
-1

*1
-1.633
1.633
0
0
0
0
0
0

x2
0
0
-1.633
1.633
0
0
0
0

x3
0
0
0
0
-1.633
1.633
0
0

11-19. Formacin de bloques del diseo central compuesto. Considere un diseo central compuesto para k = 4 varia
bles en dos bloques. Puede encontrarse siempre un diseo rotable formado de bloques ortogonales?
11-20. Cmo puede correrse un diseo hexagonal en dos bloques ortogonales?

506

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

11-21. En la tabla siguiente se muestra el rendimiento durante los cuatro primeros ciclos de un proceso qumico.
Las variables son el porcentaje de concentracin (xj) en los niveles 30,31 y 32 y la temperatura (x2) en 140,
142 y 144F. Hacer el anlisis utilizando mtodos EVOP.
Condiciones
Ciclo
1
2
3
4

(1)
60.7
59.1
56.6
60.5

(2)
59.8
62.8
59.1
59.8

(3)

(4)

(5)

60.2
62.5
59.0
64.5

64.2
64.6
62.3
61.0

57.5
58.3
61.1
60.1

11-22. Suponga que se aproxima una superficie de respuesta con un modelo de orden dh tal como y = XjSj + e,
cuando la verdadera superficie est descrita por un modelo de orden d2> di, es decir, E(y) =
+ X/32a) Demostrar que los coeficientes de regresin son sesgados, es decir, que (& ) =
+ A2, donde A =
(X'jX^X'jXj. Es comn llamar a A la matriz alias.
b) Si dx = 1 y d 2 = 2, y se utiliza un diseo 2* completo para ajustar el modelo, usar el resultado del inciso a
para determinar la estructura de los alias.
c) Si dx = 1, d2 = 2 y k = 3, encontrar la estructura de los alias, suponiendo que se usa un diseo 23-1para
ajustar el modelo.
d) Si dx = 1, d 2 = 2 y k = 3, y se utiliza el diseo simplex del problema 11-3 para ajustar el modelo, determi
nar la estructura de los alias y comparar los resultados con el inciso c.
11-23. En un artculo (Conozcamos todos el cuadrado latino, en Quality Engineering, vol. 1, pp. 453-465), J.S.
Hunter ilustra algunos de los problemas asociados con los diseos factoriales fraccionados 3k-. El factor A
es la cantidad de etanol agregada a un combustible estndar y el factor B representa la relacin aire/com
bustible. La variable de respuesta es la emisin de monxido de carbono (CO) en g/m3. El diseo se mues
tra abajo:
Diseo
A
0
1
2
0
1
2
0
1
2

B
0
0
0
1
1
1
2
2
2

-1
0
+1
-1
0
+1
-1
0
+1

*2
-1
-1
-1
0
0
0
+1
+1
+1

Observaciones
y
66
78
90
72
80
75
68
66
60

62
81
94
67
81
78
66
69
58

Observe que se ha usado el sistema de notacin de 0,1 y 2 para representar los niveles bajo, intermedio y alto
de los factores. Se ha usado tambin una notacin geomtrica de -1,0 y +1. Se hacen dos rplicas de cada
corrida del diseo.
a) Verificar que el modelo de segundo orden
5>= 78.5-l-4.5x! - 7.0x2 - 4.5Xi2 - 4.0x - 9.0x,x 2
es un modelo razonable para este experimento* Ttazar los contornos de la concentracin de CO en el es
pacio Jtj, x2.

11-8 PROBLEMAS

507

b) Suponga ahora que en lugar de slo dos factores, se usaron cuatro factores en un diseo factorial frac
cionado S ^ y que se obtuvieron exactamente los mismos datos que en el inciso a. El diseo sera el si
guiente:
Diseo
A
0
1
2
0
1
2
0
1
2

B
0
0
0
1

1
1
2
2

C
0
1
2
2
0
1
1

D
0
1
2
1

-1
0
+1
-1
0
+1
-1
0
+1

2
0
2
0
1

2
0

Observaciones
x2
-1
-1
-1
0
0
0
+1
+1

+1

*3

X4

-1
0
+1
+1
-1
0
0
+1
-1

-1
0
+1
0
+1
-1
+1
-1
0

y
66
78
90
72
80
75
68
66
60

62
81
94
67
81
78
66
69
58

Confirmar que este diseo es un arreglo ortogonal L 9.


c) Calcular los promedios marginales de la respuesta CO en cada nivel de los cuatro factores^, B, CyD.
Construir grficas de estos promedios marginales e interpretar los resultados. Los factores C y D pare
cen tener efectos grandes? Estos factores tienen en realidad algn efecto sobre la emisin de CO? Por
qu su efecto aparente es grande?
d) El diseo del inciso b permite el ajuste del modelo
y= o + Z

uxf + e

1*1

1=1

Suponga que el verdadero modelo es


y= 0+ 2
i-1

i *i + 2

<1

+X 2
/< j

P i x ix j = E

Demostrar que si las j representan las estimaciones de mnimos cuadrados de los coeficientes del mode
lo ajustado, entonces
E(o ) = 0 ~ tf ~ u 34
% i)-i-(+ M

)/2

E { l ) = l ~ (l3 + u ^ u ) / 2
E i^i-in+ )/!
EC<)=<~(n+x)/2

E (h)= n-(*-V

E ( z i ) = 22 ~^(l3 ^ u * l * ) / 2

E{K )= n-{-n)H + u
E ( ) = u - ( n - x ) l 2 +
Ayuda esto a explicar los efectos grandes de los factores C y D que se observaron grficamente en el in
ciso c?

508

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

11-24. Suponga que es necesario disear un experimento para ajustar un modelo cuadrtico en la regin -1 < x <
+ 1, i = 1,2 sujeto a la restriccin + x2 < 1. Si se viola la restriccin, el proceso no funcionar adecuada
mente. No es posible hacer ms de n = 12 corridas. Establecer los siguientes diseos:
a) Un modelo DCC inscrito con punto central en
= x 2 = 0.
b ) Un diseo factorial 32 inscrito con punto central en x x = x 2 = -0.25.
c ) Un diseo optimal D .
d ) Un diseo optimal D modificado que sea idntico al del inciso c, pero con todas las rplicas de las corri
das en el centro del diseo.
e) Evaluar el criterio l(X'X)-1! para cada diseo.
f) Evaluar la eficiencia D para cada diseo en comparacin con el diseo optimal D del inciso c.
g) Qu diseo preferira el lector? Por qu?
11-25. Considere un diseo 23 para ajustar un modelo de primer orden.
a ) Evaluar el criterio D | (X'X)-11 para este diseo.
b) Evaluar el criterio A tr(X'X)'1 para este diseo.
c) Encontrar la varianza de prediccin escalada mxima para este diseo. Este diseo es optimal G?
11-26. Repetir el problema 11-25 utilizando un modelo de primer orden con las interacciones de dos factores.
11-27. Un ingeniero qumico desea ajustar una curva de calibracin para un nuevo procedimiento utilizado para
medir la concentracin de un ingrediente particular de un producto fabricado en sus instalaciones. Pueden
prepararse 12 muestras, cuya concentracin es conocida. El ingeniero quiere construir un modelo para las
concentraciones medidas. Piensa que una curva de calibracin lineal ser adecuada para modelar la concen
tracin medida como una funcin de las concentraciones conocidas; es decir, y = 0 +
+ e, donde x es la
concentracin real. Estn bajo consideracin cuatro diseos experimentales. El diseo 1 consta de seis corri
das con la concentracin conocida 1 y seis corridas con la concentracin conocida 10. El diseo 2 consta de
cuatro corridas con las concentraciones 1,5.5 y 10. El diseo 3 consta de tres corridas con las concentraciones
1,4,7 y 10. Por ltimo, el diseo 4 consta de tres corridas con las concentraciones 1 y 10 y seis corridas con la
concentracin 5.5.
a) Graficar la varianza de prediccin escalada para los cuatro diseos en la misma grfica en el rango de la
concentracin 1 < i 10. Qu diseo sera preferible?
b ) Calcular el determinante de (X'X)-1 para cada diseo. Qu diseo sera preferible de acuerdo con el
criterio D I
c ) Calcular Ja eficiencia D de cada diseo en comparacin con el mejor diseo que se haya encontrado en
el inciso b.
d ) Para cada diseo, calcular la varianza de prediccin promedio en el conjunto de puntos dado por* = 1,
1.5, 2, 2.5, ..., 10. Qu diseo sera preferible de acuerdo con el criterio V I
e) Calcular la eficiencia V de cada diseo en comparacin con el mejor diseo que se haya encontrado en el
inciso d.
f) Cul es la eficiencia G de cada diseo?
11-28. Resolver de nuevo el problema 11-27, suponiendo que el modelo que el ingeniero quiere ajustar es cuadrti
co. Evidentemente, ahora slo pueden considerarse los diseos 2, 3 y 4.
11-29. Un experimentador quiere correr un experimento de una mezcla de tres componentes. Las restricciones so
bre las proporciones de los componentes son las siguientes:
0.2 < ^ < 0 . 4
0.1 jc2 < 0.3
0.4 < x 2 < 0.7
a) Establecer un experimento para ajustar un modelo cuadrtico para mezclas. Usar n = 14 corridas, con
cuatro rplicas. Usar el criterio D.
b) Ttazar la regin experimental.

11-8 PROBLEMAS

509

c) Establecer un experimento para ajustar un modelo cuadrtico para mezclas con n = 12 corridas, supo
niendo que tres de estas corridas son rplicas. Usar el criterio D.
d) Comentar los dos diseos que se encontraron.
11-30. Myers y Montgomery [85a] describen un experimento con una mezcla de gasolina en el que intervienen tres
componentes de la mezcla. No hay restricciones sobre las proporciones de la mezcla, y se us el siguiente di
seo con 10 corridas:

Punto del diseo


1
2
3
4
5
6
7
8
9
10

X,

x2

*3

0
i

0
1
2

1
2
0
1
3
2
3
1

6
1
6

0
1
2
1
3

J_
6
2
3
1

1
0
1
2
1
2
1
3
1
6
1
6

2
3

y, mi/gal
24.5, 25.1
24.8, 23.9
22.7, 23.6
25.1
24.3
23.5
24.8,24.1
24.2
23.9
23.7

a) Qu tipo de diseo utilizaron los experimentadores?


b) Ajustar un modelo cuadrtico para mezclas a los datos. Es adecuado este modelo?
c) Graficar los contornos de la superficie de respuesta. Qu mezcla se recomendara para maximizar las
millas por galn?
11-31. Considere el experimento del llenado de las botellas del ejemplo 6-1. Suponga que el porcentaje de carbona
tacin (A) es una variable de ruido (en unidades codificadas <7* = 1).
a) Ajustar el modelo de respuesta a estos datos. Se trata de un problema de diseo robusto?
b) Encontrar el modelo de la media y el modelo de la varianza o bien la POE.
c) Encontrar un conjunto de condiciones que resulten en una desviacin del llenado promedio tan prxima
a cero como sea posible con varianza transmitida mnima.
11-32. Considere el experimento del problema 11-12. Suponga que la temperatura es una variable de ruido (al = 1
en unidades codificadas). Ajustar modelos de respuesta para las dos respuestas. Se trata de un problema de
diseo robusto con respecto a ambas respuestas? Encontrar un conjunto de condiciones que maximicen la
conversin con la actividad entre 55 y 60 y que minimice la variabilidad transmitida por la temperatura.
11-33. Se ha corrido un experimento en un proceso que aplica un material de recubrimiento a una oblea. En cada
corrida del experimento se fabric una oblea y se midi varias veces el espesor del recubrimiento en varios si
tios de la misma. Despus se obtuvo la media y! y la desviacin estndar y2de la medicin del espesor. Los da
tos (adaptados de Box y Draper [16b]) se muestran en la tabla siguiente:

Corrida
1
2
3
4
5
6
7

Velocidad
-1.000
0.000
1.000
-1.000
0.000
1.000
-1.000

Presin
-1.000
-1.000
-1.000
0.000
0.000
0.000
1.000

Distancia
-1.000
-1.000
-1.000
-1.000
-1.000
-1.000
-1.000

Media
y
24.0
120.3
213.7
86.0
136.6
340.7
112.3

Desviacin estndar
y2
12.5
8.4
42.8
3.5
80.4
16.2
27.6

510

CAPTULO 11 MTODOS DE SUPERFICIES DE RESPUESTA

Corrida
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

Velocidad
0.000
1.000
-1.000
0.000
1.000
-1.000
0.000
1.000
-1.000
0.000
1.000
-1.000
0.000
1.000
-1.000
0.000
1.000
-1.000
0.000
1.000

Presin
1.000
1.000
-1.000
-1.000
-1.000
0.000
0.000
0.000
1.000
1.000
1.000
-1.000
-1.000
-1.000
0.000
0.000
0.000
1.000
1.000
1.000

Distancia
-1.000
-1.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
0.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000
1.000

Media

Desviacin estndar

y\
256.3
271.7
81.0
101.7
357.0
171.3
372.0
501.7
264.0
427.0
730.7
220.7
239.7
422.0
199.0
485.3
673.7
176.7
501.0
1010.0

yi
4.6
23.6
0.0
17.7
32.9
15.0
0.0
92.5
63.5
88.6
21.1
133.8
23.5
18.5
29.4
44.7
158.2
55.5
138.9
142.4

a) Qu tipo de diseo utilizaron los experimentadores? Es sta una buena eleccin del diseo para ajus
tar un modelo cuadrtico?
b) Construir los modelos para ambas respuestas.
c) Encontrar un conjunto de condiciones ptimas que resulten en una media tan grande como sea posible
con la desviacin estndar menor que 60.
11-34. Una variacin del ejemplo 6-2. En el ejemplo 6-2 se encontr que una de las variables del proceso (B = pre
sin) no era importante. Al eliminar esta variable se producen dos rplicas de un diseo 23. Los datos se
muestran enseguida:
C

+
+

A(+)
45,48
68,80
43,45
75,70

A ir )
71,65
60,65
100,104
86,96

y
57.75
68.25
73.00
81.75

s2
121.19
72.25
1124.67
134.92

Suponer que C y D son factores controlables y que A es una variable de ruido.


a) Ajustar un modelo para la respuesta media.
b) Ajustar un modelo para la respuesta ln(s2).
c) Encontrar las condiciones de operacin que resulten en la respuesta de rapidez de filtracin media que
exceda 75 con varianza mnima.
d) Comparar los resultados obtenidos con los del ejemplo 11-6, en el que se aplic el enfoque de la transmi
sin del error. Hasta qu punto son similares las dos respuestas?

Experimentos
con factores

A lo largo de gran parte de este libro se ha supuesto que los factores de un experim ento son factores fos,
es decir, los niveles de los factores usados por el experim entador son los niveles de inters especfico. La
implicacin de esto es, desde luego, que las inferencias estadsticas que se hacen acerca de estos factores
se restringen a los niveles especficos estudiados. Es decir, si se investigan tres tipos de m ateriales, como
en el experim ento de la vida de la b atera del ejem plo 5-1, las conclusiones slo son vlidas p ara esos ti
pos especficos de materiales. U na variante de esto ocurre cuando el factor o factores son cuantitativos.
E n estas situaciones, con frecuencia se usa un m odelo de regresin que relaciona la respuesta con los fac
tores para predecir la respuesta en la regin que abarcan los niveles de los factores usados en el diseo ex
perim ental. Varios ejemplos de esto se presentaron en los captulos 5 al 9. E n general, cuando se trabaja
con un efecto fijo, se dice que el espacio inferencial del experim ento es el conjunto especfico de los nive
les de los factores investigados.
E n algunas situaciones experim entales, los niveles de los factores se eligen al azar de una poblacin
ms grande de niveles posibles, y el experim entador quiere sacar conclusiones acerca de la poblacin
com pleta de los niveles, no slo de los que se usaron en el diseo experim ental. E n esta situacin se dice
que se trata de un factor aleatorio. Se em pieza con una situacin simple, un experim ento con un solo fac
to r en el que el factor es aleatorio y se usa esto p ara introducir el modelo de efectos aleatorios para el an
lisis de varianza y los com ponentes de la varianza. Los factores aleatorios ocurren tam bin norm alm ente
en experim entos factoriales, as como en otros tipos de experimentos. E ste captulo se enfoca en los m to
dos p ara el diseo y anlisis de experim entos factoriales con factores aleatorios. E n el captulo 13 se p re
sentarn los diseos anidados y de parcelas subdivididas, dos situaciones en las que es frecuente
encontrar factores aleatorios en la prctica.

12-1

MODELO CON EFECTOS ALEATORIOS

Es comn que un experim entador est interesado en un factor que tiene un gran nm ero de posibles nive
les. Cuando el experim entador selecciona aleatoriam ente a de estos niveles de la poblacin de los niveles
del factor, entonces se dice que el factor es aleatorio. Puesto que los niveles del factor utilizados realm ente
en el experimento se eligieron al azar, se hacen inferencias acerca de la poblacin completa de los niveles
del factor. Se supone que la poblacin de los niveles del factor es de tam ao infinito o bien lo suficientemen

511

512

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

te grande para considerarla infinita. No es frecuente encontrar situaciones en las que la poblacin de los ni
veles del factor sea lo suficientemente pequea para emplear el enfoque de una poblacin finita. Referirse
a Bennett y Franklin [9] y Searle y Fawcett [101] para una revisin del caso de una poblacin finita.
El modelo estadstico lineal es
i = 1 , 2,
a
(12-1)
yJ= l i + r ,.+ f# j = 1 , 2 ,
n
donde tanto r l como son variables aleatorias. Si t tiene varianza a 2 y es independiente de e } la varianza
de cualquier observacin es
V(yii) = ^ + 2
A las varianzas a 2 y a 2 se les llama los componentes de la varianza, y al modelo (ecuacin 12-1) se le llama
modelo de efectos aleatorios o de los componentes de la varianza. Para probar hiptesis en este modelo se
requiere que las { e } sean NID(0, a2), que las {r} sean NID(0, a] ),y que z y ,,sean independientes.1
La suma de cuadrados identidad
( 12 -2 )

SST 55Xrataillieiitos +SSE

sigue siendo vlida. Es decir, se hace la particin de la variabilidad total en las observaciones en un com
ponente que mide la variacin entre los tratamientos (S^Ttatamiemos) y un componente que mide la variacin
dentro de los tratamientos (SSF). Probar hiptesis acerca de los efectos de tratamientos individuales no
tiene sentido, por lo que en su lugar se prueban hiptesis acerca del componente de la varianza a 2:
H , :ar li
'2

(12-3)

>0

Si o 2 = 0, todos los tratamientos son idnticos; pero si o 2 > 0, existe variabilidad entre los tratamientos.
Como anteriormente, SSJ a 2 se distribuye como ji-cuadrada con N - a grados de libertad y, bajo la hipte
sis nula, Salvamientos/02 se distribuye como ji-cuadrada con a - l grados de libertad. Ambas variables alea
torias son independientes. Por lo tanto, bajo la hiptesis nula o 2 = 0, el cociente
S S Tratamientos

F0=-

a-
SSr
N -a

MS-rTratamientos

(12-4)

MSC

se distribuye como i 7 con a - 1 y N - a grados de libertad. Sin embargo, es necesario examinar los cuadra
dos medios esperados para tener la descripcin completa del procedimiento de prueba.
Considere
E(MS Tratamientos ) = - - ( S S
a-l
1
E
a-l

Tratamientos

/ h
>=) V/=i

l
)= a -l
\ -i / fl n_
=1

;=!

Cuando se eleva al cuadrado y se toma la funcin esperanza de las cantidades entre corchetes, se observa
que los trminos que incluyen a r 2 son reemplazados pora 2 como(r) = 0. Adems, los trminos que in1 El supuesto de que las {r,} son variables aleatorias independientes implica que el supuesto usual de que S1 r, = 0 del modelo de
efectos fijos no se aplica al modelo de efectos aleatorios.

12-1 MODELO CON EFECTOS ALEATORIOS

513

cluyen a 2 , e 2 y
son reemplazados por no2, ano2 y an2o 2, respectivamente. Por otra parte, to
dos los productos cruzados que incluyen a r y tienen valor esperado cero. Esto lleva a

o
(12-5)
De manera similar, puede demostrarse que
E(MSe ) =

(12-6)

o2

Por los cuadrados medios esperados, se observa que bajo H0 tanto el numerador como el denominador del estadstico de prueba (ecuacin 12-4) son estimadores insesgados de o2, mientras que bajo H1el
valor esperado del numerador es mayor que el valor esperado del denominador. Por lo tanto, H0 deber
rechazarse para los valores de F0 que sean muy grandes. Esto implica una regin crtica de una cola supe
rior, por lo que H0 se rechaza si F0 > Faa_ UN_.
El procedimiento de clculo y el anlisis de la tabla de varianza del modelo de efectos aleatorios son
idnticos a los que se utilizaron en el caso de efectos fijos. Sin embargo, las conclusiones son muy diferen
tes, ya que se aplican a la poblacin completa de los tratamientos.
Por lo general habr inters en estimar los componentes de la varianza (o2 y o 2) del modelo. Al pro
cedimiento que se usa para estimar o2y o 2 se le llama mtodo del anlisis de varianza, ya que hace uso de
las lneas de la tabla del anlisis de varianza. El procedimiento consiste en igualar los cuadrados medios
esperados con sus valores observados en la tabla del anlisis de varianza y despejar los componentes de la
varianza. Al igualar los cuadrados medios observados con los esperados en el modelo de efectos aleato
rios con un solo factor, se obtiene

(12-7)

(12-8)

n
Para tamaos de las muestras desiguales, se reemplaza n en la ecuacin 12-8 con
a

(12-9)

En el mtodo del anlisis de varianza para estimar los componentes de la varianza no se requiere el
supuesto de normalidad. Produce estimadores de o2y o 2%que son los mejores estimadores cuadrticos insesgados (es decir, de todas las funciones cuadrticas insesgadas de las observaciones, estos estimadores
tienen mnima varianza).

514

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Ocasionalmente, el mtodo del anlisis de varianza produce una estimacin negativa de uno de los
componentes de la varianza. Evidentemente, los componentes de la varianza son por definicin no nega
tivos, por lo que la estimacin negativa de un componente de la varianza se considera con cierta preocu
pacin, Un curso de accin es aceptar la estimacin y usarla como evidencia de que el verdadero valor del
componente de la varianza es cero, suponiendo que la variacin muestral llev a la estimacin negativa.
Esto tiene un atractivo intuitivo, pero adolece de algunas dificultades tericas. Por ejemplo, usar cero en
lugar de la estimacin negativa puede alterar las propiedades estadsticas de otras estimaciones. Otra al
ternativa es volver a estimar el componente de la varianza negativa utilizando un mtodo que produzca
siempre estimaciones no negativas. Una alternativa ms es considerar la estimacin negativa como evi
dencia de que el modelo lineal supuesto es incorrecto y examinar de nuevo el problema. El tratamiento
completo de la estimacin de los componentes de la varianza se ofrece en Searle [99a, b], Searle, Casella y
McCullogh [100] y Burdick y Graybill [22].

EJEMPLO 1 2 -1 ..................................................................................................................................
Una compaa textil fabrica un tejido en un gran nmero de telares. Le gustara que los telares fueran ho
mogneos a fin de obtener un tejido de resistencia uniforme. El ingeniero del proceso sospecha que, ade
ms de la variacin usual de la resistencia dentro de las muestras del tejido del mismo telar, puede haber
tambin variaciones significativas en la resistencia entre un telar y otro. Para investigar esta posibilidad, el
ingeniero selecciona cuatro telares al azar y hace cuatro determinaciones de la resistencia del tejido fabri
cado en cada telar. Este experimento se corre de manera aleatoria, y los datos obtenidos se muestran en la
tabla 12-1. Se realiza el anlisis de varianza, el cual se muestra en la tabla 12-2. Por el anlisis de varianza
se concluye que los telares de la planta difieren significativamente.
Los componentes de la varianza se estiman con d 2 = 1.90 y
2 M 3 ^ 9 0 = 6 96
4
Por lo tanto, la varianza de cualquier observacin de la resistencia se estima con
r = d 2 + =1.90+6.96=8.86.
La mayor parte de esta variabilidad es atribuible a las diferencias entre los telares.

Este ejemplo ilustra un uso importante de los componentes de la varianza: la separacin de las dife
rentes fuentes de variabilidad que afectan un producto o sistema. El problema de la variabilidad de un
producto se presenta co frecuencia en el control de calidad, y en muchas ocasiones es difcil aislar las

T a b la 1 2 - 1

Tfelares
1
2

3
4

D a t o s d e l a r e s is t e n c ia d e l e je m p lo 1 2 - 1

98
91
96
95

Observaciones
3
2
99
97
93
90
97
95
99
96

4
96
92
95
98

y,

390
366
383
388
1527 =y_

12-1 MODELO C O N EFECTOS ALEATORIOS

Tabla 12-2

515

Anlisis de varianza de los datos de la resistencia

Fuente de
variacin
Ifelares
Error
Total

Suma de
cuadrados
89.19
22.75
111.94

Grados de
libertad
3
12

Cuadrado
medio
29.73
1.90

F0
15.68

Valor P
< 0.001

15

fuentes de la variabilidad. Por ejemplo, este estudio puede haber sido motivado por una gran variabilidad
en la resistencia del tejido, como se ilustra en la figura 12-1a. En esta grfica se presenta la salida del pro
ceso (resistencia del tejido) modelado como una distribucin normal con varianza 2 = 8 .86 . (sta es la
estimacin de la varianza de cualquier observacin de la resistencia del ejemplo 12-1.) Las especificacio
nes superior e inferior de la resistencia se muestran tambin en la figura 1 2 -la, y es relativamente inme
diato ver que una proporcin bastante grande de la salida del proceso se sale de las especificaciones (las
reas sombreadas de las colas de la figura 12-la). El ingeniero del proceso se ha preguntado por qu es
tan grande la cantidad de tejido defectuoso que debe desecharse, reelaborarse o degradarse a un produc
to de menor calidad. La respuesta es que la mayor parte de la variabilidad de la resistencia del producto es
el resultado de las diferencias entre los telares. El desempeo irregular de los telares podra ser el resulta
do de una instalacin incorrecta, un mantenimiento deficiente, una supervisin ineficaz, operadores sin
la capacitacin suficiente, fibra de entrada defectuosa, etctera.
El ingeniero del proceso debe intentar ahora aislar las causas especficas de la diferencia en el desem
peo de los telares. Si pudiera identificar y eliminar estas fuentes de variabilidad entre los telares, sera
posible reducir considerablemente la varianza de la salida del proceso, quiz hasta 2y = 1.90, la estima
cin del componente de la varianza dentro del telar (error) en el ejemplo 12-1. En la figura 12-16 se mues
tra la distribucin normal de la resistencia de la fibra con 2 = 1.90. Observe que la proporcin del
producto defectuoso en la salida se ha reducido radicalmente. Aun cuando es improbable que pueda eli
minarse toda la variabilidad entre los telares, es claro que una reduccin significativa en este componente
de la varianza incrementara sensiblemente la calidad de la fibra producida.

LS (especificacin inferior)

US (especificacin superior)

a ) Variabilidad de la salida del proceso.

6) Variabilidad de la salida del proceso ei a 2 =0.

Figura 12-1 Salida del proceso en el problema de la


resistencia de la fibra.

516

CAPTULO 12

EXPERIMENTOS CON FACTORES ALEATORIOS

Es sencillo encontrar un intervalo de confianza para el componente de la varianza o2. Si las observa
ciones siguen una distribucin normal e independiente, entonces (N~a)MSE/a1 se distribuye como xlt~aPor lo tanto,
(.N - a ) M S E
y
<
Xa 2tN ~ a = 1 - a
Al-(a/2),JV-0

y un intervalo de confianza de

- a) por ciento para o2 es


(N-a)M SE
^ {N-a)M SE

10 0 (1

Xa/2,A

( 12-10)

Xi-

Considere ahora el componente de la varianza o 2. El estimador puntual de o] es


M S E

^ ^Tratamientos

La variable aleatoria (a - l)AfSlhltlimiBnt0!/(<72 + na] ) se distribuye como %2a^ , y ( N - ^ M S J o 2 se distribuye


como %2N_aPor 1 tanto, la distribucin de probabilidad de & 2 es una combinacin lineal de dos variables
aleatorias ji-cuadrada, por ejemplo
UlXa-l

U Xn-

donde
a 2 +na\
n(a - 1 )

n(N-a)

Desafortunadamente, no puede obtenerse una expresin predeterminada para la distribucin de esta


combinacin lineal de variables aleatorias ji-cuadrada. Por lo tanto, no es posible construir un intervalo
de confianza exacto para a 2. En Graybill [50] y Serle [99a] se presentan procedimientos aproximados.
Ver tambin la seccin 12-7.
Es sencillo encontrar una expresin exacta para un intervalo de confianza del cociente o 2J ( a ] + 2).
Se trata de un cociente con significado, ya que refleja la proporcin de la varianza de una observacin [re
cuerde que V(yj) == a] + cr2] que es el resultado de las diferencias entre los tratamientos. Para desarrollar
este intervalo de confianza en el caso de un diseo balanceado, observe que MSTtataBBlttosy MS son varia
bles aleatorias independientes y, adems, que puede demostrarse que
MSt

/ ( n o 2t + o 2)
MS f o

~F
1 al , N a

Por lo tanto,
MS Tratamientos
mse

no: + a

< Fa / 2 , a - l , N - = 1 - a

(12-11)

Al reordenar la ecuacin 12-11, puede obtenerse la siguiente expresin:


(12-12)

\= l-a
donde
L - -1
n

MS Tratam ientos

-1
a /2 ,a l tN - a

(12-13a)

12-2 DISEO FACTORIAL DE DOS FACTORES ALEATORIOS

MS Tratamientos

mse

1 l- a /2 ,a - l,N - a

517

(12-13b)

Observe que L y U son los lmites de confianza inferior y superior del intervalo 100(1 - a) por ciento, res
pectivamente, del cociente a \ /o2. Por lo tanto, un intervalo de confianza de 100(1 - a) por ciento para
a\(a\ + o2) es
1

+L

U
1+u

al + j 2

(12-14)

Para ilustrar este procedimiento, se encontrar un intervalo de confianza de 95% de a 2J ( a 2 + o2)


para los datos de la resistencia del ejemplo 12-1. Recuerde que
= 29.73, MSE = 1.90, a = 4, n
= 4,F 0025 3ii2 = 4A7yF0975 3 12 = VF00 2 5 U ,3 = 1/14.34 = 0.070. Por lo tanto, por las ecuaciones 12-13 y fc,
(2 9 .7 3 \(

4
U=

= 0.625

-1

1.90 A4.47
29.73V 1
1.90 A 0.070

-1

= 54.883

y por la ecuacin 12-12, el intervalo de confianza de 95% para o 2/(a 2 + a2) es


0.625
1.625: a l + o 2

0.39^

al + a 2

54.883
55.883

<0.98

Se concluye que la variabilidad entre los telares explica entre 39 y 98% de la varianza en la resistencia ob
servada del tejido producido. Este intervalo de confianza es relativamente ancho debido al tamao pe
queo de la muestra que se us en el experimento. Sin embargo, es evidente que la variabilidad entre los
telares (a 2) no es insignificante.

12-2

DISEO FACTORIAL DE DOS FACTORES ALEATORIOS

Suponga que se tienen dos factores, A y B, y que ambos tienen un gran nmero de niveles de inters
(como en la seccin anterior, se supondr que el nmero de niveles es infinito). Se escogern al azar a ni
veles del factor^ y b niveles del factor B, y estos niveles de los factores se incluirn en un diseo experi
mental factorial. Si el experimento se hace con n rplicas, las observaciones pueden representarse con el
modelo lineal
y,rn = ^ i + j H t l j

z = l, 2 , ..., a
/ = 1, 2 , ..., b
[fc = l, 2 , ..., n

(12-15)

donde todos los parmetros del modelo, r p(x)y ljk, son variables aleatorias independientes. Tambin
se supondr que las variables aleatorias t p(r/?)/yy ei
jksiguen una distribucin normal con media cero y

518

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

varianzas dadas por V(t) = a \ , V(j) = a 2, V\(z)tj\ = a\ y V(sijk) = a2. Por lo tanto, la varianza de cual
quier observacin es
v (yyk) = a + <j ] + a e+ <j2
(12-16)
y a 2r , a 2 , a\ y o2 son los componentes de la varianza. Las hiptesis que quieren probarse soni?Q:aJ = 0,
H0:o2p = 0 y H0:a2x = 0 . Observe la similitud con el modelo de efectos aleatorios de un solo factor.
Los clculos numricos del anlisis de varianza se mantienen sin cambios; es decir, SSA, SSB, 55^ , SST
y SSEse calculan como en el caso de efectos fijos. Sin embargo, para formar los estadsticos de prueba, de
ben examinarse los cuadrados medios esperados. Puede demostrarse que
E(MSA) = a 2 + n 4 +bn 2r
E(MSg ) = a 2 +no\ +ana2

E(MS ab ) = a 2 + n a 2

(12-17)

E(MSe ) =

o2

Por los cuadrados medios esperados se observa que el estadstico apropiado para probar la hiptesis
de que no hay interaccin, H^.a2x = 0 , es
p =
0

MS e

(12-18)
v

ya que bajo H0tanto el numerador como el denominador de F0tienen valor esperado o2, y slo si H0es fal
sa E(MSab) es mayor que.E(M5). El cociente F0 se distribuye comoJF(a_1)i0i,(_1). De manera similar, para
probar H0:a\ = 0 se usara
MS,
F0 =
(12-19)
M SAB
.
2
que se distribuye como Fa i, (a _ ^ _ i), y para probar H0:a
= 0 el estadstico es

F =
0

( 1 2 -2 0 )
v

AfS,

que se distribuye como Fb_h(a_^ . i). Todas estas pruebas son de una sola cola superior. Observe que estos
estadsticos de prueba no son los mismos que se usaran si ambos factores^ y B fuesen fijos. Los cuadra
dos medios esperados se usan siempre como gua para construir los estadsticos de prueba.
En muchos experimentos que incluyen factores aleatorios existe al menos inters tanto en estimar los
componentes de la varianza como en la prueba de las hiptesis. Los componentes de la varianza pueden
estimarse con el mtodo del anlisis de varianza, es decir, igualando los cuadrados medios observados de
las lneas de la tabla del anlisis de varianza con sus valores esperados y resolviendo para los componentes
de la varianza. Se obtiene as
d 2 = MS e
*2

t0

M S AB -

M S E

n
msb -M Sm

an
msa -M Sm
d2=
bn

(12-21)

12-2 DISEO FACTORIAL DE DOS FACTORES ALEATORIOS

519

como las estimaciones puntuales de los componentes de la varianza en el modelo de efectos aleatorios de
dos factores. En la seccin 12-7 se revisarn otros mtodos para obtener estimaciones puntuales de los
componentes de la varianza y los procedimientos para construir intervalos de confianza.

EJEMPLO 1 2 -2 ..................................................................................................................................
Estudio de capacidad o aptitud de sistemas de medicin
Con frecuencia se usan experimentos diseados estadsticamente para investigar las fuentes de variabili
dad que afectan a un sistema. Una aplicacin industrial comn es usar un experimento diseado para es
tudiar los componentes de la variabilidad en un sistema de medicin. Estos estudios se conocen
comnmente como estudios de capacidad o aptitud de instrumentos de medicin (calibradores) o estu
dios de repetibilidad y reproductibilidad (R&R) de instrumentos de medicin (calibradores), ya que s
tos son los componentes de la variabilidad de inters.
En la tabla 12-3 se muestra un experimento R&R de instrumentos de medicin tpico (de Montgo
mery [80a]). Se usa un instrumento o calibrador para medir una dimensin crtica de una pieza. Se han se
leccionado 2 0 piezas del proceso de produccin, y tres operadores escogidos al azar miden dos veces cada
pieza con este calibrador. El orden en que se hacen las mediciones est completamente aleatorizado, por
lo que se trata de un experimento factorial de dos factores en el que los factores del diseo son las piezas y
los operadores, con dos rplicas. Las piezas y los operadores son factores aleatorios. Es vlida la identi
dad del componente de la varianza de la ecuacin 12-15; es decir,
a ] = o ) + o z + a 2+
l o2

donde erJ es la variabilidad total (que incluye la variabilidad debida a las diferentes piezas, la variabilidad
debida a los diferentes operadores y la variabilidad debida al calibrador), a \ es el componente de la va
rianza de las piezas, o 2 es el componente de la varianza de los operadores, a\ es el componente de la va-

T a b la 1 2 - 3

E l e x p e r im e n t o d e la c a p a c id a d o a p t it u d d e l s is t e m a d e

___________________ m e d i c i n d e l e j e m p l o 1 2 - 2 ________________________________________________
N m e ro de
la p ie z a

O p e ra d o r 1

O p e ra d o r 2

O p e ra d o r 3

21

20

20

20

23

24

20

21

21

20

22

27
18

26
18
21

27
18
23

28

27
19
23

24
19
28
19
24

19
23

21

24

1
2

3
4
5

9
10
11
12

13
14
15
16
17
18
19
20

24

22

21
21

22

24

22

21
22
20

19
24
25

17
23
23

18
25
26

20

23
25

19
24
24

18
24
25

21

20

20

20

21

20

18
23
24
29
26

19
25
24
30
26

19
25
25
28
26

18
25
24
31
25

19
25
25
30
27

20

20
21

17
25
23
30
25
19
19
25
18

20

20
21

19
25
19

26
19

19
24
17

25
19

20

23
25
17

520

CAPTULO 12

EXPERIMENTOS CO N FACTORES ALEATORIOS

rianza que representa la interaccin entre las piezas y los operadores, y o 2 es el error experimental
aleatorio. De manera tpica, al componente de la varianza a2 se le llama la repetibilidad del instrumento
de medicin (calibrador), ya que puede considerarse que d1refleja la variacin obtenida cuando la misma
pieza es medida por el mismo operador, y es comn llamar a
a \ + a l
la reproductibilidad del instrumento de medicin (calibrador), ya que refleja la variabilidad adicional en
el sistema de medicin que resulta del uso del instrumento por parte del operador. Estos experimentos
suelen realizarse con el objetivo de estimar los componentes de la varianza.
En la tabla 12-4 se muestra el anlisis de varianza de este experimento. Los clculos se realizaron uti
lizando la rutina Balanced ANOVA (anlisis de varianza balanceado) de Minitab. Con base en los valores
P, se concluye que el efecto de las piezas es grande, que los operadores quiz tengan un efecto pequeo y
que no hay ninguna interaccin significativa pieza-operador. La ecuacin 12-21 puede usarse para esti
mar los componentes de la varianza de la siguiente manera:

6Z39-0.71
(3)(2)
1 .3 1 -0 7 1
(20)(2)
0.71-0.99

ni/l

---------- ---------- = - - 1 4

1 = 0.99
La parte inferior de la salida de Minitab de la tabla 12-4 contiene los cuadrados medios esperados del
modelo aleatorio, con los nmeros entre parntesis representando los componentes de la varianza [(4)
representa cr, (3) representa o\, etc.]. Se presentan tambin las estimaciones de los componentes de la
varianza, junto con el trmino del error que se utiliz para probar ese componente de la varianza en el
anlisis de varianza. Ms adelante se estudiar la terminologa modelo no restringido; sta no tiene rele
vancia en los modelos aleatorios.
Observe que la estimacin de uno de los componentes de la varianza, d ], es negativa. Desde luego,
esto no tiene sentido, ya que por definicin las varianzas son no negativas. Desafortunadamente, pueden
obtenerse estimaciones negativas de los componentes de la varianza cuando se usa el mtodo de estima
cin del anlisis de varianza (lo cual se considera una de sus desventajas). Existen varias maneras de abor
dar esta situacin. Una posibilidad es suponer que la estimacin negativa significa que el componente de
la varianza en realidad es cero y simplemente se hace cero, dejando sin cambios las dems estimaciones
no negativas. Otro enfoque es estimar los componentes de la varianza con un mtodo que asegure estima
ciones no negativas (este enfoque se revisar brevemente en la seccin 12-7). Por ltimo, podra observar
se que el valor P del trmino de interaccin de la tabla 12-4 es muy grande, tomar esto como evidencia de
que a 2r es en realidad cero (es decir, que no hay efecto de interaccin) y ajustar un modelo reducido de la
forma
yijk ^ / t + t , + j + e

ijk

que no incluye el trmino de interaccin. ste es un enfoque relativamente sencillo y que con frecuencia
funciona casi tan bien como los mtodos ms elaborados.

Tabla 12-4

Anlisis de varianza balanceado (Balanced A N O V A de Minitab) del ejemplo 12-2

A n lis is d e v a r ia n z a ( d is e o s b a la n c e a d o s )

Factor
part

Type
random

operator

random

Analysis

of

Levels
20

Variance

Source
part
operator
pa r t * o p e r a t o r
Error
Total

DF
19
2
38
60
119

Source
1 part
2 operator
3 part*operator
4 Error

Values
1
8
15
1
for

2
9
16
2

3
10
17
3

4
11
18

5
12
19

6
13
20

7
14

SS
1185.425
2.617
27.050
59.500
1274.592

Variance
component
10.2798
0.0149
-0.1399
0.9917

MS
62.391
1 .308
0.712
0.992

Error
term
3
3
4

F
87.65
1 .84
0.72

P
0.000
0.173
0.861

E x p e c t e d Mean S q u a r e f o r Each
(u s in g u n r e s t r i c t e d model)
(4) + 2(3) + 6(1)
(4) + 2(3) + 40(2)
(4) + 2(3)
(4)

Term

522

CAPTULO 12

Tabla 12-5

EXPERIMENTOS C O N FACTORES ALEATORIOS

Anlisis de varianza del modelo reducido, ejemplo 12-2

A n lis is d e v a r ia n z a ( d is e o s b a la n c e a d o s )

Factor
part

Type
random

operator

random

Analysis

of

Source
part
operator
Error
Total

1
2
3

part
operator
Error

Values
1
2
9
8
16
15
2
1

Variance

DF
19
2
98
119

Source

Levels
20

for

SS
1185.425
2.617
86.550
1274.592
Variance
component
10.2513
0.0106
0.8832

3
10
17
3

4
11
18

5
12
19

6
13
20

7
14

y
MS
62.391
1.308
0.883

Error
term
3
3

F
70.64
1.48

P
0.000
0.232

E x p e c t e d Me a n S q u a r e
(using u n r e s tric te d
(3) + 6(1)
(3) + 40(2)
(3)

f o r Each
model)

Term

En la tabla 12-5 se muestra el anlisis de varianza del modelo reducido. Puesto que no hay trmino de
interaccin, los dos efectos principales se prueban contra el trmino del error, y las estimaciones de los
componentes de la varianza son
62.39-0.88
" = -< 5 j(2 r = m 25
1.31-0.88

'

(20)(2)

2 = 0.88

Por ltimo, la varianza del calibrador podra estimarse como la suma de las estimaciones de los compo
nentes de la varianza 2 y a 2 como
calibrador

= 0.88+0.0108
= 0.8908
La variabilidad del calibrador parece ser pequea en comparacin con la variabilidad del producto. Se
trata generalmente de una situacin deseable, la cual implica que el calibrador tiene la capacidad de dis
tinguir entre las diferentes gradaciones del producto.

12-3

MODELO MIXTO CON DOS FACTORES

Se considera ahora la situacin en que uno de los factores,.<4, est fijo y el otro, B, es aleatorio. Se le llama
anlisis de varianza del modelo mixto. El modelo estadstico lineal es
i = 1 , 2, . . a
y =
+ j + W)i + Ern
7 = 1 , 2 ,...,ft
( 1 2 -2 2 )
[k = l,2,...,n

12-3 MODELO MIXTO CON DOS FACTORES

523

Aqu r, es un efecto fijo,/J; es un efecto aleatorio, se supone que la interaccin (r)^ es un efecto aleatorio y
ijk es un error aleatorio. Se supone tambin que las {r,} son efectos fijos tales que 2 _1 r = Oy que j es
una variable aleatoria NID(0, a 2). El efecto de la interaccin,
es una variable aleatoria normal con
media 0 y varianza [(a - l)/a]a^ ; sin embargo, la operacin suma del componente de la interaccin en el
rango del factor fijo es igual a cero. Es decir,

2 mj=mj=o
i=i

j=i,2,...,b

Esta restriccin implica que algunos elementos de la interaccin en diferentes niveles del factor fijo no
son independientes. De hecho, puede demostrarse (ver el problema 12-25) que
Cov[(^), (r/3)i] = - i a ^

iV i'

La covarianza entre (r/3),; y (r)ir para j * j' es cero, y el error aleatorio eijk es NID(0, o2). Puesto que la
sma de los efectos de la interaccin en los niveles del factor fijo es igual a cero, a esta versin del modelo
mixto con frecuencia se le llama modelo restringido.
En este modelo la varianza de (z),-, se define como [( - 1 )l\j] en vez de como a 2m para simplificar
los cuadrados medios esperados. El supuesto (rfi) = 0 tambin tiene un efecto sobre los cuadrados me
dios esperados, los cuales puede demostrarse que son
r?
E(MSA) = o 2+ n o 2t+
E(MS b ) = a 2 +ana2
E(MSM ) = o 2 + n a 2

(12-23)

E(MSe ) ~ o 2
Por lo tanto, el estadstico de prueba apropiado para probar que las medias de los efectos del factor fijo
son iguales, o H0:t = 0, es
MS.
Fn =
MS^
que tiene la distribucin de referencia Fa_i, (fl. i)(,. i>. Para probar H 0: o 2, e 1estadstico de prueba es
^
msb
F = ----
mse
con la distribucin de referencia Fb _ t a,( _ 1}. Por ltimo, para probar la hiptesis de la interaccin
H 0 :o\ = 0, se usara
F =

MS.
mse

que tiene la distribucin de referencia F(a _ 1)() _ ^ ab( _ ly


En el modelo mixto es posible estimar los efectos del factor fijo como

524

CAPTULO 12

EXPERIMENTOS C O N FACTORES ALEATORIOS

Los componentes de la varianza a 2, a 2z y o 2 pueden estimarse aplicando el mtodo del anlisis de varian
za. Al eliminar la primera ecuacin de las ecuaciones 12-23 quedan tres ecuaciones con tres incgnitas,
cuyas soluciones son
d 2 = MS b - M S e

an
M S^-M S,
o T = ----------------z
n

(12-25)

<72 =

mse

Este enfoque general puede emplearse para estimar los componentes de la varianza en cualquier modelo
mixto. Despus de eliminar los cuadrados medios que contienen factores fijos, siempre quedar un siste
ma de ecuaciones que puede resolverse para los componentes de la varianza.
En los modelos mixtos, el experimentador puede tener inters en probar hiptesis o en construir in
tervalos de confianza para las medias de tratamientos individuales del factor fijo. Al utilizar estos proce
dimientos, deber tenerse cuidado de usar el error estndar apropiado de la media de los tratamientos. El
error estndar de la media de los tratamientos del efecto fijo es
Cuadrado medio para probar el efecto fijo
n
Nmero de observaciones en la media de cada tratamiento

MS^
bn

Observe que esto es simplemente el error estndar que se usara si ste fuera un modelo con efectos fijos,
salvo porque MSEse ha reemplazado con el cuadrado medio que se us en la prueba de la hiptesis.

EJEMPLO 1 2 -3 ..................................................................................................................................
Retomando el experimento de la capacidad o aptitud del sistema de medicin
Considere de nuevo el experimento R&R del calibrador descrito en el ejemplo 12-2. Suponga ahora que
slo tres operadores usan este calibrador, de tal modo que los operadores son un factor fijo. Sin embargo,
puesto que las piezas se eligen al azar, se trata ahora de un experimento con un modelo mixto.
El anlisis de varianza del modelo mixto se muestra en la tabla 12-6. Los clculos se realizaron utili
zando la rutina Balanced ANOVA (anlisis de varianza balanceado) de Minitab. Se especific el uso del
modelo restringido en el anlisis de Minitab, el cual gener tambin los cuadrados medios esperados para
este modelo. En la salida de Minitab, la cantidad Q[2] indica una expresin cuadrtica que incluye al ope
rador del efecto de factor fijo. Es decir, Q[2] = ^.x) / ( b - 1). Las conclusiones son similares al ejemplo
12-2. Los componentes de la varianza pueden estimarse con la ecuacin 12-25 como

Pieas
22

MS?iems MS e
an
M S pjezas
operadores
nezas X
a uperauorcs

Piezas X operadores

62.39-0.99
(3)(2)
- M S af _ 0.71-0.99
/ a
u iy y

(\ 1 A

2 = MSW= 0.99
Estos resultados tambin se muestran en la salida de Minitab. De nueva cuenta, resulta una estimacin
negativa del componente de la varianza de la interaccin. Un curso de accin apropiado sera ajustar un

Tabla 12-6

Anlisis de varianza (Minitab) del modelo mixto del ejemplo 12-3. Se supone el modelo restringido

A n lis is d e v a r ia n z a ( d is e o s b a la n c e a d o s )

Factor
part

Type
random

operator

fixed

Analysis

of

Levels

8
15
1

Variance

Source
part
ope r a t o r
part*opera tor
Error
Total

Values

20

DF
19
2
38
60
119

Source
1 pa r t
2 operator
3 part*operator
4 Error

for

9
16
2

10
17
3

11
18

12
19

13
20

14

SS
1185.425
2.617
27-050
59.500
1274.592
V a r i ance
component
10.2332
-0.1399
0.9917

MS
62.391
1 .308
0.712
0.992

Error
tern
4
3
4

F
62.92
1.84
0.72

P
0.000
0.173
0.861

E x p e c t e d Me a n S q u a r e f o r
( u s i ng r e s t r i c t e d mode I )
4 ) + 6(1 )
( 4 ) + 2 ( 3 ) + 4 0 C 2 D
(4) + 2(3)
(4)

526

CAPTULO 12

EXPERIMENTOS CON FACTORES ALEATORIOS

modelo reducido, como se hizo en el ejemplo 12-2. En el caso de un modelo mixto con dos factores, esto
lleva a los mismos resultados del ejemplo 1 2 -2 .

Modelos mixtos alternativos


Se han propuesto varias versiones diferentes del modelo mixto. Estos modelos difieren de la versin res
tringida del modelo mixto estudiado anteriormente en los supuestos establecidos acerca de los compo
nentes aleatorios. A continuacin se revisa brevemente uno de estos modelos alternativos.
Considere el modelo
y # = f t + a + y ] + ( a y ) + e tk

donde a (i = 1 , 2 , a) son efectos fijos tales que 2 =1 a,. = 0 y yp (ay)^ y eijkson variables aleatorias no co
rrelacionadas que tienen media cero y varianzas V(yj) = a 2y, ^(oy),,] = o ^ y V(eiJk) = o2. Observe que
aqu no se usa la restriccin impuesta anteriormente sobre el efecto de la interaccin; por consiguiente, a
esta versin del modelo mixto se le llama con frecuencia modelo mixto no restringido.
Es posible demostrar que los cuadrados medios esperados para este modelo son (referirse al material
suplementario del texto de este captulo)

E(MSA) = a 2 +na% +
E(MS b ) =

bn2
^

o 2 + n o l y -tana2

E(MSAB) ^ o 2 +na%

(12-26)

E(MSe ) =

o2

Al comparar estos cuadrados medios esperados con los de la ecuacin 12-23, se observa que la nica dife
rencia evidente es la presencia del componente de la varianza a 2 en el cuadrado medio esperado del
efecto aleatorio. (En realidad, hay otras diferencias debido a las definiciones diferentes de la varianza del
efecto de la interaccin en los dos modelos.) Por consiguiente, se probara la hiptesis de que el compo
nente de la varianza del efecto aleatorio es igual a cero (H^a2^, = 0 ) usando el estadstico

en contraste con probar H0:<J2 con F0 = MSB/MSE en el modelo restringido. La prueba deber ser ms
conservadora cuando se emplee este modelo porque por lo general MSAB ser mayor que MSE.
Los parmetros de los dos modelos guardan una relacin cercana. De hecho, puede demostrarse que
j = Yj +(ccy)j

12-3 MODELO MIXTO CON DOS FACTORES

527

Puede usarse el mtodo del anlisis de varianza para estimar los componentes de la varianza. Con re
ferencia a los cuadrados medios esperados, se encuentra que el nico cambio de las ecuaciones 12-25 es
que
MS MSa
dl = ---- ---------
r
an

(12-27)

Estos dos modelos son casos especiales del modelo mixto propuesto por Scheff [98b, d]. En este mo
delo se supone que las observaciones pueden representarse con
i = 1 , 2 ,..., a
\ j = l , 2,...,b
[k = l,2,...,n

yk = m +Em

donde mtj y eijk son variables aleatorias independientes. La estructura de mj es


,= l + T ,+ b j + C t
E(mij) = f i + r,
2

*,= o

i=i
y

Cj=

; '=

1,2,..,,b

Las varianzas y covarianzas de b y c se expresan a travs de las covarianzas de las w /y. Adems, los par
metros de los efectos aleatorios en otras formulaciones del modelo mixto pueden relacionarse con b y c,j.
El anlisis estadstico del modelo de Scheff es idntico al del modelo restringido tratado aqu, salvo por
que, en general, el estadstico MSJMS^ no siempre se distribuye como F cuando HQ:t = 0 es verdadera.
A la luz de esta multiplicidad de modelos mixtos, una pregunta lgica es: qu modelo deber usarse?
La mayora de los especialistas en estadstica prefieren el modelo restringido, mismo que se encuentra
con mayor frecuencia en la literatura del tema. El modelo restringido es en realidad un poco ms general
que el no restringido, ya que en el primero la covarianza entre dos observaciones del mismo nivel del fac
tor aleatorio puede ser positiva o negativa, mientras que en el segundo esta covarianza slo puede ser po
sitiva. Si la estructura correlativa de los componentes aleatorios no es grande, entonces cualquiera de los
dos modelos mixtos es apropiado, y slo hay diferencias menores entre ellos. Cuando se haga referencia
ms adelante a los modelos mixtos, se supondr la estructura del modelo restringido. Sin embargo, si hay
correlaciones grandes en los datos, entonces quiz deba emplearse el modelo de Scheff. La eleccin del
modelo deber ser siempre dictada por los datos. El artculo de Hocking [56] es un resumen claro de dife
rentes modelos mixtos.

EJEMPLO 1 2 -4 ..................................................................................................................................
El modelo no restringido
Algunos paquetes de software de computadora tienen soporte para un solo modelo mixto. Minitab sopor
ta tanto el modelo restringido como el no restringido, aun cuando la seleccin por omisin es el modelo
no restringido. En la tabla 12-7 se muestra la salida de Minitab para el experimento del ejemplo 12-3 utili
zando el modelo no restringido. Observe que los cuadrados medios esperados concuerdan con los de la
ecuacin 12-26. Las conclusiones son idnticas a las del anlisis del modelo restringido, y las estimaciones
de los componentes de la varianza son muy similares.

528
T b la 1 2 - 7

A n l i s i s d e l e x p e r im e n t o d e l e je m p lo 1 2 - 3 u t iliz a n d o e l m o d e lo r e s t r in g id o

A n lis is d e v a r ia n z a ( d is e o s b a la n c e a d o s )

Factor
part

Type
random

operator

fixed

Analysis

of

Levels Values
1
20
8
15
3
1

Variance

Source
part
operator
part*ope rator
Error
Total

DF
19
2
38
60
119

Source
1 part
2 operator
3 part*operator
4 Error

for

2
9
16
2

3
10
17
3

4
11
18

5
12
19

6
13
20

7
14

SS
1185.425
2.617
27.050
59.500
1274.592
Variance
component
10.2798
-0.1399
0.9917

62.
1.
0.
0.

Error
term
3
3
4

MS
391
308
712
992

F
87.65
1.84
0.72

P
0.000
0.173
0.861

E x p e c t e d Mean S q u a r e
(using u n r e s tr ic te d !
(4) + 2(3) + 6(1)
( 4 ) + 2 ( 3 ) + QC2 J
(4) + 2(3)
(4)

12-4 DETERMINACIN DEL TAMAO DE LA MUESTRA CON EFECTOS ALEATORIOS

12-4

529

DETERMINACIN DEL TAMAO DE LA MUESTRA


CON EFECTOS ALEATORIOS

Pueden usarse las curvas de operacin caracterstica del apndice para determinar el tamao de la mues
tra en experimentos con factores aleatorios. Se empieza con el modelo de efectos aleatorios con un solo
factor de la seccin 12-1. La probabilidad del error tipo II para el modelo de efectos aleatorios es
= l - F{Rechazar H0\ H es falsa}
= l - P { F 0 > F Ba_hN_a\ a l > 0 }

(12-28)

De nueva cuenta se requiere la distribucin del estadstico de prueba F0 = MS-nimicM0JMSEbajo la hip


tesis alternativa. Puede demostrarse que si Hl es verdadera (o2T > 0), la distribucin de F0es F central con
a - 1 y N - a grados de libertad.
Puesto que la probabilidad del error tipo II del modelo de efectos aleatorios se basa en la distribucin
F central usual, podran usarse las tablas de la distribucin F del apndice para evaluar la ecuacin 12-28.
Sin embargo, es ms simple determinar la sensibilidad de la prueba mediante el uso de las curvas de ope
racin caracterstica. En la parte IV del apndice se presenta una serie de estas curvas para varios valores
de los grados de libertad del numerador, de los grados de libertad del denominador y de 0.05 y 0.01. En
estas curvas se grafica la probabilidad del error tipo II contra el parmetro X, donde

k= \l+r^h

( 1 2 2 9 )

Observe que k incluye dos parmetros desconocidos, a2 y a 2. Quiz pueda estimarse a] si se tiene una
idea acerca de cunta variabilidad de la poblacin de tratamientos es importante detectar. Puede esco
gerse una estimacin de o 2 recurriendo a la experiencia previa o discrecionalmente. En ocasiones es til
definir el valor de o 2 que quiere detectarse en trminos del cociente aj/o2.

EJEMPLO 1 2 -5 ..................................................................................................................................
Suponga que se han seleccionado cinco tratamientos al azar con seis observaciones por tratamiento y que
a = 0.05, y quiere determinarse la potencia de la prueba cuando a) es igual a a 2. Puesto que a = 5, n = 6 y
o] = cr, puede calcularse
A = VI+ 6(1) = 2.646
Por la curva de operacin caracterstica con a - l = 4 , N - a = 25 grados de libertad y a = 0.05, se encuen
tra que
=0.20
y por lo tanto la potencia es de aproximadamente 0.80.

Tkmbin puede usarse el incremento porcentual en la desviacin estndar de un mtodo de observa


cin para determinar el tamao de la muestra. Si los tratamientos son homogneos, entonces la desvia
cin estndar de una observacin seleccionada al azar es o. Sin embargo, si los tratamientos son
diferentes, la desviacin estndar de una observacin elegida al azar es

530

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Si P es el incremento porcentual fijo en la desviacin estndar de una observacin ms all del cual se de*
sea rechazar la hiptesis nula, entonces
V 2 + r

- = 1 + 0 .0 1 P

Por lo tanto, utilizando la ecuacin 12-29, se encuentra que


=

yf+n(l + 0.01P)2 - 1 ]

(12-30)

Para una/* dada pueden usarse las curvas de operacin caracterstica de la parte VI del apndice para en
contrar el tamao de la muestra deseado.
Tmbin pueden usarse las curvas de operacin caracterstica para determinar el tamao de la mues
tra del modelo de efectos aleatorios con dos factores y del modelo mixto. Se utiliza la parte VI del apndi
ce para el modelo de efectos aleatorios. El parmetro A, los grados de libertad del numerador y los grados
de libertad del denominador se muestran en la mitad superior de la tabla 12-8. Para el modelo mixto de
ben usarse las partes V y VI del apndice. Los valbres apropiados de O2 y A se muestran en la mitad infe
rior de la tabla 1 2 -8 .
T a b la 1 2 - 8

P a r m e t r o s d e la s c u r v a s d e o p e r a c i n c a r a c t e r s t ic a d e la s t a b la s V y V I d e l a p n d ic e p a r a lo s m o d e lo s c o n d o s
f a c t o r e s d e e f e c t o s a le a t o r io s y m ix t o
E l m o d e lo d e e fe c to s a le a t o r io s

F a cto r

1+

G ra d o s de

G ra d o s d e

lib e r t a d d e l

lib e r t a d d e l

n u m e rad o r

d e n o m in a d o r

bno.
a2+ na%

ano

b-1

1+ -

AB

( a -l)( b -l)

- 1

(a -l) (b-1)

na
(a -l)( b -l)

1+ -

a b (n

- 1 )

E l m o d e lo m ix t o

F a cto r

( f ijo )

P a r m e tro

bZ, r?

G r a d o s d e lib e r t a d

G r a d o s d e lib e r t a d

P a rte d e l

d el n u m e rad o r

d e l d e n o m in a d o r

a p n d ic e

( a~ l) (b - l )

a-

a[o2+ nal\
B ( a le a t o r io )
AB

anol

H l+ /

b-1

ab(n - 1 )

V I

(a-l)(b-l)

ab(n - 1 )

V I

na]i

12-5 REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS

12*5

531

REGLAS PARA LOS CUADRADOS MEDIOS ESPERADOS

Una parte importante de cualquier problema de diseo experimental es la realizacin del anlisis de va
rianza. Esto implica determinar la suma de cuadrados de cada componente del modelo y el nmero de
grados de libertad asociados con cada suma de cuadrados. Despus, para construir los estadsticos de prueba
apropiados, deben determinarse los cuadrados medios esperados. En situaciones de diseo complejas,
particularmente las que incluyen modelos aleatorios o mixtos, con frecuencia es til contar con un proce
dimiento formal para este proceso.
Se presentar un conjunto de reglas para anotar los cuadrados medios esperados en cualquier experi
mento factorial balanceado, anidado2 o factorial anidado. (Observe que los arreglos parcialmente balan
ceados, como los cuadrados latinos y los diseos de bloques incompletos, se excluyen explcitamente.)
Estas reglas son estudiadas por varios autores, incluyendo Scheff [98d], Bennett y Franklin [9], Cornfield
y Hikey [34] y Searle [99a, b]. Mediante el examen de los cuadrados medios esperados puede desarrollar
se el estadstico apropiado para probar hiptesis acerca de cualquier parmetro del modelo. El estadsti
co de prueba es el cociente de los cuadrados medios que se elige, de tal modo que el valor esperado del
cuadrado medio del numerador difiere del valor esperado del cuadrado medio del denominador nica
mente por el componente de la varianza o el factor fijo en el que se tiene inters.
Siempre es posible determinar los cuadrados medios esperados de cualquier modelo como se hizo en
el captulo 3, es decir, mediante la aplicacin directa del operador valor esperado. Este mtodo de fuerza
bruta, como suele llamrsele, puede ser muy laborioso. Las reglas que se presentan a continuacin pro
ducen siempre los cuadrados medios esperados sin recurrir al enfoque de fuerza bruta y, con la prctica,
su uso se vuelve relativamente simple. Cuando se aplican a un modelo mixto, estas reglas producen cua
drados medios esperados que son consistentes con los supuestos del modelo mixto restringido de la sec
cin 12-3. Las reglas se ilustran utilizando el modelo factorial de efectos fijos con dos factores.

Regla 1, El trmino del error del modelo, jjn, se escribe como %.i)m, donde el subndice m denota el
subndice de la rplica. Para el modelo con dos factores, esta regla implica que ijkse convierte en (j)k.

Regla 2. Adems de una media global (ji) y un trmino del error [(y )m], el modelo contiene todos los
efectos principales y las interacciones cuya existencia supone el experimentador. Si existen todas las in
teracciones posibles entre los k factores, entonces hay ( * ) interacciones de dos factores, ( * ) interacciones
de tres factores,..., 1 interaccin de k factores. Si uno de los factores de un trmino aparece entre parnte
sis, entonces no hay interaccin entre ese factor y los dems factores de ese trmino.

Regla 3. Para cada trmino del modelo, los subndices se dividen en tres clases: a) vivos: aquellos que es
tn presentes en el trmino y no estn entre parntesis; b) muertos: aquellos que estn presentes en el tr
mino y estn entre parntesis; yc) ausentes: aquellos subndices que estn presentes en el modelo pero no
en ese trmino particular.
Por lo tanto, en (x)/y, i y j son subndices vivos y A: es un subndice ausente, y en {)k, k es un subndice
vivo, mientras que i y j son subndices muertos.
2 Los diseos anidados se estudian en el captulo 13.

532

CAPTULO 12

EXPERIMENTOS CO N FACTORES ALEATORIOS

Regla 4. Grados de libertad. El nmero de grados de libertad de cualquier trmino del modelo es el pro
ducto del nmero de niveles asociados con cada subndice muerto y el nmero de niveles asociados con
cada subndice vivo menos 1 .
Por ejemplo, el nmero de grados de libertad asociados con (r/?) es (a - l)(b - 1), y el nmero de gra
dos de libertad asociados con s(J)l es ab(n - 1 ).
Regla 5. Cada trmino del modelo tiene asociado con l un componente de la varianza (efecto aleato
rio) o bien un factor fijo (efecto fijo). S una interaccin contiene al menos un efecto aleatorio, la interac
cin completa se considera aleatoria. Un componente de la varianza tiene letras griegas como subndices
para identificar el efecto aleatorio particular. Por lo tanto, en un modelo mixto de dos factores con el fac
tor A fijo y el factor B aleatorio, el componente de la varianza de B es a ^, y el componente de la varianza
de AB es a 2t. Un efecto fijo se representa siempre por la suma de cuadrados de los componentes del mo
delo asociados con ese factor dividida por sus grados de libertad. En el ejemplo tratado aqu, el efecto de
A es
a

2i=i

*?

a~l
Regla 6. Cuadrados medios esperados. Para obtener los cuadrados medios esperados, se elabora la tabla
siguiente. Hay un rengln para cada componente (cuadrado medio) del modelo y una columna para cada
subndice. Arriba de cada subndice se escribe el nmero de niveles del factor asociados con ese subndice
y si el factor es fijo (F) o aleatorio (R ). Las rplicas siempre se consideran aleatorias.
a) En cada rengln se escribe 1 si uno de los subndices muertos en el componente del rengln coin
cide con el subndice de la columna:

Factor

F
a
i

F
b
i

Pj
m ,
em

R
n
k

b) En cada rengln, si cualquiera de los subndices del componente del mismo coincide con el sub
ndice de la columna, se escribe 0 si el encabezado de la columna es un factor fijo y 1 si es un fac
tor aleatorio:

F
a
i

Factor
T,
i
m

F
b
j

R
n
k

0
0

12-5 REGLAS PARA LOS CUADR ADO S MEDIOS ESPERADOS

533

c) En las posiciones del rengln que quedan vacas se escribe el nmero de niveles que aparecen in
dicados arriba del encabezado de la columna:

0
0

R
n
k
n
n
n

F
a
i

Factor

j
m
Em

F
b
j
b

d) Para obtener los cuadrados medios esperados de cualquier componente del modelo, primero se
cubren todas las columnas cuyos encabezados sean subndices vivos de ese componente. Des
pus, en cada rengln que contiene al menos los mismos subndices que los del componente bajo
consideracin, se toma el producto de los nmeros visibles y se multiplica por el factor fijo o alea
torio apropiado de la regla 1. La suma de estas cantidades es el cuadrado medio esperado del
componente del modelo bajo consideracin. Por ejemplo, para encontrarEfMS^), se cubre la co
lumna i. El producto de los nmeros visibles en los renglones que contienen al menos el subndi
ce / son bn (rengln 1), 0 (rengln 3) y 1 (rengln 4). Observe que i no est presente en el rengln
2. Por lo tanto, el cuadrado medio esperado es
E(MSa ) =

o 1 +

a I
En la tabla 12-9 se presenta la tabla completa de los cuadrados medios esperados para este diseo. En
las tablas 1 2 - 1 0 y 1 2 - 1 1 se muestran las derivaciones de los cuadrados medios esperados para los modelos
con dos factores, aleatorio y mixto, respectivamente. Observe que se ha supuesto la versin restringida
del modelo mixto para producir los cuadrados medios esperados. En el ejemplo siguiente se considera un
diseo factorial con tres factores.

EJEMPLO 1 2 -6 .............................................................................................................. ...................


Considere un experimento factorial de tres factores con a niveles del factor^, b niveles del factor B, c ni
veles del factor C y n rplicas. El anlisis de este diseo, suponiendo que todos los factores son de efectos

Tabla 12-9

D e r i v a c i n d e lo s c u a d r a d o s m e d io s e s p e r a d o s , m o d e lo d e
e f e c t o s f ijo s c o n d o s f a c t o r e s

Factor

j
m

Em

F
a
i

F
b
j

R
n
k

Cuadrado
medio esperado
,
bnZT1
a2+ ------!fl 1
b 1
(a-)(b-l)
i

G~

534

CAPTULO 12 EXPERIMENTOS CON FACTORES ALEATORIOS

Tabla 12-10

Derivacin de los cuadrados medios esperados, modelo de


efectos aleatorios con dos factores
R
b
i
b

R
n
k
n

a 1 + n o 2 + bno]

a 1 + n o 2t + a n a 2

(?)a

a 1 + na \t

em

o1

R
a
i

F a cto r

T a b la

12-11

C u a d ra d o
m e d io e s p e r a d o

D e r iv a c i n d e lo s c u a d r a d o s m e d io s e s p e r a d o s , m o d e lo
m ix t o c o n d o s fa c to re s

F a cto r

Tabla 12-12

F
a
i

R
b
j

R
n
k

a 2 + a n a 2

a 1 + na\

a1

C u a d ra d o
m e d io e s p e r a d o

,
* + r<

briSLr?
+ a- 1

Derivacin de los cuadrados medios esperados, modelo de


efectos aleatorios con tres factores
R
c
k

R
n
l

R
b
i
b

a 2 + cno] + bnoly + n o ^ + b c n o 2t

a 1 + c n a 2t + a n a ^ + n a ^ + a c n a \

Yk

a 2 + b n a ^ + a n a 2^ + n a 2ly + a b n a 2

a 1 + nolfy + c n a 20

fa')*

o 1 + n a 2y + b n a 1^

m *

o 2 + n a 2ly + a n o \

a 2 + n a 2Ty

a1

F a cto r

Eijlcl

R
a
i

C u a d ra d o
m e d io e s p e r a d o

12-6 PRUEBAS F APROXIMADAS

535

fijos, se presenta en la seccin 5-4. Ahora se determinan los cuadrados medios esperados suponiendo que
todos los factores son aleatorios. El modelo estadstico apropiado es
y * = fl + t + j + n H*)a +(* y )& + (A 0 * + (* # % +#*
Utilizando las reglas descritas antes, en la tabla 12-12 se derivan los cuadrados medios esperados.
Se observa, al examinar los cuadrados medios esperados de la tabla 12-12, que sM , B y C son factores
aleatorios, entonces no existe ninguna prueba exacta para los efectos principales. Es decir, si se quiere
probar la hiptesis o \ = 0 , no es posible formar un cociente de dos cuadrados medios esperados tal que el
nico trmino del numerador que no est en el denominador sea berta\. El mismo fenmeno ocurre para
los efectos principales de B y C. Observe que efectivamente existen las pruebas apropiadas para las in
teracciones de dos y tres factores. Sin embargo, es posible que las pruebas de los efectos principales sean
de importancia bsica para el experimentador. Por lo tanto, cmo debern probarse los efectos principa
les? Este problema se considera en la siguiente seccin.

12-6

PRUEBAS F APROXIMADAS

Es frecuente que en experimentos factoriales con tres o ms factores incluidos en un modelo aleatorio o
mixto, as como en otros diseos ms complejos, no exista un estadstico de prueba exacto para ciertos
efectos de los modelos. Una posible solucin a este dilema es suponer que ciertas interacciones son insig
nificantes. Para ilustrar, si fuera razonable suponer que todas las interacciones de dos factores del ejem
plo 1 2 -6 son insignificantes, entonces podra hacerse o 2z = o 2^ = o 2^ = 0, y sera posible conducir
pruebas de los efectos principales.
Aun cuando parece tratarse de una posibilidad atractiva, es necesario sealar que debe haber algo en
la naturaleza del proceso o algn conocimiento previo slido que permita suponer que una o ms de
las interacciones son insignificantes. En general, no es sencillo establecer este supuesto, y tampoco debe
r hacerse a la ligera. No debern eliminarse ciertas interacciones del modelo sin evidencia concluyente
de que es apropiado hacerlo. Un procedimiento defendido por algunos experimentadores es probar pri
mero las interacciones, despus fijar en cero aquellas interacciones que se hayan encontrado no significa
tivas, para despus suponer que estas interacciones son cero cuando se prueben otros efectos en el mismo
experimento. Aun cuando en ocasiones se aplica en la prctica, este procedimiento puede ser riesgoso, ya
que cualquier decisin respecto a una interaccin est sujeta tanto al error tipo I como al error tipo II.
Una variante de esta idea es agrupar ciertos cuadrados medios en el anlisis de varianza para obtener
una estimacin del error con ms grados de libertad. Por ejemplo, suponga que en el ejemplo 12-6 no fue
significativo el estadstico de prueba F0 = MS^JMS e. Por lo tanto, H0:a^ = 0 no se rechaza, y tanto
MS Me como MSe estiman la varianza del error o2. El experimentador podra considerar la agrupacin o
combinacin de MS^c y MSE de acuerdo con
MS

_ abc(nl)MSE +(a l ) ( b l ) ( c l)MSABC


E'
a b c ( n - \ ) + ( a - \ ) ( b - \ ) ( c l)

de tal modo que E(MSe) = o2. Observe que MSE. tiene abc(n - 1 ) + ( a - l ) ( b - l)(c - 1 ) grados de libertad,
en comparacin con los abc(n - 1) grados de libertad del MSE original.
El riesgo de agrupar es que puede incurrirse en un error tipo II y combinar con el error el cuadrado
medio de un factor que en realidad es significativo, obtenindose as un nuevo cuadrado medio residual

536

CAPITULO 12

EXPERIMENTOS CON FACTORES ALEATORIOS

(MSe ) que es muy grande. Esto har que sea ms difcil detectar otros efectos significativos. Por otra par
te, si el cuadrado medio del error original tiene un nmero muy pequeo de grados de libertad (por ejem
plo, menos de seis), el experimentador quiz tenga mucho que ganar al hacer la agrupacin, ya que podra
conseguirse as un incremento potencialmente considerable de la precisin de pruebas posteriores. Un
procedimiento razonablemente prctico es el siguiente. Si el cuadrado medio del error original tiene seis
o ms grados de libertad, no hacer la agrupacin. Si el cuadrado medio del error original tiene menos de
seis grados de libertad, hacer la agrupacin slo si el estadstico F del cuadrado medio que se agrupar no
es significativo para un valor grande de a, tal como a = 0.25.
Cuando no es posible suponer que ciertas interacciones son insignificantes y sigue siendo necesario
hacer inferencias acerca de los efectos para los que no existen pruebas exactas, puede emplearse un pro
cedimiento atribuido a Satterthwaite [97]. El mtodo de Satterthwaite utiliza combinaciones lineales de
cuadrados medios, por ejemplo,
MS ' = MSr + + MSs

(12-31)

M S"= M SU+ ---+MSV

(12-32)

donde los cuadrados medios de las ecuaciones 12-31 y 12-32 se seleccionan de tal modo que E(MS') E(MS") sea igual a un mltiplo del efecto (el parmetro del modelo o el componente de la varianza) con
siderado en la hiptesis nula. Entonces el estadstico de prueba sera

MS

(12-33)

que se distribuye aproximadamente como Fp q, donde


(MSr + - - + M S s f
P

MS2 / / - + + MS] / f s

(12-34)

(MSU+ - + M S V)2

(12-35)

Enp y q J i es el nmero de grados de libertad asociados con el cuadrado medio MS',. No existe la seguridad
de que p y q sean enteros, por lo que puede ser necesario hacer una interpolacin en las tablas de la distri
bucin ,F. Por ejemplo, en el modelo de efectos aleatorios con tres factores (tabla 12-12), es relativamente
sencillo ver que un estadstico de prueba apropiado para H0:al = 0 sera F = MS'IMS", con
MS' = MS a + M S abc
y

MS" = M S ^ + M S ac
Los grados de libertad de F se calcularan con las ecuaciones 12-34 y 12-35.
La teora subyacente de esta prueba es que tanto el numerador como el denominador del estadstico
de prueba (ecuacin 12-33) se distribuyen aproximadamente como mltiplos de variables aleatorias

537

12-6 PRUEBAS F APROXIMADAS

ji-cuadrada, y puesto que no aparece ningn cuadrado medio en el numerador o el denominador de la


ecuacin 12-33, el numerador y el denominador son independientes. Por lo tanto, en la ecuacin 12-33, F
se distribuye aproximadamente como Fp r Satterthwaite hace hincapi en que deber prestarse atencin
al aplicar el procedimiento cuando algunos de los cuadrados medios de MS' y MS" aparezcan con signos
negativos. Gaylor y Hopper [48] reportan que si MS' = MSX- M S 2, entonces la aproximacin de Sattert
hwaite tiene una validez razonable si
MSl
> F 0.01S,f2 . / , X F o .5 0 ,f2 , f 2

y si A <

10 0

y f 2 > fJ2.

EJEMPLO 1 2 -7 ..................................................................................................................................
Se estudia la cada de la presin medida en una vlvula de expansin de una turbina. El ingeniero de dise
o considera que las variables importantes que influyen en las lecturas de la cada de la presin son la
temperatura del gas en la admisin (A), el operador (B) y el manmetro especfico que utiliza el operador
(C). Estos tres factores se incluyen en un diseo factorial, con la temperatura del gas fija y el operador y el
manmetro aleatorios. En la tabla 12-13 se muestran los datos codificados de dos rplicas. El modelo li
neal de este diseo es
yijkl = / + r; + j + y k +(x)ij +(ry)k +( y) jk + (ty)^k + e jkl
donde tes el efecto de la temperatura del gas (A),j es el efecto del operador (B) y yk es el efecto del ma
nmetro (C).
El anlisis de varianza se muestra en la tabla 12-14. Se ha agregado la columna titulada Cuadrados
medios esperados a esta tabla, y las entradas de esta columna se derivan por los mtodos estudiados en la
seccin 12-5. Por la columna Cuadrados medios esperados, se observa que existen pruebas exactas para
todos los efectos esperados salvo el efecto principaM, En la tabla 12-14 se muestran los resultados de es
tas pruebas. Para probar el efecto de la temperatura del gas, o H:t, = 0, podra usarse el estadstico

T a b la 1 2 - 1 3

MS'
~ MS"

D a t o s c o d if ic a d o s d e la c a d a d e l a p r e s i n p a r a e l e x p e r im e n t o d e l a t u r b in a
T fe m p e ra tu ra d e l g a s

M a n m e tro

;o
i
2

6 0 F

7 5 F

O p e r a d o r (B )

O p e r a d o r (B )

-2

-3
-6
4

-9
-5

-1
-2

-4

-1
-8
-8
-2
0

-8

-7

-1

4
4
4
-3
-7
-2

14
14

6
0
8
6
2
0

1
2
6
2

22

24
20

16

(A )
9 0 F
O p e r a d o r ( f i)

4
-7
6

-5
2

-5

-1

-8
-8
-8

-2
20
1

-1
-2

-9

-2
1
-8

-7

-8

-1

-4
-7

3
-2
-1

~2

538
Tabla 12-14 Anlisis de v a r i a n z a de los datos de la cada de la presin
Fu e n te de

S u m a de

G ra d o s de

v a r ia c i n

cu ad rad o s

lib e r t a d

T e m p e ra tu ra ,

C u ad rad o
C u a d r a d o s m e d io s e s p e r a d o s

2 .

10 2 3 .3 6

m e d io

F0

V a lo r

i
bchSx]
( f + b n a rr + c n a lfi + n a ry+

5 1 1 .6 8

2 .2 2

0 .17

4 2 3 .8 2

a c n a 2^

14 1 .2 7

4 .0 5

0 .0 7

7 .19

a 1 + a n o ^ + abno^

3 .6 0

0 .10

0 .9 0

AB

12 1 1 .9 7

o 1 + n O t y + cn o l

2 0 2 .0 0

1 4 .5 9

< 0 .0 1

A C

1 3 7 .8 9

o 2 + n o 2^

3 4 .4 7

2 .4 9

0 .10

B C

2 0 9 .4 7

o 2 + a n c r^

3 4 .9 1

1.6 3

0 .17

A BC

16 6 .1 1

12

o2 + no^

13 .8 4

0 .6 5

0 .7 9

o2

2 1.4 0

O p e ra d o r,

M a n m e tro , C

E rro r

7 7 0 .5 0

36

Ib t a l

3 9 5 0 .3 2

7 1

2 +

a n o 2^

b n o 2^

12-6 PRUEBAS F APROXIMADAS

539

donde
M S ' = M S A +M S abc
y

MS" = M S ^ +M S ac
ya que
beni, r?
E(MS')-E(MS")=
Para determinar el estadstico de prueba para H0:r, = 0, se calculan
MS' = MS A + MS ABC
= 511.68+13.84 = 525.52
M S'^M S^+M S^
= 202.00 + 34.47 = 236.47

MS' 525.52
F = ------ = --------- = 2.22
MS" 236.47
Los grados de libertad de este estadstico se encuentran con las ecuaciones 12-34 y 12-35 de la siguiente
manera:
\2

(.MSA+ M SABC
MS a / 2 + M S ^ . /12
________ (52S.52)2_______
= 2 .1 1 =
_ (511.68)2 /2+ (13.84)2 /12

(.MSm +MS a c ) 2
MS^g 6 +MS ac / 4
t236-47)------------- 7.888
(202.00) 2 /6+ (34,47 ) 2 / 4

Al comparar = 2.22 cn ic os 2 g = 4.46, no puede rechazarse//. El valor P aproximado csP = 0.17.


La interaccin AB, o temperatura-operador, es grande, y hay ciertos indicios de una interaccin j4C o
temperatura-manmetro. El anlisis grfico de las interacciones AB yAC, ilustrado en la figura 12-2, indi
ca que el efecto de la temperatura puede ser grande cuando se usan el operador 1 y el manmetro 3. Por lo
tanto, parece posible que los efectos principales de la temperatura y el operador estn enmascarados por
la interaccin AB grande.

En la tabla 12-15 se presenta la salida de la rutina Balanced ANOVA (anlisis de varianza balancea
do) de Minitab para el experimento del ejemplo 12-7. Se ha especificado el modelo restringido. Q[ 1] re
presenta el efecto fijo de la presin del gas. Observe que las entradas de la tabla del anlisis de varianza

540

CAPTULO 12

EXPERIMENTOS CO N FACTORES ALEATORIOS

100
75

O
x
"S 50

ss
&

25

-25
C

-50

60

7 5

9 0

Figura 12-2 Interacciones en el experimento de la cada de la presin.

concuerdan en general con las de la tabla 12-14, salvo por la prueba 1 de la temperatura del gas (factor^).
Minitab indica que la prueba no es exacta (lo que se ve por los cuadrados medios esperados). La Prueba
Sintetizada construida por Minitab es en realidad el procedimiento de Satterthwaite, pero usa un estads
tico de prueba diferente del que se utiliz aqu. Observe que, por la salida de Minitab, el cuadrado medio
del error para probar el factor A es
( 4 ) + ( 5 ) - 7 = MSjg +MS ac - MS abc
cuyo valor esperado es
[(4 )+ (5 )-(7 )]= a 2 + n a &
2 + cnat + 2

iy

+bnal/ - { a 1 + n a ^ )
= 2 +n 2Ty +cna% + b n o l
que es un cuadrado medio del error apropiado para probar el efecto promedio de A . Esto es una muy bue
na ilustracin de que puede haber ms de una manera de construir los cuadrados medios sintticos usa
dos en el procedimiento de Satterthwaite. Sin embargo, se preferira en general la combinacin lineal de
los cuadrados medios que se seleccionaron, en lugar de la que eligi Minitab, ya que no incluye ningn
cuadrado medio con signo negativo en las combinaciones lineales.
El anlisis del ejemplo 12-7, suponiendo el modelo no restringido, se presenta en la tabla 12-16.
La diferencia principal con el modelo restringido es que ahora los valores esperados de los cuadrados me
dios de los tres efectos principales son tales que no existe ninguna prueba exacta. En el modelo restringido,
los dos efectos aleatorios promedio podran probarse contra su interaccin, pero ahora el cuadrado me
dio esperado de B incluye a a 2ty y a o], y el cuadrado medio esperado de C incluye a o ^ y a
. De nueva
cuenta, Minitab construye cuadrados medios sintticos y prueba estos efectos con el procedimiento de
Satterthwaite. Las conclusiones generales no son radicalmente diferentes del anlisis del modelo restrin
gido, adems del cambio grande en la estimacin del componente de la varianza del operador. El modelo
no restringido produce una estimacin negativa de a 2 . Puesto que el factor manmetro no es significativo
en ninguno de los dos anlisis, es posible que sea pertinente alguna reduccin del modelo.

la b ia 12-15

Anliss de varianza balanceado de M initab {Balanced ANOVA) del ejemplo 12-7, modelo restringido

A n l i s i s d e v a r ia n z a ( d is e o s b a la n c e a d o s )

Factor
GasT
Operator
Gauge

Type
f i xed
random
random

Analysis

of

Levels Values
3
60
4
1
3
1

Variance

for

Source
Ga s T
Operator
Gauge
GasT*0pe r a t o r
GasT*Gauge
Operator*Gauge
GasT*Operator*Gauge
Error
Tota I
x

Not

an

exact

GasT
Operator
Gauge
GasT*0perator
GasT*Gauge
Operator*Gauge
GasT*Operator*Gauge
Error

Error

Drop
SS
1023.36
423.82
7.19
1211.97
137.89
209.47
166.11
770.50
3950.32

DF
2
3
2
6
4
6
12
36
71

Variance
component

Synthesized
Terms

Source
1 GasT

90
3
3

HS
511.68
141.27
3.60
202.00
34.47
34.91
13.84
21.40

F
2.30
4.05
0.10
14.59
2.49
1 .63
0.65

P
0.171
0.069
0.904
0.000
0.099
0.167
0.788

F-test.

Source
1
2
3
4
5
6
7
8

75
2
2

5.909
-1.305
31.359
2.579
2.252
-3.780
21.403

E r r o r E x p e c t e d Mean S q u a r e f o r
t e r m ( u s i n g r e s t r i c t e d mode I )
*
(8) + 2(7) + 8(5) + 6(4)
6
(8) + 6(6) + 18(2)
(8) + 6(6) + 24(3)
6
7
(8) + 2 (7 ) + 6(4)
7
( 8 ) + 2<7> + 8 ( 5 )
8
(8) + 6(6)
(8) + 2(7)
8
(8)

Each

Test.

for

Synthesized

Tests

E r r o r DF
6.97

E r r o r MS
222.63

Synthesis of
(4> + ( 5 ) -

Error
(7)

MS

24

Term

a m

T a b la 1 2 - 1 6

A n lis is d e v a r ia n z a b a la n c e a d o d e M in it a b

( B a la n c e d A N V A ) d e l e je m p lo 1 2 - 7 , m o d e lo n o r e s t r in g id o

A n l is is d e v a r ia n z a ( d is e o s b a la n c e a d o s )

Factor
Ga s T
Operator
Gauge

Type
f i xed
random
random

Analysis

of

Levels Values
3
60
1
4
3
1

Variance

for

Source
Ga s T
Operator
Gauge
GasT*0perator
GasT*Gauge
Opera t o r * G a u g e
GasT*Operator*Gauge
Error
Tota I
x

Not

an

exact

GasT
Operator
Gauge
GasT*0perator
GasT*Gauge
Operator*Gauge
GasT*0perator*Gauge
Error

Error

Drop
SS
1023.36
423.82
7.19
1211.97
137.89
209.47
166.11
770.50
3950.32

DF
2
3
2
6
4
6
12
36
71

Variance
component

Synthesized
Terns

Source
1 Ga s T
2 Operator
3 Gauge

90
3
3

MS
511.68
141.27
3.60
202.00
34.47
34.91
13.84
21.40

F
2.30
0.63
0.06
14.59
2.49
2.52
0.65

P
0.171 x
0.616 x
0.938 x
0.000
0.099
0.081
0.788

F-test.

Source
1
2
3
4
5
6
7
8

75
2
2

-4.544
-2.164
31.359
2.579
3.512
-3.780
21.403

E r r o r E x p e c t e d Me a n S q u a r e f o r E a c h T e r m
t e r m ( u s i n g u n r e s t r i c t e d mode I )
*
(8) + 2(7) + 8(5) + 6(4) + o m
*
(8) + 2(7) + 6 (6 ) + 6(4 ) + 18(2)
*
(8) + 2(7) + 6 (6 ) + 8(5 ) + 24(3)
7
(8 > + 2 ( 7 ) + 6 ( 4 )
(8> + 2 ( 7 ) + 8 ( 5 )
7
(3) + 2(7) + 6(6)
7
(8) + 2(7)
8
(8)

Test.

for

Synthesized

Tests

E r r o r DF
6.97
7.09
5.98

E r r o r MS
222.63
223.06
55.54

Synthesis of
( 4 ) + <5)
(4) + (6)
(5) + 6 )

Error
- <7)
- (7)
- (7)

MS

12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIN DE LOS COMPONENTES DE LA VARIANZA

12-7

543

ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIN DE LOS


COMPONENTES DE LA VARIANZA

Como se seal anteriormente, la estimacin de los componentes de la varianza en un modelo aleatorio o


mixto reviste con frecuencia considerable importancia para el experimentador. En esta seccin se presen
tan algunos resultados y tcnicas adicionales que son tiles para estimar los componentes de la varianza.
La atencin se centra en los procedimientos para encontrar intervalos de confianza para los componentes
de la varianza, y se ilustra asimismo cmo encontrar estimaciones de mxima verosimilitud de los compo
nentes de la varianza. El mtodo de mxima verosimilitud puede ser una alternativa til cuando el mto
do del anlisis de varianza produce estimaciones negativas.

12-7.1

Intervalos de confianza aproximados para los componentes de la varianza

Cuando se introdujo el modelo de efectos aleatorios en la seccin 12-1, se presentaron intervalos de con
fianza exactos de 1 0 0 ( 1 - a) por ciento para o2 y para otras funciones de los componentes de la varianza en
ese diseo experimental simple. Siempre es posible encontrar un intervalo de confianza exacto para cual
quier funcin de los componentes de la varianza que es el valor esperado de uno de los cuadrados medios
del anlisis de varianza. Por ejemplo, considere el cuadrado medio del error. Puesto que E(MSe) = o2,
siempre es posible encontrar un intervalo de confianza exacto para o2, ya que la cantidad
f BMSEl a 2 = f E 2 / a 2
tiene una distribucin ji-cuadrada con/ grados de libertad. El intervalo de confianza exacto de 100(1 - a)
por ciento es
fEMSE
,
fEMSE
2 - < o 2 < \ --- Xa/2,fE

(12-36)

Xl-al2,fE

Desafortunadamente, en experimentos ms complejos en los que intervienen varios factores del dise
o no es posible por lo general encontrar intervalos de confianza exactos para los componentes de la va
rianza de inters, ya que estas varianzas no son el valor esperado de un solo cuadrado medio del anlisis
de varianza. Sin embargo, los conceptos fundamentales de las pseudo pruebas F aproximadas de Sat
terthwaite, introducidos en la seccin 1 2 -6 , pueden emplearse para construir intervalos de confianza
aproximados de los componentes de la varianza para los que no se cuenta con ningn intervalo de con
fianza exacto.
Recuerde que el mtodo de Satterthwaite utiliza dos combinaciones lineales de cuadrados medios
M S'=M S,+ - + M S t

M S " = M S U+ - + M S V

con el estadstico de prueba


F =

MS'
MS"

que tiene una distribucin F aproximada. Al utilizar los grados de libertad apropiados paraAS' y M S ", de
finidos en las ecuaciones 12-34 y 12-35, este estadstico F puede usarse en una prueba de significacin
aproximada del parmetro o del componente de la varianza de inters.

544

CAPTULO 12

EXPERIMENTOS CON FACTORES ALEATORIOS

Para probar la significacin de un componente de la varianza, por ejemplo a \ , las dos combinaciones
lineales, MS' y MS", se eligen de tal modo que la diferencia en sus valores esperados sea igual a un mlti
plo del componente, por ejemplo
E( M S ' )- E ( M S " ) =k o 2a
_ E(MS')-E(MS")

(12-37)

La ecuacin 12-37 proporciona una base para una estimacin puntual de


MS'-MS"
i= ^ M S r + - - - + M S , - ^ M S u - MSV

(12-38)

Los cuadrados medios (MS) de la ecuacin 12-38 son independientes, donde las/AfS-Jo] = SSJa] tienen
distribuciones ji-cuadrada con f grados de libertad. La estimacin del componente de la varianza, a \ , es
una combinacin lineal de mltiplos de los cuadrados medios, y rd\!a\ sigue una distribucin ji-cuadrada
aproximada con r grados de libertad, donde
r

-,

(ft ) 2
1 MSJ
t
/,
(MSr + ---+MSs - M S u-------- MSVf
MS?

MS2 MSl
-+ + ^ 7 ^ + 7^ +
fr
fu
f.

(12-39)

MSt
+-

Este resultado slo puede usarse si \ > 0 . Como r no ser un entero en la mayora de los casos, por lo ge
neral ser necesario hacer una interpolacin de las tablas ji-cuadrada. Graybill [50] establece un resulta
do general para r.
Ahora bien, puesto que rd^/1tiene una distribucin ji-cuadrada aproximada con r grados de libertad,
Xl

T0\

a ( 2 tr

2 .r

ri

rdl

= 1-a

' - ao
X a l2 ,r

= 1-a

X l-a l2 ,r

Por lo tanto, un intervalo de confianza aproximado de 100(1 - a) por ciento para (Tq es
ran

r p
Xa!2,r

(12-40)

X i-

EJEMPLO 1 2 -8 ..................................................................................................................................
Para ilustrar este procedimiento, considere nuevamente el experimento del ejemplo 12-7, donde se us
un modelo mixto con tres factores en un estudio de la cada de la presin en una vlvula de expansin de
una turbina. El modelo es

yvu +*i +j
=

+(*)ij

+ ( * y ) *

+(y)Jk

+ f >

12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIN DE LOS COMPONENTES DE LA VARIANZA

545

donde r, es un efecto fijo y todos los dems efectos son aleatorios. Se encontrar un intervalo de confianza
aproximado para a]. Al utilizar los cuadrados medios esperados de la tabla 12-14, se observa que la dife
rencia en los valores esperados de los cuadrados medios para el efecto de la interaccin de dos factores
AB y el efecto de interaccin de tres factores ABC es un mltiplo del componente de la varianza de
inters, a 2.
E(MS ab ) - E(MSAac ) = a 2 + n o 2Ty +cno2 - ( o 2 + n a 2jr )
= cno]
Por lo tanto, la estimacin puntual de o ^ es
*

= MS - M S _ 134.91-19.26 _ 192S
cn
"
(3)(2)

(M S ^ -M S^ )2
MS2m
|
M S^ C
(fl- l ) ( f t - l ) ( a - l ) ( f t - l ) ( c - l )

(134.91-19.26)2
(134.91)2
(2)(3)

(19.26)2
(2)(3)(2)

El intervalo de confianza aproximado de 95% para a\ se encuentra entonces con la ecuacin 12-40 de la
siguiente manera:
----o zfi
l < ----2 ~ <
2
X 0 .0 7 5 ,r
X0.75,r
(4.36)(19.28) _ 2 _ (4.36)(19.28)
11.58
0.61
7.26 < o 2z <137.81
Este resultado es consistente con los resultados de la prueba F exacta para a], en que hay evidencia sli
da de que este componente de la varianza es diferente de cero.

12-7.2

Mtodo de grandes muestras modificado

El mtodo de Satterthwaite de la seccin anterior es una forma relativamente simple de encontrar un in


tervalo de confianza aproximado para un componente de la varianza que puede expresarse como una
combinacin lineal de cuadrados medios, por ejemplo
l ~ 2 ciMSi
/=i

(1241)

El mtodo de Satterthwaite funciona bien cuando los grados de libertad de cada cuadrado medio MS, son
relativamente grandes, y cuando todas las constantes c de la ecuacin 12-41 son positivas. Sin embargo,
en ocasiones algunas de las c, son negativas. Graybill y Wang [51] propusieron un procedimiento llamado
mtodo de grandes muestras modificado, que puede ser una alternativa muy til del mtodo de Sattert
hwaite. Si todas las constantes c de la ecuacin 12-41 son positivas, entonces el intervalo de confianza mo
dificado de 1 0 0 ( 1 - a) por ciento de una muestra grande para a \ es
0

-^ 2

GfcfMS2 < o s o + j

HfcfMSf

(12-42)

546

C A P T U L O

12

E X P E R I M E N T O S

C O N

F A C T O R E S

A L E A T O R I O S

donde
y

------ 1

a,/,,

Observe que una variable aleatoria F con un nmero infinito de grados de libertad en el denominador es
equivalente a una variable aleatoria ji-cuadrada dividida por sus grados de libertad.
Considere ahora el caso ms general de la ecuacin 12-41, donde las constantes c, no tienen restric
ciones sobre el signo. Esto puede escribirse como
Q

K = 2 ) ciMS - J

CjMS j ,

c Cj > 0

(12-43)

j= P + 1

Ting, et al [110], dan un intervalo de confianza inferior aproximado de 100(1 - a) por ciento para a;; como
L = i-jr

(12-44)

donde
P

GfcfMSf +
= l

i= l

j= P + 1

P -l

S X G2cicJMSiMS]

H)c)MS) + 2

y= p + 1

G. = 1 a/jt
H. =
' E

G* =

1-

q
-

+ /,) 2

f i2/

g,7 ,

( /> - ! ) ,

aJl+fr,

Estos resultados tambin pueden extenderse para incluir intervalos de confianza aproximados para
cocientes de componentes de la varianza. Para una relacin completa de estos mtodos, referirse al exce
lente libro de Burdick y Graybill [22].

EJEMPLO 1 2 -9 ..................................................................................................................................
Para ilustrar el mtodo de grandes muestras modificado, considere nuevamente el modelo mixto con tres
factores del ejemplo 12-7. Se encontrar un intervalo de confianza inferior aproximado de 95% para a\.
Recuerde que la estimacin puntual de < e s

12-7

A L G U N O S

T E M A S

A D I C I O N A L E S

S O B R E

L A

E S T I M A C I N

D E

L O S

C O M P O N E N T E S

D E

L A

V A R I A N Z A

547

Por lo tanto, en la notacin de la ecuacin 12-43, c, = c2 = V, y


G. = 1 - 1 - = 0.524
F0,05,6,
21
H, = ^~----- 1 = 7 - 1 = 1.30
0. 95, 12, *
0-435
12

r
*0.05,6,12

( 3 0 0 - 1)2 - (0.524)2(3.00)2 - (1.3) 2


3.00
Gi, =

Q Q 51

Por la ecuacin 12-44


VL = G2c2MS^j + H 2c M S ^ c + Gl2c1c2MSABMSABC
= (0.524)2(1 / 6 )2 (134.91)2 +(1.3 ) 2 (1 / 6 ) 2 (19.26)2
+(-0l054)(1 / 6)(1 / 6)(134.91)(19.26)
= 152.36
As, un lmite de confianza inferior aproximado de 95% para o] es
L=; -

= 19.28- V152.36 = 6.94

Este resultado es consistente con los resultados de la prueba F exacta para este efecto.

12-7.3

Estimacin de mxima verosimilitud de componentes de la varianza

En este captulo se ha subrayado el mtodo del anlisis de varianza para estimar los componentes de la
varianza debido a que es relativamente directo y hace uso de cantidades familiares: los cuadrados medios
de la tabla del anlisis de varianza. Sin embargo, el mtodo tiene ciertas desventajas, incluyendo la moles
ta tendencia a producir en ocasiones estimaciones negativas. Adems, el mtodo del anlisis de varianza
es en realidad un mtodo de estimador de momentos, una tcnica que los especialistas en estadstica ma
temtica prefieren en general no usar para estimar parmetros, debido a que resulta con frecuencia en es
timaciones de parmetros que no tienen buenas propiedades estadsticas. A la tcnica de estimacin de
parmetros preferida se le llama mtodo de mxima verosimilitud. La implementacin de este mtodo
puede ser un tanto complicada, en particular para el modelo de un diseo experimental, pero en cierto
sentido el mtodo de mxima verosimilitud selecciona estimaciones de los parmetros que, para un mo
delo y una distribucin del error especificados, maximiza la probabilidad de ocurrencia de los resultados
mustrales. Una descripcin general muy adecuada del mtodo de mxima verosimilitud aplicado a mo
delos de diseos experimentales se ofrece en Milliken y Johnson [79].
La revisin completa del mtodo de mxima verosimilitud sale del alcance de este libro, pero la idea
general puede ilustrarse con suma facilidad. Soponga que x es una variable aleatoria con una distribucin

548

CAPITULO 12

EXPERIMENTOS CON FACTORES ALEATORIOS

de probabilidad f(x; 6), donde 6 es un parmetro desconocido. Seaxl5x2, ...,x una muestra aleatoria de n
observaciones. Entonces la funcin de verosimilitud de la muestra es
L ( 0 ) = / ( * , ; ) - f ( x 2; d ) .........f ( x n- e )
Observe que ahora la funcin de verosimilitud es una funcin nicamente del parmetro desconocido 0,
El estimador de mxima verosimilitud de 6 es el valor de 8 que maximiza la funcin de verosimilitud L(6).
Para ilustrar cmo se aplica esto en el modelo de un diseo experimental con efectos aleatorios, con
sidere un modelo de dos factores con a = b = n = 2. El modelo es
V = t * + * i + j + (*)ij +ilk
con i = 1, 2, j = 1, 2 y k = 1, 2. La varianza de cualquier observacin es
^ O V ) = CT = t f r2 + ^ + < 3 + < 7 2
y las covarianzas son
C o v (^ , yffk ) = a t + o + o ti

i = i', j = , k * k '
i=i

= o 2

j * j'

(12-45)

i * i', j = j '
i * i', j * j '

= 0

Es conveniente considerar las observaciones como un vector

x 1, es decir,

Vll2

^211

y=

y212

y 121

y122
y22i
y 222

y las varianzas y covarianzas pueden expresarse como una matriz de covarianza


2

=
22 J]

donde Zn, Z22,

2 12

2 21

"2 22

2 ' 12

son matrices 4 x 4 definidas de la siguiente manera:

\ +o] +0*
2

o] + o 2 +o]
'a \

2,, =

o\

a\

a \ 2
2 2

12-7 ALGUNOS TEMAS ADICIONALES SOBRE LA ESTIMACIN DE LOS COMPONENTES DE LA VARIANZA

549

y 2 2i es slo la transpuesta de 2 12. Entonces cada observacin sigue una distribucin normal con varianza
o 2, y si se supone que todas las N = abn observaciones tienen una distribucin normal conjunta, entonces
la funcin de verosimilitud del modelo aleatorio queda como
L(fi, o 2, o ] , a T, o 2) =

(2n)N,2\J\ti 1/2

exp - | ( y - j N^)' 2 _1 ( y - j ^ )

donde jjv es un vector N x 1 compuesto de unos. Las estimaciones de mxima verosimilitud e, n , o ] , a 2 ,


a 2r y o 2 son los valores de estos parmetros que maximizan la funcin de verosimilitud. Tambin sera de
seable restringir las estimaciones de los componentes de la varianza a valores no negativos. Por lo tanto,
en la prctica la funcin de verosimilitud se maximizara sujeta a esta restriccin.
La estimacin de los componentes de la varianza por el mtodo de mxima verosimilitud requiere
software de computadora especializado. Algunos paquetes de software de estadstica general cuentan
con esta capacidad. El sistema SAS calcula estimaciones de mxima verosimilitud de los componentes de
la varianza de modelos aleatorios o mixtos con la rutina SAS PROC MIXED. Se ilustrar el uso de la ruti
na PROC MIXED aplicndola al modelo factorial de dos factores introducido en los ejemplos 12-2 y
12-3.
Considere primero el ejemplo 12-2. Se trata del modelo de un diseo factorial de efectos aleatorios
con dos factores. El mtodo del anlisis de varianza ha producido una estimacin negativa del componen
te de la varianza de la interaccin. Las estimaciones negativas de los componentes de la varianza pueden
evitarse en la rutina PROC MIXED especificando el uso del mtodo de mxima verosimilitud restringi
da (o residual) (REML, por sus siglas en ingls). En esencia, la REML restringe las estimaciones de los
componentes de la varianza a valores no negativos.
La rutina PROC MIXED del sistema SAS requiere como entrada la matriz de covarianza de los par
metros del modelo. La estructura de un modelo aleatorio en el que todas las variables aleatorias son mu
tuamente independientes es

G=

o2
tI

all

(12-46)
I

donde las I son matrices identidad. (La estructura de la covarianza de un modelo puede especificarse en
la rutina PROC MIXED con la opcin TYPE = structure en el enunciado RANDOM.) La estructura de
la covarianza del modelo del ejemplo 12-2 se especifica como TYPE = SIM (el valor por omisin de
PROC MIXED), que especifica la estructura simple de la covarianza para los parmetros del modelo da
dos en la ecuacin 12-46.
En la tabla 12-17 se presenta la salida de la rutina PROC MIXED de SAS para el experimento del
ejemplo 12-2. Se especific el mtodo de estimacin REML de los componentes de la varianza. La salida
se ha anotado con nmeros para facilitar la descripcin que se presenta a continuacin:
1. Estimaciones de los componentes de la varianza y la salida relacionada.
2. Parmetro covarianza. Identifica los parmetros del modelo: a 2, o 2, o 2t y er2.
3. Cociente de la varianza estimada del efecto y la varianza estimada del error residual:
2 / 2
4. Estimaciones de los parmetros. Son las estimaciones REML de los componentes de la varianza
o], o 2 , o] y d 2. Observe que la estimacin REML de d 2 es cero.

550

Tabla

1 2 -1 7

S a lid a d e P R O C M I X E D

d e l s is t e m a S A S d e l a n lis is d e l e s t u d io d e r e p e t ib ilid a d y r e p r o d u c t b ilid a d d e in s t r u m e n t o s d e m e d ic i n

(c a lib r a d o r e s )

d e l_ e je m p ] o . 1 2 - 2 u t il iz a n d o la e s t im a c i n R E M L d e lo s c o m p o n e n t e s d e v a r ia n z a

The

MI XED

Procedure

Class Level In fo rm a tio n


Levels
Values
20
1 2 3 4 5 6 7 8 9
14 15 16 17 18 19
OPERATOR
3
1 2 3
R E P L I CAT
2
1 2
Class
PART

10
20

11

12

13

0
Cova r i a n c e

Cov

3
Ratio

S
E s t i mate

0.01203539
11.60743820
-0.00000000
1.00000000

0.01062922
10.25126446
-0.00000000
0.88316339

0
Parm

OPERATOR
PART
PART * 0 P E RATOR
Resi d u a l

Pa r a m e t e r

Asymptoti c
Cov P a r m
OPERATOR
PART
P A R T * OP E RA T OR
Residual

OPERATOR
0.00107978
0.00006632
0.00000000
-0.00039795

Std

Estimates

0
Errors

0
Z

(REML)

Pr

0
0
> Iz I Alpha

0
Lower

0.03286000
3.37376878

0.32
3.04

0.7463
0.0024

0.05
0.05

-0.0538
3.6388

0.12616620

7.00

0.0000

0.05

0.6359

M
Cova r i a n c e

Matrix

PART
0.00006632
11.38231579
0.00000000
-0.00265287

of

Es t i n a t e s

P A R T * 0 P ERAT0 R
0.00000000
0.00000000
0.00000000
-0.00000000

0
M o d e l F i t t i n g I n f o r m a t i on f o r VALUE
Va l u e
D e s c r i p t i on
120.0000
O b s e r v a t i ons
0.8832
V a r i a n c e Est i mate
0.9398
S t a n d a r d D e v i a t i on E s t i m a t e
-204.696
REML L o g L i k e l i h o o d
Akaike's Inform ation C rite rio n -208.696
-214.254
Schwarz's Bayesian C r it e r io n
409.3913
- 2 REML L og L i k e l i h o o d

Re s i d u a l
-0.00039795
-0.00265287
-0.00000000
0.01591791

Upper
0.0750
16.8637
.
1 .1304

T a b la

12 -18

S a lid a d e P R O C M I X E D

d e l s is t e m a S A S

d e l a n lis is d e l e s t u d io d e r e p e t ib ilid a d y r e p r o d u c t ib ilid a d d e in s t r u m e n t o s d e m e d ic i n ( c a lib r a d o r e s ) c o n e l

o p e r a d o r c o m o e f e c t o f ijo u t il iz a n d o la e s t i m a c i n R E M L d e lo s c o m p o n e n t e s d e la v a r ia n z a

The
Cova r i a n c e
Cov

Parm

PART
PART* OPERATOR
Residual

Ratio

Est isa te

11.60743876
0.00000000
1.00000000

10.25126472
0.00000000
0.88316337
Asymptotic

C ov

Procedure

Parameter
Std

Estima tes

Error

3.37376895
0.12616620

Covariance

Par

PART
P A R T * OP E R A T OR
Residuai

NIXED

Pr

> I zI

Alpha

Loue r

Upper

3.04

0.0024

0.05

3.6388

16.8637

7.00

0.0000

0.05

0.6359

1 .1304

Matrix

of

Est i mates

PART* OPERATOR

Residuai

11.38231693
0.00000000
-0.00265287

0.00000000
0.00000000
0.00000000

- 0 . 0 0 2 6 5 2 87
-0.00000000
-0.01591791

Fitting

Inform ation

for

Description
Observations
Variance Estimate
Standard D eviation Estim ate
REHL L o g L i k e l i h o o d
Akaike's Inform ation C rite rio n
Schwarz's Bayesian C r it e r io n
- 2 REML L o g L i k e l i h o o d
Tests

OPERATOR

PART

Model

Source

(REML)

of

Fixed

NDF

DDF

38

VALUE
Value
120.0000
0.8832
0.9398
-204.729
-207.729
-211.872
409.4572

Effects

Type

I I I

1.48

Pr

>

0.2401

551

552

CAPTULO 12

EXPERIMENTOS CON FACTORES ALEATORIOS

5. Error estndar de la estimacin. Es el error estndar (se) para muestras grandes de la estimacin
del parmetro: se(] ) = -JV(f).
6. El estadstico Z asociado con la varianza estimada:
Z = f /se(&f).
7. Valor P del estadstico Z calculado.
8 . Nivel alfa usado para calcular el intervalo de confianza.
9. Lmites inferior y superior de un intervalo de confianza de la teora normal para muestras gran
des de 1 0 0 ( 1 - a) por ciento para los componentes de la varianza:
L = ) - Z til2se(] )
U=* + Z al2se(] )
10. Matriz asintotica de la covarianza de las estimaciones. Es la matriz de la covarianza para mues
tras grandes de las estimaciones de los componentes de la varianza.
11. Medidas del ajuste del modelo para comparar el ajuste de modelos alternativos.
Observe que los resultados de la rutina PROC MIXED de SAS coinciden muy de cerca con los valores pre
sentados en el ejemplo 1 2 -2 cuando el modelo reducido (sin el trmino de la interaccin) se ajust a los datos.
En el ejemplo 12-3 se consider el mismo experimento, pero se supuso que los operadores eran un
factor fijo, lo cual llev a un modelo mixto. La rutina PROC MIXED de SAS puede emplearse para esti
mar los componentes de la varianza para esta situacin. La estructura de la covarianza de las observacio
nes, suponiendo que todas las variables aleatorias son mutuamente independientes (es decir, el modelo
mixto no restringido), es
Cov(> W y , i v ) = a \ + a % + 2

= a + a I

i = i

k = k'

i = i \ j = j t k& k

(1 2 -4 7 )

=0
j* j'
La matriz de la covarianza de los parmetros del modelo es
o]l
0
G=

(12-48)

(Esto se especifica en el enunciado TYPE = SIM en la entrada de la rutina PROC MIXED.) En la tabla
12-18 se muestra la salida de la rutina PROC MIXED de SAS para la forma no restringida del modelo
mixto del ejemplo 12-3. De nueva cuenta se seleccion el mtodo REML. La estimacin del componente
de la varianza para el factor pieza es muy similar a la estimacin que se obtuvo utilizando el modelo
aleatorio. La estimacin de la varianza del error residual tambin es similar. Adems, la salida incluye
una prueba F para el efecto fijo.

12-8
12 -1.

PROBLEMAS
U n a f b r ic a t e x t il t ie n e u n g r a n n m e r o d e t e la r e s . S e s u p o n e q u e c a d a t e la r p r o d u c e la m is m a c a n t id a d d e
t e la p o r m in u t o . P a r a in v e s t ig a r e s t e s u p u e s t o , s e e lig e n c in c o t e la r e s a l a z a r y s e r e g is t r a s u p r o d u c c i n e n
t ie m p o s

d if e r e n t e s . S e

o b t ie n e n

lo s

T e la r

s ig u ie n t e s

d a to s:

P r o d u c c i n ( lb /m in )

1 4 .0

14 .1

14 .2

14 .0

14 .1

1 3 .9

13 .8

13 .9

14 .0

1 4 .0

14 .1

1 4 .2

14 .1

14 .0

1 3 .9

1 3 .6

1 3 .8

14 .0

1 3 .9

13 .7

13 .8

1 3 .6

13 .9

13 .8

14 .0

12-8 PROBLEMAS
a)

E x p lic a r p o r q u e s t e e x p e r im e n t o e s d e e f e c t o s a le a t o r io s . T o d o s lo s t e la r e s t ie n e n l a m is m a p r o d u c

b)

E s t im a r

la

v a r ia b ilid a d

c)

E s t im a r

la

v a r ia n z a

c i n ?

U t iliz a r

0 .0 5 .
e n tre

lo s

t e la r e s .

d e l e r r o r e x p e r im e n t a l.

d)

E n co n tra r u n

e)

A n a liz a r lo s r e s id u a le s d e e s te e x p e r im e n t o . C o n s id e r a e l le c t o r q u e s e s a t is f a c e n lo s s u p u e s t o s d e l a n

U n

f a b r ic a n t e s o s p e c h a q u e lo s lo t e s d e m a t e r ia p r im a s u m in is t r a d o s p o r s u p r o v e e d o r d if ie r e n d e m a n e r a

lis is
12 -2 .

553

in t e r v a lo

de

c o n f ia n z a

d e

9 5 %

a\

p ara

/ (o j +

c t2 )

d e v a r ia n z a ?

s ig n if ic a t iv a e n e l c o n t e n id o d e c a lc io . H a y u n g r a n n m e r o d e lo t e s a c t u a lm e n t e e n e l a lm a c n . S e s e le c c io
n a n c in c o d e e llo s p a r a h a c e r u n e s t u d io . U n
s ig u ie n t e s

L o te 2

L o te 3

L o te 4

L o te 5

2 3 .4 6

2 3 .5 9

2 3 .5 1

2 3 .2 8

2 3 .2 9

2 3 .4 8

2 3 .4 6

2 3 .6 4

2 3 .4 0

2 3 .4 6

2 3 .5 6

2 3 .4 2

2 3 .4 6

2 3 .3 7

2 3 .3 7

2 3 .3 9

2 3 .4 9

2 3 .5 2

2 3 .4 6

2 3 .3 2

2 3 .4 0

2 3 .5 0

2 3 .4 9

2 3 .3 9

2 3 .3 8

L o te

12 -3 .

q u m ic o h a c e c in c o d e t e r m in a c io n e s e n c a d a lo t e y o b t ie n e lo s

d a to s:

a)

E x is t e

b)

E s t im a r

c)
d)

A n a liz a r

u n a

v a r ia c i n

s ig n if ic a t iv a

lo s c o m p o n e n t e s

E n co n tra r

u n

d e

la

en

e l c o n t e n id o

de

c a lc io

d e

u n

lo t e

o tro ?

U t iliz a r

0 .0 5 .

v a r ia n z a .

in t e r v a lo

de

c o n f ia n z a

lo s r e s id u a le s

de

e ste

d e

9 5 %

a\ / (erj + a2).

p ara

e x p e r im e n t o . S e

s a t is f a c e n

lo s

s u p u e s t o s d e l a n lis is

d e v a r ia n z a ?

E n u n a f b r ic a m e t a l r g ic a s e u s a n v a r io s h o r n o s p a r a c a le n t a r e je m p la r e s d e m e t a l. S e s u p o n e q u e t o d o s lo s
h o r n o s o p e r a n a la m is m a t e m p e r a t u r a , a u n q u e s e s o s p e c h a q u e q u iz n o s e a s te e l c a s o . S e s e le c c io n a n a l
a z a r t r e s h o r n o s y s e r e g is t r a n s u s t e m p e r a t u r a s e n c a r g a s s u c e s iv a s . L o s d a t o s r e c a b a d o s s o n lo s s ig u ie n t e s :

H o rn o

a)

E x is t e

b)

E s t im a r

c)
12 -4 .

E n

T e m p e ra tu ra

4 9 1 .5 0

4 9 8 .3 0

4 9 8 .1 0

4 9 3 .5 0

4 8 8 .5 0

4 8 4 .6 5

4 7 9 .9 0

4 7 7 .3 5

4 9 0 .1 0

4 8 4 .8 0

4 8 8 .2 5

4 7 3 .0 0

u n a v a r ia c i n
lo s

s ig n if ic a t iv a

c o m p o n e n te s d e

d e

la

la v a r ia n z a

te m p e ra tu ra
d e

e ste

e n tre

lo s

4 9 3 .6 0

4 7 8 .6 5

4 7 1 .8 5

h o rn o s?

U t iliz a r

0 .0 5 .

m o d e lo .

A n a liz a r lo s r e s id u a le s d e e s te e x p e r im e n t o y s a c a r c o n c lu s io n e s a c e r c a d e la a d e c u a c i n d e l m o d e lo .
u n a r t c u lo d e

J o u r n a l o f the E le c t r o c h e m ic a l S o c ie ty

( v o l. 1 3 9 , n o . 2 , p p . 5 2 4 -5 3 2 ) s e d e s c r ib e u n e x p e r i

m e n t o p a r a in v e s t ig a r la d e p o s ic i n d e v a p o r a b a ja p r e s i n d e l p o lis ilic io . E l e x p e r im e n t o s e lle v a c a b o e n


e l r e a c t o r d e a lt a c a p a c id a d d e S e m a t e c h e n A u s t in , T e x a s . E l r e a c t o r t ie n e v a r ia s p o s ic io n e s p a r a la s o b le a s ,
y s e s e le c c io n a n a l a z a r c u a t r o d e e s t a s p o s ic io n e s . L a v a r ia b le d e r e s p u e s t a e s la u n if o r m id a d d e l e s p e s o r d e
la

p e lc u la .

Se

h ic ie r o n

t r e s r p lic a s

d e l e x p e r im e n t o

P o s ic i n d e la o b le a

se

o b t u v ie r o n

lo s

s ig u ie n t e s

U n if o r m id a d

2 .7 6

5 .6 7

4 .4 9

1.4 3

1.7 0

2 .1 9

2 .3 4

1.9 7

1.4 7

0 .9 4

1.3 6

1.6 5

d a to s:

554

12 -5 .

EXPERIMENTOS C O N FACTORES ALEATORIOS

CAPTULO 12
a)

H a y

b)

E s t im a r

la

c)

E s t im a r

e l co m p o n e n te

d)

A n a liz a r

a lg u n a

C o n s id e r e

d if e r e n c ia

v a r ia b ilid a d

lo s

r e s id u a le s

e l e x p e r im e n t o

en

la s

p o s ic io n e s

d e b id a

d e l e rro r
d e

d e

e ste
la

de

la s

la s p o s ic io n e s

o b le a s ?
d e

la s

U t iliz a r

a -

0 .0 5 .

o b le a s .

a le a t o r io .

e x p e r im e n t o

d e p o s ic i n

d e

c o m e n ta r la

v ap o r

a d e c u a c i n

d e l p r o b le m a

d e l m o d e lo ,

12 -4 .

a)

E s t im a r la

b)

Q u p a r t e d e l a v a r ia b ilid a d t o t a l d e la r e s p u e s t a u n if o r m id a d s e d e b e a la d if e r e n c ia e n t r e la s p o s ic io
n es

c)

en

v a r ia b ilid a d

to ta l d e

la

re sp u e sta

u n if o r m id a d .

el re a cto r?

H a s t a q u n iv e l p o d r a r e d u c ir s e la v a r ia b ilid a d d e la r e s p u e s t a u n if o r m id a d s i p u d ie r a e lim in a r s e la v a
r ia b ilid a d e n t r e u n a p o s ic i n y o tr a e n e l r e a c t o r ? C o n s id e r a e l le c t o r q u e s ta e s u n a r e d u c c i n s ig n if i
c a t iv a ?

12 -6 .

e J o u r n a l o f Q u a lit y T e c h n o lo g y

E n u n a r t c u lo d

( v o l. 1 3 , n o . 2 , p p ! 1 1 1 - 1 1 4 ) s e d e s c r ib e u n e x p e r im e n t o p a r a

in v e s t ig a r lo s e f e c t o s d e c u a t r o s u s t a n c ia s q u m ic a s b la n q u e a d o r a s s o b r e la b r illa n t e z d e l a p u lp a . E s t a s c u a
tr o s u s t a n c ia s q u m ic a s s e s e le c c io n a r o n a l a z a r d e u n a p o b la c i n g r a n d e d e a g e n t e s b la n q u e a d o r e s p o t e n
c ia le s . L o s

d a to s

so n

lo s

s ig u ie n t e s :

S u s t a n c ia q u m ic a

12 -7 .

7 4 .4 6 6

9 2 .7 4 6

7 6 .2 0 8

8 2 .8 7 6

8 0 .5 2 2

7 9 .3 0 6

8 1.9 14

8 0 .3 4 6

7 3 .3 8 5

7 9 .4 1 7

7 8 .0 1 7

9 1 .5 9 6

8 0 .8 0 2

8 0 .6 2 6

7 8 .0 0 1

7 8 .3 5 8

7 7 .5 4 4

7 7 .3 6 4

7 7 .3 8 6

E x is t e

b)

E s t im a r

la v a r ia b ilid a d

c)

E s t im a r

la

d)

A n a liz a r

d if e r e n c ia

v a r ia b ilid a d

lo s

r e s id u a le s

t ip o s

d e

s u s t a n c ia s

q u m ic a s ?

d e b id a

en

a l t ip o

de

s u s t a n c ia s

q u m ic a s .

d e b id a

a l e rro r

de

lo s

e ste

U t iliz a r

0 .0 5 .

a le a t o r io .

e x p e r im e n t o

c o m e n ta r la

a d e c u a c i n

d e l m o d e lo .

C o n s id e r e e l m o d e lo d e e f e c t o s a le a t o r io s , b a la n c e a d o , e n u n a v a r ia b le . D e s a r r o lla r u n p r o c e d im ie n t o p a r a
e n c o n tra r u n

12 -8 .

7 7 .1 9 9

a)

a lg u n a

B r illa n t e z d e la p u lp a

R e f e r ir s e

in t e r v a lo

a l p r o b le m a

de

c o n f ia n z a

de

10 0 (1

a)

p o r c ie n t o

p ara

o2/(al + a2).

12 -1.

a)

C u l es

b)

S i la d if e r e n c ia e n t r e lo s t e la r e s e s lo s u f ic ie n t e m e n t e g r a n d e p a r a in c r e m e n t a r l a d e s v ia c i n e s t n d a r d e

la

p r o b a b ilid a d

de

H 0

a ce p ta r

si c r

es

4 veces

la v a r ia n z a

d e l e r r o r <72 ?

u n a o b s e r v a c i n e n 2 0 % , q u ie r e d e t e c t a r s e e s t o c o n u n a p r o b a b ilid a d d e a l m e n o s 0 .8 0 . Q u t a m a o d e
la
12 -9 .

m u e stra

d e b e r

u sarse ?

S e lle v a c a b o u n e x p e r im e n t o p a r a in v e s t ig a r la c a p a c id a d o a p t it u d d e u n s is t e m a d e m e d ic i n . S e s e le c c io
n aro n

d ie z p ie z a s a l a z a r , y

p ru e b a s

se

h ic ie r o n

en

d o s o p e r a d o r e s e s c o g id o s a le a t o r ia m e n t e m id ie r o n

o rd e n

a le a t o r io

se

o b t u v ie r o n

lo s

s ig u ie n t e s

M e d ic io n e s d e l

M e d ic io n e s d e l

d e p ie z a

o p erad o r 2

o p erad o r 1

N m e ro

tr e s v e c e s c a d a p ie z a . L a s

d a to s:

50

49

50

50

48

5 1

5 2

5 2

5 1

5 1

5 1

5 1

53

50

50

54

5 2

5 1

49

5 1

50

48

50

5 1

48

49

48

48

49

48

52

50

50

52

50

50

5 1

5 1

5 1

5 1

50

50

52

50

49

53

48

50

50

5 1

50

5 1

48

49

10

47

46

49

46

4 7

48

12-8 PROBLEMAS

555

a)

A n a liz a r

b)

E n c o n t r a r e s t im a c io n e s p u n t u a le s d e lo s c o m p o n e n t e s d e la v a r ia n z a u t iliz a n d o e l m t o d o d e l a n lis is d e

lo s

d a to s

de

e ste

e x p e r im e n t o .

v a r ia n z a .
12 -10 .

C o n s id e r e n u e v a m e n t e lo s d a t o s d e l p r o b le m a 5 -6 . S u p o n g a q u e a m b o s f a c t o r e s , la s m q u in a s y lo s o p e r a d o
re s, se

e lig e n

a l azar.

a)

A n a liz a r

b)

E n c o n t r a r e s t im a c io n e s p u n t u a le s d e lo s c o m p o n e n t e s d e la v a r ia n z a u t iliz a n d o e l m t o d o d e l a n lis is d e

lo s

d a to s

d e

e ste

e x p e r im e n t o .

v a r ia n z a ,
1 2 -1 1 .

12 -12 .

C o n s id e r e

n u e v a m e n te

a)

A n a liz a r

b)

E s t im a r

lo s
lo s

lo s

d a to s

de

d a to s
e ste

d e l p r o b le m a

5 -13 .

S u p o n g a

q u e

a m b o s fa cto re s so n

a le a t o r io s .

e x p e r im e n t o .

c o m p o n e n te s

d e

la

v a r ia n z a .

S u p o n g a q u e e n e l p r o b le m a 5 - 1 1 la s p o s ic io n e s e n e l h o m o

s e s e le c c io n a r o n a le a t o r ia m e n t e , d a n d o c o m o

r e s u lt a d o u n e x p e r im e n t o c o n u n m o d e lo m ix t o . A n a l iz a r d e n u e v o lo s d a t o s d e e s t e e x p e r im e n t o b a jo e s t e
n u evo

s u p u e s to . E s t im a r

lo s

co m p o n e n te s

a p r o p ia d o s

d e l m o d e lo .

12 -13 .

A n a liz a r d e n u e v o e l e x p e r im e n t o d e lo s s is t e m a s d e m e d ic i n d e l p r o b le m a 1 2 - 9 , s u p o n ie n d o q u e lo s o p e r a

12 -14 .

E n

d o re s so n

u n

f a c t o r f ijo .

E s t im a r lo s

co m p o n e n te s

a p r o p ia d o s

d e l m o d e lo .

e l p r o b le m a 5 -6 , s u p o n g a q u e s lo h a y c u a t r o m q u in a s d e in t e r s , p e r o lo s o p e r a d o r e s s e s e le c c io n a r o n

a le a t o r ia m e n t e .

12 -15 .

a)

Q u

b)

E fe ctu a r

t ip o

d e

m o d e lo

es

e l a n lis is y

a p r o p ia d o ?

e s t im a r lo s

c o m p o n e n te s

d e l m o d e lo .

M e d ia n t e la a p lic a c i n d e l o p e r a d o r v a lo r e s p e r a d o , d e s a r r o lla r lo s c u a d r a d o s m e d io s e s p e r a d o s d e l m o d e lo
f a c t o r ia l m ix t o c o n d o s f a c t o r e s . U s a r lo s s u p u e s t o s d e l m o d e lo r e s t r in g id o . V e r if ic a r lo s r e s u lt a d o s c o n lo s
cu a d ra d o s

1 2 -16 .

m e d io s

e sp erad o s

d e

la

t a b la

1 2 -1 1

p ara

co n sta ta r

q u e

co n cu erd an .

C o n s id e r e e l d is e o f a c t o r ia l d e t r e s f a c t o r e s d e l e je m p lo 1 2 - 6 . P r o p o n e r lo s e s t a d s t ic o s d e p r u e b a a p r o p ia
d o s p a r a t o d o s lo s e f e c t o s p r in c ip a le s y la s in t e r a c c io n e s . R e p e t ir p a r a e l c a s o e n q u e

s o n f ijo s y C

es

a le a t o r io .
12 -17 .

C o n s id e r e e l e x p e r im e n t o d e l e je m p lo 1 2 - 7 . A n a liz a r lo s d a t o s p a r a e l c a s o e n

12 -18 .

D e d u c ir

12 -19 .

lo s

cu a d ra d o s

m e d io s

e sp erad o s d e

la

t a b la

queA, B y C

C o n s id e r e u n e x p e r im e n t o f a c t o r ia l d e c u a t r o f a c t o r e s d o n d e e l f a c t o r ^ t ie n e

v e le s , e l fa c t o r

c n iv e le s , e l f a c t o r D

t ie n e

t ie n e

s o n a le a t o r io s .

12 -14 .

d n iv e le s y

h ay

n iv e le s , e l f a c t o r B

t ie n e

n i

r p lic a s . A n o t a r la s s u m a s d e c u a d r a d o s , lo s

g r a d o s d e lib e r t a d y lo s c u a d r a d o s m e d io s e s p e r a d o s p a r a lo s s ig u ie n t e s c a s o s . S u p o n e r e l m o d e lo r e s t r in g id o
p ara

a)

to d o s

lo s

A , B, C

b)

A , B, C

c)

e s f ijo

d)

e)

A, B

m o d e lo s

so n

so n

B, C

so n
y

f ijo s y
so n

m ix t o s . P u e d e

u sarse

u n

p a q u e te

de

c o m p u ta d o ra

co m o

M in it a b .

f a c t o r e s f ijo s ,
fa cto re s
y

D
C

a le a t o r io s .

so n

f ijo s y

a le a t o r io s .
so n

es

a le a t o r io s ,

a le a t o r io .

E x is t e n p r u e b a s e x a c t a s p a r a t o d o s lo s e f e c t o s ? S i n o e s a s , p r o p o n e r e s t a d s t ic o s d e p r u e b a p a r a lo s e f e c t o s
q u e
12 -2 0 .

n o

p u e d an

p ro b a rse

d ir e c t a m e n t e .

C o n s id e r e n u e v a m e n t e lo s in c is o s

c,d ye

d e l p r o b le m a 1 2 - 1 9 , O b t e n e r lo s c u a d r a d o s m e d io s e s p e r a d o s s u

p o n ie n d o u n m o d e lo n o r e s t r in g id o . P u e d e u s a r s e u n p a q u e t e d e c o m p u t a d o r a c o m o M in it a b . C o m p a r a r lo s
r e s u lt a d o s
12 -2 1.

E n

o b t e n id o s c o n

c o n d ic io n e s y
12 -2 2 .

lo s

d e l m o d e lo

r e s t r in g id o .

e l p r o b le m a 5 - 1 7 , s u p o n g a q u e lo s tr e s o p e r a d o r e s s e s e le c c io n a r o n a l a z a r . A n a liz a r lo s d a t o s b a jo e s ta s

C o n s id e r e

s a c a r c o n c lu s io n e s . E s t im a r

e l m o d e lo

f a c t o r ia l d e

yjk=

tre s

lo s

c o m p o n e n te s

d e

la

v a r ia n z a .

fa cto re s

+j +yk+(rf)y+(y)jk+&

i 1,

\j=

2 , ...,

2 , ...,

|fc = 1 , 2 , ..., c
S u p o n ie n d o q u e lo s t r e s f a c t o r e s s o n a le a t o r io s , d e s a r r o lla r la t a b la d e l a n lis is d e v a r ia n z a , in c lu y e n d o lo s
cu a d ra d o s

m e d io s

esp erad o s. P ro p o n e r

lo s

e s t a d s t ic o s d e

p ru e b a

a p r o p ia d o s

p a ra

to d o s lo s

e fe cto s.

556
12 -2 3 .

CAPTULO 12
E l

m o d e lo

EXPERIMENTOS CON FACTORES ALEATORIOS

f a c t o r ia l d e

tre s

fa cto re s p a ra

u n a

s o la r p lic a

y,jk = r*+i, +j +Yk

es

+(*A'V +

+ (y)jk

S i t o d o s lo s f a c t o r e s s o n a le a t o r io s , p u e d e p r o b a r s e a lg u n o d e lo s e f e c t o s ? S i la s in t e r a c c io n e s d e t r e s f a c t o
re s y
12 -2 4 .

E n

(T/?),y n o

e x is t e n , e s

p o s ib le

p ro b ar

t o d o s lo s

d em s

e fe cto s?

e l p r o b le m a 5 -6 , s u p o n g a q u e t a n t o la s m q u in a s c o m o lo s o p e r a d o r e s s e e s c o g ie r o n a l a z a r . D e t e r m in a r

la p o t e n c ia d e la p r u e b a p a r a d e t e c t a r u n e fe c to d e la m q u in a t a l q u e
la
12 -2 5 .

d e l f a c t o r m q u in a .

s u f ic ie n t e s

dos

a 2

a 2,

d o n d e

o 2 e s

e l co m p o n e n te d e

r p lic a s ?

C a v [ ( t ) v, ( r ) rj\

- ( 1 / a ) a \ p

ara

D e m o s t r a r q u e e l m t o d o d e l a n lis is d e v a r ia n z a s ie m p r e p r o d u c e e s t im a c io n e s p u n t u a le s in s e s g a d a s d e lo s
co m p o n e n te s

12 -2 7 .

S o n

E n e l a n lis is d e v a r ia n z a d e l m o d e lo m ix t o d e d o s f a c t o r e s , d e m o s t r a r q u e

i
12 -2 6 .

v a r ia n z a

In v o c a n d o

de

la

v a r ia n z a

en

c u a lq u ie r m o d e lo

a le a t o r io

m ix t o .

lo s s u p u e s t o s d e .n o r m a lid a d u s u a le s , e n c o n t r a r u n a e x p r e s i n p a r a la p r o b a b ilid a d

d e o b te n e r

u n a e s t im a c i n n e g a t iv a d e u n c o m p o n e n t e d e la v a r ia n z a p o r e l m t o d o d e l a n lis is d e v a r ia n z a . U t iliz a n d o
e s t e r e s u lt a d o , e s c r ib ir u n e n u n c ia d o p a r a la p r o b a b ilid a d d e q u e j <
to r. C o m e n ta r
12 -2 8 .

la

u t ilid a d

de

e ste

e n u n c ia d o

de

0 e n u n a n lis is d e v a r ia n z a d e u n f a c

p r o b a b ilid a d .

A n a liz a r lo s d a t o s d e l p r o b le m a 1 2 - 9 , s u p o n ie n d o q u e lo s o p e r a d o r e s s o n f ijo s y u t iliz a n d o t a n t o la f o r m a n o


r e s t r in g id a c o m o la r e s t r in g id a d e lo s m o d e lo s m ix t o s . C o m p a r a r lo s r e s u lt a d o s q u e s e o b t ie n e n c o n lo s d o s
m o d e lo s .

12 -2 9 .

C o n s id e r e e l m o d e lo m ix t o d e d o s f a c t o r e s . D e m o s t r a r q u e e l e r r o r e s t n d a r d e la m e d ia d e l f a c t o r f ijo ( p o r
e je m p lo ,

12 -3 0 .

A)

C o n s id e r e

[M S AB/b n ] 1/1.
c o m p o n e n te s

de

la

v a r ia n z a

a le a t o r io

E n co n tra r

b)

E n c o n t r a r in t e r v a lo s d e c o n f ia n z a a p r o x im a d o s d e l 9 5 %

u n

in t e r v a lo

e l m to d o

d e

de

c o n f ia n z a

e x acto

d el 9 5 %

p ara

d e l p r o b le m a

12 -9 .

a 2.

p a r a lo s o t r o s c o m p o n e n t e s d e la v a r ia n z a u t ili

S a t t e r t h w a it e .

U s a r e l e x p e r im e n t o d e s c r it o e n e l p r o b le m a 5 -6 y s u p o n e r q u e a m b o s f a c t o r e s s o n a le a t o r io s . E n c o n t r a r u n
in t e r v a lo d e c o n f ia n z a e x a c t o d e l 9 5 %
lo s

12 -3 2 .

d e l m o d e lo

a)

za n d o
12 -3 1.

es

lo s

o tro s

co m p o n e n te s

d e

la

v a r ia n z a

p ara

a2. C o n s t r u i r

u t iliz a n d o

in t e r v a lo s d e c o n f ia n z a a p r o x im a d o s d e l 9 5 %

e l m to d o

de

p ara

S a t t e r t h w a it e .

C o n s id e r e e l e x p e r im e n t o d e t r e s f a c t o r e s d e l p r o b le m a 5 - 1 7 y s u p o n g a q u e lo s o p e r a d o r e s s e s e le c c io n a r o n
a l a z a r . E n c o n t r a r u n in t e r v a lo d e c o n f ia n z a a p r o x im a d o d e l 9 5 %

p a r a e l c o m p o n e n t e d e la v a r ia n z a d e l o p e

rad o r.
12 -3 3 .

R e s o lv e r d e n u e v o e l p r o b le m a 1 2 - 3 0 u t iliz a n d o e l m t o d o d e g r a n d e s m u e s t r a s m o d if ic a d o q u e s e d e s c r ib e
en

12 -3 4 .

la

s e c c i n

1 2 -7 .2 .

C o m p a ra r

la s

dos

s e r ie s

d e

in t e r v a lo s

d e

c o n f ia n z a

o b t e n id a s y

c o m e n t a r la s .

R e s o lv e r d e n u e v o e l p r o b le m a 1 2 - 3 2 u t iliz a n d o e l m t o d o d e g r a n d e s m u e s t r a s m o d if ic a d o q u e s e d e s c r ib e
e n la s e c c i n 1 2 - 7 .2 . C o m p a r a r e s te in t e r v a lo d e c o n f ia n z a c o n e l q u e s e o b t u v o a n t e r io r m e n t e y c o m e n t a r lo .

Diseos anidados
y de parcelas
subdivididas

En este captulo se introducen dos importantes tipos de diseos experimentales: el diseo anidado y el di
seo de parcelas subdivididas. Estos dos diseos encuentran una aplicacin razonablemente generaliza
da en el uso industrial de los experimentos diseados. Con frecuencia incluyen tambin uno o ms
factores aleatorios, por lo que algunos de los conceptos introducidos en el captulo 1 2 tendrn cabida
aqu.

13-1

DISEO ANIDADO DE DOS ETAPAS

En algunos experimentos con factores mltiples, los niveles de uno de los factores (por ejemplo el factor
B) son similares pero no idnticos a los diferentes niveles de otro factor (por ejemplo A). A un arreglo
como ste se le llama diseo anidado o jerrquico, con los niveles del factor B anidados bajo los niveles
del factor A. Por ejemplo, considere una compaa que compra su materia prima a tres proveedores dife
rentes. La compaa quiere determinar si la pureza de la materia prima de cada proveedor es la misma.
Hay cuatro lotes de materia prima disponibles de cada proveedor, y se harn tres determinaciones de la
pureza en cada lote. La situacin se describe en la figura 13-1.
Se trata de un diseo anidado de dos etapas, con los lotes anidados bajo los proveedores. A primera
vista se podra preguntar por qu no es un experimento factorial. Si fuera un experimento factorial, en
tonces el lote 1 se referira siempre al mismo lote, el lote 2 se referira siempre al mismo lote, etctera.
Evidentemente, no es ste el caso, ya que los lotes de cada proveedor son nicos para ese proveedor
particular. Es decir, el lote 1 del proveedor 1 no tiene relacin con el lote 1 de cualquier otro proveedor,
el lote 2 del proveedor 1 no tiene relacin con el lote 2 de cualquier otro proveedor, etctera. Para sub
rayar el hecho de que los lotes de cada proveedor son diferentes, se pueden numerar como 1, 2, 3 y 4
para el proveedor 1; 5 , 6 , 7y 8 para el proveedor 2; y 9,10,11 y 12 para el proveedor 3, como se muestra en
la figura 13-2.
En ocasiones quiz no se sepa si un factor est cruzado en un arreglo factorial o anidado. Si los niveles
del factor pueden numerarse arbitrariamente como en la figura 13-2, entonces el factor est anidado.

557

558

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS


Proveedores

Lotes

O bservaciones -

F ig u r a

1 3 -1

13-1.1

| 1 |

r n

[ T |

[3 ~ |

>111

>121

> 13 1

>112

>122

> 113

> 12 3

D is e o

4]

[ T |

3]

|4 ~ |

> 3 11

>321

>331

>341

>242

> 3 12

>322

>332

>342

>243

> 3 13

>323

>333

>343

[T ]

> 14 1

>211

>221

>231

>241

>132

> 14 2

>212

>222

>232

>133

> 14 3

>2 13

>223

>233

a n id a d o d e d o s e t a p a s .

Anlisis estadstico

El modelo estadstico lineal para el diseo anidado de dos etapas es


i 1 , 2 ,,,,, a
y ijk ~

^j(i)

M +

' J = Is

(13-1)

k = 1 , 2 ,..., n
Es decir, hay a niveles del factor A, b niveles del factor B anidados bajo cada nivel d e A , y n rplicas. El
subndice j(i) indica que el nivel j-simo del factor B est anidado bajo el nivel i-simo del factor Resul
ta conveniente considerar que las rplicas estn anidadas dentro de la combinacin de los niveles de A y
B ; por lo tanto, se usa el subndice (ij)k para el trmino del error. Se trata de un diseo anidado balancea
do, ya que hay el mismo nmero de niveles de B con cada nivel de^4 y el mismo nmero de rplicas. Puesto
que no todos los niveles del factor B aparecen dentro de todos los niveles del factor^, no puede haber in
teraccin entre A y B.
La suma de cuadrados total corregida puede escribirse como
t l
1= 1

(y -y ...)2 =

j = l fc= l

[(a . -

y...

im 1 jm 1 k= l

+ ( } ' . -

yL

) + 0 v

y>,

)]2

13- 2)

Al desarrollar el miembro derecho de la ecuacin 13-2, se obtiene


S E S

1=1 J=1 k -1

( y * - 3L ) 2 = br

1=1

(i.. - y... ) 2 + w S S

1=1 j = 1

( ? * ._ - ) 2 + S

i= l ;=1 fc=l

( j v ~ h ) 2 ( 13-3)

ya que los tres trminos con productos cruzados son cero. La ecuacin 13-3 indica que puede hacerse la
particin de la suma de cuadrados total en una suma de cuadrados debida al factor A, una suma de cua
drados debida al factor B bajo los niveles de^4, y una suma de cuadrados debida al error. Simblicamente,
la ecuacin 13-3 puede escribirse como
SST = SSA + SSB(A) + SSE

(13-4)

Hay abn - 1 grados de libertad para SSj, a - 1 grados de libertad para SSA, a ( b - 1) grados de libertad para
SSB(A) y ab(n - 1 ) grados de libertad para el error. Observe que abn - 1 = (a - 1 ) + a(b - 1 ) + ab(n -1). Si
los errores son NID(0, o2), cada una de las sumas de cuadrados del miembro derecho de la ecuacin 13-4

Figura 13-2

Disposicin alternativa del diseo anidado de dos etapas.

1 3 -1

T a b la 1 3 - 1

D IS E O A N ID A D O D E D O S E T A P A S

C u a d r a d o s m e d io s e s p e r a d o s e n e l d is e o a n id a d o d e d o s e t a p a s

A
E (M S )

_______________________________________

A f ijo
B a le a t o r io

f ijo

f i f ijo

E (M S a)

A a le a t o r io
B a le a t o r io

bn2

a + n a l H------
p
a 1

a l

5 5 9

a 1 + n a 2 + b n a \

a 2 + n a 2f

a1+ na2t

<72

a2

a ( b - 1)

a2

E (M S e)

puede dividirse por sus grados de libertad para obtener cuadrados medios con una distribucin indepen
diente tales que el cociente de dos cuadrados medios cualesquiera se distribuye como F,
Los estadsticos apropiados para probar los efectos de los factores vi y B dependen de siA y B son fos
o aleatorios. Si los factores/! y B son fijos, se supone que Z =1 r, = 0 y 2 *=1 m = 0 (i = 1,2,..., a). Es decir,
la suma de los efectos del tratamiento A es cero, y la suma de los efectos del tratamiento B es cero dentro
de cada nivel deA. De manera alternativa, si A y B son aleatorios, se supone que r es NID(0, a ] ) y que Ki)
es NID(0, o 2), Tmbin es frecuente encontrar modelos mixtos con A fijo y B aleatorio. Los cuadrados
medios esperados pueden determinarse aplicando directamente las reglas del captulo 12. Para el modelo
mixto, estos cuadrados medios esperados suponen la forma restringida del modelo del captulo 12. En la
tabla 13-1 se muestran los cuadrados medios esperados para estas situaciones.
La tabla 13-1 indica que si los niveles deA y B son fijos, H0:r - 0 se prueba con MSA/MSEy H0:j(i) = 0
se prueba con MSB(/^MSE. Si A es un factor fijo y B es aleatorio, entonces H0:r = 0 se prueba con
MSA/MSB{A) y H0\o2 = 0 se prueba conMSB(A)/MSE. Por ltimo, si tantoA como B son factores aleatorios,
H0:a2z = 0 se prueba con MSA/MSBW y H0:o = 0 conMSB(A)/MS. El procedimiento de prueba se resume
en la tabla del anlisis de varianza, como se muestra en la tabla 13-2. Las frmulas para calcular las sumas
de cuadrados se obtienen desarrollando las cantidades de la ecuacin 13-3 y simplificando. stas son
( 1 3 -5 )

1=1 j = 1
_a

-i

1-1
4

-1

k= i

t>
b

y.

( i w )

'* i = i j - \

SSr = 2 2 2 y l - i
,=1 y - 1 *=1

T a b la 1 3 - 2

(13-8)

a bn

T a b la d e l a n lis is d e v a r ia n z a p a r a e l d is e o a n id a d o d e d o s e t a p a s

Fu e n te de

S u m a de

G ra d o s de

C u a d ra d o

v a r ia c i n

cu a d ra d o s

lib e r t a d

m e d io

A
B d e n tro

de

2 Ov. -...Y

a-l

E U v - ..)2

a(b-1)

M Sa

E rro r

2 2 2

O'# -9*.f

ab(n - 1 )

T b ta l

ov ~ y f

abn -

ms e

560

C A P T U L O

13

D I S E O S

A N I D A D O S

D E

P A R C E L A S

S U B D I V I D I D A S

Se observa que la ecuacin 13-6 para SSB^ puede escribirse como


1

SSB(A) =

- y
i =1

y2--

Esto expresa la idea de que SSB[A) es la suma de cuadrados entre los niveles de B para cada nivel dA, su
mados en todos los niveles de A.

EJEMPLO 1 3 -1 ..................................................................................................................................
Considere una compaa que compra materia prima en lotes de tres proveedores diferentes. La pureza de
esta materia prima vara considerablemente, lo cual ocasiona problemas en la manufactura del producto
terminado. Quiere determinarse si la variabilidad de la pureza es atribuible a las diferencias entre los pro
veedores. Se seleccionan al azar cuatro lotes de materia prima de cada proveedor, y se hacen tres determi
naciones de la pureza en cada lote. Se trata, desde luego, de un diseo anidado de dos etapas. Los datos,
despus de codificarlos restando 93, se muestran en la tabla 13-3. Las sumas de cuadrados se calculan de
la siguiente manera:
a
=

rt

yi2jk

=1 k = l

y
abn

= 153.00- ^ 7 = 148.31
36
1 Q
.,
S S .bn
- -S
abn
ab
[(-5)2 +( 4) 2 +(14)2] -
(4)(3)
= 19.75-4.69=15.06 .
=1 ;=1

= ^[(0 ) 2 + ( - 9 ) 2 + ( - l ) 2 + - +( 2 ) 2 +( 6) 2] - 19.75
= 89.67-19.75 = 69.92
a

-j

;=l 1
n =1 ;=l
= 153.00-89.67= 63.33

T a b la 1 3 - 3

D a t o s c o d if ic a d o s d e la p u r e z a d e l e je m p lo 1 3 - 1

( C o d if ic a c i n :

T o t a le s d e lo s lo t e s
Ib t a le s d e lo s p r o v e e d o r e s

yayt..

yjk p u r e z a

1
1
-1
0

-2

-2

-9

1
1

P ro v e e d o r 3

- 1

-2

-2

-4

-3

-4

- 1

93)

-3

-5

P ro v e e d o r 2

P ro v e e d o r 1
L o te s

Jya2.

-2

-3

14

4
1

- 1

13-1 DISEO A N ID A D O DE DOS ETAPAS

la b ia 13-4

561

Anlisis de varianza de los datos del ejemplo 13-1


Fu e n te de

S u m a de

G ra d o s de

C u a d ra d o

C u a d r a d o m e d io

v a r ia c i n

cu ad rad o s

lib e r t a d

m e d io

e sp erad o

P ro v e e d o re s

1 5 .0 6

7 .5 3

<72 +

L o t e s ( d e n t r o d e lo s p r o v e e d o r e s )

6 9 .9 2

7 .7 7

a 2 + 30 p

E rro r

6 3 .3 3

24

2 .6 4

T o tal

1 4 8 .3 1

35

3 c t^ +

F0
t

V a lo r

0 .9 7

0 .4 2

2 .9 4

0 .0 2

En la tabla 13-4 se resume el anlisis de varianza. Los proveedores son fijos y los lotes aleatorios, por lo
que los cuadrados medios esperados se obtienen de la columna de en medio de la tabla 13-1 y se repiten
por conveniencia en la tabla 13-4. Por el examen de los valores P, se concluira que no hay ningn efecto
significativo sobre la pureza debido a los proveedores, pero la pureza de los lotes de materia prima del
mismo proveedor difieren significativamente.

Las implicaciones prcticas de este experimento y del anlisis son muy importantes. El objetivo del
experimentador es encontrar la fuente de la variabilidad en la pureza de la materia prima. Si sta es resul
tado de las diferencias entre los proveedores, el problema puede resolverse seleccionando al mejor
proveedor. Sin embargo, esa solucin no es aplicable aqu porque la principal fuente de variabilidad es la
variacin de la pureza de un lote a otro dentro de los proveedores. Por lo tanto, el problema debe atacarse
trabajando con los proveedores para reducir su variabilidad de un lote a otro. Esto puede implicar modifi
caciones en los procesos de produccin de los proveedores o en su sistema interno de control de calidad.
Observe lo que habra pasado si se hubiera hecho un anlisis incorrecto de este diseo como un expe
rimento factorial de dos factores. Si se considera que los lotes estn cruzados con los proveedores, se ob
tienen los totales de los lotes de 2, -3, -2 y 16, donde cada celda lote x proveedores contiene tres rplicas.
Por lo tanto, puede calcularse una suma de cuadrados debida a los lotes y una suma de cuadrados de in
teraccin. El anlisis de varianza factorial completo se muestra en la tabla 13-5, suponiendo un modelo mixto.
Este anlisis indica que los lotes difieren significativamente y que hay una interaccin significativa
entre los lotes y los proveedores. Sin embargo, es difcil ofrecer una interpretacin prctica de la interac
cin lotes x proveedores. Por ejemplo, esta interaccin significativa quiere decir que el efecto del pro
veedor no es constante de un lote a otro? Adems, la interaccin significativa aunada al efecto no
significativo del proveedor podra llevar al analista a concluir que los proveedores en realidad difieren,
pero su efecto est enmascarado por la interaccin significativa.

T a b la 1 3 - 5

A n l is is d e v a r ia n z a in c o r r e c t o d e l d is e o a n id a d o d e d o s e t a p a s d e l e je m p lo 1 3 - 1 c o m o u n d is e o f a c t o r ia l
( p r o v e e d o r e s f ijo s , lo t e s a le a t o r io s )

F u e n te de

S u m a de

v a r ia c i n

G ra d o s de

C u a d ra d o

lib e r t a d

m e d io

F 0

V a lo r /1

7 .5 3

1.0 2

0 .4 2

8 .5 5

3 .2 4

0 .0 4

7 .3 8

2 .8 0

6 3 .3 3

24

2 .6 4

14 8 .3 1

35

______________________ c u a d r a d o s

P ro v e e d o re s (S )

1 5 .0 6

L o t e s (B )

2 5 .6 4

4 4 .2 8

E rro r
T o tal

In t e r a c c i n

0 .0 3

562

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

Clculos
Algunos paquetes de software de estadstica realizarn el anlisis de un diseo anidado. En la tabla 13-6
se presenta la salida del procedimiento Balanced ANOVA (anlisis de varianza balanceado) de Minitab
(utilizando el modelo restringido). Los resultados numricos concuerdan con los clculos manuales re
portados en la tabla 13-4. Minitab tambin reporta los cuadrados medios esperados en la parte inferior de
la tabla 13-6. Recuerde que el smbolo Q[ 1] es un trmino cuadrtico que representa el efecto fijo de los
proveedores, por lo que en la notacin que se usa aqu,
r?
m =

a-

Por lo tanto, el trmino del efecto fijo en el cuadrado medio esperado de Minitab para los proveedores
12Q[1] = 12Zf=1 rf / ( 3 - 1 ) = 62
rf , resultado que concuerda con el que se presenta en el algoritmo ta
bular de la tabla 13-4.
En ocasiones no se cuenta con un programa de computadora especializado para analizar diseos ani
dados. Sin embargo, observe, al comparar las tablas 13-4 y 13-5, que
SSB +SSSXB = 25.64+44.28= 69.92= SSB{5)
Es decir, la suma de cuadrados de los lotes dentro de los proveedores se compone de la suma de cuadra
dos de los lotes ms la suma de cuadrados de la interaccin lotes x proveedores. Los grados de libertad
poseen una propiedad similar; es decir,
Lotes t Lotes x Proveedores _ Lotes dentro de los proveedores
3 +
6
~
9
Por lo tanto, un programa de computadora para analizar diseos factoriales podra usarse tambin para
analizar diseos anidados agrupando el efecto principal del factor anidado y las interacciones de ese
factor con el factor bajo el que est anidado.

T a b la 1 3 - 6

S a lid a d e M in it a b

(B a la n c e d A N O V A )

[ a n lis is d e v a r ia n z a b a la n c e a d o ] p a r a e l e je m p lo 1 3 - 1

Anlisis de varianza (diseos balanceados)


Factor
Supp L i e r
B atch(Supplier)
Analysis

of

Variance

Source
Supplier
B atch(Supplier)
Error
Total

DF
2
9
24
35

Levels Values
1
3
4
1

for

2
2

3
3

Purity

SS
15.056
69.917
63.333
148.306

Variance Error
component te r m
2
Supplier
B a t c h ( Supp1i e r )
1.710
3
2.639
Error

Source
1
2
3

Type
fixed
random

MS
7.528
7.769
2.639

F
0 . 97
2 . 94

P
0.416
0.017

E x p e c t e d Me a n S q u a r e f o r
( u s i n g r e s t r i c t e d mo d e I )
(3) + 3(2) +
(3 > + 3 (2 )
(3)

Each

Term

13-1 DISEO ANIDADO DE DOS ETAPAS

13-1.2

563

Verificacin del diagnstico

La herramienta principal para verificar el diagnstico es el anlisis residual. Para el diseo anidado de
dos etapas, los residuales son

^jk yijk yjk


El valor ajustado es

yijk=fl+
+h(n
y si se establecen las restricciones usuales sobre los parmetros del modelo (2, r = O yS . j(l) = 0,i = 1,
2,

a), entonces fx = , ?, = L - , y j(i) = . - J L. Por consiguiente, el valor ajustado es


yk - y... +(>,. - y... ) + (y tf. - yL )

Por lo tanto, los residuales del diseo anidado de dos etapas son

e,k= y,jk- yi,

( 1 3 -9 )

donde y. son los promedios de los lotes individuales.


Las observaciones, los valores ajustados y los residuales para los datos de la pureza del ejemplo
13-1 son:

s e r v a d o y ,-,*
1
- 1
0

V a lo r a ju s t a d o

y tj

=y*k - y i

0 .0 0

1.0 0

0 .0 0

-1 .0 0

0 .0 0

0 .0 0

-2

-3 .0 0

1.0 0

-3

-3 .0 0

0 .0 0

-A

-3 .0 0

-1 .0 0

-2

-0 .3 3

-1 .6 7

-0 .3 3

0 .3 3

-0 .3 3

1.3 3

1.6 7

-0 .6 7

1.6 7

2 .3 3

1.6 7

-1 .6 7

-1 .3 3

2 .3 3

-2

-1 .3 3

-0 .6 7

-3

-1 .3 3

-1 .6 7

2 .0 0

-2 .0 0

2 .0 0

2 .0 0

2 .0 0

0 .0 0

-1 .0 0

0 .0 0

- 1
0

-1 .0 0

1.0 0

-1 .0 0

-1 .0 0

1.6 7

-1 .6 7

1.6 7

1.3 3

1.6 7

0 .3 3

2 .0 0

0 .0 0

-2

564

CAPTULO 13

DISEOS A N ID A D O S Y DE PARCELAS SUBDIVIDIDAS


% jk

= y ;

V a lo r a ju s t a d o

II

V a lo r o b s e r v a d o ^
4

2 .0 0

2 .0 0

2 .0 0

-2 .0 0

-2

0 .0 0

-2 :0 0

0 .0 0

0 .0 0

0 .0 0

2 .0 0

0 .6 7

0 .3 3

- 1

0 .6 7

-1 .6 7

0 .6 7

1.3 3

2 .0 0

1.0 0

2 .0 0

0 .0 0

2 .0 0

-1 .0 0

Pueden realizarse ahora las verificaciones de diagnstico usuales; incluyendo las grficas de probabilidad
normal, la verificacin de puntos atpicos y la graficacin de los residuales contra los valores ajustados.
Como una ilustracin, en la figura 13-3 se grafican los residuales contra los valores ajustados y contra los
niveles del factor proveedor.

3
2

-i
-2

Valores predichos
a ) Grfica de los residuales contra los valores predichos

-1
-2

2
Proveedor

6) Grfica de los residuales contra el proveedor

F igura 13-3

G rficas de lo s residuales d el ejem plo 13-1.

13-1 DISEO A N ID A D O DE DO S ETAPAS

565

En la situacin de un problema como el que se describe en el ejemplo 13-1, las grficas de los residua
les son particularmente tiles debido a la informacin de diagnstico adicional que contienen. Por ejem
plo, el anlisis de varianza ha indicado que la pureza media de los tres proveedores no difiere pero que
hay una variabilidad estadsticamente significativa de un lote a otro (es decir, o 2^ >0). Pero, la variabili
dad dentro de los lotes es la misma para todos los proveedores? Se ha supuesto de hecho que ste es el
caso, y si no es cierto desde luego que nos gustara saberlo, ya que tiene un impacto prctico considerable
sobre la interpretacin de los resultados del experimento. La grfica de los residuales contra los provee
dores de la figura 13-30 es una manera simple pero eficaz de verificar este supuesto. Puesto que la disper
sin de los residuales es aproximadamente la misma para los tres proveedores, se concluira que la
variabilidad en la pureza de un lote a otro es aproximadamente la misma para los tres proveedores.

13' 1.3

Componentes de la varianza

Para el caso de efectos aleatorios, el mtodo del anlisis de varianza puede usarse para estimar los com
ponentes de la varianza o2, g 2 y a \ . Por los cuadrados medios esperados de la ltima columna de la tabla
13-1, se obtiene
a 2 = MS e

(13-10)

m s bia, - m s e
d i = ---- ^ -------- -

(13-11)

MS . ~ M S b
bn

] =

------ (13-12)

En muchas aplicaciones de diseos anidados interviene un modelo mixto, con el efecto principal (A)
fijo y el factor anidado (B) aleatorio. ste es el caso para el problema descrito en el ejemplo 13-1; los pro
veedores (factor^) son fijos, y los lotes de materia prima (factor B) son aleatorios. Los efectos de los pro
veedores pueden estimarse con
13 -2 8
36 36
1 3 _ -1
f 2 = y z. - y... =
12 36 36
14 _ 1 3 = 29
* 3 =
- y ... 12 36 36

Ti=

A.

y...

-5
12

Para estimar los componentes de la varianza a2y a, 2


2 , se elimina la lnea de la tabla del anlisis de varianza
relativo a los proveedores y se aplica el mtodo de estimacin del anlisis de varianza a las dos lneas si
guientes. Se obtiene as
2 = MS f = 2.64

m s ha) -

m s e

_ 7 .7 7 - 1 6 4 _
3

566
Etapa 1

CAPTULO 13

DISEOS A N ID A D O S Y DE PARCELAS SUBDIVIDIDAS


Lote 1 ...

Figura 13-4 Diseo anidado escalonado de dos etapas.

Estos resultados se muestran tambin en la parte inferior de la salida de Minitab de la tabla 13-6. Por el
anlisis del ejemplo 13-1, se sabe que no difiere significativamente de cero, mientras que el componente
de la varianza a 2 es mayor que cero.

13' 1.4

Diseos anidados por etapas

Un problema potencial en la aplicacin de los diseos anidados es que en ocasiones para obtener un n
mero razonable de grados de libertad en el nivel ms alto, puede terminarse con muchos grados de liber
tad (quiz demasiados) en las etapas inferiores. Para ilustrar, suponga que se estn investigando las
diferencias potenciales en el anlisis qumico entre diferentes lotes de material. Se planea tomar cinco
muestras por lote, y cada muestra se medir dos veces. Si quiere estimarse un componente de la varianza
para los lotes, entonces 10 lotes no sera una eleccin irrazonable. Esto resulta en 9 grados de libertad
para los lotes, 40 grados de libertad para las muestras y 50 grados de libertad para las mediciones.
Una manera de evitar esta situacin es usar un tipo particular de diseo anidado no balanceado lla
mado diseo anidado por etapas. En la figura 13-4 se muestra un ejemplo de un diseo anidado escalona
do. Observe que slo se toman dos muestras de cada lote; una de ellas se mide dos veces, mientras que la
otra una sola vez. Si hay a lotes, entonces habr a - l grados de libertad para los lotes (o, en general, la eta
pa superior), y todas las etapas inferiores tendrn exactamente a grados de libertad. Para ms informa
cin sobre el uso y el anlisis de estos diseos, ver Bainbridge [5], Smith y Beverly [104] y Nelson [8 8 a, b,
c], as como el material suplementario del texto de este captulo.

13-2

DISEO ANIDADO GENERAL DE m ETAPAS

Los resultados de la seccin 13-1 pueden extenderse fcilmente al caso de m factores completamente ani
dados. A este diseo se le llamara diseo anidado de m etapas. Como un ejemplo, suponga que una fun
dicin quiere investigar la dureza de dos formulaciones diferentes de una aleacin de metal. Se preparan
tres hornadas de cada formulacin de la aleacin, se seleccionan dos lingotes al azar de cada hornada
para probarlos, y se hacen dos mediciones de la dureza en cada lingote. La situacin se ilustra en la figura
13-5.
En este experimento, las hornadas estn anidadas bajo los niveles del factor formulacin de la alea
cin, y los lingotes estn anidados bajo los niveles del factor hornada. Por lo tanto, se trata de un diseo
anidado de tres etapas con dos rplicas.

13-2 DISEO ANIDADO GENERAL DE m ETAPAS

567

Formulacin
de la aleacin

Hornadas

Lingotes

Observaciones

^ >1112
Figura

1 3 -5

D is e o

>1122

a n id a d o

>1212

>1222

>1312

>1322

>2112

>2122

>2212

>2222

>2312

>2322

d e tre s e ta p a s .

El modelo para el diseo anidado general de tres etapas es


i = 1,
j = 1,
y # = p + t i + m +Yk(ij) +,*>,
k = ,
1=1,

a
..
,b
%
c
2, .
% n
2, .

(13-13)

Para el ejemplo tratado aqu, r, es el efecto de la formulacin de la aleacin -sima, j{i) es el efecto de la
hornada;-sima dentro de la aleacin i-sima, yk(lf) es el efecto del lingote fc-simo dentro de la hornada

media

Figura 13-6
tre s e ta p a s.

observada

F u e n t e s d e v a r ia c i n e n e l e je m p lo d e l d is e o a n id a d o d e

568

CAPTULO 13

DISEOS A N ID A D O S Y DE PARCELAS SUBDIVIDIDAS

T a b la 1 3 - 7

A n l is is d e v a r ia n z a d e l d is e o a n id a d o d e tr e s e t a p a s

F u e n te de
v a r ia c i n

S u m a d e cu ad rad o s

( . v

m e d io

MSa

a (b -

1)

MSc(b)

- 1 )

ms e

i1

C (d e n tro d e # )

C u a d ra d o

lib e r t a d

a-l

bcn2

B ( d e n t r o deA)

G ra d o s de

E rro r

T o tal

H
i

a b c(n

aben - 1

/-sima y la aleacin -sima, y Em , es el trmino del error NID(0, a1) usual. La extensin de este modelo a
m factores es directa.
Observe que en el ejemplo anterior la variabilidad global de la dureza const de tres componentes:
uno que result de las formulaciones de las aleaciones, otro que se gener de las hornadas y uno ms que
sali del error de la prueba analtica. Estos componentes de la variabilidad en la dureza global se ilustran
en la figura 13-6.
Este ejemplo demuestra la manera en que se usa frecuentemente el diseo anidado en el anlisis de
procesos para identificar las principales fuentes de variabilidad en la salida. Por ejemplo, si el componen
te de la varianza de la formulacin de la aleacin es grande, entonces esto implica que la variabilidad glo
bal de la dureza podra reducirse utilizando nicamente una de las formulaciones de la aleacin.
El clculo de las sumas de cuadrados y el anlisis de varianza del diseo anidado de m etapas son si
milares al anlisis presentado en la seccin 13-1. Por ejemplo, el anlisis de varianza del diseo anidado
de tres etapas se resume en la tabla 13-7. En esta tabla se muestran tambin las definiciones de las sumas
de cuadrados. Observe que son una extensin simple de las frmulas para el diseo anidado de dos eta
pas. Muchos paquetes de software de estadstica realizarn los clculos.
Para determinar los estadsticos de prueba apropiados deben encontrarse los cuadrados medios es
perados empleando los mtodos del captulo 12. Por ejemplo, si los factores^ y B son fijos y el factor C es
aleatorio, entonces los cuadrados medios esperados pueden derivarse como se indica en la tabla 13-8. En
esta tabla se indican los estadsticos de prueba apropiados para esta situacin.
T a b la 1 3 -8

D e r i v a c i n d e lo s c u a d r a d o s m e d io s e s p e r a d o s p a r a u n d is e o a n id a d o
d e tre s e ta p a s c o n A

y B f ijo s y C

F
b

F a cto r

F
a
i

a le a t o r io

R
c
k

R
n
l

C u a d r a d o m e d io e s p e r a d o
,

f in o

y k()

Ei m

a 2 + n a 27 +
7

y
a 2+ nal
a1

b cnS^

r?

----------- ^

a -

a (b

1 )

13-3 DISEOS CON FACTORES ANIDADOS Y FACTORIALES

13-3

569

DISEOS CON FACTORES ANIDADOS Y FACTORIALES

En experimentos con factores mltiples, algunos factores pueden estar incluidos en un arreglo factorial y
otros estar anidados. En ocasiones a estos diseos se les llama diseos factoriales-anidados. El anlisis
estadstico de un diseo as con tres factores se ilustra en el ejemplo siguiente.

EJEMPLO 1 3 -2 ..................................................................................................................................
Un ingeniero industrial estudia la insercin manual de componentes electrnicos en tarjetas de circuitos
impresos a fin de mejorar la rapidez de la operacin de ensamblaje. Ha diseado tres dispositivos de en
samblaje y dos arreglos del sitio de trabajo que parecen prometedores. Se necesitan operadores para rea
lizar el ensamblaje, y se decide seleccionar aleatoriamente cuatro operadores para cada combinacin
dispositivo-arreglo del sitio de trabajo. Sin embargo, debido a que los sitios de trabajo se encuentran en
diferentes puntos dentro de la planta, es difcil usar los mismos cuatro operadores para cada arreglo del
sitio de trabajo. Por lo tanto, los cuatro operadores escogidos para el arreglo 1 son diferentes de los cuatro
para el arreglo 2. Puesto que slo hay tres dispositivos y dos arreglos del sitio de trabajo, y los operadores
se escogen al azar, se trata de un modelo mixto. Las combinaciones de tratamientos de este diseo se co
rren en orden aleatorio y se obtienen dos rplicas. Los tiempos de ensamblaje se miden en segundos y se
muestran en la tabla 13-9.
En este experimento, los operadores estn anidados dentro de los niveles de los arreglos del sitio de
trabajo, mientras que los dispositivos y los arreglos del sitio de trabajo estn incluidos en un factorial. Por
lo tanto, este diseo tiene factores anidados y factoriales. El modelo lineal para este diseo es
i = 1, 2, 3
y =

+ j + YkU)

+( iy ) * o ) +
/ = 1,

donde r, es el efecto del dispositivo /-esimo,/}, es el efecto del arreglo del sitio de trabajoy-simo, yk(j) es el
efecto del operador fc-simo dentro del nivel/-simo del arreglo del sitio de trabajo, (r/3) es la interaccin
dispositivo x arreglo del sitio de trabajo, (ry)ik(j) es la interaccin dispositivo x operadores dentro del
arreglo del sitio de trabajo, y e(W, es el trmino del error usual. Observe que no puede existir ninguna in
teraccin arreglo del sitio de trabajo x operador porque no todos los operadores usan todos los arreglos
del sitio de trabajo. Asimismo, tampoco puede haber ninguna interaccin dispositivo x arreglo del sitio
de trabajo x operador. En la tabla 13-10 se derivan los cuadrados medios esperados utilizando el algo
ritmo tabular del captulo 12. Esto produce el anlisis de un modelo mixto restringido. El estadstico de
prueba apropiado para cualquier efecto o interaccin puede encontrarse inspeccionando esta tabla.
T a b la 1 3 - 9

D a t o s d e l t ie m p o d e e n s a m b la je d e l e je m p lo 1 3 - 2

Operador
Dispositivos 1
Dispositivos 2
Dispositivos 3

1
22

24
30
27
25
21

Totales de los operadores, y jk


Tbtales de los arreglos,

149

Arreglo 1
2
3
28
23
24
29
29
30
28
32
24
27
22
25
150
171
619

4
25
23
27
25
26
23
149

26
28
29
28
27
25
163

Arreglo 2
2
3
27
28
25
25
30
24
27
23
24
26
24
27
159 151
633

4
24
23
28
30
28
27
160

yi,.
404
447
401

1252 = y

570

CAPTULO 13 DISEOS ANIDADOS YDE PARCELAS SUBDIVIDIDAS

Tabla 13-10 Derivacin del cuadrado medio esperado del ejemplo 13-2

Factor

P,

v Hi)
m ,

0
3
3
0
0
1

4
4
1
4
.1
1

0
1
0
1
1

R
2
l
2

Cuadrado medio esperado


.

a 2 + 2 < + 8 2 T?

2
2
2
2
1

o 2 + 6 a 2 + 24j )
o 1 + 6a:

a 2+ 2 < + 4 2 2 (t%
a 2+ 2 <
C7J

En la tabla 13-11 se muestra el anlisis de varianza completo. Se observa que los dispositivos de en
samblaje son significativos y que los operadores dentro de los arreglos del sitio de trabajo tambin difie
ren significativamente. Est presente tambin una interaccin significativa entre los dispositivos y los
operadores dentro de los arreglos del sitio de trabajo, indicando que los efectos de los diferentes disposi
tivos no son los mismos para todos los operadores. Los arreglos del sitio de trabajo parecen tener un efec
to reducido sobre el tiempo de ensamblaje. Por lo tanto, para minimizar el tiempo de ensamblaje, la
atencin debera centrarse en los dispositivos tipo 1 y 3. (Observe que los totales de los dispositivos de la
tabla 13-9 son menores para los tipos 1 y 3 que para el tipo 2. Esta diferencia en las medias del tipo de dis
positivo podra probarse formalmente utilizando comparaciones mltiples.) Adems, la interaccin entre
los operadores y los dispositivos implica que algunos operadores son ms eficientes que otros al utilizar
los mismos dispositivos. Quizs estos efectos operador-dispositivo podran aislarse y los operadores cuyo
desempeo es menos eficiente podran mejorar impartindoles capacitacin adicional.

Clculos

Hay varios paquetes de software de estadstica que analizan con facilidad diseos factoriales-anidados,
incluyendo Minitab y SAS. En la tabla 13-12 se presenta la salida de Minitab (Balanced ANOVA, anlisis
de varianza balanceado), suponiendo la forma restringida del modelo mixto, para el ejemplo 13-2. Los
cuadrados medios esperados de la parte inferior de la tabla 13-12 concuerdan con los que se derivaron
con el mtodo tabular de la tabla 13-10. Q[ 1], Q[ 3] y Q[4] son los efectos del factor fijo para los arreglos
del sitio de trabajo, los dispositivos, y la interaccin arreglo del sitio de trabajo X dispositivo, respectiva
mente. Las estimaciones de los componentes de la varianza son:
Operador (arreglo):
a 2 = 1.609
Dispositivo x operador (arreglo):
o 2^ = 1.576
Error:
o 2 = 2.333
Tabla 13-11 Anlisis de varianza del ejemplo 13-2
Fuente de variacin
Dispositivos (F )
Arreglos (L)
Operadores (dentro de los arreglos), O (L )
FL
F O (L )

Error
Tbtal

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

82.80
4.08
71.91
19.04
65.84
56.00
299.67

2
1
6
2
12
24
47

41.40
4.09
11.99
9.52
5.49
2.33

F0

Valor P

7.54
0.34
5.15
1.73
2.36

0.01
0.58
<0.01
0.22
0.04

Tabla 13-12 Anlisis Balanced ANOVA de Minitab dei ejemplo 13-2 utilizando el modelo restringido

Anlisis de varianza (diseos balanceados)


Factor
Layout
Operator(Layout)
Fixture
Analysis

for

Ti me

So u r c e
Layout
Operator(Layout)
Fixture
Layout*Fi xture
Fixture*0perator(Layout)
Error
Tota I

DF
1
6
2
2
12
24
47

Source
1
2
3
4
5
6

of

Type L e v e l s V a l u e s
fixed
2
1
random
4
1
fixed
3
1

Variance

SS
4 .083
71 . 9 1 7
82 . 7 9 2
19 . 0 4 2
65 . 8 3 3
56 . 0 0 0
29 9 . 6 6 7

3
3

MS
4.083
11.986
41.396
9.521
5.486
2.333

F
0.34
5.14
7.55
1 .74
2.35

P
0.581
0.002
0.008
0.218
0.036

E r r o r E x p e c t e d Kean Sq ua r e 1
t e r m ( u s i n g r e s t r i c t e d mode I )
2
6 ( 2 ) + 2 4SC1:
(6 )
1 .609
(6)
6(2)
6
5
(6)
2 ( 5 ) + 168E33
2 ( 5 ) + 8QC4]
5
(6 )
6
1 .576
(6)
2(5)
(6 )
2.333

Variance
component

Layout
Operator(Layout)
Fixture
Layout*Fixture
Fixture*Operator(Layout)
Error

2
2

572
Tabla 13-13 Anlisis Balanced ANOVA de Minitab del ejemplo 13-2 utilizando el modelo no restringido
Anlisis de varianza (diseos balanceados)
Factor
Layout
Qperator(Layout)
Fixture
Analysis

for

T i me

Sou r ce
Layout
Operator(Layout)
Fixture
L a y o u t * Fi x t u r e
Fixture*Operator(Layout)
Error
Total

DF
1
6
2
2
12
24
47

Source
1
2
3
4
5
6

of

Type L e v e l s V a l u e s
2
1
fixed
4
1
random
1
3
f i xed

Variance

SS
4.083
71.917
82.792
19.042
65.833
56.000
299.667

Variance
component

Layout
Operator(Layout)
Fixture
L a y o u t * Fi x t u r e
F i x t u r e * O p e r a t o r ( Layout)
Error

2
2
2

3
3

MS
4.083
11 . 9 8 6
41.396
9.521
5.486
2.333

F
0.34
2.18
7.55
1 .74
2.35

P
0 . 581
0.117
0.008
0.218
0.036

E r r o r E x p e c t e d Mean S q u a r e f o r Each Term


t e r n ( u s i n g u n r e s t r i c t e d mo d e l )
( 6 ) + 2 ( 5 ) + 6 ( 2 ) + QC1 , 4 3
2
1. 083
( 6 ) + 2 ( 5 ) + 6 (2 )
5
( 6 ) + 2 ( 5 ) + QC3r 4D
5
( 6 ) + 2 ( 5 ) + QC4:
5
1 .576
6
( 6) + 2(5)
(6)
2.333

13-4 DISEO DE PARCELAS SUBDIVIDIDAS

573

En la tabla 13-13 se presenta el anlisis de Minitab del ejemplo 13-2 utilizando la forma no restringida
del modelo mixto. Los cuadrados medios esperados de la parte inferior de esta tabla son ligeramente di
ferentes de los que se reportaron para el modelo restringido y, por lo tanto, la construccin de los estads
ticos de prueba ser ligeramente diferente para el factor operadores (arreglo). Especficamente, el
denominador del cociente F de los operadores (arreglo) es la interaccin dispositivos x operadores
(arreglo) del modelo restringido ( 1 2 grados de libertad para el error), y es la interaccin arreglo x dispo
sitivos en el modelo no restringido (2 grados de libertad para el error). Puesto que M5amglo x di5p05itiV0S >
^^dispositivos x operador(arreglo)y tiene menos grados de libertad, se encuentra ahora que el operador dentro del
efecto del arreglo slo es significativo en el nivel aproximado de 12% (el valor P fue 0.002 en el anlisis del
modelo restringido). Adems, la estimacin del componente de la varianza d 2y = 1.083 es menor. Sin em
bargo, puesto que est presente un efecto grande de los dispositivos y una interaccin dispositivos x ope
rador (arreglo) significativa, seguira sospechndose que existe un efecto del operador y, por lo tanto, las
conclusiones prcticas de este experimento no son afectadas mucho por elegir la forma restringida o la no
restringida del modelo mixto. Las cantidades Q[ 1,4] y Q [3,4] son trminos cuadrticos del tipo fijo que
contienen el efecto de interaccin arreglos x dispositivos.
Si no se cuenta con un paquete de software especializado como SAS o Minitab, entonces puede usar
se un programa para analizar experimentos factoriales con factores anidados y factoriales. As, el experi
mento del ejemplo 13-2 podra considerarse como un factorial de tres factores, con los dispositivos (F),
los operadores (O) y los arreglos (L) como los factores. Entonces se agruparan ciertas sumas de cuadra
dos y ciertos grados de libertad para formar las cantidades apropiadas requeridas para el diseo con los
factores anidados y factoriales de la siguiente manera:

Aniisis factorial
Suma de cuadrados
SSF
SSL
SSfL
SSo
S$LO
SSpo
S S fol

ssE
ssT

13-4

Grados de
libertad
2
1
2
3
3
6
6
24
47

Anlisis factorial-anidado
Grados de
Suma de cuadrados
libertad
SSF
2
SSL
1
SSfL
2
SSo(L) = S S q + S S LO

S S fo(L) ~ SSfQ + SSpoL

12

SSE
SST

24
47

DISEO DE PARCELAS SUBDIVIDIDAS

En algunos experimentos factoriales con factores mltiples quiz no sea posible la aleatorizacin comple
ta del orden de las corridas. Esto suele resultar en una generalizacin del diseo factorial llamada diseo
de parcelas subdivididas.
Como un ejemplo, considere un fabricante de papel que est interesado en tres mtodos diferentes
para preparar la pulpa y cuatro temperaturas de coccin diferentes de la pulpa y que desea estudiar el
efecto de estos dos factores sobre la resistencia a la tensin del papel. Cada rplica de un experimento fac
torial requiere 12 observaciones, y el experimentador ha decidido correr tres rplicas. Sin embargo, la ca

574

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

pacidad de la planta piloto slo permite realizar 1 2 corridas por da, por lo que el experimentador decide
correr una rplica en cada uno de tres das y considerar los das o las rplicas como bloques. En un da lle
va a cabo el experimento de la siguiente manera. Se produce un lote de pulpa con uno de los tres mtodos
bajo estudio. Despus este lote se divide en cuatro muestras, y la coccin de cada muestra se hace con una
de las cuatro temperaturas. Entonces se produce un segundo lote de pulpa utilizando otro de los tres m
todos. Este segundo lote tambin se divide en cuatro muestras que se prueban con las cuatro temperatu
ras. Despus se repite el proceso, utilizando un lote de pulpa producido por el tercer mtodo. Los datos se
muestran en la tabla 13-14.
Inicialmente, esto podra considerarse un experimento factorial con tres niveles del mtodo de pre
paracin (factor A ) y cuatro niveles de la temperatura (factor B) en un bloque aleatorizado. Si ste fuera
el caso, entonces el orden de experimentacin dentro de cada rplica o bloque debera ser completamen
te aleatorizado. Es decir, dentro de un bloque debera seleccionarse aleatoriamente una combinacin de
tratamientos (un mtodo de preparacin y una temperatura) y obtener una observacin, despus debera
seleccionarse aleatoriamente otra combinacin de tratamientos y obtener una segunda observacin, y as
sucesivamente hasta que se hayan tomado las 12 observaciones en el bloque. Sin embargo, el experimen
tador no recab los datos de esta manera. l hizo un lote de pulpa y obtuvo observaciones para las cuatro
temperaturas de ese lote. Debido a la economa para preparar los lotes y al tamao de los lotes, sta es la
nica manera factible de correr este experimento. Un experimento factorial completamente aleatorizado
requerira 36 lotes de pulpa, lo cual es totalmente irrealista. El diseo de parcelas subdivididas requiere
slo tres lotes de pulpa por bloque (rplica), en este caso 9 lotes en total. Evidentemente, el diseo de par
celas subdivididas ha dado como resultado una eficiencia experimental considerable.
El diseo utilizado en el ejemplo de la pulpa es de parcelas subdivididas. Cada rplica o bloque del di
seo de parcelas subdivididas se divide en tres partes llamadas parcelas completas, y a los mtodos de
preparacin se les llama tratamientos principales o de parcelas completas. Cada parcela completa se di
vide en cuatro partes llamadas subparcelas (o parcelas subdivididas), y se asigna una temperatura a cada
una de ellas. A la temperatura se le llama el tratamiento de la subparcela. Observe que si estn presentes
otros factores no controlados o fuera del diseo, y si estos factores no controlados varan cuando los m
todos para preparar la pulpa se modifican, entonces cualquier efecto de los factores fuera del diseo so
bre la respuesta estar completamente confundido (o mezclado) con el efecto de los mtodos para
preparar la pulpa. Puesto que los tratamientos de las parcelas completas de un diseo de parcelas subdivi
didas estn confundidos con las parcelas completas y los tratamientos de las subparcelas no estn confun
didos, es mejor asignar el factor en el que haya mayor inters a las subparcelas, de ser posible.
Este ejemplo es bastante tpico de la forma en que se usan los diseos de parcelas subdivididas en un
ambiente industrial. Observe que, en esencia, los dos factores se aplicaron en tiempos diferentes. Por
consiguiente, un diseo de parcelas subdivididas puede considerarse como dos experimentos combina-

Tabla 13-14 El experimento de la resistencia a la tensin del papel_______ __________ ____________ ______ _________
Rplica (o
Rplica (o
Rplica (o
Mtodo de preparacin
blque>1_____
____ bloque)2____
____ bloque)3____
de la pulpa____________________1_______ 2_______ 3______ 1_______ 2_______ 3______ 1_______ 2_______3
Temperatura (F)
35
32
31
29
28
31
34
31
200
30
40
34
37
26
32
30
41
36
225
35
39
39
42
41
33
40
32
38
250
37
44
45
41
40
40
36
40
42
275
36

5 75

13-4 DISEO DE PARCELAS SUBDIVIDIDAS

dos o superpuestos entre s. Un experimento tiene el factor parcela completa aplicado a las unidades
experimentales grandes (o es un factor cuyos niveles son difciles de cambiar) y el otro experimento tie
ne el factor subparcela aplicado a las unidades experimentales ms pequeas (o es un factor cuyos niveles
son fciles de cambiar).
El modelo linea) para el diseo de parcelas subdivididas es
y #

H * ) u

+(A0*

+y* +(*y)*
i = 1,2, ..., r
j = l, 2,
a
k = l,2 ,...,b

+Eijk

(13-15)

donde r j y (r/J),} representan la parcela completa y corresponden respectivamente a los bloques (o rpli
cas), a los tratamientos principales (factory!) y al error de la parcela completa [rplicas (o bloques) x A);
Y
(yJifcj ( y b y (Ty)ij* representan la subparcela y corresponden respectivamente al tratamiento de la
subparcela (factor B), las rplicas (o bloques) x B y las interacciones AB, y al error de la subparcela (blo
ques x AB). Observe que el error de la parcela completa es la interaccin rplicas (o bloques) x A y que
el error de la subparcela es la interaccin de tres factores bloques x AB. Las sumas de cuadrados para es
tos factores se calculan como en el anlisis de varianza de tres factores sin rplicas.
Los cuadrados medios esperados del diseo de parcelas subdivididas, con las rplicas o bloques alea
torios y los tratamientos principales y los tratamientos de subparcelas fijas, se derivan en la tabla 13-15.
Observe que el factor principal (A) de la parcela completa se prueba contra el error de la parcela comple
ta, mientras que el subtratamiento (B) se prueba contra la interaccin rplicas (o bloques) x subtratamientos. La interaccin A se prueba contra el error de la subparcela. Observe que no hay pruebas para
el efecto de la rplica (o bloque) (A) o la interaccin rplica (o bloque) x subtratamiento (AC).
El anlisis de varianza de los datos de la resistencia a la tensin de la tabla 13-14 se resume en la tabla
13-16. Puesto que tanto los mtodos de preparacin como las temperaturas son fijos y las rplicas son
aleatorias, son aplicables los cuadrados medios esperados de la tabla 13-15. El cuadrado medio de los
mtodos de preparacin se compara con el cuadrado medio del error de la parcela completa, y el cuadra-

Tabla 13-15 Derivacin del cuadrado medio esperado del diseo de parcelas subdivididas

Factor
Parcela completa

R
i

F
k

1
R

Cuadrado medio esperado

a 2+ a b a ;

a 2 + bo] +

<f + bol

Yk

tf2 + <

(ryh

o 2 + 00%

(Pv)jk

<72+ < . -

(zy)ijk

1
1

0
1

1
1

Subparcela

<im

<7

(no esti

- S o ;
a -l

(b-1)

578

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

subtratamiento. Esta situacin tambin es similar a un submuestreo, como lo describe Ostie [92]. Supo
niendo que A y B son fijos, los cuadrados medios esperados en este caso son

(13-18)

E(MSE) = o 2e

Por lo tanto, no hay pruebas para los efectos principales a menos que la interaccin sea insignificante. La
situacin es exactamente la de un anlisis de varianza de dos factores con una observacin por celda. Si
los dos factores son aleatorios, entonces los efectos principales pueden probarse contra la interaccin AB.
Si slo uno de los factores es aleatorio, entonces el factor fijo puede probarse contra la interacciones.
En general, si se analiza un diseo factorial y todos los efectos principales y las interacciones son sig
nificativos, entonces deber examinarse con atencin cmo se realiz realmente el experimento. Puede
haber restricciones sobre la aleatorizacin en el modelo que no se tomaron en cuenta en el anlisis y, por
consiguiente, los datos no debern analizarse como un factorial.

13-5
13'5.1

OTRAS VARIANTES DEL DISEO DE PARCELAS SUBDIVIDIDAS


Diseo de parcelas subdivididas con ms de dos factores

En ocasiones se encuentra que la parcela completa o la subparcela contendrn dos o ms factores, dis
puestos en una estructura factorial. Como un ejemplo, considere un experimento conducido en un homo
para hacer crecer un xido en una oblea de silicio. Las variables de respuesta de inters son el espesor de
la capa de xido y la uniformidad de la capa. Hay cuatro factores del diseo: la temperatura (A), el flujo
de gas (B), el tiempo (C) y la posicin de la oblea en el homo (>). El experimentador planea correr un di
seo factorial 24 con dos rplicas (32 ensayos). Ahora bien, los factores A y B (la temperatura y el flujo de
gas) son difciles de cambiar, mientras que C y D (el tiempo y la posicin de la oblea) son fciles de modifi
car. Esto lleva al diseo de parcelas subdivididas que se muestra en la figura 13-7. Observe que las dos r
plicas del experimento estn subdivididas en cuatro parcelas completas, cada una de las cuales contiene
una combinacin de los ajustes de la temperatura y el flujo de gas. Una vez que se eligen estos niveles,
cada parcela completa se subdivide en cuatro subparcelas, y se realiza un diseo factorial 22 en los facto
res tiempo y posicin de la oblea, donde las combinaciones de tratamientos de la subparcela se prueban
en orden aleatorio. nicamente se hacen cuatro cambios de la temperatura y del flujo de gas en cada r
plica, mientras que los niveles del tiempo y la posicin de la oblea estn completamente aleatorizados.
Un modelo para este experimento, consistente con la ecuacin 13-16, es
y q k lm

= fl+ T i + j + 7 k +(v)jk

+ d ijk + A l

+ ( 0 ) to .

+ ( / ) , + m im +(Y)U +(<**), HY)m + ( A * ) * ,


i = 1, 2
7
"K t)ihn + (y ^ )k lm

+ ( y ^ ) j k b n +ijklm

" U

= 1,
=

1, 2

1= 1 ,2
m = 1, 2

(13-19)

13-5 OTRAS VARIANTES DEL DISEO DE PARCELAS SUBDIVIDIDAS

5 79

Bloque 2

Bloque 1

Parcela
com pleta

ir
Subparcela

O+Q-

O + Q-

+-

- 0 + CP

Q + Q.

0+0

-o

O-O+ -

--

0 -0

+ -

o-o*

0-0

-O

Figura 13-7 Diseo de parcelas subdivididas con cuatro factores del diseo, dos en la parcela completa y dos
en la subparcela.

donde r, representa el efecto de la rplica, >y y k los efectos principales de la parcela completa, 0,jk es el
error de la parcela completa, <5, y Xmrepresentan los efectos principales de la subparcela y eijklmes el error
de la subparcela. Se han incluido todas las interacciones entre los cuatro factores del diseo. En la tabla
13-17 se presenta el anlisis de varianza de este diseo, suponiendo que las rplicas son aleatorias y que
todos los factores del diseo son efectos fijos. En esta tabla, y a ] representan las varianzas de los erro
res de la parcela completa y de la subparcela, respectivamente, o \ es la varianza de los efectos de los bloTabla 13-17 Anlisis abreviado de un diseo de parcelas subdivididas con los factores A y B en las parcelas completas
y los factores C y D en las subparcelas (referirse a la figura 13-7)
Fuente de
Suma de
Grados de
variacin
cuadrados
libertad
Cuadrado medio esperado
Rplicas (r()
1
al + 16a]
^^Rplicas

*<*)
AB
Error de la parcela completa (6jk)

C()
CD
AC

BC
AD
BD
ABC
ABD
ACD
BCD
ABCD

Error de la subparcela ( e ^ )
Total

SSA
SSB

SSwp
ssc
SSD
S$CD
SSac
SSBC
SSad
SSgn
SSabc
SSa b d
SSACD
SSBCD
SSabcd
s s SP
SST

1
1
1
1

1
1
1
1
1
1
1
1
1
1
12
31

al + 8al + A
ol+8a$+ B
o\ +
+ AB
<7+ 8a]
al+ C
a] + D
a] + CD
a] + A C
a] + B C
a) + A D
a 2e + B D
a 2c + A B C
a^ + A B D

al + ACD
a l + BCD
a] + A B C D
l

580

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

ques, y (para simplificar) se han usado letras maysculas latinas para denotar los efectos de tipo fijo. Los
efectos principales y la interaccin de la parcela completa se prueban contra el error de la parcela com*
piet, mientras que los factores de la subparcela y todas las dems interacciones se prueban contra el
error de la subparcela. Si algunos de los factores del diseo son aleatorios, los estadsticos de prueba se
rn diferentes. En algunos casos no habr ninguna prueba F exacta y deber usarse el procedimiento de
Satterthwaite (descrito en el captulo 12).
Los experimentos factoriales con tres o ms factores en una estructura de parcelas subdivididas tien
den a ser experimentos bastante grandes. Por otra parte, la estructura de parcelas subdivididas con fre
cuencia facilita la realizacin de un experimento grande. Por ejemplo, en el caso del horno de oxidacin,
los experimentadores slo tienen que cambiar ocho veces los factores que son difciles de modificar (A y
B), por lo que quiz un experimento de 32 corridas no sea demasiado ilgico. Es posible reducir el nme
ro de corridas utilizando un factorial fraccionado para los factores del diseo de inters.

13-5.2

Diseo de parcelas con doble subdivisin

El concepto de diseos de parcelas subdivididas puede extenderse a situaciones en las que pueden ocurrir
restricciones sobre la aleatorizacin en cualquier nmero de niveles dentro del experimento. Si hay dos
niveles de restricciones sobre la aleatorizacin, al arreglo se le llama diseo de parcelas con doble subdi
visin. En el ejemplo siguiente se ilustra este diseo.

EJEMPLO 1 3 - 3 ................................................... ............................................................................................


Un investigador estudia los tiempos de absorcin de un tipo particular de cpsula de antibitico. Hay tres
tcnicos, tres concentraciones de la dosis y cuatro espesores de la pared de la cpsula. Cada rplica de un
experimento factorial requerira 36 observaciones. El experimentador se ha decidido por cuatro rplicas,
y es necesario correr cada rplica en un da diferente. Observe que los das pueden considerarse como
bloques. Dentro de una rplica (o un bloque) (da), el experimento se realiza asignando una unidad de
antibitico a un tcnico que lleva a cabo el experimento con las tres concentraciones de la dosis y los cua
tro espesores de la pared. Una vez que se ha formulado una concentracin particular de la dosis, se prue
ban los cuatro espesores de la pared con esa concentracin. Despus se selecciona otra concentracin de
la dosis y se prueban los cuatro espesores de la pared. Por ltimo se prueba la tercera concentracin de la
dosis y los cuatro espesores de la pared. Mientras tanto, otros dos tcnicos del laboratorio tambin siguen
el mismo plan, empezando cada uno con una unidad de antibitico.
Observe que hay dos restricciones sobre la aleatorizacin dentro de cada rplica (o bloque): el tcni
co y la concentracin de la dosis. Las parcelas completas corresponden al tcnico. El orden en que se asig
nan los tcnicos a las unidades de antibitico se determina aleatoriamente. Las concentraciones de la
dosis forman tres subparcelas. La concentracin de la dosis puede asignarse aleatoriamente a una subpar
cela. Por ltimo, dentro de una concentracin particular de la dosis se prueban los cuatro espesores de la
pared de la cpsula de manera aleatoria, formando cuatro sub-subparcelas. A los espesores de la pared
suele llamrseles sub-subtratamientos. Puesto que hay dos restricciones sobre la aleatorizacin en el ex
perimento (algunos autores dicen que hay dos divisiones en el diseo), al diseo se le llama diseo de
parcelas con doble subdivisin. En la figura 13-8 se ilustran las restricciones sobre la aleatorizacin y el
arreglo experimental de este diseo.

13-5 OTRAS VARIANTES DEL DISEO DE PARCELAS SUBDIVIDIDAS

581

Espesor de la parad

Antibitico
asignado a
un tcnlco

Concentracin

-X>-

de la dosis
elegida

Segunda
restriccin
sobre la
aleatorizacin

Primera
restriccin
sobre la
aleatorizacin

T c n ic o
2

Bloques

Concentracin
de la dosis

Espesor de
la pared

Espesor de
la pared

Espesor de
la pared

Espesor de
la pared

3
3

Figura 13-8 Diseo de parcelas con doble subdivisin.

Un modelo estadstico lineal para el diseo de parcelas con doble subdivisin es


y,jkh

+ j +(* 0 ), + n +(*y)* H y )# H r f v )
+<*+(*)*+(/)*
+ (* # % +(y<5)t + ( ty) ia + (y)jkh
+ (ty)ij

i = l, 2 ,...,
..., a
k = l, 2, ..., b
h = , 2 , ..., c
7 = 1 , 2,

(13-20)
donde t, j y (z)^ representan la parcela completa y corresponden a las rplicas o bloques, a los trata
mientos principales (factory!) y al error de la parcela completa [rplicas (o bloques) x A)], respectiva-

582

CAPITULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

mente; y y k, (ry)ik, (y)jk y (ty)ijk representan la subparcela y corresponden al tratamiento de la


subparcela (factor B), las interacciones de rplicas (o bloques) x B y AB, y al error de la subparcela, res
pectivamente; y hy los parmetros restantes corresponden a la sub-subparcela y representan, respectiva
mente, al tratamiento de la sub-subparcela (factor C) y a las interacciones restantes. A la interaccin de
cuatro factores (r y ) ijkh se le llama el error de la sub-subparcela.
Suponiendo que las rplicas (bloques) son aleatorias y que los dems factores del diseo son fijos,
pueden derivarse los cuadrados medios esperados como se muestra en la tabla 13-18. Las pruebas de los
tratamientos principales, los subtratamientos, los sub-subtratamientos y sus interacciones son obvias al
inspeccionar esta tabla. Observe que no existen pruebas para las rplicas o bloques ni para las interaccio
nes en las que intervienen rplicas o bloques.
El anlisis estadstico de un diseo de parcelas con doble subdivisin es como el de una sola rplica de
un factorial de cuatro factores. El nmero de grados de libertad de cada prueba se determina de la mane
ra usual. Para ilustrar, en el ejemplo 13-3, donde se manejaron cuatro rplicas, tres tcnicos, tres concen
traciones de la dosis y cuatro espesores de la pared, se tendran slo (r - l)(a - 1) = (4 - 1)(3 - 1) = 6
grados de libertad del error de la parcela completa para probar a los tcnicos. Se trata de un nmero rela
tivamente pequeo de grados de libertad, y el experimentador podra considerar el uso de rplicas adicioTabla 13-18 Derivacin del cuadrado medio esperado para el diseo de parcelas con doble subdivisin
c
r
a
b
1

Parcela completa

Factor

R
i

F
i

F
k

F
h

R
l

Cuadrado medio esperado

o 2 + abedul

Subparcela

(i7)n

(rb

(rfvhk

#
(a - 1 )

y\

o 2+ a c o \

>. , . rcS S (y)l


* +C^ + ( a - m - l )

2+ Caly

<5,

a- +^ + ( c l )

(r)iA

o 2+ a b a #

(yU

(Ty)lkh

+b0^ + (a l)(c 1 )
a2+ ba2Td
I S m
d 1 + aa\niAT ..
j v. y
j '
*
( f c - l) ( c - l)
o1+ aa2tyi

m u

o + a^ +

(jY&\lkh

O +O

l(fkh)

a 2 (no estimable)

m h
Sub-subparcela

Yk

'
o 2 + b co 2e

_ _

_ _

E S E (ftdfe
( f t - l ) ( c - l)

13-5 OTRAS VARIANTES DEL DISEO DE PARCELAS SUBDIVIDIDAS

583

Parcelas completas

B,

AjB,

A,S,

AjB,

a ,b2

Parcelas
en franjas

Figura 13-9 Una rplica (bloque) de un di


seo de parcelas subdivididas en franjas.

nales para incrementar la precisin de la prueba. Si hay a rplicas, se tendrn 2(r - 1 ) grados de libertad
para el error de la parcela completa. Por lo tanto, cinco rplicas producirn 2(5 - 1 ) = 8 grados de liber
tad, seis rplicas producirn 2(6 - 1 ) = 10 grados de libertad, siete rplicas producirn 2(7 - 1 ) = 12 gra
dos de libertad, etctera. Por consiguiente, es probable que el experimentador no quiera correr menos de
cuatro rplicas, ya que se produciran as slo cuatro grados de libertad. Cada rplica adicional permite
ganar dos grados de libertad para el error. Si se cuenta con recursos para correr cinco rplicas, la preci
sin de la prueba podra incrementarse en un tercio (de seis a ocho grados de libertad). Adems, al pasar
de cinco a seis rplicas, hay 25% de ganancia adicional en la precisin. Si los recursos lo permiten, el expe
rimentador deber correr cinco o seis rplicas.

13-5.3

Diseo de parcelas subdivididas en franjas

El diseo de parcelas subdivididas eo franjas ha tenido una amplia aplicacin en las ciencias agrcolas,
pero slo ocasionalmente encuentra un uso en la experimentacin industrial. En el caso ms simple, se
tienen dos factores A y B. El factor A se aplica a las parcelas completas como en el diseo de parcelas sub
divididas estndar. Despus el factor B se aplica a franjas (que son en realidad slo otro conjunto de parlabia 13-19 Anlisis de varianza abreviado de un diseo de parcelas subdivididas en franjas

Fuente de
variacin
Rplicas (o bloques)

Suma de
cuadrados

Grados de
libertad
r-

Rplicas

ssA

Error,, de la parcela completa

S S wpa

SSB

o l + a b o 2.

a-

Cuadrado medio esperado


r b y ]
o \ + ba% +

( r - l ) ( - l )

a] + ba]

raS^ y\

b -1
*

ErrorBde la parcela completa

SSwPg

(r -)(b -l)

AB

SS ab

(a -

Error de la subparcela
Tbtal

SSsf
SST

l) ( b

6 - 1

*
1

1)

( r - l ) ( fl- l ) ( f c - l )

rab -

+ <

( a -i)( f c - i)

584

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

celas completas) que son ortogonales a las parcelas completas originales utilizadas para el factor A. En la
figura 13-9 se ilustra una situacin en la que los dos factores A y B tienen tres niveles. Observe que los ni
veles del factor A estn confundidos (o mezclados) con las parcelas completas, y que los niveles del factor
B estn confundidos con las franjas (las cuales pueden considerarse como un segundo conjunto de parce
las completas).
U n m odelo para el diseo de parcelas subdivididas en franjas de la figura 13-9, suponiendo y rplicas,

a niveles del factor A y b niveles del factor B, es

yijk = +*i + j H r)ii + yk +0r)*

i i = 1 , 2,

+(A0*

j y= i, 2,..., a
[* = 1 , 2 ,..., b

donde (t)^- y (ry),fcson los errores de la parcela completa de los factores^ y B, respectivamente, y egk es el
error de la subparcela usado para probar la interaccin^#. En la tabla 13-19 se muestra un anlisis de
varianza abreviado, suponiendo que A y B son factores fijos y que las rplicas son aleatorias. En ocasiones
las rplicas se consideran como bloques.

13-6

PROBLEMAS

------------------------------------------------------------------------------------------

13-1. El fabricante de la carga propulsora de una turbina est estudiando la rapidez de combustin del propulsor
obtenido de tres procesos de produccin. Se seleccionan al azar cuatro lotes del propulsor de la salida de
cada proceso y se hacen tres determinaciones de la rapidez de combustin de cada lote. Los resultados se
presentan a continuacin. Analizar los datos y sacar conclusiones.

Lote

1
25
30
26

Proceso 1
2
3
15
19
17
28
14
20

4
15
16
13

1
19
17
14

Proceso 2
2
3
23
18
21
24
21
17

4
35
27
25

1
14
15
20

Proceso 3
2
3
35
38
54
21
24
50

4
25
29
33

13-2. Se estudia el acabado superficial de piezas metlicas fabricadas en cuatro mquinas. Se conduce un experi
mento en el que cada mquina es operada por tres operadores diferentes y se colectan y prueban dos ejem
plares de cada operador. Debido a la ubicacin de las mquinas, se usan operadores diferentes en cada
mquina, y los operadores se eligen al azar. Los datos se muestran en la tabla siguiente. Analizar los datos y
sacar conclusiones.

Operador

Mquina 1
2
1
3
94
79
46
62
74
57

Mquina 2
3
1
2
76
92
85
68
99
79

Mquina 3
2
3
1
53
46
88
56
57
75

Mquina 4
1
3
2
36
62
40
53
47
56

13-3. Un ingeniero de manufactura est estudiando la variabilidad dimensional de un componente particular que
se produce en tres mquinas. Cada mquina tiene dos mandriles, y se seleccionan al azar cuatro componen
tes de cada mandril. Los resultados se presentan a continuacin. Analizar los datos, suponiendo que las m
quinas y los mandriles son factores fijos.

13-6 PROBLEMAS

Mandril

Mquina 3
1
2
14
16
10
15
12
15
11
14

Mquina 2
1
2
12
14
15
10
11
13
14
13

Mquina 1
1
2
12
8
9
9
11
10
12
8

585

13-4. Para simplificar la programacin de la produccin, un ingeniero industrial est estudiando la posibilidad de
asignar un tiempo estndar a una clase particular de tareas, con la creencia de que las diferencias entre las ta
reas son insignificantes. Para ver si esta simplificacin es posible, se seleccionan seis tareas al azar. Cada ta
rea se encarga a un grupo diferente de tres operadores. Cada operador completa dos veces la tarea en
momentos diferentes durante la semana, y se obtienen los resultados siguientes. Qu conclusiones pueden
sacarse acerca del uso del tiempo estndar comn para todas las tareas de esta clase? Qu valor se usara
para el estndar?
Threa
1
2
3
4
5
6

Operador 2

Operador 1
159.4
154.9
162.6
158.7
158.1
161.0

158.3
154.6
162.5
160.0
156.3
163.7

159.2
157.7
161.0
157.5
158.3
162.3

Operador 3
158.9
154.8
160.5
161.1
157.7
162.6

159.6
156.8
158.9
158.9
156.9
160.3

157.8
156.3
159.5
158.5
156.9
161.8

13-5. Considere el diseo anidado de tres etapas que se muestra en la figura 13-5 para investigar la dureza de una
aleacin. Utilizando los datos que se presentan a continuacin, analizar el diseo, suponiendo que la qumi
ca de la aleacin y las hornadas son factores fijos y que los lingotes son aleatorios. Usar la forma restringida
del modelo mixto.
Qumica de la aleacin
Hornadas
1
Lingotes

1
40
63

2
2
27
30

1
95
67

3
2
69
47

1
65
54

1
2
78
45

1
22
10

2
23
39

1
83
62

3
2
75
64

1
61
77

2
35
42

13-6. Analizar nuevamente el experimento del problema 13-5 utilizando la forma no restringida del modelo mixto.
Comentar las diferencias que se observan entre los resultados del modelo restringido y el no restringido.
Puede usarse un paquete de software de computadora.
13-7. Derivar los cuadrados medios esperados para el diseo anidado balanceado de tres etapas, suponiendo que
A es fijo y que B y C son aleatorios. Obtener las frmulas para estimar los componentes de la varianza. Supo
ner la forma restringida del modelo mixto.
13-8. Repetir el problema 13-7 suponiendo la forma no restringida del modelo mixto. Puede usarse un paquete de
software de computadora para hacerlo. Comentar las diferencias entre el anlisis y las conclusiones del mo
delo restringido y el no restringido.
13-9. Derivar los cuadrados medios esperados para el diseo anidado balanceado de tres etapas si los tres factores
son aleatorios. Obtener las frmulas para estimar los componentes de la varianza.

586

CAPTULO 13

DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

13-10. Verificar los cuadrados medios esperados que se dan en la tabla 13-1.
13-11. D iseos anidados no balanceados. Considere un diseo anidado de dos etapas no balanceado con b niveles de
B bajo el nivel -simo d e A y n rplicas en la celda y'-sima.
a) Anotar las ecuaciones normales de mnimos cuadrados para esta situacin. Resolver las ecuaciones nor
males.
b ) Construir la tabla del anlisis de varianza para el diseo anidado no balanceado de dos etapas.
c) Analizar los datos siguientes, utilizando los resultados del inciso b.
Factor^
Factor B

1
1
6
4
8

2
-3
1

2
2
2
4
3

1
5
7
9
6

..

3
1
0
-3

13-12. Componentes de la varianza en el diseo anidado no balanceado de dos etapas. Considere el modelo

i=

i,

7 -1 ,

yk =f*+*i +j(o + e *()

2,
2,

a
b

k = 1, 2 ,

71..

donde A y B son factores aleatorios. Demostrar que

E(MSA) = o 2 + Cla ] + c 2a 2T
E(MSB(A^ ) = o + c 0a
E(MS e ) = o 2
donde

j= l

Cr\

b a
a

( b

S S
i= 1

n i

\;=1

Cl =

_S S

in i.

bj
n V

=l _/=l

^ 1

1= 1

c = ____* ____
a -1

13-13. Un ingeniero de procesos est probando el rendimiento de un producto manufacturado en tres mquinas.
Cada mquina puede operarse con dos ajustes de la potencia. Adems, una mquina tiene tres estaciones en
las que se fabrica el producto. Se conduce un experimento en el que cada mquina se prueba con ambos ajus
tes de la potencia, y se toman tres observaciones del rendimiento de cada estacin. Las corridas se hacen en
orden aleatorio, y los resultados se presentan a continuacin. Analizar este experimento, suponiendo que los
tres factores son fijos.

13-6 PROBLEMAS

Mquina 1
Estacin
Ajuste de la potencia 1
Ajuste de la potencia 2

34.1
30.3
31.6
24.3
26,3
27.1

33.7
34.9
35.0
28.1
29.3
28.6

Mquina 3

Mquina 2
3
36.2
36.8
37.1
25.7
26.1
24.9

31.1
33.5
34.0
24.1
25.0
26.3

33.1
34.7
33.9
24.1
25.1
27.9

587

3
32,8
35.1
34.3
26.0
27.1
23.9

32,9
33.0
33.1
24.2
26.1
25,3

33.8
33.4
32.8
23.2
27.4
28.0

3
33.6
32.8
31.7
24.7
22.0

24.8

13-14. Suponga que en el problema 13-13 podran emplearse un gran nmero de ajustes de la potencia y que los dos
que se seleccionaron para el experimento se escogieron a] azar. Obtener los cuadrados medios esperados para
esta situacin suponiendo la forma restringida del modelo mixto y hacer las modificaciones apropiadas al
anlisis anterior.
13-15. Analizar nuevamente el experimento del problema 13-14 suponiendo la forma no restringida del modelo
mixto. Puede usarse un paquete de software de computadora para hacerlo. Comentar las diferencias entre el
anlisis y las conclusiones del modelo restringido y el no restringido.
13-16. Un ingeniero de estructuras est estudiando la resistencia de una aleacin de aluminio adquirida de tres fa
bricantes. Cada fabricante entrega la aleacin en barras de tamao estndar de 1.0,1.5 o 2.0 pulgadas. El
procesamiento de los diferentes tamaos de las barras a partir de un lingote comn implica tcnicas diferen
tes de forjado, por lo que este factor puede ser importante. Adems, las barras se forjan de lingotes fabrica
dos en hornadas diferentes. Cada fabricante entrega dos ejemplares de prueba de cada tamao de las barras
de tres hornadas. Los datos de la resistencia resultantes se presentan a continuacin. Analizar los datos, su
poniendo que los fabricantes y el tamao de las barras son fijos y las hornadas son aleatorias. Usar la forma
restringida del modelo mixto.

Fabricante 1
Hornada
Tkmao de la barra: 1 pulgada
1

\ pulgadas
2

pulgadas

1.230
1.259
1.316
1.300
1.287
1.292

1.346
1.400
1.329
1.362
1.346
1.382

3
1.235
1.206
1.250
1.239
1.273
1.215

Fabricante 2
1

1.301
1.263
1.274
1.268
1.247
1.215

1.346
1.392
1.384
1.375
1.362
1.328

3
1.315
1.320
1,346
1.357
1.336
1.342

Fabricante 3
1

1.247
1.296
1.273
1.264
1.301
1.262

1.275
1.268
1.260
1.265
1.280
1.271

3
1.324
1.315
1.392
1.364
1.319
1.323

13-17. Resolver de nuevo el problema 13-16 utilizando la forma no restringida del modelo mixto. Puede usarse un
paquete de software de computadora para hacerlo. Comentar cualquier diferencia entre el anlisis y las con
clusiones del modelo restringido y el no restringido.
13-18. Suponga que en el problema 13-16 las barras pueden adquirirse en muchos tamaos y que los tres tamaos
que realmente se utilizaron en el experimento fueron seleccionados al azar. Obtener los cuadrados medios
esperados para esta situacin y hacer las modificaciones apropiadas al anlisis anterior. Usar la forma res
tringida del modelo mixto.
13-19. La normalizacin del acero se hace calentndolo arriba de la temperatura crtica, recalentndolo y despus
enfrindolo con aire. Este proceso incrementa la resistencia del acero, refina el grano y homogeneiza la es
tructura. Se lleva a cabo un experimento para determinar el efecto de la temperatura y de la duracin del
tratamiento trmico sobre la resistencia del acero normalizado. Se seleccionan dos temperaturas y tres dura-

588

CAPTULO 13 DISEOS ANIDADOS Y DE PARCELAS SUBDIVIDIDAS

dones. El experimento se realiza calentando el homo a una temperatura seleccionada aleatoriamente e in


sertando tres ejemplares de prueba. Despus de 10 minutos se retira uno de ellos, despus de 20 minutos se
retira un segundo ejemplar y despus de 30 minutos se retira el ltimo. Entonces se corre la temperatura al
otro nivel y se repite el proceso. Se requieren cuatro corrimientos para recabar los datos, los cuales se mues
tran abajo. Analizar los datos y sacar conclusiones, suponiendo que ambos factores son fijos.

Corrimiento

Tiempo, minutos

10
20

Temperatura, F
1600
1500
63
89
54
91
61
62
50
80
52
72
59
69
48
73
74
81
69
71
54
88
92
48
64
59

30
10
20

30
10
20

30
10
20

30

13-20. Se disea un experimento para estudiar la dispersin de los pigmentos de una pintura. Se estudian cuatro
mezclas diferentes de un pigmento particular. El procedimiento consiste en preparar una mezcla particular y
en aplicarla despus a un panel utilizando tres mtodos (con brocha, por roco y con rodillo). La respuesta
medida es el porcentaje de reflectancia (coeficiente de reflexin) del pigmento. Se necesitan tres das para
correr el experimento, y los datos obtenidos se presentan a continuacin. Analizar los datos y sacar conclu
siones, suponiendo que las mezclas y los mtodos de aplicacin son fijos.

Da

Mtodo de
aplicacin

1
2

3
2

1
2

3
3

1
2

Mezcla
1

64.5
68.3
70.3
65.2
69.2
71.2

66.3
69.5
73.1
65.0
70.3
72.8
66.5
69.0
74.2

66.2

69.0
70.8

3
74.1
73.8
78.0
73.8
74.5
79.1
72.3
75.4
80.1

4
66.5
70.0
72.3
64.8
68.3
71.5
67.7
68.6

72.4

13-21. Repetir el problema 13-20, suponiendo que las mezclas son aleatorias y que los mtodos de aplicacin son fi
jos.
13-22. Considere el diseo de parcelas con doble subdivisin del ejemplo 13-3. Suponga que este experimento se
conduce como se describe y que se obtienen los datos que se muestran en la siguiente tabla. Analizar los da
tos y sacar conclusiones.

13-6 PROBLEMAS

589

Tcnico
Rplicas
(o bloques)

Concentracin
de las dosis
Espesor de la pared

1
2

95
104

3
4

10 1

71
82
85
85
78
84

108
115
117
116

1
2

3
4
3

1
2

3
4
4

1
2

3
4

108
95
106
103
109
96
105
106
113
90

3
108

95

100

102

105
109
104

105
107
92

102

100
10 1

99

84
70
81

110

112

86

107
106

94

66

100

88

112

104

90

117
109

121

84
87
90

98

68

112

102
100

81
85
85

68

100
102

84
85

114

88

1 10

109
116

115
118

96
99
95
97

70
84
83
85
72
79
80

86

100
10 1

118

108
109
100
10 1

108
90
97

109
117
106
103

102

1 10

105

116

110

100
110

98

70
81
84
87
69
76
80
86

73
75
82
91
72
78
80
95

3
100

106
113
115
10 1

104
109
113
98
100

104
112
10 1

105
1 10
120

13-23. Resolver nuevamente el problema 13-22, suponiendo que los tcnicos se eligen al azar. Usar la forma restrin
gida del modelo mixto.
13-24. Suponga que en el problema 13-22 se usaron cuatro tcnicos. Suponiendo que todos los factores son fijos,
cuntos bloques debern correrse para obtener un nmero adecuado de grados de libertad para probar las
diferencias entre los tcnicos?
13-25, Considere el experimento que se describe en el ejemplo 13-3. Demostrar cmo se determinara el orden en
que se corren la combinaciones de tratamientos si este experimento se realizara como a) una parcela con do
ble subdivisin, b) una parcela subdividida, c) un diseo factorial en un bloque aleatorizado y d) un diseo
factorial completamente aleatorizado.

Ottos tpicos
de diseo y
anlisis

El tema de los experimentos diseados estadsticamente es muy amplio. En los captulos previos se ha
ofrecido una presentacin introductoria de muchos de los conceptos y mtodos bsicos, aunque en algu
nos casos slo se ha podido presentar un panorama general. Por ejemplo, hay exposiciones que ocupan un
libro sobre tpicos, como la metodologa de superficies de respuesta, los experimentos con mezclas, la es
timacin de los componentes de la varianza y los diseos ptimos. En este captulo se presenta un panora
ma general de varios tpicos ms que el experimentador puede encontrar potencialmente tiles.

14-1
14-1.1

RESPUESTAS Y TRANSFORMACIONES NO NORMALES


Seleccin de una transformacin: el mtodo de Box-Cox

En la seccin 3-4.3 se estudi el problema de una varianza no constante de la variable de respuesta y en


un experimento diseado, y se seal que se trata de una desviacin de los supuestos del anlisis de va
rianza estndar. Este problema de la desigualdad de la varianza ocurre con relativa frecuencia en la
prctica, muchas veces en conjuncin con una variable de respuesta no normal. Algunos ejemplos in
cluiran el conteo de defectos o partculas, los datos de proporciones, como el rendimiento o la propor
cin de productos defectuosos, o una variable de respuesta que sigue alguna distribucin sesgada (una
cola de la distribucin de la respuesta es ms larga que la otra). Se introdujo la transformacin de la
variable de respuesta como un mtodo apropiado para estabilizar la varianza de la respuesta. Se revisa
ron dos mtodos para seleccionar la forma de la transformacin, una tcnica grfica emprica y un pro
cedimiento esencialmente de ensayo y error en el que el experimentador simplemente intenta una o
ms transformaciones, y selecciona la que produce la grfica ms agradable o satisfactoria de los residua
les contra la respuesta ajustada.
En general, las transformaciones se usan para tres propsitos: estabilizar la varianza de la respuesta,
hacer que la distribucin de la variable de respuesta est ms cerca de la distribucin normal y mejorar el
ajuste del modelo a los datos. Este ltimo objetivo podra incluir la simplificacin del modelo, por ejem-

590

14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES

591

pio, eliminando trminos de interaccin. En ocasiones, una transformacin ser razonablemente eficaz
para conseguir de manera simultnea ms de uno de estos objetivos.
Se ha sealado ya que la familia de potencias de las transformaciones^* =y*es muy til, donde Aes el
parmetro de la transformacin que habr de determinarse (por ejemplo A = \ significa usar la raz cua
drada de la respuesta original). Box y Cox [15] han indicado cmo puede estimarse el parmetro de la
transformacin A al mismo tiempo que los dems parmetros del modelo (la media global y los efectos de
los tratamientos). La teora fundamental en su procedimiento utiliza el mtodo de mxima verosimilitud.
El procedimiento de clculo real consiste en efectuar, para varios valores de A, el anlisis de varianza es
tndar de
y* ~ i
L
A) / ' 1
ln y

A* 0

(14-1)

A= 0

donde = ln_1[(l/) 2 ln_y] es la media geomtrica de las observaciones. La estimacin de mxima verosi
militud de Aes el valor para el que la suma de cuadrados del error, por ejemplo 55(A), es un mnimo. Este
valor de A se encuentra generalmente construyendo una grfica de S5(A) contra Ay leyendo despus en la
grfica el valor de A que minimiza SSE(X). En general, son suficientes entre 10 y 20 valores de A para esti
mar el valor ptimo. Si se necesita una estimacin ms precisa de A, podra realizarse una segunda itera
cin utilizando un nmero mayor de valores.
Observe que no es posible seleccionar el valor de A comparando directamente las sumas de cuadrados
del error obtenidas en los anlisis de varianza d e / , ya que para cada valor de A la suma de cuadrados del
error se mide en una escala diferente. Adems, surge un problema con y cuando A = 0; a saber, cuando A
tiende a cero, y tiende a la unidad. Es decir, cuando A = 0, todos los valores de la respuesta son una cons
tante. El componente ( / - 1)/A de la ecuacin 14-1 alivia este problema porque cuando A tiende a cero, (y*
- 1)/A tiende a un lmite de ln_y. El componente del divisor y 1 - 1 de la ecuacin 14-1 reescala las respues
tas para que las sumas de cuadrados del error sean comparables directamente.
Al utilizar el mtodo de Box-Cox, se recomienda que el experimentador use elecciones simples de A,
ya que es probable que la diferencia prctica entre A = 0.5 y A = 0.58 sea pequea, pero la transformacin
de la raz cuadrada (A = 0.5) es mucho ms fcil de interpretar. Obviamente, los valores de A prximos a la
unidad sugeriran que no es necesaria ninguna transformacin.
Una vez que se ha seleccionado un valor de A por el mtodo de Box-Cox, el experimentador puede
analizar los datos utilizando y 1 como la respuesta, a menos desde luego que A = 0, en cuyo caso se usa lny.
Es perfectamente aceptable utilizar _y(A) como la respuesta real, aun cuando las estimaciones de los par
metros del modelo tendrn una diferencia de escala y un corrimiento del origen en comparacin con los
resultados obtenidos cuando se usa y* (o ln y).
Es posible encontrar un intervalo de confianza aproximado de 100(1 - a ) por ciento para A calcu
lando
t2
SS' = SSE(X) 1 + ^ r

(I4-2)

donde v es el nmero de grados de libertad, y graficando una recta paralela al eje A a la altura SS* sobre la
grfica de 55(A) contra A. Entonces, al localizar los puntos sobre el eje A donde SS* corta la curva SSE(A),
pueden leerse directamente en la grfica los lmites de confianza para A. Si este intervalo de confianza in
cluye el valor A = 1, esto implica (como se seal antes) que los datos no soportan la necesidad de una
transformacin.

592

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

EJEMPLO 14-1
El procedimiento de Box-Cox se ilustrar utilizando los datos de la descarga pico presentados original
mente en el ejemplo 3-5. Recuerde que se trata de un experimento con un solo factor (ver la tabla 3-7
para los datos originales). Utilizando la ecuacin 14-1 se calcularon los valores de SSE(X) para varios valo
res de A:

s s Ea )

-1.00

7922.11

-0.50

687.10

-0.25

232.52

0.00

91.96

0.25
0.50
0.75

46.99
35.42
40.61
62.08
109.82
208.12

1.0 0

1.25
1.50

En la figura 14-1 se muestra una grfica de los valores prximos al mnimo, en la que se observa que
A-0 .5 2 produce un valor mnimo de aproximadamente SSE(X) = 35.00. Un intervalo de confianza aproxi
mado de 95% para Ase encuentra calculando la cantidad SS* de la ecuacin 14-2 de la siguiente manera:

= 35.00 1 +

(2.086)
20

Al representar SS* en la grfica de la figura 14-1 y al leer los puntos de la escala Adonde esta recta interse
ca la curva, se obtienen los lmites de confianza inferior y superior de Ade X~ = 0.27 y A+ = 0.77. Puesto que
estos lmites de confianza no incluyen el valor 1 , es correcto el uso de una transformacin, y la transforma
cin de la raz cuadrada (A = 0.50) que se us en realidad se justifica con facilidad.

Algunos programas de computadora incluyen el procedimiento de Box-Cox para seleccionar una


transformacin de la familia de potencias. En la figura 14-2 se presenta la salida de este procedimiento
como se implementa en Design-Expert para los datos de la descarga pico. Los resultados concuerdan en
gran medida con los clculos manuales resumidos en el ejemplo 14-1. Observe que la escala vertical de la
grfica de la figura 14-2 es ln[SS(A)].

14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES

X- = 0.27

k* = 0.77

Figura 14-1 Grfica de SSE() contra X para el ejemplo


14-1.

Grfica de B ox-C o x transform aciones de potencias


Grfica de DESIGN-EXPERT
D escarga pico
Lam bda
C o n ie n te =1
M e jo r = 0.541377
Intervalo de confianza
bajo = 0.291092
Intervalo de confianza
alto = 0.791662
Transform acin
recom endada
Raz cuadrada
(Lam bda = 0.5)

20.32

ID-

=
a

11.95

7.76

3.58
-

Lam bda

Figura 14-2

Salida de Design-Expert para el procedimiento de Box-Cox.

594
14-1.2

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Modelo lineal generalizado

Con frecuencia las transformaciones de datos son una forma muy eficaz de abordar el problema de las
respuestas no normales y de la desigualdad asociada de la varianza. Como se ha visto en la seccin ante
rior, el mtodo de Box-Cox es una forma sencilla y eficaz de seleccionar la forma de la transformacin.
Sin embargo, puede haber problemas asociados con el uso de una transformacin de datos.
Un problema es que el experimentador puede sentirse incmodo al trabajar con la respuesta en la es
cala transformada. Es decir, el experimentador se interesa en el nmero de defectos, no en la raz cuadra
da del nmero de defectos, o en la resistividad en lugar del logaritmo de la resistividad. Por otra parte, si
una transformacin en realidad tiene xito y mejora el anlisis y el modelo asociado de la respuesta, los
experimentadores adoptarn por lo general con rapidez la nueva mtrica.
Un problema ms serio es que una transformacin puede resultar en un valor sin sentido para la va
riable de respuesta en alguna porcin del espacio de los factores del diseo que es de inters para el expe
rimentador. Por ejemplo, suponga que se ha usado la transformacin de la raz cuadrada en un
experimento que incluye el nmero de defectos observados en obleas de semiconductores, y para alguna
porcin de la regin de inters la raz cuadrada predicha del conteo de defectos es negativa. Es probable
que esto suceda en situaciones en las que el nmero real de defectos observados es pequeo. Por consi
guiente, el modelo del experimento ha producido una prediccin evidentemente no confiable justo en la
regin donde sera deseable que este modelo tuviera un buen desempeo predictivo.
Por ltimo, como se seal en la seccin 14-1.1, es frecuente el uso de transformaciones a fin de esta
bilizar la varianza, inducir la normalidad y simplificar el modelo. No existe la seguridad de que una trans
formacin conseguir eficazmente todos estos objetivos al mismo tiempo.
Una alternativa del enfoque tpico de la transformacin de datos seguida del anlisis estndar de m
nimos cuadrados de la respuesta transformada es usar el modelo lineal generalizado. Se trata de un enfo
que desarrollado por Neider y Wedderburn [87] que en esencia unifica modelos lineales y no lineales con
respuestas normales y no normales. McCullagh y Neider [76] ofrecen un completo estudio de los modelos
lineales generalizados y Myers y Montgomery [85b] proporcionan un tutorial. Tmbin se presentan deta
lles adicionales en el material suplementario del texto de este captulo. Se ofrecer un panorama general
de los conceptos y se ilustrarn con dos ejemplos breves.
Un modelo lineal generalizado es bsicamente un modelo de regresin (el modelo de un diseo expe
rimental tambin es un modelo de regresin). Como todos los modelos de regresin, est constituido por
un componente aleatorio (lo que se ha llamado generalmente el trmino del error) y una funcin de los
factores del diseo (lasx) y algunos parmetros desconocidos (las/?). En un modelo de regresin lineal de
la teora normal estndar se escribe
y = a + i x i + i x 2 + + kxk + e

(14'3)

donde se supone que el trmino del error s tiene una distribucin normal con media cero y varianza cons
tante, y la media de la variable de respuesta y es
E(y) = P -

+ i x i + i x 2

"I

v k x k

~ x

14'4)

A la parte x' de la ecuacin 14-4 se le llama predictor lineai. El modelo lineal generalizado contiene la
ecuacin 14-3 como un caso especial.
En un modelo lineal generalizado, la variable de respuesta puede tener cualquier distribucin que
sea un miembro de la familia exponencial. Esta familia incluye las distribuciones normal, de Poisson, bi-

144 RESPUESTAS Y TRANSFORMACIONES NO NORMALES

595

nomial, exponencial y gamma, por lo que la familia exponencial es una coleccin rica y flexible de distri
buciones aplicables en muchas situaciones experimentales. Adems, la relacin entre la media de la
respuesta fi y el predictor lineal x' se determina por una funcin de enlace.
g()=x'

(14-5)

El modelo de regresin que representa la respuesta media est dado entonces por
E(y) = fi = g -'(xfi)

(14-6)

Por ejemplo, a la funcin de enlace que lleva al modelo de regresin lineal ordinario en la ecuacin 14-3
se le llama enlace identidad, ya que fi = g 1(x') = x'. Como otro ejemplo, el enlace log (logartmico)
ln ( p ) - x '

(14-7)

H = e l

(14-8)

produce el modelo

El enlace logartmico se usa con frecuencia con datos de conteos (respuesta de Poisson) y con respuestas
continuas que presentan una distribucin que tiene una cola larga a la derecha (la distribucin exponen
cial o gamma). Otra funcin de enlace importante que se usa con datos binomiales es el enlace logit
/
ln
= x'
(14-9)
Esta eleccin de la funcin de enlace lleva al modelo
^
l+ e 'p

(14-10)
v
'

Hay muchas elecciones posibles de la funcin de enlace, pero debe ser siempre montona y diferenciable.
Observe asimismo que en un modelo lineal generalizado, la varianza de la variable de respuesta no tiene
que ser una constante; puede ser una funcin de la media (y de las variables predictoras a travs de la fun
cin de enlace). Por ejemplo, si la respuesta es de Poisson, la varianza de la respuesta es exactamente
igual a la media.
Para usar un modelo lineal generalizado en la prctica, el experimentador debe especificar una distri
bucin de la respuesta y una funcin de enlace. Despus se hace el ajuste del modelo o la estimacin de
los parmetros por el mtodo de mxima verosimilitud, el cual para la familia exponencial resulta ser una
versin iterativa de los mnimos cuadrados ponderados. Para los modelos de regresin lineal o de diseos
experimentales ordinarios con una variable de respuesta normal, esto se reduce a los mnimos cuadrados
estndares. Utilizando un enfoque que es anlogo al anlisis de varianza de datos de la teora normal,
pueden hacerse inferencias y la verificacin de diagnsticos para un modelo lineal generalizado. Referir
se a Myers y Montgomery [85b] para los detalles y ejemplos. Dos paquetes de software que soportan el
modelo lineal generalizado son SAS (PROC GENMOD) y S-PLUS.

IJEMPLO 1 4 -2 ..................................................................................................................................
El experimento de los defectos en las rejillas
En el problema 8-29 se introdujo un experimento para estudiar los efectos de nueve factores sobre los de
fectos en rejillas de planchas moldeadas de recuadros abiertos. Bisgaard y Fuller realizaron un interesan
te y til anlisis de estos datos para ilustrar el valor de la transformacin de datos en un experimento

596
Tibia 14-1

Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Anlisis de mnimos cuadrados y del modelo lineal generalizado para el experimento rejilla de recuadros abiertos

Utilizando mtodos de mnimos cuadrados con la


transformacin
de los datos de la raz cuadrada modificada de Freeman y Tukey
Transformados
No transformados
Intervalo de
Intervalo de
Valor
confianza de
Valor
confianza de
predicho
95%
predicho
95%
29.70
(16.65,46.41)
(4.14, 6.85)
5.50
15.12
(6.25, 27.65)
3.95
(2.60, 5.31)
1.84
(1.69, 7.78)
1.52
(0.17, 2.88)
(1.71,4.42)
8.91
(2.45,19.04)
3.07
1.84
(1.69, 7.78)
1.52
(0.17,2.88)
(1.71,4.42)
8.91
(2.45,19.04)
3.07
(4.14, 6.85)
29.70
(16.65, 46.41)
5.50
15.12
(6.25, 27.65)
3.95
(2.60,5.31)
0.71
C, 5.41)
1.08
(-0.28,2.43)
*
(*, 0.36)
(-1.82, 0.89)
-0.47
(0.04,10.49)
(0.61, 3.31)
3.36
1.96
11.78
(4.13, 23.10)
3.50
(2.15, 4.86)
3.36
(0.04,10.49)
1.96
(0.61, 3.31)
11.78
(4.13,23.10)
3.50
(2.15, 4.86)
(-0.28, 2.43)
0.71
1.08
(*, 5.41)
*
(-1.82, 0.89)
(*, 0.36)
-0.47

Modelo lineal generalizado


[respuesta de Poisson, enlace
log (logartmico)]
Intervalo de
Valor
confianza
predicho
de 95%
(42.45, 61.90)
51.26
11.74
(8.14,16.94)
1.12
(0.60, 2.08)
4.88
(2.87, 8.32)
1.12
(0.60, 2.08)
4.88
(2.87, 8.32)
51.26
(42.45, 61.90)
11.74
(8.14,16.94)
0.81
(0.42,1.56)
0.19
(0.09, 0.38)
1.96
(1.16, 3.30)
8.54
(5.62,12.98)
1.96
(1.16, 3.30)
(5.62,12.98)
8.54
(0.42,1.56)
0.81
(0.09,0.38)
0.19

Longitud del
intervalo de confianza
del 95%
Mnimos
GLM (modelo
cuadrados
lineal generalizado)
19.45
29.76
8.80
21.39
6.09
1.47
5.45
16.59
6.09
1.47
5.45
16.59
19.45
29.76
8.80
21.39
*
1.13
*
0.29
2.14
10.45
7.35
18.96
2.14
10.45
7.35
18.97
*
1.13
*
0.29

14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES

597

diseado. Como se seal en el inciso/del problema 8-29, los autores utilizaron una modificacin de la
transformacin de la raz cuadrada que llev al modelo
) / 2 = 2.513- 0,996x4 - 1.21x6 - 0.772x2x 7
donde, como de costumbre, las x representan los factores del diseo codificados. Esta transformacin
hace un excelente trabajo para estabilizar la varianza del nmero de defectos. En las dos primeras seccio
nes de la tabla 14-1 se presenta parte de la informacin acerca de este modelo. Bajo el encabezado
Transformados, la primera columna contiene la respuesta predicha. Observe que hay dos valores predichos negativos. El encabezado No transformados presenta los valores predichos no transformados, jun
to con los intervalos de confianza de 95% para la respuesta media en cada uno de los 16 puntos del diseo.
Puesto que hubo algunos valores predichos negativos, as como lmites de confianza inferiores negativos,
no fue posible calcular los valores de todas las entradas de esta seccin de la tabla.
La respuesta es en esencia una raz cuadrada del conteo de los defectos. Un valor predicho negativo
es claramente ilgico. Observe que esto ocurre donde los conteos observados fueron pequeos. Si es im
portante usar el modelo para predecir el desempeo en esta regin, el modelo puede ser no confiable.
Esto no deber tomarse como una crtica del experimento original ni del anlisis de Bisgaard y Fuller. Fue
un experimento de exploracin en extremo exitoso que defini con toda claridad las variables importan
tes del proceso. La prediccin no fue una de las metas originales, y tampoco fue el objetivo del anlisis
realizado por Bisgaard y Fuller.
Sin embargo, si hubiera sido importante obtener un modelo de prediccin, probablemente un modelo
lineal generalizado habra sido una buena alternativa para el enfoque de la transformacin. Myers y
Montgomeiy usan un enlace log (logartmico) (ecuacin 14-7) y una respuesta de Poisson para ajustar
exactamente el mismo predictor lineal dado por Bisgaard y Fuller. Esto produce el modelo
v=

J (1.1280-8V6J:,,1 . 1 7 6 0.737jr2jr7 )

La tercera seccin de la tabla 14-1 contiene los valores predichos de este modelo y los intervalos de
confianza de 95% para la respuesta media en cada punto del diseo (obtenida con el procedimiento
PROC GENMOD de SAS). No hay valores predichos negativos (lo cual se asegura con la eleccin de la
funcin de enlace) ni lmites de confianza inferiores negativos. En la ltima seccin de la tabla se compa
ran las longitudes de los intervalos de confianza de 95% para la respuesta no transformada y el modelo li
neal generalizado (GLM). Observe que los intervalos de confianza del modelo lineal generalizado son
uniformemente m s cortos que sus contrapartes de mnimos cuadrados. Esto es un slido indicio de que
el enfoque del modelo lineal generalizado ha explicado la variabilidad y ha producido un modelo superior
en comparacin con el enfoque de la transformacin.

EJEMPLO 1 4 -3 ..................................................................................................................................
El experimento del hilado de estambre
En la tabla 14-2 se presenta un diseo factorial 33 que se realiz para investigar el desempeo de un hilado
de estambre bajo ciclos de carga repetida. El experimento se describe completo en Boxy Draper [16b]. La
respuesta es el nmero de ciclos hasta una falla. De manera tpica, los datos de confiabilidad como stos
son no negativos y continuos, y con frecuencia tienen una distribucin con una cola derecha alargada.
Los datos se analizaron inicialmente utilizando el enfoque estndar (mnimos cuadrados), y la trans
formacin de datos fue necesaria para estabilizar la varianza. Se encuentra que el logaritmo de los datos

598

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Tabla 14-2 El experimento del hilado de estambre

Corrida
1
2

3
4
5
6

7
8

9
10
11
12

13
14
15
16
17
18
19
20
21
22

23
24
25
26
27

-1
-1
-1
-1
-1
-1
-1
-1
-1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1

*2

*3

-1
-1
-1
0
0
0
1
1
1
-1
-1
-1
0
0
0
1
1
1
-1
-1
-1
0
0
0
1
1
1

-1
0
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
0
1

Ciclos hasta
una falla
674
370
292
338
266
210

170
118
90
1414
1198
634

Logaritmo
de los ciclos
hasta una falla
2.83
2.57
2.47
253
2.42
2.32
2.23
2.07
1.95
3.15
3.08

10 22

620
438
442
332
220

3636
3184
2000

1568
1070
566
1140
884
360

2.8

3.01
2.79
2.64
2.65
2.52
2.34
3.56
3.5
3.3
3.19
3.03
2.75
3.06
2.95
2.56

de los ciclos hasta una falla produce un modelo adecuado en trminos del ajuste global del modelo, as
como grficas satisfactorias de los residuales. El modelo es
log>>= 2.751 + 0.3617^ - 0.2739;t2 - 0.1711*3
o en trminos de la respuesta original, ciclos hasta una falla,
j > = J Q 2- 7SX+ 0.361-7 X, - .2 7 3 9 i 2 - 0 . m i i 3

Este experimento se analiz tambin utilizando el modelo lineal generalizado, seleccionando la dis
tribucin gamma para la respuesta y el enlace log (logartmico). Se us exactamente la misma forma del
modelo encontrada por el anlisis de mnimos cuadrados de la respuesta con la transformacin logartmi
ca. El modelo que result es
*

. 3489+ 0.84251 , - 0 . 6313i2 - 0.38511,

En la tabla 14-3 se presentan los valores predichos del modelo de mnimos cuadrados y del modelo lineal
generalizado, junto con los intervalos de confianza de 95% para la respuesta media de cada uno de los 27

Tabla 14-3

Anlisis del modelo de mnimos cuadrados y del modelo lineal generalizado para el experimento det hilado de estambre

Mtodos de mnimos cuadrados con la transformacin


logartmica de los datos
Transformados
No transformados

Observacin
1
2

Valor
predicho
2.83
2.66

3
4
5

2.49
2.56
2.39

2.22

2.29

2 .12

1.94
3.20
3.02
2.85
2.92
2.75
2.58
2.65
2.48
2.31
3.56
3.39
3.22
3.28
3.11
2.94
3.01
2.84
2.67

10
11
12

13
14
15
16
17
18
19
20
21
22

23
24
25
26
27

Intervalo de
confianza
de
95%
(2.76, 2.91)
(2.60, 2.73)
(2.42,2.57)
(2.50,2.62)
(234,2.44)
(2.15,2.28)
(2.21,2.36)
(2.05,2.18)
(1.87, 2.02)
(3.13, 3.26)
(2.97,3.08)
(2.79, 2.92)
(2.87, 2.97)
(2.72, 2.78)
(2.53, 2.63)
(2.58, 2.71)
(2.43, 2.53)
(2.24, 2.37)
(3.48, 3.63)
(3.32, 3.45)
(3.14, 3.29)
(3.22, 3.35)
(3.06, 3.16)
(2.88, 3.01)
(2.93, 3.08)
(2.77, 2.90)
(2.59, 2.74)

Intervalo de
confianza
Valor
de
predicho
95%
682.50
(573.80,811.52)
460.26
(397.01,533.46)
310.38
(260.98,369.06)
363.25
(313.33,421.11)
244.96
(217.92,275.30)
165.20
(142.50,191.47)
193.33
(162.55,229.93)
130.38
(112.46,151.15)
87.92
(73.93,104.54)
1569.28 (1353.94,1819.28)
1058.28
(941.67,1189.60)
713.67
(615.60,827.37)
835.41
(743.19, 938.86)
563.25
(523.24, 606.46)
379.84
(337.99,426.97)
444.63
(383.53,515.35)
299.85
(266.75,336.98)
202.16
(174.42, 234.37)
3609.11 (3034.59,4292.40)
2433.88 (2099.42, 2821.63)
1641.35 (1380.07, 1951.64)
1920.88 (1656.91,2226.90)
1295.39 (1152.66, 1455.79)
873.57
(753.53,1012.74)
102235
(859.81, 1215.91)
689.45
(594.70, 799.28)
464.94
(390.93,552.97)

Modelo lineal generalizado


Intervalo de
confianza
Valor
de
predicho
95%
680.52
(583.83, 793.22)
463.00
(407.05, 526.64)
315.01
(271.49, 365.49)
361.96
(317.75,412.33)
(222.55,272.51)
246.26
167.55
(147.67, 190.10)
192.52
(165.69,223.70)
130.98
(115.43,148.64)
89.12
(76.87,103.32)
1580.00 (1390.00, 1797.00)
1075.00
(972.52, 1189.00)
731.50
(644.35, 830.44)
840.54
(759.65, 930.04)
571.87
(536.67, 609.38)
389.08
(351.64,430.51)
(393.81,507.54)
447.07
304.17
(275.13,336.28)
206.95
(182.03,235.27)
3670.00 (3165.00, 4254.00)
2497.00 (2200.00, 2833.00)
1699.00 (1462.00,1974.00)
1952.00 (1720.00, 2215.00)
1328.00 (1200.00,1470.00)
903.51
(793.15,1029.00)
1038.00
(894.79,1205.00)
706.34
(620.99, 803.43)
480.57
(412.29, 560.15)

Longitud del
intervalo de confianza
del 95%
GLM
(modelo
Mnimos
lineal
cuadrados generalizado)
237.67
209.39
136.45
119.59
108.09
94.00
107.79
94.58
57.37
49.%
48.97
42.42
67.38
58.01
38.69
33.22
30.62
26.45
465.34
407.00
247.92
216.48
211.77
186.09
195.67
170.39
83.22
72.70
88.99
78.87
131.82
113.74
70.23
61.15
59.95
53.23
1257.81
1089.00
722.21
633.00
571.57
512.00
569.98
495.00
303.14
270.00
259.22
235.85
356.10
310.21
182.44
204.58
162.04
147.86

599

600

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

puntos del diseo. La comparacin de las longitudes de los intervalos de confianza revela que es posible
que el modelo lineal generalizado sea un mejor predictor que el modelo de mnimos cuadrados.

Los modelos lineales generalizados han encontrado amplia aplicacin en la investigacin y el desa
rrollo biomdico y farmacutico. Conforme ms paquetes de software incluyan esta capacidad, encontra
r una aplicacin ms amplia en el mbito de la investigacin y el desarrollo industrial general.

14-2

DATOS NO BALANCEADOS EN UN DISEO FACTORIAL

El centro de atencin principal de este libro ha sido el anlisis de diseos factoriales balanceados, es de
cir, los casos en que en cada celda hay el mismo nmero n de observaciones. Sin embarg, es comn en
contrar situaciones en las que el nmero de observaciones en las celdas son desiguales. Estos diseos
factoriales no balanceados ocurren por varias razones. Por ejemplo, el experimentador puede haber dise
ado inicialmente un experimento balanceado, pero debido a problemas imprevistos cuando se corre el
experimento, los cuales resultan en la prdida de algunas observaciones, termina trabajando con datos no
balanceados. Por otra parte, algunos experimentos no balanceados se disean expresamente de este
modo. Por ejemplo, ciertas combinaciones de tratamientos pueden ser ms costosas o ms difciles de co
rrer que otras, por lo que pueden hacerse menos observaciones en esas celdas. De manera alternativa, al
gunas combinaciones de tratamientos pueden ser de mayor inters para el experimentador debido a que
representan condiciones nuevas o nq exploradas, por lo que puede optar por obtener rplicas adicionales
de dichas celdas.
La propiedad de ortogonalidad de los efectos principales y las interacciones, presente en los datos ba
lanceados, no es vlida en el caso no balanceado. Esto significa que las tcnicas del anlisis de varianza
usual no son aplicables. Por consiguiente, el anlisis de factoriales no balanceados es mucho ms difcil
que el de los diseos balanceados.
En esta seccin se ofrece un breve panorama general de los mtodos para abordar los factoriales no
balanceados, centrando la atencin en el caso del modelo de efectos fijos con dos factores. Suponga que
el nmero de observaciones en la celda /'-sima es ny Adems, sea n, = E *=1 n.. el nmero de observacio
nes en el rengln z'-simo (el nivel '-simo del factor A ), sea n = 2 .'=1 n el nmero de observaciones de la
columnay'-sima (el nivel;-simo del factor ,6 ) y sea = 2 =1 Xbj=1 nt] el nmero total de observaciones.

14-2.1

Datos proporcionales: un caso sencillo

Una de las situaciones que incluye datos no balanceados presenta escasa dificultad para el anlisis; se tra
ta del caso de los datos proporcionales. Es decir, el nmero de observaciones en la celda )-sima es
n n .
nv = ^
1
n

(14-11)

Esta condicin implica que el nmero de observaciones en dos renglones o columnas cualesquiera es pro
porcional. Cuando ocurren datos proporcionales, puede emplearse el anlisis de varianza estndar. Slo

14-2 DATOS NO BALANCEADOS EN UN DISEO FACTORIAL

601

es necesario hacer modificaciones menores en las frmulas del clculo manual de las sumas de cuadrados,
las cuales quedan como

=1 /= 1 k = 1

ssa

n -

=2
t

n,

= 2
n nJ
A v2
v2
= y - SSA - SSB
M n
n>j n -

ssb

s s E = s s T - s s A - s s B - s s AB
JL.

J _

= 2 2 2

=L j= l Jt=l

V2

- 1 2

1=1 i - 1

Como un ejemplo de datos proporcionales, considere el experimento del diseo de la batera del
ejemplo 5-1. En la tabla 14-4 se muestra una versin modificada de los datos originales. Desde luego, los
datos son proporcionales; por ejemplo, en la celda 1 , 1 se tienen
nL/i,
10 ( 8)

20

= 4

observaciones. Los resultados que se obtienen al aplicar el anlisis de varianza usual a estos datos se pre
sentan en la tabla 14-5. Tanto el tipo de material como la temperatura son significativos, lo cual concuerda
con el anlisis del conjunto completo de datos del ejemplo 5-1. Sin embargo, la interaccin que se observ
en el ejemplo 5-1 no est presente.

14-2.2

Mtodos aproximados

Cuando los datos no balanceados no se apartan demasiado del caso balanceado, en ocasiones es posible
usar procedimientos aproximados que convierten el problema no balanceado en uno balanceado. Esto

Tabla 14-4

Tipo de
material

Experimento del diseo de la batera con datos proporcionales

__________________________ -temperatura, F
15
70
nn =4
ni2 = 4
34
40
130
155
80
75
74
180
=2
159

21
2

31 = 2
138
nl = S
y.1. = 1 1 2 2

126
160

2
136

22

^32 = 2
150
n2 = 8
y.2. = 769

115
139

125
13 =

n1 =

70
23 = 1
45
/Z33 1
96
.3 = 4
y.3. = 269

58

10

yh = 896
2=5
?2.. = 581
3 = 5
y 3., = 683
n = 20
y = 2160

602

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Tabla 14-5

Anlisis de varianza de los datos del diseo de la batera


de la tabla 14-4
Fuente de
Suma de
Grados de
Cuadrado
variacin
cuadrados
libertad
medio
F0
Tipos de material
8,170.400
2
4,085.20
5.00
Temperatura
16,090,875
2
8,045.44
9.85
Interaccin
5,907,725
4
1,476.93
1.18
Error
8,981.000
11
816.45
Tbtal
39,150.000
19

hace, desde luego, que el anlisis sea tan slo aproximado, pero el anlisis de datos balanceados es tan
sencillo que con frecuencia el experimentador se ve tentado a usarlo. En la prctica, es necesario decidir
cundo los datos no son lo suficientemente diferentes del caso balanceado para hacer que el grado de
aproximacin introducido sea relativamente de escasa importancia. A continuacin se describen breve
mente algunos de estos mtodos aproximados. Se supone que todas las celdas contienen al menos una ob
servacin (es decir, nj > 1 ).
Estimacin de observaciones faltantes
Si slo unas cuantas n son diferentes, un procedimiento razonable es estimar los valores faltantes. Por
ejemplo, considere el diseo no balanceado de la tabla 14-6. Evidentemente, estimar el nico valor faltante de la celda 2,2 es un enfoque razonable. Para un modelo con interaccin, la estimacin del valor faltante en la celda z)'-sima que minimiza la suma de cuadrados del error es yir Es decir, el valor faltante se
estima tomando el promedio de las observaciones que estn disponibles en esa celda.
El valor estimado se trata como un dato real. La nica modificacin del anlisis de varianza es reducir
los grados de libertad del error en el nmero de observaciones faltantes que se han estimado. Por ejemplo,
si se estima el valor faltante en la celda 2,2 de la tabla 14-6, se usaran 26 grados de libertad en lugar de 27.
Apartado de datos

Considere los datos de la tabla 14-7. Observe que la celda 2,2 slo tiene una observacin ms que las otras.
Estimar los valores faltantes de las ocho celdas restantes quiz no sea una buena idea en este caso, ya que
esto resultara en estimaciones equivalentes a cerca de 18% de los datos finales. Una alternativa es apar
tar una de las observaciones de la celda 2,2, para obtener as un diseo balanceado con n = 4 rplicas.
La observacin que se aparte deber elegirse al azar. Adems, en lugar de descartar completamente
la observacin, podra reintegrarse al diseo, despus elegir al azar otra observacin para apartarla y re-

Tabla 14-6

Renglones
1
2
3

Los valores npara un


diseo no balanceado
Columnas
1
2
3
4
4
4
4
3
4
4
4
4

14-2 DATOS NO BALANCEADOS EN UN DISEO FACTORIAL

Tabla 14-7

603

Los valores n, para un


diseo no balanceado

Columnas
Renglones

1
2

4
4
4

4
5
4

3
4
4
4

petir el anlisis. Y, se esperara, estos dos anlisis no llevarn a interpretaciones antagnicas de los datos.
Si lo hacen, se sospecha que la observacin que se apart es un valor atipico o disparatado y deber mane
jarse en consecuencia. En la prctica es improbable que ocurra esta confusin cuando slo se aparta un
nmero reducido de observaciones y la variabilidad dentro de las celdas es pequea.
Mtodo de las medias no ponderadas
En este enfoque, introducido por Yates [113a], los promedios de las celdas se tratan como si fueran datos
y son objeto de un anlisis de datos balanceados estndar para obtener las sumas de cuadrados de los ren
glones, las columnas y la interaccin. El cuadrado medio del error se encuentra como
,i( y * - y ,y
MS =

- " - a i ,---------

<14-12>

Entonces, MSE estima o2, la varianza deylk, una observacin individual. Sin embargo, se ha realizado un
anlisis de varianza de los promedios de las celdas, y como la varianza del promedio de la celda i-sima es
(fhtij, el cuadrado medio del error que se usa en realidad en el anlisis de varianza deber ser una estima
cin de la varianza promedio de las
por ejemplo

22

. 1
----------^

(M -U )

Utilizando MSE de la ecuacin 14-12 para estimar o2 en la ecuacin 14-13, se obtiene


,

M S

^ - - ur u X i = i Zy = i r"i

(1M 4)

como el cuadrado medio del error (con n -a b grados de libertad) que se usar en el anlisis de varianza.
El mtodo de las medias no ponderadas es un procedimiento aproximado porque las sumas de cua
drados de los renglones, las columnas y la interaccin no se distribuyen como una variable aleatoria
ji-cuadrada. La ventaja principal del mtodo parece ser la simplicidad de los clculos. Cuando las no di
fieren de manera radical, el mtodo de las medias no ponderadas funciona con frecuencia razonablemen
te bien.
Una tcnica relacionada es el mtodo de los cuadrados ponderados de las medias, propuesto tam
bin por Yates [113a]. Esta tcnica se basa tambin en las sumas de cuadrados de las medias de las celdas,
pero los trminos de las sumas de cuadrados se ponderan en proporcin inversa a sus varianzas. Para ma
yores detalles de este procedimiento, ver Searle [99a] y Speed, as como Hocking y Hackney [106].

604
14-2.3

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Mtodo exacto

En situaciones en que los mtodos aproximados no son apropiados, como cuando ocurren celdas vacas
(algunas = 0 ) o cuando las n presentan diferencias radicales, el experimentador debe usar un anlisis
exacto. El enfoque utilizado para desarrollar las sumas de cuadrados para probar los efectos principales y
las interacciones consiste en representar el modelo del anlisis de varianza como un modelo de regresin,
ajustar ese modelo a los datos y usar el enfoque de la prueba general de significacin de la regresin. Sin
embargo, existen varias formas en que puede hacerse esto, y estos mtodos pueden producir valores dife
rentes para las sumas de cuadrados. Adems, las hiptesis que se estn probando no siempre son anlo
gos directos de las del caso balanceado, y su interpretacin tampoco es siempre sencilla. Para mayor
informacin al respecto, ver el material suplementario del texto de este captulo. Otras buenas referen
cias son Searle [99a]; Speed y Hocking [105]; Hocking y Speed [58]; Hocking, Hackney y Speed [57];
Speed, Hocking y Hackney [106]; Searle, Speed y Henderson [102]; Searle [99c]; y Milliken y Johnson
[79]. El software de estadstica SAS proporciona un excelente enfoque del anlisis de datos no balancea
dos a travs del procedimiento PROC GLM.

14-3

ANLISIS DE COVARIANZA

En los captulos 2 y 4 se introdujo el uso del principio de la formacin de bloques para mejorar la preci
sin con la que se hacen comparaciones entre tratamientos. La prueba t pareada fue el procedimiento
ilustrado en el captulo 2, mientras que en el captulo 4 se present el diseo de bloques aleatorizados. En
general, el principio de la formacin de bloques puede usarse para eliminar el efecto de los factores per
turbadores controlables. El anlisis de covarianza es otra tcnica que en ocasiones es til para mejorar la
precisin de un experimento. Suponga que en un experimento con una variable de respuesta^ existe otra
variable, por ejemplo*, y que y se relaciona linealmente con*. Adems, suponga que* no puede ser con
trolada por el experimentador, pero puede observarse junto cony. A la variable* se le llama variable con
comitante o covariable. El anlisis de covarianza implica ajustar la variable de respuesta observada para
el efecto de la variable concomitante. Si no se hace este ajuste, la variable concomitante podra inflar el
cuadrado medio del error y hacer que sean ms difciles de detectar las verdaderas diferencias en la res
puesta debidas a los tratamientos. Por lo tanto, el anlisis de covarianza es un mtodo de ajuste para los
efectos de una variable perturbadora no controlable. Como se ver, el procedimiento es una combinacin
del anlisis de varianza y del anlisis de regresin.
Como un ejemplo de un experimento en el que puede emplearse el anlisis de covarianza, considere
el estudio realizado para determinar si existe una diferencia en la resistencia de una fibra de monofilaTabla 14-8

Datos de la resistencia a la ruptura (y = resistencia en libras


y x dimetro en ICH pulgadas)
Mquina 3
Mquina 2
Mquina 1

y
36
41
39
42
49
207

*
20
25
24
25
32
126

40
48
39
45
44
216

22
28
22
30
28
130

35
37
42
34
32
180

21
23
26
21
15
106

14-3 ANLISIS DE COVARIANZA

D im etro,

605

Figura 14-3 Resistencia a la ruptura (y) contra el dimetro


de la fibra (x).

mento producida por tres mquinas diferentes. Los datos de este experimento se muestran en la tabla
14-8. En la figura 14-3 se presenta un diagrama de dispersin de la resistencia (y) contra el dimetro (o
grosor) de la muestra. Evidentemente, la resistencia de la fibra tambin se afecta por su grosor; por consi
guiente, una fibra ms gruesa ser por lo general ms resistente que una delgada. El anlisis de covarianza
podra usarse para eliminar el efecto del grosor ( j e ) sobre la resistencia (y) cuando se prueban las diferen
cias en la resistencia entre las mquinas.

14-3.1

Descripcin del procedimiento

A continuacin se describe el procedimiento bsico para el anlisis de covarianza, ilustrndolo para un


experimento de un solo factor con una covariable. Suponiendo que existe una relacin lineal entre la res
puesta y la covariable, un modelo estadstico apropiado es
y, = M+r, + (x tJ- x , ) + e ,

(14-15)

donde^j es la observacin/-sima de la variable de respuesta tomada bajo el tratamiento o nivel i-si


mo del nico factor,*,y es la medicin hecha de la covariable o variable concomitante correspondiente a_y(J
(es decir, la corrida z/'-sima), * es la media de los valores xiJt n es la media global, r, es el efecto del trata
miento -simo, es el coeficiente de regresin lineal que indica la dependencia de y,y de*,y y tj es un com
ponente del error aleatorio. Se supone que los errores e,yson NID(0, a2), que la pendiente & 0 y que la
verdadera relacin entreyj y*,y es lineal, que los coeficientes de regresin de cada tratamiento son idnti
cos, que la suma de los efectos de los tratamientos es cero (S .j r, = 0) y que la variable concomitante*/,
no se afecta por los tratamientos.
Observe, por la ecuacin 14-15, que el modelo del anlisis de covarianza es una combinacin de los
modelos lineales empleados en el anlisis de varianza y regresin. Es decir, se tienen efectos de los tra
tamientos {r,}, como en un anlisis de varianza de un solo factor, y un coeficiente de regresin , como
en una ecuacin de regresin. La variable concomitante de la ecuacin 14-15 se expresa ccmo (*,y - * )

606

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

en lugar dex, para que el parmetro se preserve como la media global. El modelo pudo haberse escri
to como
* = /+ * ,+ * ,+ ,

j}:};* ;::

(14-16>

donde fi' es una constante diferente de la media global, que para este modelo es fi' + x . Es ms comn
encontrar la ecuacin 14-15 en la literatura sobre el tema.
Para describir el anlisis, se introduce la siguiente notacin:
^ =2 2

0 v - x .)2 = 2 2

a n

-
1

un

a n

S- = M

(14-17)

y i~

i =i y * i

/ - i y=i

iX' - S ) ' = H

2 (*, - * >(v- J . - l . w
j=1
=1 /=1

T. - 4

(14-18)

X- T n
- M

p
Un

(14-19)
(14-20)

U - ,

(14-21)

t,

- 2 ft
i= i

*>(?..

*>% f t )(>.) ( * y )
n i= i
un

(yn-Ji

( x j -

)2 = s ~

(z* ~

K > i

= S ~ T yy

(14-22)
(14-23)

1 j=l

E~ =

- T *

(14-24)

i-1

E v

'=1 J - l

- y i ) = s*?- T v

(14-25)

Observe que, en general, S = T + E, donde los smbolos S, T y E se usan para denotar las sumas de cuadra
dos y los productos cruzados del total, los tratamientos y el error, respectivamente. Las sumas de cuadrados
dexyy deben ser no negativas; sin embargo, las sumas de los productos cruzados (xy) pueden ser negativas.
A continuacin se indica la forma en que el anlisis de covarianza ajusta la variable de respuesta para
el efecto de la covariable. Considere el modelo completo (ecuacin 14-15). Los estimadores de mnimos
cuadrados de fi, r, y son /t = , t = yL - y - (xL- x ), y
=^~

(14-26)

La suma de cuadrados del error en este modelo es


SSF ~ E ^ - (E y ) 2 / E^
con a(n - 1) - 1 grados de libertad. La varianza del error experimental se estima con
SSE
MSe =
a(n1 ) 1

(14-27)

14-3 ANLISIS DE COVARIANZA

607

Suponga ahora que no hay ningn efecto de los tratamientos. El modelo (ecuacin 14-15) sera entonces
yf = P + (x ij ~ x . ) + e#

(14-2S)

y puede demostrarse que los estimadores de mnimos cuadrados d e jiy son - y y - S^/S. La suma
de cuadrados del error en este modelo reducido es
S S '^ S n -iS ^ /S

(14-29)

con a n - 2 grados de libertad. En la ecuacin 14-29, la cantidad (SV)1ISB es la reduccin de la suma de cua
drados de_y obtenida a travs de la regresin lineal de_y sobre*. Adems, observe que SSE es menor que
SS'E [ya que el modelo (ecuacin 14-15) contiene los parmetros adicionales {r,}] y que la cantidad SSESSEes una reduccin en la suma de cuadrados debida a las {r,}. Por lo tanto, la diferencia entre SS'E y SSE,
es decir, SS'E - SSE, proporciona una suma de cuadrados con a - l grados de libertad para probar la hip
tesis de que no hay ningn efecto de los tratamientos. Por consiguiente, para probarH0:t = 0, se calcula
( S S ' - S S E) / ( a - 1)
f -~

* /W:-i)-n

<i4 -3o>

que, si la hiptesis nula es verdadera, se distribuye como Fa_i, fl(. i). i- Por lo tanto, H0:t = 0 se rechaza si
F 0 > Fa a _ i o(
Tambin podra usarse el enfoque del valor P.
Es instructivo examinar la presentacin de la tabla 14-9. En ella el anlisis de covarianza se ha presen
tado como un anlisis de varianza ajustado. En la columna de la fuente de variacin, la variabilidad to
tal se mide por Sm con an - 1 grados de libertad. La fuente de variacin regresin tiene la suma de
cuadrados (Sv)2/S con un grado de libertad. Si no hubiera ninguna variable concomitante, se tendra
= S = Ev - E a = 0. Entonces la suma de cuadrados del error sera simplemente
y la suma de cuadra
dos de los tratamientos sera 5W- E = Tv . Sin embargo, debido a la presencia de la variable concomitan
te, SyyyEyy deben ajustarse para la regresin de y sobre*, como se muestra en la tabla 14-9. La suma de
cuadrados del error ajustada tiene a(n - 1 ) - 1 grados de libertad en lugar de a(n 4 1) grados de libertad
debido a que se ajusta un parmetro adicional (la pendiente ) a los datos.
Los clculos suelen presentarse en una tabla del anlisis de covarianza como la tabla 14-10. Se em
plea esta presentacin porque resume de manera conveniente todas las sumas de cuadrados y los produc
tos cruzados requeridos, as como las sumas de cuadrados para probar las hiptesis acerca de los efectos
de los tratamientos. Adems de utilizarla para probar la hiptesis de que no hay diferencias en los efectos
de los tratamientos, con frecuencia esta tabla se encuentra til en la interpretacin de los datos para pre
sentar las medias de los tratamientos ajustadas. Estas medias ajustadas se calculan de acuerdo con
y ajustada = y. - (x, ~ x. )

i = 1,2,...,a

(14-31)

donde = E^ / Ea . Esta media de los tratamientos ajustada es el estimador de mnimos cuadrados de


fi + r i = 1,2,..., a, en el modelo (ecuacin 14-15). El error estndar de cualquier media ajustada de los
tratamientos es

608
Tabla 14-9 El anlisis de covarianza como un anlisis de varianza ajustado"
Fuente de
Suma de cuadrados
variacin
Regresin
{ s j/s a
Tratamientos

S S E - S S E = S - ( , f /

-[ E - ( f / Ea ]

SS'E - S S E

(SS'E - S S E ) / ( a - 1)

a 1

M Se

m se

=
a(n 1 ) 1

an - 1

Tabla 14-10 Anlisis de covarianza de un experimento de un solo factor con una covariable
Sumas de cuadrados
y productos
Fuente
Grados de libertad
de variacin
xy
X

a -l

tb

Ajustados para la regresin


Grados de libertad

Cuadrado medio

Tw

a (n - 1)

SSE

Total

an - 1

SS'E

= E J>- { E j i E

s_ '
1
l*f
II

Error

Tratamientos ajustados

Fa

a -l
a (n - 1) - 1

Total

Tratamientos

Cuadrado medio

S SE

SSE = E x ( E y f /

Error

Grados de
libertad
1

SS'B -S S E

a ( n - 1 )-1

SSF
M S e = a(n 1)1

an 2
S S E - S S E
a 1

a -l

14-3 ANLISIS DE COVARIANZA

609

Por ltimo, cabe recordar que se ha supuesto que el coeficiente de regresin del modelo (ecuacin
14-15) es diferente de cero. La hiptesis H0: = 0 puede probarse utilizando el estadstico de prueba
= (E ) 2 / E
0
MSe

(14-33)
y
J

que bajo la hiptesis nula se distribuye como F, a(n_ 1} _ Por lo tanto, H0\ = 0 se rechaza si F0 > Fa h
a(n - 1) - !

EJEMPLO 1 4 '4 ..................................................................................................................................


Considere el experimento descrito al principio de la seccin 14-3. Ties mquinas producen una fibra de
monofilamento en una fbrica textil. El ingeniero del proceso tiene inters en determinar si existe alguna
diferencia en la resistencia a la ruptura de la fibra producida por las tres mquinas. Sin embargo, la resis
tencia de una fibra se relaciona con su dimetro, con las fibras ms gruesas, siendo stas, en general, ms
resistentes que las ms delgadas. Se selecciona una muestra aleatoria de cinco ejemplares de prueba de fi
bra de cada mquina. En la tabla 14-8 se muestra la resistencia de la fibra (y) y el dimetro correspondien
te (je) de cada ejemplar.
El diagrama de dispersin de la resistencia a la ruptura contra el dimetro de la fibra (figura 14-3) in
dica una clara tendencia a una relacin lineal entre la resistencia a la ruptura y el dimetro, y parece apro
piado eliminar el efecto del dimetro sobre la resistencia mediante un anlisis de covarianza. Suponiendo
que la relacin lineal entre la resistencia a la ruptura y el dimetro es apropiada, el modelo es
= 1,2,3
1,2,..., 5

.7 =

Utilizando las ecuaciones 14-17 a 14-25, pueden calcularse

I I

;=1

y - - < * > +<41) +

js=i *1 - an = (20>x + (25) ' + "

+ ( 3 2 ) = :346.40
+ <1 5 ) 2

WJWj =

2 6 1 -7 3

= ( 20)(36)+(25)(41)+...+(15)(32)
/=l
(362X603)
1

T
y"

r-

an
' 2SZ60

|[(207)2-K216)2+180>2]^ | y =140-40

- m = k126)2
^
n i
(362)(603)
I

an
'

+(130)2+(106)2]^ T

6 6 13

=-[(126)(207)+(130)(216)+(106)(184)]
5

610

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

= Sw - Tn = 346.40-140.40 = 206.00
Ea = Sa - T a = 261.73- 66.13= 195.60
EV = S - T V = 282.60- 96.00 = 186.60
Por la ecuacin 14-29 se encuentra
m ; = ^ - ( ^ ) 2 /5 h
= 346.40-(186.60)2 / 261.73
= 41.27
con an - 2 = (3)(5) - 2 = 13 grados de libertad; y por la ecuacin 14-27 se encuentra
SSE = E - ( E V )2 / E :a
= 206.00-(186.60)2 /195.60
= 27.99
con a(n - 1) - 1 = 3(5 - 1) - 1 = 11 grados de libertad.
La suma de cuadrados para probar H0:t} = r2 = r3 = 0 es
SSE - S S E = 41.27 - 27.99
= 13:28
con a - l = 3 ~ l = 2 grados de libertad. Estos clculos se resumen en la tabla 14-11.
Para probar la hiptesis de que las mquinas difieren en la resistencia a la ruptura de la fibra produci
da, es decir, 7 7 0.t , = 0, por la ecuacin 14-30 el estadstico de la prueba se calcula como
0

_ (SS'B- S S E) / ( a - 1)
SSE / [ a ( n - 1)1]

13.28/ 2
27.99/11

6.64 =
2.54

261

Al comparar este valor con F0i0i 2, n = 2.86, se encuentra que no puede rechazarse la hiptesis nula. El va
lor P de este estadstico de la prueba es P = 0.1181. Por lo tanto, no hay evidencia slida de que las fibras
producidas por las tres mquinas difieran en la resistencia a la ruptura.
La estimacin del coeficiente de regresin se calcula con la ecuacin 14-26 como
^
H

^ . 1 1 ^ = 0.9540
E
195.60

La hiptesis H0: = 0 puede probarse usando la ecuacin 14-33. El estadstico de prueba es


F _ {E- ) 2 1E* _
0
MSe

(186-6Q)2! 195-6Q yo0g


2.54

y puesto que f 0_01i 1;u = 9.65, se rechaza la hiptesis de que = 0. Por lo tanto, existe una relacin lineal
entre la resistencia a la ruptura y el dimetro, y el ajuste proporcionado por el anlisis de covarianza fue
necesario.

Tabla 14-11

Anlisis de covarianza de los datos de la resistencia a la ruptura

Ajustados para fa regin


Fuente de
variacin
Mquinas
Error
Total
Mquinas ajustadas

Grados de
libertad
2
12
14

Sumas de cuadrados y productos


x

66.13
195.60
261.73

xy

96.00
186.60
282.60

140.40
206.00
346.40

Grados de
libertad

Cuadrado
medio

27.99
41.27
13.28

11
13
2

2.54
6.64

F B Valor P

2.61 0.1181

612

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Las medias de los tratamientos ajustadas pueden calcularse con la ecuacin 14-31. Estas medias ajus
tadas son
yL ajustada =

- (xL - x )

= 41.40- (0.9540)(25.20 - 24.13) = 40.38


% ajustada = y2 - (x2 - x )
= 43.20- (0.9540)(26.00-24.13) = 41.42
y

yi ajustada = , - (x3 - x )
= 36.00 - (0.9540)(21.20 - 24.13) = 38.80
Al comparar las medias ajustadas con las medias no ajustadas de los tratamientos (las y, ), se observa que
las medias ajustadas se encuentran mucho ms prximas entre s, una indicacin ms de que el anlisis de
covarianza fue necesario.
Un supuesto bsico en el anlisis de covarianza es que los tratamientos no influyen en la covariable x,
ya que la tcnica elimina el efecto de las variaciones en las x . Sin embargo, si la variabilidad en las xLse
debe en parte a los tratamientos, entonces el anlisis de covarianza elimina parte del efecto de los trata
mientos. Por lo tanto, deber tenerse una seguridad razonable de que los tratamientos no afectan los va
lores^. En algunos experimentos esto puede ser obvio a partir de la naturaleza de la covariable, mientras
que en otros puede ser ms dudoso. En el ejemplo tratado aqu puede haber una diferencia en el dimetro
de la fibra (x) entre las tres mquinas. En tales casos, Cochran y Cox [26] sugieren la posible utilidad de
un anlisis de varianza de los valores je,ypara determinar la validez de este supuesto. Para el problema tra
tado aqu, con este procedimiento se obtiene
F
66.13/2 _ 3 a 0 7
0
195.60/12 16.30
'
que es menor queF 010 2ii2 = 2.81, por lo que no hay razn para creer que las mquinas producen fibras con
dimetros diferentes.
La verificacin del diagnstico del modelo de covarianza se basa en el anlisis residual. Para el mode
lo de covarianza, los residuales son
e a = y ii- %

donde los valores ajustados son


h i = + i i + k x a - * . . ) = y. + [& - y.. - ( x L ~ x . )]

+ k xii - x . . ) = y , + (x,I - x , )
Por lo tanto,
ej =

a-

y,

x ,j

- *L )

(14-34)

Para ilustrar el uso de la ecuacin 14-34, el residual de la primera observacin de la primera mquina
del ejemplo 14-4 es
en = Vn - y, - h * n - \ ) = 3 6 - 4 1 .4 - (0.9540)(20- 25.2)
= 36-36.4392 = -0.4392

14-3 ANLISIS DE COVARIANZA

613

En la tabla siguiente se presenta una lista completa de las observaciones, los valores ajustados y los
residuales:
Valor observado y,y
36
41
39
42
49
40
48
39
45
44
35
37
42
34
32

Valor ajustado ytj


36.4392
41.2092
40.2552
41.2092
47.8871
39.3840
45.1079
39.3840
47.0159
45.1079
35.8092
37.7171
40.5791
35.8092
30.0852

Residual et] = y u- $ v
-0.4392
-0.2092
-1.2552
0.7908
1.1129
0.6160
2.8921
-0.3840
-2.0159
-1.1079
-0.8092
-0.7171
1.4209
-1.8092
1.9148

Los residuales se grafican contra los valores ajustados en la figura 14-4, contra la covariable xtj en la fi
gura 14-5 y contra las mquinas en la figura 14-6. En la figura 14-7 se muestra la grfica de probabilidad
normal de los residuales. Estas grficas no revelan ninguna desviacin importante de los supuestos, por lo
que se concluye que el modelo de covarianza (ecuacin 14-15) es apropiado para los datos de la resisten
cia a la ruptura.
Es interesante observar lo que habra ocurrido en este experimento si no se hubiera realizado el an
lisis de covarianza, es decir, si los datos de la resistencia a la ruptura (y) se hubieran analizado como un ex
perimento de un solo factor en el que se ignorara la covariable x. En la tabla 14-12 se muestra el anlisis de
varianza de los datos de la resistencia a la ruptura. Se concluira, con base en este anlisis, que las mqui
nas difieren significativamente en la resistencia de la fibra producida. Es exactamente la conclusin

Figura 14-4 Grfica de los residuales contra los valores ajus


tados del ejemplo 14-4.

614

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Figura 14-5 Grfica de los residuales contra el dimetro x de


la fibra en el ejemplo 14-4,

opuesta del anlisis de covarianza. Si se sospechara que las mquinas difieren significativamente en su
efecto sobre la resistencia de la fibra, entonces se intentara igualar la resistencia producida por las tres
mquinas. Sin embargo, en este problema las mquinas no difieren en la resistencia de la fibra producida
despus de que se elimina el efecto lineal del dimetro. Sera conveniente reducir la variabilidad del di
metro de la fibra dentro de las mquinas, ya que con esto probablemente se reducira la variabilidad de la
resistencia de la fibra.
14-3.2

Solucin por computadora

Se cuenta con varios paquetes de software que pueden realizar el anlisis de covarianza. En la tabla 14-13
se muestra la salida del procedimiento General Linear Models (modelos lineales generales) de Minitab

Mquina

Figura 14-6
mquinas.

Grfica de los residuales contra las

14-3 ANLISIS DE COVARIANZA

615

Residuales, e -

Figura 14*7 Grfica de probabilidad normal de los residuales del ejemplo 14-4.

para los datos del ejemplo 14-4. Esta salida es muy similar a las que se presentaron anteriormente. En la
seccin de la salida bajo el encabezado Anlisis de varianza (Analysis of variance), SS Seq corres
ponde a la particin secuencial de la suma de cuadrados del modelo global, es decir,
SS (Modelo) = SS (Dimetro)+ 55(Mquina | Dimetro)
= 305.13+13.28
= 318.41
mientras que SS ajustada corresponde a la suma de cuadrados extra para cada factor, es decir,
55(Mquina| Dimetro) = 13.28
y

55(Dimetro IMquina) = 178.01


Observe que 55(Mquina | Dimetro) es la suma de cuadrados que deber usarse para probar que no liay
ningn efecto de la mquina, y que 55(Dimetro | Mquina) es la suma de cuadrados corregida que debe
r usarse para probar la hiptesis de que = 0. Los estadsticos de la prueba de la tabla 14-13 difieren li
geramente de los que se calcularon manualmente debido al redondeo.

Tabla 14-12 Anlisis incorrecto de los datos de la resistencia a la ruptura como un experimento de un solo factor
Fuente de
variacin
Mquinas

Error
Total

Suma de cuadrados

140.40
206.00
346.40

Grados de
libertad

Cuadrado medio

2
12

70.20
17.17

14

Valor P

4.09

0.0442

616

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Tabla 14-13

Salida de M initab (anlisis de covarianza) del ejemplo 14-4

Modelo lineal general


Factor
Ma c h i n e
Analysis
Source
Di a m e t e r
Machi ne
Error
Total
Term
Constant
Diameter
Machi ne
1
2
Means f o r

Type
fixed
of

Va r i a nc e f or

S t r e ngth x u si ng
Ad j
178.
13.
27.

SS
13
28
99
40

SS
01
28
99

Ad j u s t e d
Ad j MS
178 . 01
6 .64
2 .54

Coef
17 . 1 7 7
0. 9540

St D e v
2 .783
0 . 11 4 0

T
6 . 17
8 . 36

P
0. 000
0 . 000

0 . 18 2 4
1 21 9 2

0 . 59 5 0
0 . 6201

0 . 31
1 . 97

0 . 765
0 . 075

SS f o r
F
6 9 . 97
2 . 61

Tests
P
0.000
0.118

Cova r i a t e s
Mean
24.13

Squ a r e s

Ma c h i n e
1
2
3

Seq
305.
13.
27.
346.

DF
1
2
11
14

Cova r a t e
Diameter
Least

Levels Values
3 1 2 3

St Dev
4.324

Means f o r St r en g t h

Mean
40.38
41.42
38.80

St Dev
0.7236
0.7444
0.7879

El programa calcula tambin las medias de los tratamientos ajustadas con la ecuacin 14-31 (Minitab
hace referencia a stas como las medias de mnimos cuadrados en la salida muestral) y los errores estn
dar. El programa comparar asimismo todos los pares de medias de tratamientos utilizando los procedi
mientos de comparacin mltiple por pares estudiados en el captulo 3.
14-3.3

Desarrollo mediante la prueba general de significacin de la regresin

Es posible desarrollar formalmente el procedimiento para probar H0:t = 0 en el modelo de covarianza


y = f i + t i + (x ij- x , ) + f ..

(14~35)

utilizando la prueba general de significacin de la regresin. Considere la estimacin de los parmetros


del modelo (ecuacin 14-15) por mnimos cuadrados. La funcin de mnimos cuadrados es

L=Si=x S}=i

(14-36)

14-3

A N L I S I S

D E

C O V A R I A N Z A

617

y a partir de L//j. - L/dt, = dLld = 0, se obtienen las ecuaciones normales


a

/.i-.anfi+n^ i = y
1=1

(14-37a)

71

Ti :nfi+nTi, + ^ (x ~ x ) = yL

i = l,2 ,...,a

(14-37b)

j =i

.=i

*2
j=i

" * ) + ^S- =

(1437c)

Al sumar las a ecuaciones de la ecuacin 14-37b, se obtiene la ecuacin 14-37a porque 2 =1 2 =1 (xv x ) = 0, por lo que existe una dependencia lineal en las ecuaciones normales. Por lo tanto, es necesario au
mentar las ecuaciones 14-37 con una ecuacin linealmente independiente para obtener una solucin.
Una condicin lgica es 2 =1 f, = 0.
Al utilizar esta condicin, de la ecuacin 14-37a se obtiene
p. =

(14-38a)

y de la ecuacin 14-37b
(14-38b)
La ecuacin 14-37c puede reescribirse como
2

O i. - ..

(X<J

^ i

y=i

despus de sustituir para

(*i. ~ x -

(x * ) + s ~ = 5 XV
j=i

1=1

Pero se observa que


X ( X . - X . ) (xJ- x . . ) = Tv
i=i
y=i

S (*, - * . . ) c* * - * ) = r =
=i
j=i
Por lo tanto, la solucin de la ecuacin 14-37c es
a

Sy ~ Fy _ Ey
S - T
E
XX

XX

que fue el resultado dado anteriormente en la seccin 14-3.1 en la ecuacin 14-26.


La reduccin en la suma de cuadrados total debida al ajuste del modelo (ecuacin 14-15) puede ex
presarse como
a

R(/, r, ) = y

+ 2
= 1

iy , + S v
a

= (y. )y. + 2

[i. - - - ( E*y ! E~ )(*!. * )]>/. + (E*y ! E* )SV

i=l

= y ^ l a n + 2 a . - y . ) y , - ( ^ / n ) (x, ~ x )yL + (E xy/ E xx)Sxy


~ y ? / a n + T l - ( E v IE yrv - S v )
= Vi Zan + Tyy + (E xy ) 2 /

618

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Esta suma de cuadrados tiene a + 1 grados de libertad porque el rango de las ecuaciones normales es
a + 1. La suma de cuadrados del error de este modelo es

i= 1 j =\

=2 2

y-ytlan-T-(Ev flE

^ Syy~Tyy~

= Eyy ~ (E V )2 / E^

, j 4

(1

y)

con an - (a + 1) = a(n - 1) - 1 grados de libertad. Esta cantidad se obtuvo anteriormente como la ecua
cin 14-27.
Considere ahora el modelo restringido a la hiptesis nula, es decir, a H0\t = t2 = ... = ra = 0. Este
modelo reducido es
i = 1,2,...,a

yiJ=M +(x,} - x J + e v

Se trata de un modelo de regresin lineal simple, y las ecuaciones normales de mnimos cuadrados para
este modelo son
anfi = y
S=Sv

(14-41a)
(14-41b)

Las soluciones de estas ecuaciones son pi = y y = SJS^;, y la reduccin en la suma de cuadrados total
debida al ajuste del model reducido es
R(fi, ) = f t y ^ + S v
= 0 0 y.+ (sv /s )s v

= y 2 la n + (S sy) 2 / S xc

(14-42)

Esta suma de cuadrados tiene dos grados de libertad.


La suma de cuadrados apropiada para probar H\t1 = t 2= ... = r a = Opuede encontrarse como
R(r\n, )= R(ti, r, ) - R(fi, )
= y 2 lan + T w + (E V ) 2 / E^ - y 2 / a n - ( S v f / S
= 5W- (Sv )2 / S - [E - (Ev )2 / Ew ]

(14-43)

utilizando Tw = Syy- Eyy. Observe que R(r\fi, ) tiene a + 1 - 2 = a ~ l grados de libertad y que es idntica
a la suma de cuadrados dada por SS'E- SSEen la seccin 14-3.1. Por lo tanto, el estadstico de prueba para
H 0\t, = O es
0

_ R( T\ f i , ) / ( a - l )
SSE / [ a ( n - l ) - l ]

(SSE - S S E) ( a - 1)
SS / [ ( - 1 ) 1]

expresin que se dio anteriormente como la ecuacin 14-30. Por lo tanto, utilizando la prueba general de
significacin de la regresin, se ha justificado el desarrollo heurstico del anlisis de covarianza de la sec
cin 14-3.1.

14-3 ANLISIS DE COVARIANZA

14-3.4

619

Experimentos factoriales con covariables

El anlisis de covarianza puede aplicarse a estructuras de tratamientos ms complejas, como los diseos
factoriales. Siempre que existan datos suficientes para cada combinacin de tratamientos, prcticamente
cualquier estructura de tratamientos compleja puede analizarse mediante el enfoque del anlisis de cova
rianza. A continuacin se indica cmo podra usarse el anlisis de covarianza en la familia ms comn de
diseos factoriales utilizados en la experimentacin industrial, los factoriales 2k.
Al establecer el supuesto de que la covariable afecta a la variable de respuesta de manera idntica
para todas las combinaciones de tratamientos, podra construirse una tabla del anlisis de covarianza si
milar al procedimiento dado en la seccin 14-3.1. La nica diferencia sera la suma de cuadrados de los
tratamientos. Para un factorial 22 con n rplicas, la suma de cuadrados de los tratamientos (Tn) sera (1ri)
2 ?=1 2
y~ y 2/(2)(2)n. Esta cantidad es la suma de las sumas de cuadrados de los factores^, B y la in
teracciones. Entonces podra hacerse la particin de la suma de cuadrados ajustada de los tratamientos
en componentes de los efectos individuales, es decir, la suma de cuadrados de los efectos principales ajus
tados SSA y SSB, y una suma de cuadrados de la interaccin, SS^.
El nmero de rplicas es un aspecto clave cuando se ampla la estructura de los tratamientos del dise
o. Considere un arreglo factorial 23. Se necesita un mnimo de dos rplicas para evaluar todas las combi
naciones de tratamientos con una covariable separada para cada combinacin de tratamientos, (una
covariable por interaccin de tratamientos). Esto es equivalente a ajustar un modelo de regresin simple
a cada combinacin de tratamientos o celda del diseo. Con dos observaciones por celda, un grado de li
bertad se usa para estimar la ordenada al origen (el efecto del tratamiento), y el otro se usa para estimar la
pendiente (el efecto de la covariable). Con este modelo saturado, no se cuenta con ningn grado de liber
tad para estimar el error. Por lo tanto, se necesitan al menos tres rplicas para un anlisis de covarianza
completo, suponiendo el caso ms general. Este problema se agudiza cuando se incrementa el nmero de
celdas distintas del diseo (combinaciones de tratamientos) y las covariables.
Si el nmero de rplicas est limitado, pueden hacerse varios supuestos para permitir un anlisis til.
El supuesto ms simple (y tpicamente el peor) que puede hacerse es que la covariable no tiene ningn
efecto. Si la covariable, incorrectamente, deja de tomarse en consideracin, el anlisis completo y las con
clusiones subsecuentes podran tener graves errores. Otra eleccin es suponer que no hay ningn trata
miento por interaccin de la covariable. Aun cuando este supuesto sea incorrecto, el efecto promedio de
la covariable en todos los tratamientos seguir incrementando la precisin de la estimacin y la prueba de
los efectos de los tratamientos. Una desventaja de este supuesto es que si varios niveles de los tratamien
tos interactan con la covariable, los diferentes trminos pueden cancelarse entre s y el trmino de la covariable, si se estima solo sin ninguna interaccin, puede resultar no significativo. Una tercera eleccin
sera suponer que algunos de los factores (como algunas interacciones de dos factores y de rdenes supe
riores) no son significativos. Esto permite usar parte de los grados de libertad para estimar el error. Sin
embargo, este curso de accin deber emprenderse con cuidado, y los modelos subsecuentes debern
evaluarse a profundidad, ya que la estimacin del error ser relativamente imprecisa a menos que se le
asignen suficientes grados de libertad. Con dos rplicas, cada uno de estos supuestos liberar algunos gra
dos de libertad para estimar el error y permitir realizar pruebas de hiptesis tiles. El supuesto que se es
tablecer deber ser dictado por la situacin experimental y por el riesgo que el experimentador est
dispuesto a correr. Cabe hacer notar que en la estrategia de construccin del modelo de los efectos, si se
elimina el factor de uno de los tratamientos, entonces las dos rplicas resultantes de cada factorial 2 3
original no son en realidad rplicas. Estas rplicas ocultas liberan grados de libertad para la estimacin
de parmetros, pero no debern usarse como rplicas para estimar el error puro porque la ejecucin del
diseo original quiz no se haya aleatorizado para ello.

620

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Tabla 14-14 Datos de la respuesta y la covariable para un diseo 23 con


2 rplicas
B
X
A
C
y
_1

1
1
4.05
-30.73
-1
-1
0.36
9.07
1
-1
-1
1
5.03
39.72
1
1.96
16.30
1
-1
-1
-1
5.38
-26.39
1
-1
1
1
8.63
54.58
-1
1
4.10
44.54
1
1
11.44
66.20
1
1
-1
-1
-1
3.58
-26.46
-1
-1
10.94
1
1.06
_1
-1
1
15.53
103.01
-1
1
2.92
20.44
1
_1
-1
2.48
-8.94
1
1
13.64
73.72
1
1
1
-0.67
15.89
-1
1
1
5.13
38.57
1
1

Para ilustrar algunas de estas ideas, considere el diseo factorial 23 con dos rplicas y una covariable
que se muestra en la tabla 14-14. Si la variable de respuesta}' se analiza sin tomar en cuenta la covariable,
resulta el siguiente modelo:
^ = 25L03+11.204+18. Q5B + 7.24C - 1 8 .9L 4 5 +14.80 AC
El modelo global es significativo en el nivel de a = 0.01 coni ? 2 = 0.786 y MS = 470.82. El anlisis residual
no indica problemas con este modelo, excepto porque la observacin con y = 103.01 es inusual.
Si se elige el segundo supuesto, que las pendientes son comunes con ningn tratamiento por interac
cin de la covariable, pueden estimarse el modelo de los efectos completo y el efecto de la covariable. La
salida de Minitab (de la rutina General Linear Models) se muestra en la tabla 14-15. Observe que MSEse
ha reducido considerablemente al tomar en consideracin la covariable. El anlisis final resultante des
pus de eliminar de manera secuendal cada interaccin no significativa y el efecto principal C se muestra
en la tabla 14-16. Este modelo reducido proporciona un MSEtodava menor que el modelo completo con
la covariable de la tabla 14-15.
Por ltimo, podra considerarse un tercer curso de accin, suponiendo que ciertos trminos de in
teraccin son insignificantes. Se considera el modelo completo que permite pendientes diferentes entre
los tratamientos y la interaccin tratamiento por covariable. Se supone que no son significativas las in
teracciones de tres factores (tanto ABC como ABCx) y se usan los grados de libertad asociados con ellas
para estimar el error en el modelo de los efectos ms general que pueda ajustarse. ste es con frecuencia
un supuesto prctico. Las interacciones de tres factores son por lo general insignificantes en la mayora de
los ambientes experimentales. La versin actual de Minitab no puede modelar covariables que interactan con los tratamientos, por lo que se usa PROC GLM de SAS. Las sumas de cuadrados tipo III son las
sumas de cuadrados ajustadas que se necesitan. En la tabla 14-17 se presentan los resultados de SAS para
este modelo.
Con un modelo casi saturado, la estimacin del error ser bastante imprecisa. Incluso cuando unos
cuantos trminos son individualmente significativos en el nivel a = 0.05, el sentido general es que este
modelo es mejor que los dos escenarios previos (basados en R 2 y el cuadrado medio del error). Debido a
que el aspecto de los efectos de los tratamientos del modelo es de mayor inters, se eliminan de manera
secuencial trminos de la porcin de la covariable del modelo a fin de agregar grados de libertad para esti-

14-3 ANLISIS DE COVARIANZA

621

Tabla 14-15 Anlisis de covarianza de Minitab para el experimento de la tabla 14-14, suponiendo una
pendiente comn
Modelo lineal general
Factor
A
B
C
Ana l y s i s

Type
fixed
fixed
f i xed
of

Variance
DF
1
1
1
1
1
1
1
1
7
1 5

Source
X

A
B
C
A*B
A*C
B* C
A* B* C
Error
Total

Levels
2
2
2

for

y,

using

S e q SS
12155.9
1320.7
3997.6
52.7
3788.3
10.2
5.2
33.2
628.1
21992.0

Coef
-1.016
4.9245

Term
Constant

Values
1
-1
1
-1
1
-1
Adjusted

Adj SS
2521 . 6
1403.8
4066.2
82.3
3641.0
1 .1
8.4
33.2
628.1
T
-0.19
5.30

St De v
5 . 454
0.9290

SS f o r

Adj MS
2521.6
1403.8
4066.2
82.3
3641.0
1 .1
8.4
33.2
89.7

Tests
F
28.10
15.64
45.31
0.92
4 0 . 58
0.01
0.09
0.37

P
0.001
0.005
0.000
0.370
0.000
0.913
0.769
0.562

P
0.858
0.001

mar el error. Si se elimina secuencialmente el trmino ACx seguido de BCx, el MSEdecrece a 0.7336 y va
rios trminos no son significativos. En la tabla 14-18 se muestra el modelo final despus de eliminar
secuencialmente Cx, A C y BC.
Este ejemplo destaca la necesidad de contar con grados de libertad para estimar el error experimen
tal a fin de incrementar la precisin de las pruebas de hiptesis asociadas con los trminos individuales
del modelo. Este proceso deber hacerse de manera secuencial para evitar la eliminacin de trminos sig
nificativos enmascarados por una estimacin pobre del error.
Tabla 14-16 Anlisis de covarianza de Minitab, modelo reducido para el experimento de la tabla 14-14
Modelo lineal general
Factor
A
B

Type L e v e l s V a l u e s
fixed
2-1
1
fixed
2 -1
1

A n a l y s i s of
Sou r c e
X

A
B
A*B
Error
Tota I
Term
Constant
X

Variance
DF
1
1
1
1
11
15

for

y,

Seq SS
12155.9
1320.7
3997.6
3754.5
763.3
21992.0

Coef
-1.878
5.0876

St De v
3.225
0.4655

using

Adjusted

Adj SS
8287.9
1404.7
4097.7
3754.5
763.3
T
-0.58
10.93

SS f o r

Adj MS
8287.9
1404.7
4097.7
3754.5
69.4
P
0.572
0.000

Tests

F
119.43
20.24
59.05
54.10

P
0.000
0.001
0.000
0.000

0\

to
Ki

Tabla 14-17

Salida de PROC GLM {anlisis de covarianza) de SAS para el experimento de la tabla 14-14

Dependent
Source
Mode l
Error
Corrected

Source
A
B
C
AB
AC
BC
X
AX
BX
CX
ABX
ACX
BCX

Variable:

Total

Y
DF
13
2
15

Sum o f
Squares
21989.20828
2.80406
21992.01234

Hean
Squ ar e
1691.47756
1.40203

R- Squa re
0.999872

C.V.
4.730820

Root MSE
1.184074

DF
1
1
1
1
1
1
1
1
1
1
1

Type I I I SS
4.6599694
13.0525319
35.0087994
17.1013635
0.0277472
0.4437474
49.2741287
33.9024288
95.7747490
0.1283784
336.9732676
0.0020997
0.0672386

Hean S q u a r e
4.6599694
13.0525319
35.0087994
17.1013635
0.0277472
0.4437474
49.2741287
33.9024288
95.7747490
0.1283784
336.9732676
0.0020997
0.0672386

F Value
1206.45

Pr > F
0.0008

Y Hean
25.02895
F Value
3.32
9.31
24.97
12.20
0.02
0.32
35.14
24.18
68.31
0.09
240.35
0.00
0.05

Pr > F
0.2099
0.0927
0.0378
0.0731
0.9010
0.6304
0.0273
0.0390
0.0143
0.7908
0.0041
0.9726
0.8470

Tabla 14*18 Salida de PROC GLM de SAS para el experimento de la tabla 14-14, modelo reducido
De p e n d e n t

Variable:

Y
DF
8
7
15

Sum o f
Sq u a r e s
21986.33674
5.67560
21992.01234

Mean
Squa r e
2748.29209
0.81080

R-Square
0.999742

C . V.
3 . 597611

Root MSE
0.900444

Source
A
B
C
AB
X
AX
BX
ABX

DF
1
1
1
1
1
1
1
1

Type I H SS
19.1597158
38.0317496
232.2435668
31 . 7 6 3 5 0 9 8
240.8726525
233.3934567
550.1530561
542.3268940

Mean S q u a r e
19.1597158
38.0317496
232.2435668
31.7635098
240.8726525
233.3934567
550.1530561
542.3268940

Parameter
Intercept
A
8
C
AB
X
AX
BX
ABX

Est i mat e
10.2438830
2.7850330
3.6596279
5.4560862
-3.3636850
2.0471937
2.0632049
3.0340997
-3.0342229

Source
Mode I
Error
Corrected

Tota I

T f o r HO:
Parameter=0
18.74
4.86
6.85
16.92
-6.26
17.24
16.97
26.05
-25.86

F Value
3389.61

Pr > F
0.0001

Y Mean
25 . 0 2 8 9 5
F Value
23.63
46.91
286.44
39.18
297.08
287.86
678.53
668.88

Pr > |T I
0.0001
0.0018
0.0002
0.0001
0.0004
0.0001
0.0001
0.0001
0.0001

Pr > F
0.0018
0.0002
0.0001
0.0004
0.0001
0.0001
0.0001
0.0001

St d E r r o r of
Est i mat e
0.54659908
0.57291820
0.53434356
0.32237858
0.53741264
0.11877417
0.12160595
0 .1 1 6 4 7 8 2 6
0.11732045

623

624

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Al revisar los resultados obtenidos de los tres enfoques, se observa que cada mtodo mejora de mane
ra sucesiva el ajuste del modelo en este ejemplo. Si hay una razn fundada para creer que la covariable no
interacta con los factores, quiz sea mejor establecer ese supuesto desde el principio del anlisis. Esta
opcin tambin puede ser dictada por el software. Aun cuando los paquetes de software para diseos ex
perimentales quiz slo tengan capacidad para modelar covariables que no interactan con los trata
mientos, el analista puede tener una oportunidad razonable de identificar los factores principales que
influyen en el proceso, incluso si hay alguna covariable por interaccin de tratamientos. Se observa asi
mismo que las pruebas usuales de la adecuacin del modelo siguen siendo apropiadas y se recomiendan
enrgicamente como parte del proceso de construccin del modelo del anlisis de covarianza ANCOVA.

14-4

MEDICIONES REPETIDAS

En el trabajo experimental de las ciencias sociales y el comportamiento, as como en algunos aspectos de


la ingeniera y las ciencias fsicas, las unidades experimentales son con frecuencia personas. Debido a las
discrepancias en experiencia, capacitacin o formacin, en algunas situaciones experimentales las dife
rencias en las respuestas de distintas personas al mismo tratamiento pueden ser muy grandes. A menos
que est controlada, esta variabilidad entre las personas se convertir en parte del error experimental, y
en algunos casos inflar significativamente el cuadrado medio del error, haciendo ms difcil detectar las
diferencias reales entre los tratamientos.
Es posible controlar esta variabilidad entre las personas utilizando un diseo en el que cada uno de
los a tratamientos se usa en cada persona (o sujeto). A ste se le llama diseo de mediciones repetidas.
En esta seccin se ofrece una breve introduccin a los experimentos de mediciones repetidas con un solo
factor.
Suponga que un experimento incluye a tratamientos y que cada tratamiento se va a usar exactamente
una sola vez en cada uno de n sujetos. Los datos apareceran como en la tabla 14-19. Vea que la observa
cin representa la respuesta del sujeto j al tratamiento i y que slo se usan n sujetos. El modelo que se
utiliza para este diseo es
yij= + r . + j + e .

(14-45)

donde r es el efecto del tratamiento z'-simo y j es un parmetro asociado con el sujetoy'-simo. Se supone
que los tratamientos son fijos (de donde 2 --it = 0) y que los sujetos empleados son una muestra aleato
ria de alguna poblacin ms grande de individuos potenciales. Por lo tanto, colectivamente los sujetos re
presentan un efecto aleatorio, por lo que se supone que la media de j es cero y que la varianza de j es a 2.
Puesto que el trmino j es comn a todas las a mediciones del mismo sujeto, la covarianza entre y^yy^ no

Tabla 14-19 Datos de un diseo de mediciones repetidas con un solo factor


Sujeto
1
2
Ttatamiento

Totales de
los tratamientos

1
2

yu
y

yu
y22

yu.
y?"

yy.
y?

yi
Xi

yal
y.2

yn
y.n

ya.
y..

Ibtales de los sujetos

625

14-4 MEDICIONES REPETIDAS

es, en general, cero. Se acostumbra suponer que la covarianza entre y,yy y, es constante a lo largo de todos
los tratamientos y los sujetos.
Considere una particin en el anlisis de varianza de la suma de cuadrados total, por ejemplo

S X

i = i

0.1 -

(y* ~ - )2 = a2

j=i

y.. Y + 2 2

_ h )2

= i j= i

(14_46)

El primer trmino del miembro derecho de la ecuacin 14-46 puede considerarse como una suma de cua
drados que resulta de las diferencias entre los sujetos, y el segundo trmino es una suma de cuadrados de
las diferencias dentro de los sujetos. Es decir,
SSj-

los sujetos ^

Dentro de los sujetos

Las sumas de cuadrados SS^ae[os,ujetosy 55DentIodclossujetos son estadsticamente independientes, con grados
de libertad
an -

= (n -l)+n(a-1)

Las diferencias dentro de los sujetos dependen tanto de las diferencias en los efectos de los trata
mientos como de la variabilidad no controlada (ruido o error). Por lo tanto, la suma de cuadrados resul
tante de las diferencias dentro de los sujetos puede descomponerse de la siguiente manera:

X X

( y * - y.,- ) 2 = " 2

i= i y=i

(% - - ) 2+

O'# ~

i= i

~ h + ?~ )*

(14*47)

-i y - i

El primer trmino del miembro derecho de la ecuacin 14-47 mide la contribucin de la diferencia entre
las medias de los tratamientos a SS^tm de ios sujetos* y el segundo trmino es la variacin residual debida al
error. Ambos componentes de SSDt.ntIOde los sujetos son independientes. Por lo tanto,
Dentro de los sujetos = Vi Tratamientos +

'

con los grados de libertad dados por


n ( a - l ) = ( a - l ) + ( f l l ) ( n - l )
respectivamente.
Para probar la hiptesis de que no hay ningn efecto de los tratamientos, es decir,
H 0:t1 = t 2 = =

=0

H^.M menos una z ^

se usara el cociente
I

^ ^Tratamientos /
-

ss,/ -

^)

i ) ( - i )

^ ^ T ra tam ien to s

w r ~

1 1 ,1o \

( 1 4 '4 8 )

Si los errores del modelo siguen una distribucin normal, entonces bajo la hiptesis nula, H0: r, = 0, el es
tadstico F0sigue una distribucinFa_1(a_1)(_ La hiptesis nula se rechazara siF0 > Faa_j(a_1)(n_1}.
En la tabla 14-20 se resume el procedimiento del anlisis de varianza, donde se presentan tambin
frmulas convenientes de clculo para las sumas de cuadrados. El lector deber identificar el anlisis de
varianza de un diseo de un solo factor con mediciones repetidas como el equivalente del anlisis de un
diseo de bloques completos aleatorizados, donde los sujetos se consideran como los bloques.

626
Tabla 14-20 Anlisis de varianza del diseo de mediciones repetidas con un solo factor
Suma de cuadrados

Fuente de variacin
1. Entre los sujetos

r-1

;=1

;=1

.,2
( ! )

4. (Error)
5. Total

f b

Cuadrado medio

n 1

an

2. Dentro de los sujetos


3. (Tiatamientos)

Grados de
libertad

y
P

a i

an

M S

Sustraccin: lnea (2) - lnea (3)

x 2 -

s s *

E
an -1

Tratamientos
^
^

Tratamientos

(a-l)(-l)

^^Tratamientos
m

s e

14-5 PROBLEMAS

14-5

PROBLEMAS

627

------------------------------------------------------------------------------------------

14-1. Considere nuevamente el problema 5-22. Usar el procedimiento de Box-Cox para determinar si es apropiada
(o til) una transformacin de la respuesta para analizar los datos de este experimento.
14-2. En el ejemplo 6-3 se seleccion una transformacin logartmica para la respuesta velocidad de avance de una
perforadora. Usar el procedimiento de Box-Cox para demostrar que se trata de una transformacin de datos
apropiada.
14-3. Considere de nuevo el experimento del proceso de fundicin del problema 8-23, donde se us un diseo fac
torial fraccionado 26- 3 para estudiar el peso del material de empaque que se adhiere a nodos de carbono
despus de la coccin. Se hicieron tres rplicas de las ocho corridas del diseo, y el peso promedio y el rango
de los pesos de cada combinacin de prueba se trataron como las variables de respuesta, Existe algn indi
cio de que se necesite una transformacin para cualquiera de las dos respuestas?
14-4. En el problema 8-24 se us un diseo factorial fraccionado con rplicas para estudiar el abombamiento o
combadura del sustrato en la fabricacin de semiconductores. Se usaron como variables de respuesta tanto la
media como la desviacin estndar de las mediciones de la combadura. Existe algn indicio de que se nece
site una transformacin para cualquiera de las dos respuestas?
14-5. Considere nuevamente el experimento del recubrimiento fotoprotector del problema 8-25. Usar la varianza
del espesor del recubrimiento en cada combinacin de prueba como la variable de respuesta. Existe algn
indicio de que se necesite una transformacin?
14-6. En el experimento defectos en la rejilla del problema 8-29 se emple una variante de la transformacin de la
raz cuadrada en el anlisis de los datos. Usar el mtodo de Box-Cox para determinar si sta es la transforma
cin apropiada.
14-7. En el diseo central compuesto del problema 11-14 se obtuvieron dos respuestas, la media y la varianza del
espesor del xido. Usar el mtodo de Box-Cox para investigar la utilidad potencial de una transformacin
para estas dos respuestas. Es apropiada la transformacin logartmica sugerida en el inciso c de ese proble
ma?
14-8. En el diseo factorial 3- del problema 11-33, una de las respuestas es la desviacin estndar. Usar el mtodo
de Box-Cox para investigar la utilidad de las transformaciones para esta respuesta. Cambiara su contesta
cin si se usara la varianza como la respuesta?
14-9. En el problema 11-34 se sugiere usar ln(s2) como la respuesta (referirse al inciso b ). El mtodo de Box-Cox
indica que es apropiada una transformacin?
14-10. Un distribuidor de bebidas gaseosas est estudiando la efectividad de los mtodos de descarga. Se han desa
rrollado tres tipos diferentes de carretillas, y se lleva a cabo un experimento en el laboratorio de ingeniera de
mtodos de la compaa. La variable de inters es el tiempo de descarga en minutos (y); sin embargo, el tiem
po de descarga tambin guarda una estrecha relacin con el volumen de las cajas descargadas (x). Cada ca
rretilla se us cuatro veces y se obtuvieron los datos siguientes. Analizar estos datos y sacar las conclusiones
apropiadas. Utilizar a = 0.05.
Tipo de carretilla
2

1
y

27
44
33
41

24
40
35
40

25
35
46
26

26
32
42
25

40
22
53
18

38
26
50
20

14-11. Calcular las medias ajustadas de los tratamientos y los errores estndar de stas para los datos del problema
14-10.
14-12. A continuacin se presentan las sumas de cuadrados y los productos de un anlisis de covarianza de un solo
factor. Terminar el anlisis y sacar las conclusiones apropiadas. Utilizar a = 0.05.

632

BIBLIOGRAFA

Conover, W.J. y R.L. Iman. [30b.] Rank Transformations as a Bridge Between Parametric and Nonparametric Statistics (con comentarios), en The American Statistician, vol. 35, pp. 124-133.
Conover, W.J., M.E. Johnson y M.M, Johnson. [31.] A Comparative Study of Tests for Homogeneity of
Variances, with Applications to the Outer Continental Shelf Bidding Data, en Technometrics, vol. 23, pp.
351-361.
Cook, D.R. [32a.] Detection of Influential Observations in Linear Regression, en Technometrics, vol.
19, pp. 15-18.
Cook, D.R. [32b.] Influential Observations in Linear Regression, en Journal of the American Statistical
Association, vol. 74, pp. 169-174.
Cornell, J.A. [33.] Experiments with Mixtures: Designs, Models, and the Analysis o f Mixture Data. 2a. edi
cin, Wiley, Nueva York.
Cornfield, J. y J.W. Tukey. [34.] Average Value of Mean Squares in Factorials, en Annals of Mathemati
cal Statistics, vol. 27, pp. 907-949.
Daniel, C. [35a.] Use of Half-Normal Plots in Interpreting Factorial TWo Level Experiments, en Tech
nometrics, vol. 1, pp. 311-342.
Daniel, C. [35b.] Applications of Statistics to Industrial Experimentation. Wiley, Nueva York.
Davies, O.L. [36.] Design and Analysis of Industrial Experiments. 2a. edicin, Hafner Publishing Company,
Nueva York.
Derringer, G. y R. Suich. [37.] Simultaneous Optimization of Several Response Variables, en Journal of
Quality Technology, vol. 12, pp. 214-219.
Dolby, J.L. [38.] A Quick Method for Choosing a Transformation, en Technometrics, vol. 5, pp. 317-326.
Draper, N.R. y W.G. Hunter. [39.] Transformations: Some Examples Revisited, en Technometrics, vol.
11, pp. 23-40.
Duncan, A.J. [40.] Quality Control and Industrial Statistics. 5a. edicin, Richard D. Irwin, Homewood, 111.
Duncan, D.B. [41.] Multiple Range and Multiple F Tests, en Biometrics, vol. 11, pp. 1-42.
Dunnett, C.W. [42.] New Tables for Multiple Comparisons with a Control, en Biometrics, vol. 20, pp.
482-491.
Eisenhart, C. [43.] The Assumptions Underlying the Analysis of Variance, en Biometrics, vol. 3,
pp. 1 -2 1 .
Fisher, R.A. [44a.] Statistical Methods for Research Workers. 13ava edicin, Oliver & Boyd, Edimburgo.
Fisher, R.A. [44b.] The Design of Experiments. 8 a. edicin, Hafner Publishing Company, Nueva York.
Fisher, R.A. y F. Yates. [45.] Statistical Tables for Biological, Agricultural, and Medical Research. 4a. edi
cin, Oliver & Boyd, Edimburgo.
Fries, A. y W.G. Hunter. [46.] Minimum Aberration 2k'p Designs, en Technometrics, vol. 22, pp. 601-608.
Gaylor, D.W. y T.D. Hartwell. [47.] Expected Mean Squares for Nested Classifications, en Biometrics,
vol. 25, pp. 427-430.
Gaylor, D.W. y F.N. Hopper. [48.] Estimating the Degrees of Freedom for Linear Combinations of Mean
Squares by Satterthwaites Formula, en Technometrics, vol. 11, no. 4, pp. 699-706.
Graybill, F.A. y D.L. Weeks. [49.] Combining Interblock and Intrablock Information in Balanced Incom
plete Blocks, en Annals of Mathematical Statistics, vol. 30, pp. 799-805.
Graybill, F.A. [50.] An Introduction to Linear Statistical Models. Vol. 1, McGraw-Hill, Nueva York.

BIBLIOGRAFA

633

Graybill, F.A. y C.M. Wang. [51.] Confidence Intervals on Nonnegative Linear Combinations of Varian
ces, en Journal of the American Statistical Association, vol. 75, pp. 869-873.
Hamada, M. y N. Balakrishnan. [52.] Analyzing Unreplicated Factorial Experiments: A Review with
Some New Proposals (con comentarios), en Statistica Sinica, vol. 8 , pp. 1-41,
Hamada, M. y C.F.J. Wu. [53.] Analysis of Designed Experiments with Complex Aliasing, en Journal of
Quality Technology, vol. 24, no. 3, pp. 130-137.
Hill, W.G. y W.G. Hunter. [54.] A Review of Response Surface Methodology: A Literature Survey, en
Technometrics, vol. 8 , pp. 571-590.
Hines, W.W. y D.C. Montgomery. [55.] Probability and Statistics in Engineering and Management Science.
3a. edicin, Wiley, Nueva York.
Hocking, R.R. [56.] A Discussion of the Ttyo-Way Mixed Model, en The American Statistician, vol. 27,
no. 4, pp. 148-152.
Hocking, R.R., O.P. Hackney y F.M. Speed. [57.] The Analysis of Linear Models with Unbalanced Data,
en Contributions to Survey Sampling and Applied Statistics, H.A. David (ed.), Academic Press, Nueva
York.
Hocking, R.R. y F.M. Speed. [58.] A Full Rank Analysis of Some Linear Model Problems, en Journal of
the American Statistical Association, vol. 70, pp. 706-712.
Hunter, J.S. [59a.] Statistical Design Applied to Product Design, en Journal of Quality Technolog)>, vol.
17, pp. 210-221.
Hunter, J.S. [59b.] Lets All Beware the Latin Square, en Quality Engineering, vol. 1, pp. 453-465.
John, J.A. y P. Prescott. [60.] Critical Values of a Test to Detect Outliers in Factorial Experiments, en
Applied Statistics, vol. 24, pp. 56-59.
John, P.W.M. [61a.] The Three-Quarter Replicates of 24 and 2s Designs, en Biometrics, vol. 17, pp.
319-321.
John, P.W.M. [61b.] Three-Quarter Replicates of 2" Designs, en Biometrics, vol. 18, pp. 171-184.
John, P.W.M. [61c.] Blocking a 3(2" k) Design, en Technometrics, vol. 6 , pp. 371-376.
John, P.W.M. [61d.] Statistical Design and Analysis of Experiments. Macmillan, Nueva York.
Kackar, R.N. [62.] Off-Line Quality Control, Parameter Design, and the Tkguchi Method, en Journal of
Quality Technology, vol. 17, pp. 176-188.
Kempthorne, O. [63.] The Design and Analysis of Experiments. Wiley, Nueva York.
Keuls, M. [64.] The Use of the Studentized Range in Connection with an Analysis of Variance, en Euphytica, vol. 1 , pp. 1 1 2 -1 2 2 .
Kiefer, J. [65a,] Optimum Experimental Designs, en Journal of the Royal Statistical Society B, vol. 21, pp.
272-304.
Kiefer, J. [65b.] Optimum Designs in Regression Problems, enAnnals of Mathematical Statistics, vol. 32,
pp. 298-325.
Kiefer, J. y J. Wolfowitz. [66 .] Optimum Designs in Regression Problems, en Annals of Mathematical
Statistics, vol. 30, pp. 271-294.
Khuri, A.I. y J.A. Cornell. [67.] Response Surfaces: Designs and Analyses. 2a. edicin, Dekker, Nueva York.
Kruskal, W.H. y W.A. Wallis. [68 .] Use of Ranks on One Criterion Variance Analysis, en Journal of the
American Statistical Association, vol. 47, pp. 583-621 (las correcciones aparecen en el vol. 48, pp. 907-911).

634

BIBLIOGRAFA

Lamtz, K. y P. Whitcomb. [69.] Use of Replication in Almost Unreplicated Factorials, ponencia presen
tada en la Conferencia Tcnica de Otoo, Corning, N.Y,
Lenth, R.V. [70.] Quick and Easy Analysis of Unreplicated Factorials, en Technometrics, vol. 31, pp.
469-473.
Leon, R.V., A.C. Shoemaker y R.N. Kackar. [71.] Performance Measures Independent of Adjustment,
en Technometrics, vol. 29, pp. 253-265.
Levene, H. [72.] Robust Ifests for Equality of Variance, en Contributions to Probability and Statistics, Z.
Olkin, ed., Stanford University Press, Palo Alto, CA, pp. 278-292.
Loughin, T.M. [73.] Calibration of the Lenth Test for Unreplicated Factorial Designs, en Journal of
Quality Technology, vol. 30, pp. 171-175.
Loughin, T.M. y W. Noble. [74.] A Permutation Test for Effects in an Unreplicated Factorial Design, en
Technometrics, vol. 39, pp. 180-190.
Margolin, B.H. [75a.] Systematic Methods of Analyzing 2"3mFactorial Experiments with Applications,
en Technometrics, vol. 9, pp. 245-260.
Margolin, B.H. [75b.] Results on Factorial Designs of Resolution IV for the 2" and 2"3mSeries, en Tech
nometrics, vol. 11, pp. 431-444.
McCullagh, P. y J.A. Neider. [76.] Generalized Linear Models. 2a. edicin, Chapman & Hall, Nueva York.
Miller, R.G. [77.] Simultaneous Statistical Inference. Springer-Verlag, Nueva York.
Miller, R.G., Jr. [78.] Developments in Multiple Comparisons, 1966-1976, en Journal of the American
Statistical Association, vol. 72, pp. 779-788.
Milliken, G.A. y D.E. Johnson. [79.]Analysis of Messy Data, Vol. 1. Van Nostrand Reinhold, Nueva York.
Montgomery, D.C. [80a.] Introduction to Statistical Quality Control. 3a. edicin, Wiley, Nueva York.
Montgomery, D.C. [80b.] Experimental Design for Product and Process Design and Development, en
Journal of the Royal Statistical Society, D, vol. 48, pp. 159-177.
Montgomery, D.C., C.M. Borror y J.D. Stanley. [81.] Some Cautions in the Use of Plackett-Burman D e
signs, en Quality Engineering, vol. 10, pp. 371-381.
Montgomery, D.C. y E.A. Peck. [82.] Introduction to Linear Regression Analysis. 2a. edicin, Wiley, Nueva
York.
Montgomery, D.C. y G.C. Runger. [83a.] Gauge Capability Analysis and Designed Experiments. Part I:
Basic Methods, en Quality Engineering, vol. 6 , pp. 115-135.
Montgomery, D.C. y G.C. Runger. [83b.] Gauge Capability Analysis and Designed Experiments. Part II:
Experimental Design Models and Variance Component Estimation, en Quality Engineering, vol. 6 , pp.
289-305.
Montgomery, D.C. y G.C. Runger. [83c.] Foldovers of 2k~p Resolution IV Designs, en Journal of Quality
Technology, vol. 24, pp. 446-450.
Montgomery, D.C. y G.C. Runger. [83d.] Probabilidad y estadstica aplicadas para ingenieros. 2a. edicin,
Limusa-Wiley, Mxico.
Myers, R.H. [84,] Classical and Modem Regression with Applications. 2a. edicin, PNS-Kent, Boston.
Myers, R.H. y D.C. Montgomery. [85a.] Response Surface Methodology: Process and Product Optimization
Using Designed Experiments, Wiley, Nueva York.
Myers, R.H. y D.C. Montgomery. [85b.] A Tutorial on Generalized Linear Models, en Journal of Quality
Technology, vol. 29, pp. 274-291.

BIBLIOGRAFA

635

Nair, V.N. et al. (eds.) [86 .] Tkguchis Parameter Design: A Panel Discussion, en Technometrics, vol. 34,
pp. 127-161.
Neider, J.A. y R.W.M. Wedderbum. [87.] Generalized Linear Models, en Journal of the Royal Statistical
Society, A, vol. 135, pp. 370-384.
Nelson, L.S. [88 a.] Using Nested Designs I: Estimation of Standard Deviations, en Journal of Quality
Technology, vol. 27, no. 2, pp. 169-171.
Nelson, L.S. [88 b.] Using Nested Designs II: Confidence Limits for Standard Deviations, en Journal of
Quality Technology, vol. 27, no. 3, pp. 265-267.
Nelson, L.S. [88 c.] Variance Estimation Using Staggered, Nested Designs, en Journal of Quality Techno
logy, vol. 15, pp. 195-198.
Nelson, P.R. [89.] Multiple Comparison of Means Using Simultaneous Confidence Intervals, en Journal
of Quality Technology, vol. 21, No. 4, pp. 232-241.
Newman, D, [90.] The Distribution of the Range in Samples from a Normal Population, Expressed in
Terms of an Independent Estimate of Standard Deviation, en Biometrika, vol. 31, pp. 20-30.
ONeill, R. y G.B. Wetherill, [91.] The Present State of Multiple Comparison Methods, en Journal of the
Royal Statistical Society, B, vol. 33, pp. 218-241.
Ostie, B. [92,] Statistics in Research. 2a. edicin, Iowa State Press, Ames, Iowa.
Pearson, E.S.yH.O. Hartley. [93a.] Biometrika Tables for Statisticians. Vol. 1,3a. edicin, Cambridge Uni
versity Press, Cambridge.
Pearson, E.S. y H.O. Hartley. [93b.] Biometrika Tables for Statisticians. Vol. 2, Cambridge University
Press, Cambridge.
Pignatiello, J.J., Jr. y J.S. Ramberg. [94.] Top Ten Triumphs and Tragedies of Genichi Thguchi, en Qua
lity Engineering, vol. 4, pp. 211-225.
Plackett, R.L. y J.P. Burman. [95.] The Design of Optimum Multifactorial Experiments, en Biometrika,
vol. 33, pp. 305-325.
Quenouille, M.H. [96.] The Design and Analysis of Experiments. Charles Griffin & Company, Londres.
Satterthwaite, EE. [97.] An Approximate Distribution of Estimates of Variance Components, en Bio
metrics Bull., vol. 2, pp. 110-112.
Scheff, H. [98a.] A Method for Judging All Contrasts in the Analysis of Variance, en Biometrika, vol.
40, pp. 87-104.
Scheff, H. [98b.] A Mixed Model for the Analysis of Variance, en Annals of Mathematical Statistics,
vol. 27, pp. 23-36.
Scheff, H. [98c.] Alternative Models for the Analysis of Variance, en Annals of Mathematical Statistics,
vol. 27, pp. 251-271.
Scheff, H. [98d.] The Analysis of Variance. Wiley, Nueva York.
Searle, S.R. [99a.] Linear Models. Wiley, Nueva York.
Searle, S.R. [99b,] Tbpics in Variance Component Estimation, en Biometrics, vol. 27, pp. 1-76.
Searle, S.R. [99c.] Linear Models for Unbalanced Data. Wiley, Nueva York.
Searle, S.R., G. Casella y G.E. McCulloch. [100.] Variance Components. Wiley, Nueva York.
Searle, S.R. y R.E Fawcett. [101.] Expected Mean Squares in Variance Component Models Having Fini
te Populations, en Biometrics, vol. 26, pp. 243-254.

636

BIBLIOGRAFA

Searle, S.R., F.M. Speed y H.V. Henderson. [102.] Some Computational and Model Equivalences in
Analyses of Variance of Unequal-Subclass-Numbers Data, en The American Statistician, vol. 35, pp.
16-33.
Smith, H.F. [103.] Interpretations of Adjusted Treatment Means and Regressions in Analysis of Cova
riance, en Biometrics, vol. 13, No. 3, pp. 282-308.
Smith, J.R. y J.M. Beverly, [104.] The Use and Analysis of Staggered Nested Factorial Designs, en Jour
nal of Quality Technology, vol. 13, pp. 166-173.
Speed, F.M. y R.R. Hocking. [105.] The Use of the R( )-Notation with Unbalanced Data, en The Ameri
can Statistician, vol. 30, pp. 30-33.
Speed, F.M., R.R. Hocking y O.R Hackney. [106.] Methods of Analysis of Linear Models with Unbalan
ced Data, en Journal of the American Statistical Association, vol. 73, pp. 105-112.
Stefansky, W. [107.] Rejecting Outliers in Factorial Designs, en Technometrics, vol. 14, pp. 469-479.
Taguchi, G. [108a.] System of Experimental Design: Engineering Methods to Optimize Quality and Minimize
Cost. UNIPUB, White Plains, Nueva York.
Taguchi, G. [108b.] Introduction to Quality Engineering. Asian Productivity Organization, UNIPUB, Whi
te Plains, Nueva York.
Taguchi, G. y Y. Wu. [109.] Introduction to Off-Line Quality Control. Central Japan Quality Control Asso
ciation, Nagoya, Japn.
Ting, N., R.K. Burdick, F.A. Graybill, S, Jeyaratnam y T.-F. C. Lu. [110.] Confidence Intervals on Linear
Combinations of Variance Components That Are Unrestricted in Sign, en Journal of Statistical Compu
tation and Simulation, vol. 35, pp. 135-143.
Tukey, J.W. [111a.] One Degree of Freedom for Non-Additivity, en Biometrics, vol. 5, pp. 232-242.
Tukey, J.W. [111b.] Comparing Individual Means in the Analysis of Variance, en Biometrics, vol. 5, pp.
99-114.
Tukey, J.W. [111c.] Quick and Dirty Methods in Statistics, Part II, Simple Analysis for Standard D e
signs, en Proceedings of the Fifth Annual Convention, American Society for Quality Control, pp. 189-197.
Tukey, J.W. [11 Id.] The Problem of Multiple Comparisons, notas inditas, Princeton University.
Winer, B.J. [112,] Statistical Principles in Experimental Design. 2a. edicin, McGraw-Hill, Nueva York.
Yates, F. [113a.] The Analysis of Multiple Classifications with Unequal Numbers in the Different Clas
ses, en Journal of the American Statistical Association, vol. 29, pp. 52-66.
Yates, F. [113b.] Design and Analysis of Factorial Experiments. Comunicado tcnico No. 35, Imperial Bu
reau of Soil Sciences, Londres.
Yates, F. [113c.] The Recovery of Interblock Information in Balanced Incomplete Block Designs, en
Annals of Eugenics, vol. 10, pp. 317-325.
Ye, K. y M. Hamada. [114.] Critical Values of the Lenth Method for Unreplicated Factorial Designs, en
Journal of Quality Technology, vol. 32, pp. 57-66.

Apndice

Distribucin normal estndar acumulada

n
m

Puntos porcentuales de la distribucin t

IV

Puntos porcentuales de la distribucin F

Puntos porcentuales de la distribucin x2

Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos fijos

VI

Curvas de operacin caracterstica para el anlisis de varianza del modelo con efectos aleatorios

vu
vin
IX

x
XI

xn
XIII

Rangos significativos para la prueba del rango mltiple de Duncan


Puntos porcentuales del estadstico del rango studentizado
Valores crticos para la prueba de Dunnett para comparar tratamientos con un control
Coeficientes de polinomios ortogonales
Nmeros aleatorios
Relaciones de alias para diseos factoriales fraccionados 2k ~p con k

15 y n

<

64

Glosario para el uso de Design Expert

637

638

APNDICE

I. Distribucin normal estndar acumulada


4>(z) = L v b ^ ;/2du
z

.00
.50000
.53983
.57926

.02

.03

.04

.65910

.50798
.54776
.58706
.62551
.66276

.51197
.55172
.59095
.62930
.66640

.51595
.55567
.59483
.63307
.67003

0
.1
.2
.3
.4

.01
.50399
.54379
.58317
,62172

.0
.1
.2
.3
.4

.61791
.65542

.5
.6
.7
.8
.9

.69146
.72575
.75803
.78814
.81594

.69497
.72907
.76115
.79103
.81859

.69847
.73237
.76424
.79389
.82121

.70194
.73565
.76730
.79673
.82381

.70540
.73891
.77035
.79954
.82639

.5
.6
.7
.8
.9

1.0
1.1
1.2
1.3
1.4

.84134
.86433
.88493
.90320
.91924

.84375
.86650
.88686
.90490
.92073

.84613
.86864
.88877
.90658
.92219

.84849
.87076
.89065
.90824
.92364

.85083
.87285
.89251
.90988
.92506

1.1
1.2
1.3
1.4

1.5
1.6
1.7
1.8
1.9

.93319
.94520
.95543
.96407
.97128

.93448
.94630
.95637

.93574

.96485
.97193

.94738
.95728
.96562
.97257

.93699
.94845
.95818
.96637
.97320

.93822
.94950
.95907
.96711
.97381

1.5
1.6
1.7
1.8
1.9

2.0
2.1
2.2
2.3
2.4

.97725
.98214
.98610
.98928
.99180

.97778
.98257
.98645
.98956
.99202

.97831
.98300
.98679
.98983
.99224

.97882
.98341
.98713
.99010
.99245

.97932
.93882
.98745
.99036
.99266

2.0
2.1
2.2
2.3
2.4

2.5

.99379
.99534

.99396

.99413

.99446
.99585

.99683

.99693

.99744
.99813

.99560
.99674
.99760
.99825

.99430
.99573

2.5

.99547
.99664
.99752
.99819

.99767
.99831

.99774
.99836

2.6
2.7
2.8
2.9

3.1
3.2
3.3
3.4

.99865
.99903
.99931
.99952
.99966

.99869
.99906
.99934
.99953
.99968

.99874
.99910
.99936
.99955

.99878
.99913
.99938
.99957
.99970

.99882
.99916
.99940
.99958
.99971

3.0
3.1
3.2
3.3
3.4

3.5
3.6
3.7

.99977
.99984
.99989

.99978
.99985
.99990

.99978
.99985
.99990

.99979
.99986

.99980
.99986

3.8
3.9

.99993
.99995

.99993
.99995

.99993
.99996

.99990
.99994

.99991
.99994

3.5
3.6
3.7
3.8

.99996

.99996

3.9

2.6
2.7
2.8
2.9
3.0

.99653

.99969

1.0

"Reproducida con permiso de Probability and Statistics in Engineering and Management Science, 3a. ed., W.W
Hines y D.C. Montgomery, Wiley, Nueva York

APNDICE

L Distribucin normal estndar acumulada (continuacin)

.05

.06

.07

.08

.09

.0

.51994

.52392

.52790

.53586

.0

.1
.2
.3
.4

.55962
.59871
.63683
.67364

.56356
.60257
.64058
.67724

.56749
.60642
.64431
.68082

.53188
.57142
.61026
.64803
.68438

.57534
.61409
.65173
.68793

.1
.2
.3
.4

.5
.6
.7
.8
.9

.70884
.74215
.77337
.80234
.82894

.71226
.74537
.77637
.80510
.83147

.71566
.74857
.77935
.80785
.83397

.71904
.75175
.78230
.81057
.83646

.72240
.75490
.78523
.81327
.83891

.5
.6
.7
.8
.9

1.0
1.1
1.2
1.3

.85314
.87493
.89435
.91149
.92647

.85543
.87697
.89616
.91308
.92785

.85769
.87900
.89796
.91465
.92922

.85993
.88100
.89973
.91621
.93056

.86214
.88297
.90147
.91773
.93189

1.0
1.1
1.2

1.5
1.6
1.7
1.8
1.9

.93943
.95053
.95994
.96784
.97441

.90462
.95154
.96080
.96856
.97500

.94179
.95254
.96164

.94295
.95352

1.5
1.6

.96926
.97558

.96246
.96995
.97615

.94408
.95448
.96327
.97062
.97670

2.0
2.1
2.2
2.3
2.4

.97982
.98422
.98778
.99061
.99286

.98030
.98461
.98809
.99086
.99305

.98077
.98500
.98840
.99111
.99324

.98124
.98537
.98870
.99134
.99343

.98169
.98574
.98899
.99158
.99361

2.0
2.1
2.2
2.3
2.4

2.5
2.6
2.7
2.8
2.9

.99461
.99598
.99702
.99781
.99841

.99477
.99609
.99711
.99788
.99846

.99492
.99621
.99720
.99795
.99851

.99506
.99632
.99728
.99801
.99856

.99520
.99643
.99736
.99807
.99861

2.5
2.6
2.7
2.8
2.9

3.0
3.1
3.2
3.3
3.4

.99886
.99918
.99942
.99960
.99972

.99889
.99921
.99944
.99961
.99973

.99893
.99924
.9994
.99962
.99974

.99897
.99926
.99948
.99964

.99900
.99929
.99950
.99965
.99976

3.0
3.1
3.2
3.3
3,4

3.5
3.6
3.7
3.8

.99981
.99987
.99991
.99994

.99981
.99987
.99992
.99994

.99982
.99988
.99992
.99995

.99983
.99989
.99992
.99995

3.5
3.6
3.7
3.8

3.9

.99996

.99996

.99996

.99997

3.9

1.4

.99975
.99983
.99988
.99992
.99995
.99997

1.3
1.4

1.7
1.8
1.9

639

640

APNDICE

IL Puntos porcentuales de la distribucin t


v

Ni

.40

.25

.10

.05

.025

.01

.005

.0025

1
2
3
4

.325
.289
.277
.271

1.000
,816
.765
.741

3.078
1.886
1.638
1.533

6.314
2.920
2.353
2.132

12.706
4.303
3.182
2.776

31.821
6.965
4.541
3.747

63.657
9.925
5.841

127.32
14.089
7.453
5.598

5
6

.727
.727

1.383

2.015
1.943
1.895
1.860
1.833

2.365
2.306
2.262

3.365
3.143
2.998
2.896
2.821

4.032

.711
.706
.703

1.476
1.440
1.415
1.397

2.571
2.447

7
8
9

.267
.265
.263
.262
.261

10
11
12
13
14

.260
.260
.259
.259
.258

.700
.697
.695
.694
.692

1.372
1.363
1.356
1.350
1.345

1.812
1.796
1.782
1.771

2.228
2.201
2.179
2.160
2.145

2.764
2.718
2.681
2.650
2.624

3.169
3.106
3.055
3.012
2.977

15

.258
.258
.257
.257
.257

.691
.690

1.341

1.753

16
17
18
19

1.337

.689
.688
.688

1.333

2.131
2.120
2.110
2.101
2.093

2.602
2.583
2.567
2.552
2.539

2.947
2.921
2.898

1.330
1.328

1.746
1.740
1.734
1.729

20
21
22
23
24

.257
.257
.256
.256
.256

.687
.686
.686
.685
.685

1.325
1.323
1.321
1.319
1.318

1.725
1.721
1.717
1.714
1.711

2.086
2.080
2.074
2.069
2.064

2.528
2.518
2.508
2.500
2.492

2.845
2.831

25
26
27
28

.256
.256
.256
.256

.684
.684
.684

1.708
1.706
1.703

.256

.683

1.701
1.699

2.045

2.485
2.479
2.473
2.467
2.462

2.787
2.779
2.771

.683

2.060
2.056
2.052
2.048

29

1.316
1.315
1.314
1.313
1.311

30
40
60
120
00

.256
.255
.254
.254

.683
.681

1.310
1.303
1.296
1.289
1.282

1.697
1.684
1.671
1.658
1.645

2.042
2.021
2.000
1.980
1.960

2.457
2.423
2.390
2.358
2.326

2.750
2.704
2.660
2.617
2.576

.253

.679
.677
.674

1.761

4.604

3.707
3.499
3.355
3.250

2.878
2.861

2.819
2.807
2.797

2.763
2.756

.001
318.31
23.326
10.213
7.173

.0005
636.62
31.598
12.924
8.610

4.773
4.317

5.893
5.208

4.019
3.833
3.690

4.785
4.501
4.297

6.869
5.959
5.408
5.041
4.781

3.581
3.497
3.428
3.372
3.326

4.144
4.025
3.930
3.852
3.787

4.587
4.437
4.318
4.221
4.140

3.286
3.252

3.733
3.686

4.073

3.222
3.197
3.174

3.646
3.610
3.579

4.015
3.965
3.922
3.883

3.153
3.135
3.119
3.104

3.552
3.527
3.505
3.485
3.467

3.850
3.819
3.792
3.767
3.745

3.450
3.435
3.421

3.091
3.078
3.067
3.057
3.047
3.038

3.408
3.396

3.725
3.707
3.690
3.674
3.659

3.030
2.971
2.915
2.860
2.807

3.385
3.307
3.232
3.160
3.090

3.646
3.551
3.460
3.373
3.291

v - grados de libertad.
"Adaptada con permiso de Biometrika Tables for Statisticians, vol. 1 ,3a. ed., E.S. Pearson y H.O. Hartley,
Cambridge University Press, Cambridge

APNDICE

HL Puntos porcentuales de la distribucin X1a


a

.975

.950

.500

.050

.025

.010

.005

0.00 +

0.00 +

0.00 +

0.02

0.05
0.22
0.48
0.83

0.10
0.35
0.71
1.15

0.45
1.39
2.37
3.36
4.35

3.84
5.99
7.81
9.49
11.07

5.02
7.38
9.35
11.14
12.38

6.63
9.21
11.34
13.28
15.09

7.88
10.60
12.84
14.86
16.75

1.24
1.69
2.18
2.70
3.25

1.64
2.17
2.73
3,33
3.94

5.35
6.35
7.34
8.34
9.34

12.59
14.07
15.51
16.92
18.31

14.45
16.01
17.53
19.02
20.48

16.81
18.48
20.09
21.67
23.21

18.55
20.28
21.96

4.57
5.23

19.68
2L03
22.36
23.68
25.00

21.92
23.34
24.74
26.12
27.49

24.72
26.22

5.89
6.57
7.26

10.34
11.34
12.34
13.34
14.34

27.69
29.14
30.58

26.76
28.30
29.82
31.32
32.80

.990

.995

1
2
3
4
5
6
7
8

0.00 +
0.01
0.07
0.21
0.41

0.11
0.30
0.55
0.87
1.24

9
10

0.68
0.99
1.34
1.73
2.16

11
12
13
14
15

2.60
3.07
3.57
4.07
4.60

4.11
4.66
5.23

3.82
4.40
5.01
5.63
6.27

16
17
18
19
20

5.14
5.70
6.26
6.84
7.43

5.81
6.41
7.01
7.63
8.26

6.91
7.56
8.23
8.91
9.59

7.96
8.67
9.39
10.12
10.85

15.34
16.34
17.34
18.34
19.34

26.30
27.59
28.87
30.14
31.41

28.85
30.19
31.53
32.85
34.17

32.00
33.41
34.81
36.19
37.57

34.27
35.72
37.16
38.58
40.00

25
30
40
50
60

10.52
13.79
20.71
27.99
35.53

11.52
14.95
22.16
29.71

13.12
16.79
24.43
32.36
40.48

14.61
18.49
26.51
34.76
43.19

24.34
29.34
39.34
49.33
59.33

37.65
43.77
55.76
67.50
79.08

40.65
46.98
59.34
71.42
83.30

44.31
50.89
63.69
76.15
88.38

46.93
53.67
66.77
79.49

70
80

43.28

45.44
53.54

48.76
57.15
65.65
74.22

51.74

51.17
59.20
67.33

60.39
69.13
77.93

69.33
79.33
89.33
99.33

90.53
101.88
113.14
124.34

95.02
106.63
118.14
129.56

112.33
124.12
135.81

90
100

1.65
2,09
2.56
3.05
3.57

37.48

61.75
70.06

100.42

23.59
25.19

91,95
104.22
116.32
128.30
140.17

v = grados de libertad
Adaptada con permiso de Biometrika Tables for Statisticians, vol. 1 ,3a, ed., E.S. Pearson y H.O. Hartley,
Cambridge University Press, Cambridge

641

IV

G rados d e libertad del num erador (v : )


8
9
10
12

15

20

24

5.S3

7.50

8.20

8.58

8.82

8.98

9.10

9.19

9.26

9.32

9.41

9.49

9.58

9,63

9,67

9.71

9.76

9.80

9.85

3.00

3.15

3.23

3.28

3.31

3.34

3,35

3.37

3.38

3.39

3.41

3.43

3.43

3,48

2.36

2.39

2.41

2.42

2.43

2.44

2.44

2.44

2.45

2.46

2.46

2.46

3,45
2.47

3.47

2.28

3,44
2.47

3.46

2.57
2.02

2.47

2.47

2.47

1.81

2.00

2.05

2.06

2.07

2.08

2.OS

2,08

2.08

2.08

2.08

2.08

2.08

2.08

2.08

2.08

2,08

2.08

2.08

t.69

1.85

1.38

1.89

1.89

.89

1,89

1.89

1.89

1.89

1,89

1.89

1.88

1.88

1.88

1.88

1,87

1.87

1.87

1.62

1,76

1.78

1.79

1.79

1.78

1.78

1.78

1.77

1.77

1,77

1.76

1.76

1.75

1.75

1,75

1.74

1,74

1.74

1.57

1.70

1.72

1.72

1.71

1.71

1,70

1.70

1.70

1.68

1.67

1,67

1.66

1.65

1.65

1.66

1.67

1,66

1.66

1.65

1.64

1.64

1.63

1,62

1.62

1.61

1,60

1.60

1.66
1.59

1.65

1.54

1.69
1.63

1.68

1,59

1.58

1.58

i.51

1.62

.63

1.63

1.62

1.61

1.60

1.60

1.59

1.59

1.58

1.57

1.56

1.56

1.55

1.54

1.54

1.53

1.53

10

1.49

1,60

1.60

1.59

1.59

1.58

1.57

1.56

1.56

1.55

1.54

1.53

1,52

152

1.51

1,51

1-50

1.49

1.48

11

1.47
1,46

1,58
1,56

1.58
1.56

1.57
1.55

1.56
1.54

1.55
1.53

1.54
1.52

1.53
1.51

1.53

1.52
1.50

1.51

12

1.49

1.50
1.48

1.49
1.47

1.49
1,46

1.48
1.45

1.47
1.45

1.47
1.44

1.45
1.42
1.40
1.38

' s

Grados de libertad del denominador (v2)

Puntos porcentuales de la distribucin F

30

40

60

120

00

13

1.45

1.55

1.55

1.53

1.52

1.51

1.50

1.49

1.49

1.48

1,47

1.46

i.45

1.44

1.43

1.42

1.42

1.46
1,43
1.41

14

1.44

1.53

1.53

1.52

1.51

1.50

1.49

1.48

1.47

1.46

1,45

1.44

1.43

1,42

1.41

1.41

1,40

1.39

15

1,43
1.42

1.52

1.52

1.51

1.49

1.46

1.46

1.45

1.44

1.43

1.41

1.41

1.40

1.39

1.38

1,37

1.36

1.51

1.50

1.48

1.43
1.47

1.47

1.51

1.46

1.45

1.44

1,44

1,43

1.41

1.40

1.39

1,38

1.37

1.36

1.35

1,34

16

1.51

17

1,42

1.51

1.50

1,49

1.47

1.46

1.45

1.44

1.43

1.43

1.41

1.40

1.39

1.36

1.35

1,34

1,33

1,41

1.50

1.49

1.48

1.46

1.45

1.44

1.43

1,42

1.40

1.39

1.38

138
1.37

1,37

18

1.36

1.35

1.34

1,33

1.32

1,41

1,36

1,35

!.34

1.33

1.32

1.30

19

1.41

1.49

1,49

1.47

1.46

1.44

1,43

1.42

1.42
1.41

1.40

1.38

1.37

20

1.40

1.49

1.48

1.47

1.45

1.44

1.43

1.42

1.41

1,40

1.39

1.37

1.36

1.35

1.34

1.33

1.32

1.31

1.29

21

1.40

1.48

1.48

1,46

1,44

1.43

1.42

1.41

1.40

1.39

1.38

1.35

1,34

1.33

1.32

131

1.30

1.28

22

1.40

1.48

1.47

1.45

1.44

1.42

1.41

1.40

1.39

1,39

1,37

1.37
1.36

1.34

1,33

1,32

1.31

1.30

1.29

1.28

23

1.39
1.39

1.47

1.47

1.45

1,43

1.42

1.41

1.40

1.39

1.38

1.35

1.34

1,33

1.32

1,31

1.30

1.28

1,27

1.47

1,46

1,44

1,43

1,41

1.40

1.39

1.38

1.38

1.37
1.36

1.35

1.33

1,32

1,31

1.30

1.29

1.28

1.26

25
26

1.39

1.47

1.46

1.44

1.42

1.41

1.40

1.39

1.38

1.37

1.36

1.34

1.33

1.32

1,31

1.28

1.27

1.25

1.38

1.46

1.45

1.44

1,42

1.41

1.39

1.38

1.37

1,37

1.35

1.34

1,32

1.31

1.30

1.29
1,29

1.28

1,26

1.25

27

1.38

1.46

1,45

1.43

1.42

1.40

1.39

.38

1.37

1,36

1.35

1.33

1.32

1.31

1.30

1.28

1.27

1.26

1.24

28

1.38

1.46

1.45

1.41

1.40

1.37

1.36

1.34

1.33

1,31

1.30

1.27

1,25

1,24

1.45

1,45

1.41

1.40

1.37

1.36

1.35

1.34

1.32

1,31

1,30

1,29
1.29

1,28

1.38

1.39
1,38

1.38

29

1,43
1,43

1,27

1.26

1.25

1,23

24

30

1.38

1.45

1,44

1.42

1,41

1.39

1.38

1.37

1.36

1.35

1.34

1.32

1.30

1.29

1.28

1.27

1.26

1.24

1.23

40

1.36

1,44

1,42

1.40

1.39

1.37

1.36

1.35

1.34

1.33

1.31

1.30

1,28

1.26

1.25

1.24

1.22

1,21

1.19

60

1.35

1.42

1.41

1.38

1,37

1,35

1.33

1.32

1.31

1.30

1.29

1.27

1.25

1.24

1.22

1.21

1.19

1,17

1.15

120

1.34

1.40

1.39

1.37

1,35

1,33

1.30

1.19

1.18

1.16

1,13

1,10

1.37

1.35

1.33

1.31

1.24
1.22

1.21

1.39

1.26
1.24

1,22

1.32

1.29
1.27

1.28

OO

1.31
1.29

1,19

1.18

1.16

1.14

1.12

1.08

1,00

1.28

1.25

v = grados de libertad
Adaptada con permiso de Biometrika Tables for Statisticians, vol. 1 ,3a. ed., E.S. Pearson y H.O. Hartley, Cambridge University Press, Cambridge

IV. Puntos porcentuales de la distribucin F (continuacin)


G rados de libertad del n um erador (vj)
:

es

S
Io
c

39,86

49.50

53.59

10

12

15

20

24

30

40

60

120

55.83

57.24

58.20

58,91

59.44

59.86

60.19

60.71

61,22

61.74

62.00

62.26

62.53

62.79

63.06

63.33
9.49

00

8.53

9.00

9.16

9.24

9.29

9.33

9.35

9.37

9.38

9,39

9.41

9.42

9.44

9.45

9.46

9.47

9.47

9.48

5.54

5.46

5.39

5.34

5.31

5.28

5.27

5.25

5.24

5.23

5.22

5.20

5.18

5.18

5.17

5.16

5.15

5,14

5.13

4,54

4.32

4.19

4.11

4.05

4.01

3.98

3.95

3.94

3.92

3.90

3.87

3.84

3.83

3.82

3.80

3.79

3.78

3.76

4.06

3.78

3.62

3.52

3.45

3.40

3.37

334

3.32

3.30

3.27

3.24

3,21

3.19

3.17

3.16

3,14

3.12

3.10

3.78

3.46

3.29

3.18

3.11

3.05

3.01

2.98

2.96

2.94

2.90

2.87

2.84

2.82

2.80

2.78

2.76

2.74

2.72

3.59

3.26

3.07

2.96

2.88

2.83

2,78

2.75

2.72

2.70

2,67

2.63

2.59

2.58

2.56

2.54

2,51

2.49

2.47

3.46

2,92

2.81

2.73

2J9

2.56

2.54

2.50

2.40

2.38

2.36

2,34

2.32

2.29

2.81

2.69

2,61

2.51

2.47

2.44

2.42

2.38

2.46
2.34

2.42

3.36

2.67
2.55

2.62

3.11
3.01

2.30

2.28

2.25

2.23

2.21

2.18

2.16

10

3,29

2.92

2.73

2,61

2,52

2.46

2.41

2.38

2.35

2.32

2.28

2.24

2.20

2.18

2.16

2.13

2.11

2.08

2.06

11

3.23

2.86

2.66

2.54

2.45

2.39

234

2.30

2.27

2.25

2.21

2.17

2.12

2.10

2.08

2.05

2.03

2.00

1.97

12

3.18

2.81

2.61

2.48

2.39

2.33

2.28

2.24

2.21

2.19

2,15

2,10

2.06

2.04

2.01

13
14

3.14
3.10

2.76

2.43

2.35

2,16

2.14

2.12

2.10

2.05
2.01

2.01
1.96

1.94

1.96
1,91

1.89

1.86

1.93
1.88
1.83

1.90
1.85

2.15

2.10
2.05

1.98

2.31

2.23
2.19

2.20

2.39

2.28
2.24

1.96
1.90

2.73

2.56
2.52

1.99
1.93

15

3.07

2.70

2.49

2.36

2.27

2.21

2.16

2.12

2.09

2.06

2.02

1.97

1.92

1.90

1.87

1.85

1.82

1.79

1.76

16

3.05

2,67

2.46

2.33

2.24

2.18

2.13

2.09

2.06

2.09

1.99

1.94

1.89

1.87

1,84

1.81

1.78

1.75

1.72

17

3.03

2.64

2,44

231

2.22

2.15

2.10

2.06

2.03

2.00

1.96

1.91

1.86

1.81

1.78

1.75

1.72

1.69

1.80

18

3.01

2.42

2.29

2.20

2,13

2.08

2.04

2.00

1.98

1.93

1.89

1.84

1.78

1.75

1.72

1.69

1.66

T3

19

2.99

2.62
2 61

1.84
1.81

2.40

2.27

2.18

2.11

2.06

2.02

1.98

1.96

1.91

1.36

1.81

1.79

1.76

1.73

1.70

1.67

1.63

TD

20

2,97

2.59

2.38

2.25

2.16

2.09

2.04

2.00

1.96

1.94

1.89

1.84

1.79

1,77

1.74

1.71

1.68

1.64

1.61

21

2.96

2.57

2.36

Z2

2.14

2.08

2.02

1.98

1.95

1.92

1.87

1.83

1.75

1.72

1.69

1.66

1.62

1.59

22

2.95

2.56

2.35

2.22

2.13

2.06

2.01

1,97

1.93

1.90

1.86

1.81

1.78
1.76

1.73

1.70

1.60

1.57

2.94

2.55

2.34

2.21

2.11

2.05

1.99

1.96

1.92

1.89

1.84

1.80

1.74

1.72

1,69

1.67
1.66

1.64

23

1.62

1.59

1.55
1.53

i
u
*a
w
q

Os
OJ

24

2.93

2.54

2.33

2.19

2.10

2.04

1.98

1.94

1.91

1.88

1.83

1.78

1.73

1.70

1.67

1.64

1.61

1.57

25

2.92

2.32

2.18

2.09

2.02

1.97

1.93

1.89

1.87

1.82

1,77

1.72

1.69

1.66

1.63

1.59

1.56

1.52

26

2,91

2.53
2.52

2.31

2.17

2.08

2.01

1.96

1.92

1.88

1.86

1.81

1.76

1.71

1.68

1.65

1.61

1.58

1.54

1.50

27

2.90

2.51

2.30

2.17

2.07

2.00

1.95

1.91

1.87

1.75

1.70

1,67

1.64

1.60

1.57

1.53

1.49

2.89

2.50

2.29

2.16

2.06

2.00

1.94

1.90

1.87

1.85
1.84

1.80

28

1.79

1.74

1.69

1.66

1.63

1.59

1.56

1.52

1.48

29

2.89

2,50

2,28

2.15

2.06

1.99

1.93

1.89

1.86

1.83

1.78

1.73

1.68

1.65

1.62

1.58

1.55

1.51

1.47

30

2.88

2.49

2.28

2.14

2.03

1.98

1.88

1.85

1.82

1.77

1.72

1.67

1.64

1.61

1.57

1.54

1.50

1.46

40

2.84

2.44

2.23

2.09

2.00

1,93

1.93
1.87

1.83

1.79

1.76

1.71

1.66

1.61

1.57

1.54

1.51

1.47

1.42

1.38
1.29

60

2.79

2.39

2.18

2.04

1.95

1.87

1.82

1.77

1.74

1.71

1.66

1.60

1.S4

1.51

1.40

1.35

2.75

2.35

2.13

1.99

1.90

1.82

1.77

1.72

1.68

1.65

1.60

1.55

1.48

1.45

1.48
1.4]

1.44

120

1.37

1.32

1.26

1.19

oo

2.71

2.30

2.08

1.94

1.85

1.77

1.72

1,67

1.63

1.60

1.55

1.49

1.42

1 38

1,34

1.30

1.24

1.17

1 .0 0

IV. Puntos porcentuales de la distribucin F (continuacin)


F

_____________________________ 1 0.05,^ jVj_____________________________

161.4

215,7

224.6

230.2

234.0

15

20

24

30

40

60

251,1

252,2

120

co

18.51

199.
19.00

19.16

19.25

19.30

19.33

19.35

1937

19.38

19.40

19.41

19,43

19,45

19.45

19.46

19.47

19.48

19.49

19.50

10.13

9.55

9.28

9.12

9.01

8.94

8.89

8.85

8.81

8.79

8.74

8,70

8.66

8.64

8.62

8.59

8.57

8.55

8.53

7.71

6.94

6.59

6.39

6.26

6.16

6.09

6.04

6,00

5.96

5.91

5.86

5.80

5,77

5.75

5.72

5.69

5.66

5.63

6.61

5.79

5.41

5.19

5.05

4.95

4.88

4.82

4.77

4.74

4,68

4.62

4.56

4,53

4.50

4,46

4,43

4.40

4.36
3.67

236.S

238,9

240.5

241.9

243.9

245,9

248,0

249.1

250.1

2533

254.3

5.99

5.14

4.76

4.53

4.39

4,28

4.21

4.15

4.10

4.06

4.00

3.94

3.87

3,84

3.81

3,77

3,74

3.70

5,59

4,74

435

4.12

3.97

3.87

3.79

3.73

3.68

3,64

3.57

3.51

3.44

3.41

3.38

3,34

3.30

3.27

3.23

5.32

4.46
4 26

4.07

3.84

3.69

3.58

3.50

3.44

3.39

3.35

3.28

3,22

3,15

3.12

3.08

3.04

3.01

2.97

2.93

3.86

3.63

3.48

3.37

3.29

3.23

3.18

3.14

3.07

3,01

2.94

2.90

2.86

2,83

2.79

2.75

2.71

4.10

3.71

3.48

3,33

3.22

3.14

3.07

3.02

2.98

2,91

2.77

2.74

2.70

2.66

2.62

2.58

2.54

2.90
2.80

2,85

2.79

2.85
2.72

2.65

2.61

2,57

2.53

2.49

2.45

2.40

2,75

2.62
2.53

2.54
2.46

2.51
2.42

247

2.43

2.38

2.34

230

2,38

2.34

2.30

2.25

2.21

2.46

2.39

2.35

2.31

2.27

2,22

2.18

2.13

5.12

10

4.96
4.84

11

Grados de libertad del denominador (y f

G rados de libertad del num erador (r 1)


8
9
10
12

3.98

3.59

3.36

3.20

3.09

3.01

2.95

12
13

4.75

3.89

3.03

3.00
2.92

2.91

3.81

3.26
3.18

3.11

4.67

3.49
3.41

2.83

2.85
2.77

Z71

2.67

2.69
2.60

14

4.60

3,74

3.34

3.11

2.96

2.85

2.76

2.70

2.65

2.60

2.53

15

4.54

3.68

3.29

3.06

2.90

2.79

2.71

2.64

2,59

2.54

2.48

2.40

233

2.29

2.25

2.20

2,16

2.11

2.07

16

4.49

3.63

3.24

3,01

2,85

2.74

2,66

2*59

2.54

2,49

2.42

2.35

2.28

2.24

2.19

2.15

2.11

2,06

2.01

17

4.45

3.59

2.96

2,81

2.70

2.61

5 5

2.49

2.45

2,38

2.31

2.23

2.19

2.15

2.10

2.06

2,01

1.96

18

4.41

2.93

2.77

2.41

2,34

2.27

2.19

2.15

2.11

2.06

2,90

2.74

2.48

2,42

2.38

2.31

2.23

2.16

2,11

2,07

2.03

2.02
1.98

1,97

3,13

2.58
2.54

2.46

4.38

2.66
2.63

2.51

19

3,55
3.52

3.20
3.16

1.93

1.92
1.88

20

4.35

3.49

3,10

2,87

2.71

2.60

2.51

2.45

239

2.35

2.28

2.20

2.12

2.08

2.04

1.99

1.95

1.90

1.84

21

4.32

3.47

3.07

2.84

2.68

2.57

2.49

2.42

2.37

2.32

2.25

2.18

2.10

2.05

2.01

1,96

1.92

1.87

22

4.30

3.44

3.05

2.82

2.66

2.55

2,46

2.40

2.34

2.30

2.23

2,15

2.07

2.03

1.98

1.94

1,89

1.84

1.81
1.78

23

4.28

3.42

3.03

2.80

2.64

2 37

2.32

2.27

2.20

2.01

1.96

1,91

1.86

1.81

1.76

3,40

3.01

2.78

2.62

2.42

2.36

2.30

2,25

2,18

2,13
2.11

2,05

4.26

2,53
2.51

2.44

24

2,03

1.98

1.94

1.89

1,84

1.79

1.73

25

4.24

339

2,99

2.76

2.60

2.49

2.40

2.34

2.28

2.24

2.16

2.09

2.01

1.96

1.92

1.87

1.82

1,77

1.71

26
27

4.23

3.37

2.98

2,74

2.59

2.47

2.39

2.32

2.27

2.22

2.15

2.07

1,99

1,95

1.90

1.85

1.80

1,75

1.69

4.21

3.35

2.96

2,73

2.57

2.46

2.37

2,31

2.25

2.20

2.13

2.06

1.97

1,93

1.88

1.84

1.79

1.73

1.67

28

4.20

3.34

2.95

2.71

2.56

2.45

2.36

2.29

2.24

2.19

2.12

2.04

1.96

1.91

1.87

1.82

1.77

1.71

1.65

29

4.18

3.33

2.93

2.70

2.55

2.43

2,35

2.28

2.22

2.18

2.10

2,03

1.94

1.90

1.85

1.81

1.75

1,70

1.64

30

4,17

3,32

2.92

2.69

2,53

2.42

2.33

2.27

2,21

2.16

2.09

2.01

1,93

1.89

1.84

1.74

1.68

1.62

40

4.08

3.23

2.84

2.61

2.45

2.34

2.25

2.18

2.12

2.08

2.00

1.92

1.84

1.79

1,74

1.79
1.69

1.64

1.58

1.51

60

4.00

3.15

2,76

2.53

2.37

2.25

2.17

2.10

2.04

1,99

1.92

1.84

1.75

L70

1.65

1.59

1.53

1.47

139

120

3.92

3.07

2.68

2.45

2.29

2.17

2.09

2.02

1.96

1.91

1,83

1.75

1.66

1.61

1,55

1.55

1.43

135

1,25

co

3.84

3.00

2.60

237

2.21

2.10

2.01

1.94

1.88

1,83

1.75

1.67

1.57

1.52

1,46

1.39

1.32

1,22

1,00

IV. Puntos porcentuales de la distribucin F (continuacin)


F0.0I5,vt .V;
G rados de libertad d el n um erador (v,)
1

s
1

547.8

2
799.5

3
864.2

4
899,6

5
921.8

937.1

948.2

956.7

963.3

10
968.6

12
976.7

15
984.9

20
993.1

24
997,2

30
1001

38.51

39.00

39.17

39.25

39.30

39.33

39.36

39.37

39.39

39.40

39.41

39.43

39.45

39.46

39.46

17,44

16.04

15,44

15.10

14.88

14.73

14.62

14.54

14.47

14.42

14.34

14.25

14.17

14.12

14.08

12,22

*0.65

9.98

9.60

9.36

9.20

9.07

8.9*

8.90

8.84

B.75

8.66

8.56

8.51

8.46

10,01

8.43

7.76

7.39

7.15

6,98

6.85

6.76

6.68

6.62

6.52

6.43

6.33

6.28

6,23

8.81

7.26

6.60

6.23

5.99

5.82

5.70

5.60

5.52

5.46

5.37

5.27

5.07

8.07

6.54

5.89

5.52

5,29

5,12

4.99

4.90

4.82

4.76

4.67

4.57

5.17
4.47

5,12

4.42

4.36

6
S

7.57

6.06

5.42

5.05

4.82

4.65

4,53

4.43

4.36

4.30

4.20

4.10

7.21

5.71

5.08

4.72

4.48

432

4.20

4.10

4.03

3.96

3,87

3.77

4.00
3.67

3,95
3,61

3.89

9
10

6.94

5.46

4.83

4.47

4.24

4.07

3.95

3.85

3.78

3.72

3.62

3.52

3.42

3.37

11
12

3.31

6.72

5.26

4.63

4.28

4.04

3.88

3.76

3.66

3.59

3.53

3.43

3.33

3.23

3.17

3.12

6.55
6.41

5.10
4.97

4.47

3,89
3.77

3.73
3.60

3.61
3.48

3.51

3.44

3.37

3.28

3.25

3.15

2.89

2.84

6.30

4,86

4.24

3.89

3.66

3.50

3.38

3.29

3.31
3.21

3.07
2.95

2.96

3.39

3.18
3.05

3.02

4.35

4.12
4.00

3.15

3.05

2.95

2.84

2,79

2.73

15

6.20

4.77

4.15

3.80

3.58

3.41

3,29

3.20

3.12

3.06

2.96

2.86

2.76

2.70

2.64

16

6.12

4.69

4.08

3.73

3.50

3.34

3,22

3.12

3.05

2.99

2.89

2.79

2.68

2.63

2.57

17

6.04

4.62

4.01

3.66

3.44

3.28

3,16

3.06

,2,98

2.92

2.82

2.72

2.62

2.56

2.50

IS

5.98

4.56

3.95

3.61

3,22

3,10

3.01

2.93

2.87

2.77

2,67

2.56

2.50

2.44

19

5.92

4.51

3.90

3.56

3.38
3.33

3,17

3.05

2.96

2.88

2.82

2,72

2,62

2.51

2.45

2.39

20

5.87

4.46

3.86

3.51

3.29

3.13

3.01

2.91

2.84

2.77

2.68

2.57

2.46

2.41

2.35

21

5.83

4.42

3.82

3.48

3.25

3.09

2.97

2.87

2.80

2.73

2.64

2.53

2.42

2.37

2.31

22

5.79

4.38

3.78

3.44

3.22

3.05

2.93

2.84

2.76

2.70

2.60

2.50

2.39

2.33

2.27

23

5.75

4.35

3.75

3.41

3.18

3.02

2.90

2.81

2.73

2.67

2.57

2.47

2.36

2.30

2.24

24

5.72

4.32

3.72

3.38

3.15

2.99

2.87

2.78

2.70

2.64

2.54

2.44

2.33

2.27

2.21

25

5.69

4.29

3.69

3.35

3.13

2.97

2.85

175

2.68

2.61

2.51

2.41

2.30

2.24

118

26

5.66

4.27

3.67

3.33

3.10

2.94

2.82

2.73

2.65

2.59

2.49

2.39

2.28

2.22

2.16

27

5.63

4.24

3.65

3.31

3.08

2.92

180

2.71

2.63

2.57

2.47

2,36

2.25

2.19

2.13

28

5.61

4.22

3.63

3.29

3.06

2.90

178

2.69

2.61

2.55

2.45

2.34

2.23

2.17

2.11

29

5.59

4.20

1.61

3.27

3.04

2,88

2.76

167

2.59

2.53

2.43

2.32

2.21

115

2.09

30

5.57

4.18

3.59

3.25

3.03

2.87

175

2.65

2.57

2.51

2.41

2.31

2.14

2.07

40

5.42

4.05

3.46

3,13

2.90

2.74

162

2.53

2.45

2.39

2.29

2,18

2.20
2.07

2.01

1.94

60

5.29

3.93

3.34

3,01

2.79

2.63

151

2.41

2.33

2.27

2.17

2.06

1.94

1.88

1.82

1.76
1.64

1.69

13
14

120

5.15

3.80

3.23

2.89

2.67

2.52

2.39

2.30

2.22

2.16

2.05

1,94

1.82

oc

5.02

3,69

3.12

2.79

2.57

2.41

2.29

2,19

2.11

2.05

1.94

1.83

1.71

3.56

1.57

IV. Puntos porcentuales de la distribucin i5 (continuacin)


G rados d e libertad del num erador ( v )
1

Grados de libertad del denominador (v2)

4052

2
4999.5

98.50

99,00

34.12

4
5

3
5403

4
5625

5
5764

6
5859

7
5928

8
5982

9
6022

10

12

15

20

24

30

40

60

120

co

6056

6106

6157

6209

6235

6261

6287

6313

6339

6366

99.25

99.30

99.33

99.36

99,37

99.39

99.40

99.42

99,43

99.45

99.46

99.47

99.47

99.48

99.49

99.50

30,82

99.17
29.46

28.71

28.24

27.91

27.67

27,49

27.35

27.23

27.05

26,87

26.69

26.00

26,50

26.41

26.32

26.22

26.13

21.20

18.00

16.69

15.98

15.52

15,21

14.98

14.80

14.66

14.55

14,37

14.20

14.02

3.93

13.84

13.75

13.65

13.56

13.46

16.26

13.27

12.06

11,39

10.97

10.67

10.46

10.29

10.16

10.05

9.89

9.72

9.55

9.47

9.38

9.29

9.20

9.11

9,02

13.75

10.92

9.78

9.15

8.75

8.47

8.26

8.10

7.98

7.87

7,72

7.56

7.40

7.31

7.23

7.14

7,06

6.97

6.88

1X25

9.55

8.45

7.85

7.46

7.19

6.99

6.84

6.72

6.62

6.47

6.31

6.16

6.07

5.99

5.91

5.82

5.74

5.65

11.26

8.65

7.59

7.01

6.63

6.37

6.18

6.03

5.91

5.81

5.67

5.52

5.36

5.28

5,20

5.12

5.03

4,95

4.86

10.56

8,02

6.99

6.42

6.06

5.80

5.61

5.47

5.35

5.26

5.11

4.96

4.81

4.73

4.65

4,57

4.48

4.40

4.31

10

10,04

7,56

6.55

5.99

5.64

5,39

5.20

5.06

4.94

4.85

4.71

4.56

4.41

4.33

4,25

4.17

4.08

4.00

3.91

11

9.65

7-21

6,22

5,67

5.32

5.07

4.89

4.63

4.54

4.40

4.25

4.10

4.02

3.94

3.86

3.78

3.69

3.60

12

9,33

6.93

5.95

5.41

5.06

4.82

4.64

4.74
4.50

4.39

4.30

4.16

4.01

3.86

13
14

9.07
8.86

6.70

5.21

4.86

4.62

4.44

4.46

4.28

3.94

3.96
3.80

3.82
3.66

3.78
3.59

4,69

4.19
4.03

3.66

5.04

4.30
4.14

4.10

6.51

5.74
5.56

3.51

15

8,68

6,36

5.42

4.89

4.56

4.32

4.14

4.00

3.89

3.80

3.67

3.52

16

8.53

6,23

. 5.29

4.77

4.44

4.20

4.03

3.89

3.78

3.69

3.55

3.41

3.70

3,62

3.54

3.45

3.36

3.43
3.27

3.34

3.25

3.43

3.51
3.35

3,18

3.09

3.17
3.00

3.37

3.29

3.21

3,13

3.05

2,96

2.87

3.26

3.18

3.10

3.02

2,93

2.84

X75

17

8,40

6,11

5.18

4.67

4,34

4.10

3.93

3,79

3.68

3.59

3.46

3.31

3.16

3.08

3.00

2.92

X83

2,75

X65

IS

8.29

6.01

5,09

4.58

4.25

4.01

3.84

3,71

3.60

3.51

3.37

3.23

3.08

3.00

2,92

2.84

2,75

2.66

2.57

19

8.18

5.93

5.01

4.50

4.17

3.94

3.77

3.63

3.52

3.43

3.30

3.15

3.00

2.92

2.84

2.76

2.67

2.58

2.49

20

8.10

5.85

4.94

4.43

4.10

3.87

3,70

3.56

3.46

3.37

3.23

3.09

2.94

2.86

2.78

2.69

2.61

2.52

2.42

21

8.02

5.7S

4.87

4,37

4.04

3.81

3.64

3.51

3.40

3.31

3,17

3.03

2.88

2.80

2.72

2.64

2,55

2.46

2,36

22

7.95

5,72

4.82

4.31

3.99

3.76

3.59

3.45

3.35

3.26

3,12

2.98

2,83

2.75

2.67

2.50

2.40

2.31

23

7.88

5.66

4.76

4,26

3.94

3.71

3.54

3.41

3.30

3,21

3,07

2.93

2.78

2.70

2.62

2.58
2.54

2.45

2.35

2.26

24

7.82

5.61

4.72

4.22

3.90

3.67

3.50

3.36

3.26

3,17

3.03

2.89

2.74

2.66

2.58

2.49

X40

231

X21

25

7.77

5.57

4.68

4.18

3.85

3.63

3.46

3.32

3.22

3.13

Z 99

2.85

170

2.62

254

2.45

2,36

2.27

2.17

26

7.72

5.53

4.64

4.14

3,82

3.59

3.42

3,29

3.18

3.09

2.96

2.81

2.66

2.58

2.50

X42

2.33

2.23

2.13

27

7.68

5.49

4.60

4.11

3.78

3.56

3.39

3.26

3.15

3.06

2.93

2.78

2.63

2.55

2.47

2.38

2.29

2,20

2.10

28

7.64

5.45

4.57

4,07

3.75

3.53

3,36

3.23

3.12

3.03

2.90

2,75

2,60

2.52

2.44

2.34

2.26

2.17

2.06

29

7.60

5.42

4.54

4.04

3.73

3.50

333

3.20

3.09

3.00

2.87

X73

2.57

2.49

2.41

2.33

2.23

2.14

2.03

30

7,56

5.39

4.51

4.02

3.70

3.47

330

3.17

3.07

2,98

2.84

2.70

2.55

2.47

2.39

2.30

2.21

2.11

2.01

40

7.31

5.18

4.31

3.83

3.51

3.29

3.12

2,99

2.89

2.B0

2.66

2,52

2.37

2.29

2.20

2,11

2.02

1.92

1.80

60

7.0S

4.98

4.13

3.65

3.34

3.12

2.95

2.82

2.72

2.63

2.50

2.35

2.20

2.12

2.03

1.94

1.84

1.73

1.60

120
00

6.85

4.79

3.95

3.48

3,17

2.96

2.79

2,66

2.56

2.47

2.34

1.95

1.S6

1.76

1.66

1.53

1,38

4.61

3,78

3.32

3.02

2.80

2.64

2,51

2.41

2,32

2.18

2.19
2.04

2.03

6.63

1.88

1.79

1.70

1.59

1.47

1.32

1.00

APENDICE

C u r v a s d e o p e r a c i n c a r a c t e r s t ic a p a r a e l a n lis is d e v a r ia n z a d e l m o d e lo c o n e f e c t o s f ijo s

1.00

wwwvw
WVWVWX^H
m w w vM

K iW U W V H

BAVM VW W

1.00

U pa ra a - ,01)

i, = grados de libertad dal n um erador.

<

v2 -

<t (para o = .05)


3

grados de libertad del denom inador.

"Adaptada con permiso de Biometrika Tables for Statisticians, vol. 2, E.S. Pearson y H.O. Hartley, Cambridge
University Press, Cambridge

647

648

APNDICE
V. Curvas de operacin caracterstica para el anlisis de varianza
del modelo con efectos fijos (continuacin)
1,00

4>{pa r s a - .01)

1.00

< |)(p a ra a = .01)

A P N D IC E

649

650

APNDICE

Probabilidad de aceptar las hiptesis

V. Curvas de operacin caracterstica para el anlisis de varianza


del modelo con efectos fijos (continuacin)

Probabilidad de aceptar fas hiptesis

m (p a r a = .0 1 )--" >

3 <
1

4> (para a .05)


2

APENDICE
V L

C u r v a s d e o p e r a c i n c a r a c t e r s t ic a p a r a e l a n lis is d e v a r ia n z a
d e l m o d e lo c o n e f e c t o s a le a t o r io s 3

10

X (para

X ( p a r a a = .01)

a=

.05)

190

1.00

X (p a ra a = .0 1 )-

13

15

17

19

23

11

13

15

19

X (para
21

23

a=

.05)
25

Reproducida con permiso de Engineering Statistics, 2a. ed A.H. Bowker y G.J. Lieberman, Prentice-Hall,
Inc., Englewood Cliffs, NJ.

651

652

APENDICE

VI.

Curvas de operacin caracterstica para el anlisis de varianza del


modelo con efectos aleatorios (continuacin)

1.00

-a

2
O-

3l (para

1
a-

2
.01 )

1.00

1
2
3
(p ara i/ - .01)

<
10

X (para a = .05)
11

12

13

APNDICE
V I.

C urvas d e op eracin caracterstica para el anlisis de varianza del


m o d e lo c o n efe c to s aleatorios (continuacin )

1.00

X (p a ra

a = .0 1 )-

6
1

A, (para a = .05)

10

1.00

7 - * - U p a ra

M p a r a a = , 0 5 ) *- 1

a = .0 1 )
5

653

654

APNDICE
C urvas d e op eracin caracterstica para e l anlisis de varianza d el
m o d e lo c o n efe c to s aleatorios (continuacin )

Probabilidad de aceptar las hiptesis

V I.

X (p a ra a = ,05)

Probabilidad

de aceptar las hiptesis

M p a ra a = .0 1 )

APNDICE
V IL

R a n g o s s ig n if ic a t iv o s p a r a la p r u e b a d e l r a n g o m lt ip le d e D u n c a n

To .pi ( 31 / )

P
f

90.0

90.0

90.0

90.0

90.0

14.0

14.0

14.0

14.0

14.0

90.0

90.0

14.0

14.0

10

20

50

100

90.0

90.0

90.0

90.0

90.0

14.0

14.0

14.0

14.0

14.0

8.26

8.5

8.6

8.7

8.8

8.9

8,9

9.0

9.0

9.3

9.3

9.3

6.51

6.8

6.9

7.0

7.1

7.1

7.2

7.2

7.3

7.5

7.5

7.5

5.70

5.96

6.11

6.18

6.26

6.33

6.40

6.44

6,5

6.8

6.8

6.8

5.24

5.5t

5.65

5.73

5.81

5.88

5.95

6.00

6,0

6.3

6.3

6.3

4.95

5.22

5.37

5.45

5.53

5.61

5.69

5.73

5.8

6.0

6.0

6.0

4.74

5.00

5.14

5.23

5.32

5.40

5.47

5.51

5.5

5.8

5.8

5.8

4.60

4.86

4.99

5.08

5.17

5.25

5.32

5.36

5.4

5.7

5.7

5.7

10

4.48

4.73

4.88

4.96

5.06

5.13

5.20

5.24

5.28

5.55

5,55

5 .5

11

4.39

4.63

4.77

4.86

4.94

5.01

5.06

5.12

5.15

5.39

5.39

5.39

12

4.32

4.55

4.68

4.76

4.84

4.92

4.96

5.02

5.07

5.26

5.26

5.26

13

4.26

4.48

4.62

4.69

4.74

4.84

4.88

4.94

4.98

5.15

5.15

5.15

14

4.21

4.42

4.55

4.63

4,70

4,78

4.83

4.87

4.91

5.07

5.07

5.07

15

4.17

4.37

4.50

4.58

4.64

4.72

4.77

4.81

4.84

5.00

5.00

5.00

16

4.13

4.34

4.45

4.54

4.60

4.67

4.72

4.76

4.79

4.94

4.94

4.94

17

4.10

4.30

4.41

4.50

4.56

4.63

4.68

4.73

4.75

4.89

4.39

4.89

18

4.07

4.27

4.38

4.46

4,53

4.59

4.64

4.68

4.71

4.85

4.85

4,85

19

4.05

4.24

4.35

4.43

4.50

4.56

4.61

4.64

4.67

4.82

4.82

4.82

20

4.02

4.22

4.33

4.40

4.47

4.53

4.58

4.61

4.65

4.79

4.79

4.79

30

3.89

4.06

4.16

4.22

4.32

4.36

4.41

4.45

4.48

4.65

4,71

4.71

40

3.82

3.99

4.10

4.17

4.24

4.30

4.34

4.37

4.41

4.59

4.69

4.69

60

3.76

3.92

4.03

4.12

4.17

4.23

4.27

4.31

4.34

4.53

4.66

4.66

100
00

3.71

3.86

3,98

4.06

4.11

4,17

4.21

4.25

4.29

4.48

4.64

4.65

3.64

3.80

3.90

3.98

4.04

4.09

4.14

4.17

4.20

4.41

4.60

4.68

f = grados de libertad
Reproducida con permiso de Multiple Range and Multiple F Tests, D.B. Duncan, Biometrics,
vol. 1, no. 1, pp. 1-42
T0.05(Pt f)

P
/
1

10

20

50

100

18.0

18.0

18.0

18.0

18.0

18.0

18.0

18.0

18.0

18.0

18.0

18.0

6.09

6.09

6.09

6.09

6,09

6.09

6.09

6.09

6.09

6.09

6.09

6.09

4.50

4.50

4.50

4.50

4.50

4.50

4 J0

4.50

4.50

4.50

4.50

4 J0

3,93

4.01

4.02

4.02

4.02

4.02

4.02

4.02

4.02

4.02

4.02

4,02

3.64

3.74

3.79

3.83

3.83

3.83

3.83

3.83

3.83

3.83

3,83

3.83

3.46

3.58

3.64

3.68

3.68

3.68

3.68

3.68

3.68

3.68

3.68

3.68

3.35

3.47

334

3.58

3.60

3.61

3.61

3.61

3.61

3.61

3.61

3.61

3.26

3.39

3.47

3.52

3.55

3.56

3.56

3.56

3 J6

3.56

3.56

3.56

3.20

3.34

3.41

3.47

3.50

3.52

3.52

3.52

3.52

3.52

3 J2

3.52

10

3.15

3.30

3.37

3.43

3.46

3.47

3/47

347

3.47

3.48

3.48

3.48

11

3.11

3.27

3.35

3.39

3.43

3.44

3.45

3.46

3.46

3.48

3.48

3.48

12

3.08

3.23

3.33

3.36

3.40

3.42

3.44

3.44

3.46

3.48

3.48

3.48

13

3.06

3.21

3.30

3.35

3.38

3.41

3.42

3.44

3.45

3.47

3.47

3.47

14

3.03

3.18

3.27

3.33

3.37

3.39

3.41

3.42

3.44

3.47

3.47

3.47

15

3.01

3.16

3.25

3.31

3.36

3.38

3.40

3.42

3.43

3.47

3.47

3.47

16

3.00

3.15

3.23

3.30

3.34

3.37

3.39

3.41

3.43

3.47

3.47

3.47

17

2.98

3.13

3.22

3.28

3.33

3.36

3.38

3.40

3.42

3.47

3.47

3.47

18

2.97

3.12

3.21

3.27

3.32

3.35

3.37

3.39

3.41

3.47

3.47

3.47
3.47

19

2.96

3.11

3.19

3.26

3.31

3.35

3.37

3.39

3.41

3.47

3.47

20

2.95

3.10

3.18

3.25

3.30

3.34

3.36

3.38

3.40

3.47

3.47

3.47

30

2.89

3.0*

3.12

3.20

3.25

3.29

3.32

3.35

3.37

3.47

3.47

3.47

40

2.86

3.01

3.10

3.17

3.22

3,27

3.30

3.33

3.35

3.47

3.47

3.47

60

2.83

2.98

3.08

3.14

3.20

3.24

3.28

3.31

3.33

3.47

3.48

3.48

100
oc

2.80

2.95

3.05

3.12

3.18

3.22

3.26

3.29

3.32

3.47

3.53

3.53

2.77

2.92

3.02

3.09

3.15

3.19

3.23

3.26

3.29

3.47

3.61

3.67

655

656

VUL

Puntos porcentuales del estadstico del rango studentizado

o .01 ( t i / )

P
2

1 90.0
2 14.0
3
8.26
4
6.51
5
5.70

3
135
19.0
10.6
8.12
6.97

4
164
22.3
12.2
9.17
7.80

6
7
8
9
10

5.24
4.95
4.74
4.60
4.48

6.33
5.92
5.63
5.43
5.27

7.03
6.54
6.20
5.96

11
12

5.14
5.04

13
14
15

4.39
4.32
4.26
4.21
4.17

16
17
18
19
20

4.13
4.10
4.07
4.05
4.02

4.78
4.74
4.70

24
30
40
60
120
00

3.89
3.82
3.76
3.70
3.64

3.96

4.96
4.89
4.83

5
186
24.7
13.3
9.96
8.42

8.32

6.63

7.68
7.24

5.77

6.35
6.14

6.66
6.43

6.91
6.67

5.62

5.97

6.25

5.50
5.40
5.32
5.25

5.84
5.73
5.63
5.56

6.10
5.98
5.88
5.80

6.48
6.32
6.19
6.08
5.99

5.49

5.72
5.66
5.60
5,55
5.51
5.37
5.24
5.11
4,99
4.87

4.67
4,64

5.09
5.05
5.02

5.43
5.38
5.33
5.29

4.54
4.45
4.37
4.28
4.20
4.12

4.91
4.80
4.70
4.60
4.50
4.40

5.17
5.05
4.93
4.82
4.71
4.60

216
202
227
26.6
28.2
29.5
14.2
15.0
15.6
10.6 . 11.1
11,5
8.91
9.32
9.67
7.97
7.37
6.96

5.19
5.14

7.56
7.01

4.76

9
237
30.7
16.2
11.9
9.97

8.61
7.94
7.47
7.13
6.87

8.87
8.17
7.68

6.67

6.84

6.51
6.37
6.26
6.16

6.67
6.53
6.41
6.31

5.92
5.85
5,79
5.73
5.69.

6.08

5.54

5.69
5.54
5.39
5.25
5.12
4.99

5.40
5.27
5.13
5.01
4.88

6M
5.94
5.89
5.84

10
246
31.7
16.7
12,3
10.24

11
253
32.6
17.1
12.6
10.48
9.30
8.55

12
260
33.4
17.5
12.8
10.70

9.10
8.37
7.87
7.49
7.21

8.03
7.65
7.36

6.99
6.81

7.13
6.94

6.67
6.54
6.44

6.79
6.66
6.55

6.22
6.15
6.08
6.02

6.35
6.27
6.20
6.14

5.97

6.09

6.46
6.38
6.31
6.25
6.19

. 6.34
6.29

5.81
5.65
5.50
5.36
5.21
5.08

5.92
5.76
5.60
5.45
5.30
5.16

6.02
5.85
5.69
5.53
5.38
5.23

5.93
5.77
5.60
5.44
5.29

7.32
7.05

13
266
31.4
17.9
13.1
10.89

9.49
8.71
8.18
7.78
7,48

9.65
8.86

14
272
34.8
18.2
13.3
11.08

15

16

272
282
286
35,4
36.0
36.5
18.5
18.8
19.1
13.5
13.7
13.9
11.24
11.40
11.55

8.31

9.81
9.00
8,44

9.95
9.12
8.55

10.08
9.24
8.66

7.91
7.60

8.03
7.71

8.13
7.81

8.23
7.91

7.25
7.06
6.90
6.77
6.66

7.36
7.17
7.01
6.87
6.76

7.46
7.26
7.10
,6.96
6.84

7.56
7.36
7.19
7.05
6.93

7.65
7.44
7.27
7.12
7.00

6.56
6.48
6.41

6.66
6.57

6.74
6.66
6.58
6.51
6.45

6.82
6,73
6.65
6.58
6.52

6.80
6.72
6.65
6.59

6.26
6.08
5.90
5.73
5.56
5.40

6.33
6.14
5.%

6.11

6.50
6.43
6.37
6.19
6.01
5.84
5.67
5.51
5.35

17

5.79
5.61
5.45

6.90

6.39
6.20
6.02
5.84
5.66
5,49

18
290
37.0
19.3
14.1
11.68

10.21

10.32

9,35
8.76
8.32
7,99

9.46
8.85
8.41
8.07

7.73
7,52

7.81

7.34
7.20
7.07
6.97
6.87
6.79
6.72
6.65
6.45
6.26
6.07
5.89
5.71
5.54

7.59
7.42
7.27

19
294
37.5
19 J
14.2
11.81
10.43
9.55
8.94
8.49
8.15
7.88
7.66
7.48

20
298
37.9
19.8
14.4
11.93
10.54
9.65
9.03
8.57
8.22
7.95
7.73
7.55
7.39
7.26

7.14

7.33
7.20

7.03
6.94
6.85
6.78
6.71

7.09
7.00
6.91
6.84
6.76

7.15
7.05
6.96

6.51
6.31
6.12
5.93
5.75
5,57

6.56
6.36

6.61
6.41

6.17
5.98
5.79
5.61

6.21
6.02

6.89
6.82

5.83
5.65

/ = grados de libertad
"De J.M. May, "Extended and Corrected Tables of the Upper Percentage Points of the Studentized Range, Biometrika, vol. 39, pp. 192-193. Reproducida con permiso de los fideicomisa
rios de Biometrika

V n L

P u n t o s p o r c e n t u a le s d e l e s t a d s t ic o d e l r a n g o s t u d e n t iz a d o

__________________________________________ ^ 0 .0 5

{continuacin)

(P* f )

P
2

10

11

12

13

14

15

16

17

18

19

20

1
2

18.1
6.09

26.7
8.28

32.8

37.2

43.1

45.4

15.65
10.52

15.91
10.69

58.0
16.36
10.98

8.03
7.17

8.67
7.72

8.80
7.83

57.2
16.14
10.84
8.92
7.93

9.03
8.03

58.8
16.57
11.12
9.14
8.12

59.6
16.77

5.88
5.00
4.60

15.08
10.16
8.37
7.47

54.3
15.38
10.35
8.52
7.60

56.3

4.50
3.93

51.9
14.75
9.95
8.21
7.32

55.4

13.03
8.85
7.35
6.58

50.6
14.39
9.72

53.2

12.43

47.3
13.54
9.18
7.60
6.80

49.1

3
4
5

40.5
11.73
8.04
6.73
6.03

6
7
8
9
10

3.46
3.34

6.65
6.29

6.79
6.42

6.92
6.54

7.04
6.65

6.18
5.98
5.83

6.29
6.09

6.39
6.19
6.03

7.24
6.84
6.57
6.36
6.20

7.34
6.93
6.65
6.44

7.43
7.01
6.73
6.51
6.34

7.51
7.08
6.80
6.58
6.41

7.59
7.16

6.05
5.87
5.72

7.14
6.75
6.48
6.28
6.12

6.87
6.65
6.47

5.61
5.51

5.71
5.61
5.53
5.46
5.40

5.90
5.80
5.71
5.64

5.98
5.88
5.79
5.72

6.06
5.95

5.43
5.36
5.31

5.81
5.71
5.63
5.56
5.49

6.20
6.09
6.00

5.57

5.65

6.14
6.02
5.93
5.86
5.79

6.27
6.15
6.06
5.98
5.91

6.33
6.21
6.11
6.03
5.96

5.35
5.31
5.27

5.44
5.39
5.35

5.52
5.47
5.43

5.59
5.55
5.50
5.46
5.43

5.73
5.68
5.63
5.59
5.56

5.79
5.74

5.84
5.79
5.74
5.70
5.66

5.90
5.84
5.79

0\

Ln

<i

3.64

3.26
3.20
3.15

11
12
13
14
15

3.11
3.08
3.06
3.03

16
17
18
19

3.00

3.01

4.34
4.16
4.04
3.95
3.88
3.82
3.77
3.73
3.70
3.67

9.80
6.83
5.76
5.22

10.89
7.51
6.31

4.90
4.68
4.53
4.42

5.31
5.06
4.89
4.76
4.66

5.63
5.35
5.17
5.02

5.89
5.59
5.40
5.24

4.91

4.08

4.58
4.51
4.46
4.41
4.37

4.33
4.26
4.20
4.15
4.11

5.67

5.77
5.60

5.12

5.46

4.82
4.75
4.69
4.64
4.59

5.03
4.95
4.88
4.83
4.78

5.20
5.12
5.05
4.99
4.94

5.35
5.27
5.19
5.13
5.08

5.49
5.40
5.32
5.25
5.20

4.74
4.70
4.67
4.64
4.62

4.90
4.86
4.83
4.79
4.77

5.03
4.99
4.96
4.92
4.90

5.15
5.11
5.07
5.04
5.01

5.26
5.21
5.17
5.14
5.11

5.23
5.20

5.32
5.28

5.39
5.36

4.54
4.46
4.39
4.31
4.24

4.68
4.60
4.52
4.44
4.36
4.29

4.81
4.72
4.63

4.92
4.83
4.74
4.65
4.56
4.47

5.10
5.00
4.90
4.81
4.71
4.62

5.18
5.08
4.98

4.55
4.47
4.39

5.01
.4 .9 2
4.82
4.73
4.64
4.55

5.25
5.15
5.05
4.94
4.84
4.74

4.05
4.02

4.34
4.31

4.56
4.52

20

2.97
2.96
2.95

3.61
3.59
3.58

4.00
3.98
3.96

4.28
4.26
4.24

4.49
4.47
4.45

24
30
40
60
120
00

2.92
2.89
2.86
2.83
2.80
2.77

3.53

3.90
3.84
3.79
3.74
3.69
3.63

4.17
4.11
4.04

4.37

3.98
3.92
3.86

6.32
5.99

6.49
6.15
5.92
5.74
5.60

3,65
3.62

3.40
3.36
3.32

6.12
5.80
5.60
5.43
5.30

2.98

3.48
3.44

8.47
7.06
6.33

13.99
9.46
7.83
6.99

4.30
4.23
4.16
4.10
4.03

4.17

5.93

4.88
4.78
4.68

5.32
5.21
5.11
5.00
4.90
4.80

5.86
5.79
5.72
5.66
5.61
5.57
5.53
5.50
5.38
5.27
5.17
5.06
4.95
4.84

6.27

5.44
5.33
5.22
5.11
5.00
4.98

5.92
5.85

5.69
5.65
5.61
5.50
5.38
5.27
5.15
5.04
4.93

5.55
5.43
5.32
5.20
5.09
4.97

11.24
9.24
8.21

5.75
5.71
5.59
5.48
5.36
5.24
5.13
5.01

658

APNDICE

IX.

V a lo r e s c r t ic o s p a r a l a p r u e b a d e D u n n e t t p a r a c o m p a r a r t r a t a m ie n t o s c o n u n c o n t r o l0

o.os-1 /)
C o m p a r a c io n e s d e d o s c o la s

a -l
1

n m e r o d e m e d ia s d e t r a t a m ie n t o s ( s in in c lu ir e l c o n t r o l)
3

2 .5 7

3 .0 3

3 .2 9

3 .4 8

3 .6 2

3 .7 3

3 .8 2

3 .9 0

3 .9 7

2 .4 5

2 .8 6

3 .1 0

3 .2 6

3 .3 9

3 .4 9

3 .5 7

3 .6 4

3 .7 1

2 .3 6

2 .7 5

2 .9 7

3 .1 2

3 .2 4

3 .3 3

3 .4 1

3 .4 7

3 .5 3

2 .3 1

2 .6 7

2 .8 8

3 .0 2

3 .1 3

3 .2 2

3 .2 9

3 .3 5

3 .4 1

2 .2 6

2 .6 1

2 .8 1

2 .9 5

3 .0 5

3 .1 4

3 .2 0

3 .2 6

3 .3 2

10

2 .2 3

2 .5 7

2 .7 6

2 .8 9

2 .9 9

3 .0 7

3 .1 4

3 .1 9

3 .2 4

11

2 .2 0

2 .5 3

2 .7 2

2 .8 4

2 .9 4

3 .0 2

3 .0 8

3 .1 4

3 .1 9

12

2 .1 8

2 .5 0

2 .6 8

2 .8 1

2 .9 0

2 .9 8

3 .0 4

3 .0 9

3 .1 4

13

2 .1 6

2 .4 8

2 .6 5

2 .7 8

2 .8 7

2 .9 4

3 .0 0

3 .0 6

3 .1 0

14

2 .1 4

2 .4 6

2 .6 3

2 .7 5

2 .8 4

2 .9 1

2 .9 7

3 .0 2

3 .0 7

15

2 .1 3

2 .4 4

2 .6 1

2 .7 3

2 .8 2

2 .8 9

2 .9 5

3 .0 0

3 .0 4

16

2 .1 2

2 .4 2

2 .5 9

2 .7 1

2 .8 0

2 .8 7

2 .9 2

2 .9 7

3 .0 2

17

2 .1 1

2 .4 1

2 .5 8

2 .6 9

2 .7 8

2 .8 5

2 .9 0

2 .9 5

3 .0 0

18

2 .1 0

2 .4 0

2 .5 6

2 .6 8

2 .7 6

2 .8 3

2 .8 9

2 .9 4

2 .9 8

19

2 .0 9

2 .3 9

2 .5 5

2 .6 6

2 .7 5

2 .8 1

2 .8 7

2 .9 2

2 .9 6

20

2 .0 9

2 .3 8

2 .5 4

2 .6 5

2 .7 3

2 .8 0

2 .8 6

2 .9 0

2 .9 5

2 .7 6

2 .8 1

2 .8 6

2 .9 0

2 .7 2

2 .7 7

2 .8 2

2 .8 6

2 .7 3

2 .7 7

2 .8 1

2 .6 9

2 .7 3

2 .7 7

24
30
40

2 .0 6
2 .0 4
2 .0 2

2 .3 5
2 .3 2
2 .2 9

2 .5 1
2 .4 7
2 .4 4

2 .6 1
2 .5 8
2 .5 4

2 .7 0
2 .6 6
2 .6 2
2 .5 8

2 .6 8
2 .6 4

60

2 .0 0

2 .2 7

2 .4 1

2 .5 1

12 0

1.9 8

2 .2 4

2 .3 8

2 .4 7

2 .5 5

2 .6 0

2 .6 5

2 .6 9

2 .7 3

2 .4 4

2 .5 1

2 .5 7

2 .6 1

2 .6 5

2 .6 9

oo

1.9 6

2 .2 1

2 .3 5

f - grados de libertad
Reproducida con permiso de C.W. Dunnett, New Tables for Multiple Comparison with a Control,
Biometrics, vol. 20, no. 3, y de C.W. Dunnett, A Multiple Comparison Procedure for Comparing Several
Treatments with a Control, Journal of the American Statistical Association, vol. 50

APNDICE
IX .

V a lo r e s c r t ic o s p a r a l a p r u e b a d e D u n n e t t p a r a c o m p a r a r t r a t a m ie n t o s c o n u n c o n t r o l"

do.oi(a 1j /)
C o m p a r a c io n e s d e d o s c o la s

(continuacin)

a - 1 = nm ero de m edias de tratam ien to s (sin incluir el control)


1

7
8
9

4.03
3.71
3.50
3.36
3.25

4.63
4.21
3.95
3.77
3.63

4,98
4.51
4.21
4.00
3.85

5.22
4,71
4.39
4.17
4.01

5.41
4.87
4.53
4.29
4.12

5.56
5.00
4.64
4.40
4,22

5.69
5.10
4.74
4.48
4.30

5.80
5.20
4.82
4.56
4.37

5.89
5.28
4,89
4.62
4.43

10
11
12
13
14

3.17
3.11
3.0S
3.01
2.98

3.53
3.45
3.39
3.33
3.29

3.74
3,65
3.58
3.52
3.47

3.88
3.79
3.71
3.65
3.59

3.99
3.89
3.81
3.74
3.69

4.08
3.98
3.89
3.82
3.76

4.16
4.05
3.96
3.89
3.83

4,22
4.11
4.02
3.94
3.88

4.28
4.16
4.07
3.99
3,93

15
16
17
18
19

2.95
2.92
2.90
2.88
2.86

3.25
3.22
3.19
3.17
3.15

3,43
3.39
3.36
3.33
3.31

3.55
3.51
3.47
3.44
3.42

3.64
3.60
3.56
3.53
3.50

3.71
3.67
3.63
3.60
3.57

3.78
3.73
3.69
3.66
3.63

3.83
3.78
3,74
3.71
3.68

3.88
3.83
3.79
3.75
3.72

20
24
30
40
60

2.85
2.80
2.75
2.70
2.66

3.13
3.07
3.01
2.95
2.90

3.29
3.22
3.15
3.09
3.03

3.40
3.32
3.25
3.19
3.12

3.48
3.40
3.33
326
3.19

3.55
3.47
3.39
3.32
3.25

3.60
3.52
3.44
3.37
3.29

3.65
3,57
3.49
3.41
3.33

3.69
3.61
3.52
3.44
3.37

120

2.62
2.58

2.85
2.79

2.97
2.92

3.06
3.00

3.12
3.06

3.18
3.11

3,22
3.15

3.26
3.19

3,29
3.22

/
5

^0.05 - 1 . / )
Comparaciones de una cola
a - 1 = nm ero de m edias de tratam ien to s (sin in cluir el control)
1

5
6
7
8
9

2.02
1.94
1.89
1.86
1.83

2.44
2.34
2.27
2.22
2.18

2.68
2.56
2.48
2.42
2.37

2.85
2.71
2.62
2.55
2.50

2.98
2.83
2.73
2.66
2.60

3.08
2.92
2.82
2.74
2.68

3.16
3.00
2.89
2.81
2.75

3.24
3.07
2.95
2.87
2.81

3.30
3.12
3,01
2.92
2.86

10
11
12
13
14

1.81
1.80
1.78
1.77
1.76

2.15
2.13
2.11
2.09
2.08

2.34
2.31
2.29
2.27
2.25

2.47
2.44
2.41
2.39
2.37

2.56
2.53
2.50
2.48
2.46

2.64
,2.60
2.58
2.55
2,53

2.70
2.67
2.64
2.61
2.59

2.76
2.72
2.69
2.66
2.64

2.81
2.77
2.74
2.71
2.69

15
16
17
18
19

1.75
1.75
1.74
1.73
1.73

2.07
2.06
2.05
2.04
2.03

2,24
2.23
2.22
2.21
2.20

2.36
2.34
2.33
2,32
2.31

2.44
2.43
2.42
2.41
2.40

2.51
2.50
2.49
2.48
2.47

2.57
2.56
2.54
2-53
2.52

2.62
2.61
2.59
2.58
2.57

2.67
2.65
2.64
2.62
2.61

20
24
30
40
60

1.72
1.71
1.70
1.68
1.67

2.03
2.01
1.99
1.97
1.95

2.19
2.17
2.15
2.13
2.10

2.30
2.28
2.25
2.23
2.21

2.39
2.36
2.33
2.31
2.28

2.46
2.43
2.40
2.37
2.35

2.51
2.48
2.45
2.42
139

2.56
2.53
2.50
2.47
2.44

2.60
2.57
2.54
2.51
2.48

120

1.66
1.64

1.93
1.92

2.08
2.06

2.18
2.16

2.26
2.23

232
2.29

2.37
2,34

2.41
2.38

2.45
2.42

659

660

APNDICE
IX .

V a lo r e s c r t ic o s p a r a l a p r u e b a d e D u n n e t t p a r a c o m p a r a r t r a t a m ie n t o s c o n u n c o n t r o l
o

,01( a

f)

C o m p a r a c i o n e s d e u n a c o l a ( con tin u aci n )

- 1

n m e r o d e m e d ia s d e t r a t a m ie n t o s ( s in i n c l u i r e l c o n t r o l)

5
6
7
8
9

3.37
3.14
3.00
2.90
2.82

3.90
3.61
3.42
3.29
3.19

4.21
3.88
3.66
3.51
3.40

4.43
4.07
3.83
3.67

4.60
4.21
3.96
3.79
3.66

4.73
4.33
4.07
3.88
3.75

4.85
4.43
4.15
3.96
3.82

4.94
4.51
4.23
4.03
3.89

5.03
4.59
4.30
4.09
3.94

10
11
12

3.11
3.06

3.45
3.38
3.32
3.27
3.23

3.71
3.63
3.56

3.37
3.32

3.64
3.56
3.50
3.44
3.40

3.51
3.46

3.78
3.69
3.62
3.56
3.51

3.83
3.74

3.01
2.97
2.94

3.31
3.25
3.19
3.15
3.11

3.56
3.48
3.42

13
14

2.76
2.72
2.68
2.65
2.62

3.67
3.61
3.56

15
16
17
18
19

2.60
2.58
2.57
2.55
2.54

2.91
2.88
2.86
2.84
2.83

3.08
3.05
3.03
3.01
2.99

3.20
3.17
3.14
3.12
3.10

3.29
3.26
3.23
3.21
3.18

3.36
3.33
3.30
3.27
3.25

3.42
3.39
3.36
3.33
3.31

3.47
3.44
3.41
3.38
3.36

3.52
3.48
3.45
3.42
3.40

20
24
30
40
60

2.53
2.49
2.46
2.42
2.39

2.81
2.77
2.72
2.68
2.64

2.97
2.92
2.87
2.82
2.78

3.08
3.03
2.97
2.92
2.87

3.17
3.11
3.05
2.99
2.94

3.23
3.17
3.11
3.05
3.00

3.29
3.22
3.16
3.10
3.04

3.34
3.27
3.21
3.14
3.08

3.38
3.31
3.24
3.18
3.12

120

2.36
2.33

2.60
2.56

2.73
2.68

2.82
2.77

2.89
2.84

2.94
2.89

2.99
2.93

3.03
2.97

3.06
3.00

00

3.55

X.
n

__________ XJ
1

P'

p2

- 1

- 2

_____________________ n

p>

p2

- 3

- 1

- 1

Coeficientes de polinomios ortogonales

- 1

^
- 1
3
- 3

2
- 1

- 2

- 1

- 2

PA

- 1

5 ______________

P*

- 2

Pt

- 4

P,

- 4

42

- 4

- 4 2

- 1

- 7
5

/>,

P4

- 5

- 1

- 1

- 4

P*

- 3
6

P2

- 5

- 1

- 3

10

2 0

4 2 0

10

14

10

1 __________ ^ _________ 1

70

*__________ *__________ *

- 5
1

[P.iX ,)}2

P2

Pi

J*

-7
-5
-3
-1
1
3
5
7

7
1
-3
-5

-7
5
7
3
-3
-7
-5
7

7
-1 3
-3

168

168

264

12

84

18 0

^5
2

.1

28

12

2 52
I

10

n = 9

P,

-5
-3
1
7

70

n = 8

9
9
-3
-1 3
7

616

P6
-7
23
-1 7
-1 5
15
17
-2 3
7

2184

1
-5
9
-5
-5
9
-5
1

264

-4
-3
-2
-1
0
1
2
3
4

60

28
7
-8
-1 7
-2 0
-1 7
-8
7
28

2772

P,

P4

P,

14
-2 1
-1 1
9
18
9
-1 1
-2 1
14

-4
11
-4
-9
0

990

2002

P4

- 1

P,

3
1

- 7

9
4
-1 1

- 4

- 3

28

- 1
0

- 1

- 7

- 4

468

15
- 6

84

15 4

84

924

i
1

P:

P2

P3

P*

-9
-7
-5
-3
-1

-4 2
14
35
31
12

5
7
9

6
2
-1
-3
-4
-4
-3
-1
2
6

-1 2
-3 1
-3 5
-1 4
42

18
-2 2
-1 7
3
18
18
3
-1 7

330

132

8580

Adaptada con permiso de Biometrika Tables for Statisticians, vol. 1 ,3a. ed., E.S. Pearson y H.O. Hartley, Cambridge University Press, Cambridge

15
-2 0

4
-1 7
22
1
-2 0
1
22
-1 7
4

1980

- 6

/>6

1
3

- 3

P6

- 1

2.

12

20

w = 10

-1 4
7
13
9
0
-9
-1 3
-7
14

/>,

j-i

- 2
- 1

- 3

P2
5

10

Xj
1
2
3
4
5
6
7
8
9
10

Pi
- 3

P*
-6
14
-1
-1 1
-6

-2 2
18

6
11
1
-1 4
6

2860

780

3
-1 1
10
6
-8
-8
6
10
-1 1
3
660

77
60

661

662

APNDICE

XL Nmeros aleatorios0
10480
22368
24130
42167
37570
77921
99562
96301
89579
85475

15011
46573
48360
93093
39975
06907
72905
91977
14342
36857

01536
25595
22527
06243
81837

02011
85393
97265
61680
16656

87647
30995
76393
07856
06121

91646
89198
64809
16376
91782

69179
27982
15179
39440
60468

14194
53402
24830
53537
81305

62590
93965
49340
71341
49684

11008
56420

42751
69994
07972
10281
53988

27756
98872
18876
17453
53060

53498
31016
20922
18103
59533

18602
71194
94595
57740
38867

70659
18738
56869
84378
62300

90655
44013
69014
25331
08158

79936
69445
33488
52267
13976

56865
18663
36320
67689
47564

05859
72695
17617
93394
81056

90106
52180
30015
01511
97735

16308
19885
04146
14513

60756
55322
18594

06691

83149
76988

92144
44819
29852
98736
13602

49442
01188
71585
23495
51851

05463
63661
53342

28918
63553
09429
10365
07119

69578
40961
93969
61129
97336

88231

33276
03427
92737
85689
08178

70997

48235
52636
87529
71048

51085
02368
01011
52162
07056

12765
21382
54092
53916
97628

51821
52404
33362
46369
33787

51259
60268
94904
58586
09998

77452
89368
31273
23216
42698

48663
54164

91245

85828

32639
29334
02488

58492
32363
27001
33062

22421
05597
87637
28834

14346
74103
24200
87308
07351

09172
47070
13363
58731
19731

30168
25306
38005
00256
92420

90229
76468
94342
45834
60952

04734
26384
28728
15398
61280

59193
58151
35806
46557
50001

81525
29676
00742
05366
91921

72295
20591
57392
04213
26418

04839
68086
39064
25669
64117

96423
26432
66432
26422
94305

24878
46901
84673
44407
26766

82651
20849
40027
44048
25940

66566
89768
32832
37937
39972

14778
81536
61362
63904
22209

76797
86645
98947
45766
71500

00582
00725

04711
69884

69011
25976
09763

65795
57948
83473

87917
62797
95876
29888
73577

77341
56170
55293
88604
12908

42206
86324
18988
67917
30883

35126
88072
27354
48708
18317

74087
76222
26575
18912
28290

99547
36086
08625
82271
35797

81817
84637
40801
65424
05998

91567
17955

42595
56349
18584
89634
62765

27958

30134
49127
49618
78171
81263

04024
20044
02304
84610
39667

86385
59931
51038
82834
47358

29880
06115
20655
09922
56873

99730
20542
58727
25417
56307

55536
18059
28168
44137
67607

46503
92157
14577

90999
18845
94824
35605

49626
88974
48237
77233

Reproducida con permiso de Probability and Statistics in Engineering and Management Science, 3a. ed., W.W.
Hines y D.C. Montgomery, Wiley, Nueva York

APNDICE

XII. Relaciones de alias para diseos factoriales fraccionados

663

con k < 15 y n 64

Diseos con 3 factores


a ) 2 3-1; fraccin 1/2

de
3 factores en 4 corridas

Resolucin I I I
Generadores del diseo
C = AB

Relacin de definicin:
Alias

A BC

A = B C
B = A C
C =A B

Diseos con 4 factores


b ) 2 41; fraccin 1/2

de
4 factores en 8 corridas

Resolucin IV
Generadores del diseo
D = A BC

Relacin de definicin:
Alias
A
B
C
D
A B
A C
A D

A BCD

= BCD
= A CD
=A B D
= A BC
= CD
= B D
= B C

Diseos con 5 factores


c)

2s-2; fraccin 1/4 de


5 factores en 8 corridas

Resolucin I I I
Generadores del diseo
D = A B

Relacin de definicin:

E = A C
ABD = A CE = B CD E

Alias
A
B
C
D
E
B C
CD

d) 25-1; fraccin 1/2 de


5 factores en 16 corridas

= BD = CE
= A D = C D E
= A E = BD E
= A B = B CE
= A C = BCD
= D E = A CD = A BE
= B E - A B C = A D E

Resolucin V
Generadores del diseo
E

ABCD

Relacin de definicin: / = A B C D E
Alias
Cada efecto principal es alias de una sola interaccin de 4 factores
AB =
A C =
A D =
A E =
B C =

CD E
BD E
B CE
BCD
A D E

BD
B E
CD
CE
D E

-=
=
=
=

A
A
A
A
A

bloques de 8 :

CE
CD
BE
BD
BC

XU. Relaciones de alias para diseos factoriales fraccionados 2 - p con Je < 15 y n < 64 (continuacin)
Diseos con 6 factores
e)

R e s o lu c i n I I I

2 e -3 ; f r a c c i n 1 / 8 d e 6 f a c t o r e s
e n 8 c o r r id a s
G e n e r a d o r e s d e l d is e o

D = AB
E = A C
F
I = A BD = A CE - B CD E

R e la c i n d e d e f in ic i n :

=
=

BC
B CF = A CD F = A B EF = D EF

A lia s

A
B
C
D
f ) l y 1 ', f r a c c i
e n 16

=
=
=
=

BD = C E = CD F = B EF
AD = CF = CD E = A EF
A E = B F = BD E = A D F
AB = EF = B CE = A CF

E = A C = D F = BCD = A BF
F = B C = D E = A CD = A BE
CD = B E = A F = A B C = A D E

BD F

CEF

R e s o lu c i n I V

n 1 /4 d e 6 fa c to re s

c o r r id a s
G e n e r a d o r e s d e l d is e o

E = A B C
I

R e la c i n d e d e f in ic i n :

F = BCD
A BCE = BCD F

A D EF

A lia s

A
B
C
D
E
F
ABD
A CD
2

= B CE
= A CE
= A B E
= B CF
= A B C
= BCD
= C D E
= BD E

= D EF
= CD F
= B D F
= A E F
= A D F
= A D E
= A C F = BEF
= A BF = CEF

b lo q u e s d e 8 :

ABD = CD E

AB
A C
AD
A E
A F
BD
B F

= CE
= B E
= EF
= B C = D F
= D E
= C F
= CD

A CF

B EF

g)

2 6 1 ; f r a c c i n

1 /2 d e 6 fa cto re s

R e s o lu c i n V I

e n 3 2 c o r r id a s
G e n e r a d o r e s d e l d is e o

A BCD E
I

R e la c i n d e d e f in ic i n :

A BCD EF

A lia s
C a d a e fe c to p r in c ip a l e s a lia s d e u n a s o la in t e r a c c i n d e S fa c to r e s .
C a d a in t e r a c c i n d e 2 f a c to r e s e s a lia s d e u n a s o la in t e r a c c i n d e 4 fa c t o r e s

b lo q u e s d e

A B C = D EF
A BD = C E F
A BE = CD F
A BF = CD E
A CD = B EF
16 : A B C = D E F

A
A
A
A
A

C
C
D
D
E

E = BD F
F = BD E
E = B CF
F = B CE
F = BCD

4 b lo q u e s d e 8 :

AB = CD EF
A CD = BEF
A EF = BCD

_____________________________________________________________________________________________ D i s e o s c o n 7 f a c t o r e s _____________________________________________________________________________________________

h ) l 1-*',

f r a c c i n 1 / 1 6

d e 7 fa cto re s

R e s o lu c i n

e n 1 6 c o r r id a s
G e n e r a d o r e s d e l d is e f lo

R e la c i n d e d e f in ic i n :

D = AB
E = A C
F = B C
G = A BC
ABD = A CE = BCD E = B CF = A CD F = A BEF = D EF
=

CD G

B EG = A D EG

A lia s

A =
B =
C =
D =

BD
AD
A E
AB

=
=
=
=

CE
CF
BF
EF

=
=
=
=

FG
EG
D G
CG

A BCG

A FG = BD FG

E = A C = D F = BG
F = B C = D E = A G
G = CD = BE = A F

CEFG

A BCD EFG

HI

665

666
X n .

i)

2 M ; f r a c c i n 1 /8

R e L a c i o n e s d e a l i a s p a r a d i s e o s f a c t o r i a l e s f r a c c i o n a d o s 2 l f c o n

k <

15 y n <

64

(continuacin)

d e 7 fa c to re s

R e s o lu c i n I V

e n 1 6 c o r r id a s
G e n e r a d o r e s d e l d is e o

R e la c i n d e d e f in ic i n :

E = A BC
F = BCD
G
A BCE = BCD F = A D EF

=
=

A CD
A CD G

BD EG

A B FG = C E FG

A lia s

A = B CE = D E
B - A CE = CD
C = A B E = BD
D = B CF = A E

F
F
F
F

=
=
=

CD G = BFG
D EG = A FG
A D G = EFG
A CG = B EG

AB = CE = FG
A C = B E = D G
A D = E F = CG
A E = B C = D F

=CD
2 b lo q u e s d e 8 :

E = A CF

ABD

E = A BC = A D F = BD G = C F G
F = BCD = A D E = A BG = CEG
G = A CD = BD E = A BF = CEF

B EF

CD =

A C F

A F = D E = BG
A G = CD = BF
BD = C F = EG

BCG = AEG = flFG


B E F = CG = AEG = PFG
R e s o lu c i n I V

_ /) 2 7- 2 ; f r a c c i n 1 / 4 d e 7 f a c t o r e s
e n 3 2 c o r r id a s
G e n e r a d o r e s d e l d is e o

R e la c i n

de

F = A BCD
G = A BD E
d e f in ic i n :
I - A B CD F = A BD EG

CEFG

A lia s

A
B
C
D
E
F
G

=
=
=

EFG

=
CFG
= CEG
= C E F

AB
A C
A D
A E
A F
A G

= CD F = D EG
= BD F
= B C F = B E G
= BDG
= B C D
= BD E

2 b lo q u e s d e 1 6 :

A CE

B C
BD
B E
B F
B G
CD

=
=
=
=
=
=

A FG

A
A
A
A
A
A

D F
CF
D G
CD
D E
BF

A E G

CE = FG
= A B D = E G
CG = E F
D E = ABG
D F = A BC
D G = A BE
C E

4 b lo q u e s d e 8 :

A CE

5 C E

BFG

AB

C D F

A CE = A FG
A CG = A EF
B CE = FG
BCG = B EF
CD E = D FG
CD G = E F

A F G

D EG

k)

Resolucin VII

7- 1; fr a c c i n 1 /2 d e 7 fa c to r e s
e n 6 4 co rrid a s

Generadores del diseo


G = ABCDEF
Relacin de definicin: I = ABCDEFG
Alias
Cada efecto principal es alias de una sola interaccin de 6 factores
Cada interaccin de 2 factores es alias de una sola interaccin de 5 factores
Cada interaccin de 3 factores es alias de una sola interaccin de 4 factores
2 bloques de 32: ABC
4 bloques de 16: ABC
CEF
CDG
Diseos con 8 factores
/) 2 ^; fraccin

1/16 de 8 factores
en 16 corridas

Generadores del diseo


E = BCD F = ACD G = ABC H = ABD
Relacin de definicin: I = BCDE = ACDF = ABEF = ABCG = ADEG = BDFG = CEFG = ABDH
= ACEH = BCFH = DEFH = CDGH = BEGH = AFGH = ABCDEFGH
Alias
A = CDF = BEF = BCG = DEG = BDH = CEH = FGH
AB = EF = CG = DH
B = C D S = AEF = ACG = >FG = ADH = C fW = Gtf AC = DF = BG = E/
C = D = ADF = ASG = EFG = /4E/ = /7 / = DGH AD = CF = EG = BH
D = C = ACF = AEG = BFG = ABH = EFH = CGH
AE = BF = DG = CH
E = BCD = ABF = ADG = CFG = ACH = DF/ = BGH AF = CD = BE = GH
F = ACD = ABE = BDG = CEG = BCH = DEff = AG/ AG = BC = DE = FH
G = ABC = ADE = BDF = CEF = CDH = BEH = AFtf
AH = BD = CE = FG
H = ABD = ACE = BCF = DEF = CDG = BEG = AFG
2 bloques de 8 :AB = EF = CG = DH

Resolucin IV

667

668
XU.

R e la c io n e s d e a lia s p a r a d is e o s f a c t o r ia le s f r a c c io n a d o s 2 ^

con k

<

15 y n

<

64

(co ntinuacin)

m ) 2M; fraccin 1/8 de 8 factores


en 32 corridas
Generadores del diseo
F = ABC G = ABD H = BCDE
Relacin de definicin: 11 = ABCF = ABDG = CDFG = BCDEH = ADEFH = ACEGH = BEFGH
Alias
A = BCF = BDG
AE = DFH = CGH
DE = BCH = AFH
B = ACF = ADG
AF = BC = DEH
DH = BCE = AEF
C = ABF = DFG
A G = BD = CEH
EF = ADH = BGH
D = ABG = CFG AH = DEF = CEG
EG = ACH = BFH
E=
BE = CDH = FGH
EH = BCD = ADF = ACG = FG
F = ABC = CDG BH = CE = EFG
F// = ADF = BG
G = ABD = CDF
CD = FG = BEH
GH = ACE = BEF
H =
CE = BDH = AGH
ABE = CEF = DEG
AB = CF = D G
CG = DF = AEH
ABH = CFH = DGH
AC = BF = EGH
CH = jB D F = AEG
ACZ> = BDF = CG = AFG
AD = BG = EFH
2 bloques de 16: E = CEF = DEG
4 bloques de 8: ABE = CEF = DFG
A B // = CFH = DGH
F tf = BCD = /0 F = ACG = BFG

R e s o lu c i n I V

n ) 2 ^ 2; fr a c c i n 1 /4 d e 8 fa c to r e s

R e s o lu c i n V

e n 6 4 c o r r id a s

Generadores del diseo


G = A BCD
H = A B EF
I = A BCD G - A B EFH

Relacin de definicin:

CD EFG H

Alias
AB
A C
A D
A E
A F
AG
AH
BC
BD
BE
BF

= CD G = EFH
BDG
= B CG
= B F H
= B E H
= B C D
- BEF
= A D G
= A C G
= A F H
= A EH

BG = A CD
B H = A EF
CD = ABG
CE =

CF =
CG = ABD
CH =
D E =
D F =
D G = A BC
D H =

699

2 bloques de 32: C D

FG H

E F = A BH
EG =
EH = A B F
FG =
FH = A BE
G H =

ACE

ACtf =
j4D =
ADF =

A D H
A EG
A FG
A G H
B CE
B CF
B CH
BD E
BD F
BD H
B EG

4 bloques de 16: C D

=
=
=

BFG

=
=
=
=

CEH = D FG
CFG = D EH
C F H = DEG
CG H = D EF

=
=

E
A CF
BD H

AG// =
CDE = FG//
CDF = EGZ/
CD// = EFG
CEF = DG//
CE G = D F H

FG H

670

XU. Relaciones de alias para diseos factoriales fraccionados 2^ con c < 15 y n 5 64 (cantmiadn)
Diseos con 9 factores
o) 2s"5; fraccin 1/32 de 9 factores
Resolucin I
en 16 corridas
Generadores del diseo
E = ABC F = BCD G = ACD H = ABD S = ABCD
Relacin de definicin: I = ABCE = BCDF = ADEF = ACDG = BDEG = ABFG = CEFG = ABDH
= CDEH = ACFH = BEFH = BCGH = AEGH = DFGH = ABCDEFGH = ABCD]
= DEJ = AFJ BCEFJ = BGJ = ACEGJ = CDFGJ = ABDEFGJ = CHJ
= ABEHJ = BDFHJ = ABCDEFHJ = ADGHJ = BCDEFGHJ = ABCFGHJ = EFGHJ
Alias
A = FJ
B = GJ
C HJ
D = EJ
E = DJ
F = AJ
G BJ
H = CJ
J = DE = AF = BG = CH
AB = CE = FG = DH
AC = BE = DG = FH
AD = EF = CG = BH
AE = BC = DF = GH
AG = CD = BF = EH
AH =BD = CF = EG
2 bloques de 8 : AB = CE = FG = DH

p ) 2^; fraccin 1/16 de 9 factores

Resolucin IV

en 32 corridas
Generadores del diseo

F = BCDE G = ACDE H = ABDE J = ABCE


Relacin de definicin: I = BCDEF = ACDEG = ABFG = ABDEH = ACFH = BCGH = DEFGH = ABCEJ
= ADF/ = BDG/ = CEFGJ = CDHJ = BEFHJ = AEGHJ = ABCDFGHJ
Alias
A = BFG = CF// = DF/ AD = CFG = BE// = FJ
BJ = ACE = DG = EFH
B = AFG = CGH = DGJ AE = CDG = BDH = BCJ = GHJ
CD = BEF = AEG = HJ
C = AFH = BGH = DHJ AF = BG = CH = DJ
CE = BDF = ADG = ABJ = FGJ
D = AFJ = BGJ = CH]
AG = CDE = BF = EHJ
C7 = ABE = EFG = DH
E=
AH = BD = CF = G /
DE = BCF = ACG = ABH = FG/
F = ARG = /1C// = AD/ AJ - BCE = DF = EGH
EF = BCD = DG// = CGJ = BHJ
G = ABF = BC// = BDJ BC = DEF = GH = AE/
EG = ACD = DFH = CF/ = AHJ
H = ACF = BCG = CDJ BD = CEF = AEH =GJ
EH = ABD = DFG = BFJ = ^4G/
/ = ADF = BDG = CD// BE = CDF = AD// = ACJ = F ///
EJ = ABC = CFG = BFH = AG//
AB = FG = DEH = CE/
B// = ADF = CG = EFJ
AEF = BEG = CEH = DEJ
AC = DEG = FH= BEI
2 bloques de 16: AEF = BEG = CEH = DEJ

4 bloques de 8 :AEF = BEG = CEH = DEJ


A B -F G = DE// = CE/
CD = BEF = AEG = HJ

671

672
X n .

q)

2 M ; f r a c c i n 1 /8

R e la c io n e s d e a lia s p a r a d is e o s f a c t o r ia le s f r a c c io n a d o s 2 * ^ c o n

k <

15 y n

<

64

(continuacin) _________
R e s o lu c i n I V

d e 9 fa c to re s

e n 6 4 c o r r id a s
G e n e r a d o r e s d e l d is e o

R e la c i n d e d e f in ic i n :

G = A BCD
H
A BCD G = A CEFH

=
=

A CEF J = CD EF
B D EFG H = CD EFJ

A BEFG J = ADHJ

A lia s
= BDG =
AD = BCG =

A C

A = D H ]
B =
C =
D = A H J

A E = CFH
A F = CEH
A G = BCD

A H

AD J
A D H
AB = C D G
D = C F J
D F = CEJ
D G = A BC
E F = A C H

C E F

A i

D ii

B C

A D G

BD

A C G

G =
EH =
EJ =
FG =
FH =
FJ =

A C F

G/f

BCJ

C D F

A C E
C D E

==

EFH
H J

DJ

= G H ]

BE =
G/ =

C D /

B CH
A B E = FG J
A BF = EG ]
A BH = B D /
ABJ = EFG = BDH
A CJ = C D H
A D E

E H /

A D F = FH J
A E G = BFJ
A EJ = BFG = D EH
A FG = BEJ

2 b lo q u e s d e 3 2 :

CFG

B F

BG = ACD = CH/
B H = CG/
BJ = CG H
C D = ABG = E F /
C E = A F H = D F /
C F = A E H =D E J
C G = ABD = B H J
CH = A E F = BGJ
C J = DEF = B G H
AF/ = B E G = D F H
A G H = D G J
A G J = B EF = D G H
B C E

B C F

B D E

F G H

B D F

E G H

B EH = D FG
BFG = D EG
CEG =
CFG =

b lo q u e s d e 1 6 :

CFG
A G I
A D E

=
=

B EF
ER J

D G H

BCG H J

Diseos con 10 factores


r ) 2 1 M ; f r a c c i n

1/6 4 d e 10 fa c to re s

R e s o lu c i n I I I

e n 1 6 c o r r id a s

R e la c i n d e d e f in ic i n :

Generadores del diseo


E = ABC F = BCD G = ACD H = ABD J = ABCD K = AB
ABCE = BCDF = ADEF = ACDG = BDEG = ABFG = CEFG = ABDH
-CDEH = ACFH = BEFH = BCGH = AEGH = DFGt = ABCDEFGH = ASC/)/
=>/ = AF/ = BCEFJ = BGJ = ACEG/ = CDFGI = ABDEFGJ = CHJ
ABEHJ = BDFHJ = ACDEFHJ = ADGHJ = BCDEGHJ = ABCFGHJ = EFGHJ = ABAT
: CE* = ACDFK = BDEFK = BCDGK = ADEGK = FGT = ABCEFGK = DHK
ABCDEHK = 5CF//K =
= ACGKH = BEGHK = ABDFGHK = CDEFGHK = CD/K
: ABDEJK = F//T = ACEFJK =
= BCEGJK = ABCDFGJK = DEFGJK = ABCHJK
=EHJK = ADFHJK = BCDEFHJK = BDGHJK = ACDEGHJK = CFGHJK = ABEFGHJK
A lia s

A = FJ = BK
J = DE = AF = BG = CH
B=GJ = AK
K = AB = CE =FG = DH
C = HJ = EK AC = BE = DG = FH
D = EJ = HK AD = EF = CG = BH
E = DJ = CK AE = BC = DF = GH
F = AJ = GK AG = CD = BF = EH = JK
G = BJ = FK AH = BD = CF = EG
H = CJ = DK
2 bloques de 8 : AG = CD=BF = EH = JK

Ov
vi
(jJ

674

XD. Relaciones de alias para diseos factoriales fraccionados 2k~?con k < 15 y n < 64 {continuacin)
s) 210-s; fraccin 1/32 de 10 factores
Resolucin IV
en 32 corridas
Generadores del diseo
F = ABCD G = ABCE H = ABDE J = ACDE K = BCDE
Relacin de definicin: / = ABCDF = ABCEG = DEFG = ABDEH = CEFH = CDGH = ABFGH = ACDEJ
= BEFJ = BDGJ = ACFGJ = BCHJ = ADFHJ = AEGHJ = BCDEFGHJ = BCDEK
= AEFK = ADGK = BCFGK = ACHK = BDFHK = BEGHK = ACDEFGHK = AB/C
= CDF/K = CEGJK = ABDEFGJK = DEH/K = ABCEFHJK = ABCDGHJK = FGHJK
Alias
A = EFX = DG = CHK = fi/K
AH = BDE = BFG = DF/ = EG/ = CX
B = EFJ = DG/ = CH7 = A/X
A / = CDE = CFG = DFH = EGH=BK
C = EFH = DGH = BH/ = AHK
AK = EF = DG = CH = BJ
D = EFG = CGH = BG/ = AGX
BC = ADF = AEG = HJ = DEK = FGX
E = DFG = CFH = BFJ = AFX
BD = ACF = AEH =GJ = CEK = FHK
F = DEG = CEH = BEI = AEK
BE = ACG = ADH = F/ = CDX = GHK
G = DEF = CDH = BD/ = AD/:
BF = ACD = AGH = EJ = CGK = DHX
H = CEF = CDG = BCJ = ACKT
BG = ACE = AFH = DJ = CFK = EHK
J = BEF = BDG = BCH = ABK
BH = ADE = AFG = CJ = DFK = EGK
K = AEF = ADG = ACH = ABJ
CD = ABF = GH = A7 = BEK = FJK
AB = CDF = CEG = DEH = FGH = /X CE = ABG =FH = AD/ = BDK = G/K
AC = BDF = BEG = DEJ = FG/ - HK CF = ABD = EH = >4G/ = BGK = DJX
AD = BCF = BEH = CEJ = FHJ = GK CG = ABE = DH = AFJ = BFK = /X
AE = BCG = BDH = CDJ = GHJ = FK DE = FG = ABH = ACJ = BCK = H/X
AF = BCD = BGH = CGJ = DH/ = EX DF = ABC = EG = AH/ = BHK = Cfff
A G = BCE = BFH = CF/ = EHJ = DX
2 bloques de 16: AX =EF = DG = CH = fi/
4 bloques de 8:AK = EF = DG = CH = BJ
AJ = CDE = CFG = DFH = EGH = BX
AS = CDF = CEG = DEH = FGH = JK

R e so lu c i n IV

) 2 1(M; fr a c c i n 1 /1 6 d e 10 fa c to r e s
e n 6 4 c o r r id a s

Generadores del diseo


Relacin de definicin:

G = BCDF H = ACDF J = ABDE K = ABCE


/ = BCDFG = ACDFH = ABGH = ABDEJ = ACEFGJ = BCEFHJ = DEGHJ = ABCEK
= ADEFGK = BDEFHK = CEGHK = CDJK = BFGJK = AFHJK = ABCDGHJK
Alias

A = BGH
AD- CFH = BEJ
BK- A C E - FG]
B = AGH
AE : BDJ--= BCK
CD- B F G = AFH = JK
C = DJK
X f = CDH = HJK
CE- A B K - --GHK
D = CJK
BH
CF B D G : - ADH
E=
= CDF = BG = FJK
CG = B D F - EHK
A / : BDE = FHK
F=
CH A D F -- --EGK
G = ABH
A K : BCE = FHJ
CJ DK
H = ABG
C : DFG = AEK
CK- A B E - EGH = DJ
SD: CFG = AEJ
J = CDK
DE A B J = GH]
K = CDJ
B =ADJ = ACK
DF- B C G -- ACH
BF CDG = GJK
AB = GH = DEJ = CEK
DG = B C F = EHJ
BJ ADE = FGK
AC = DFH = BEK
DH A C F - - EGJ
EF =
GJ DEH - BFK
AEG B E H : -CFJ = DFK
EG = DHJ = CHK
GK- CEH BFJ
AEH B E G
EH = DGJ = CGK
HJ DEG - AFK
AFG B F H - - CEJ = DEK
EJ = ABD = DGH
HK : CEG AFJ
AG]- C E F = BH]
EK = ABC = CGH
AGK D E F -- BHK
,45F = FGH
FG = BCD = HC
ACG BCH = EFJ
BCf E F H = --BDK
FH = ACD = AJK
ACJ : EFG -- ADK
BEF = C H J = DHK
FJ = BGK = AHK
BDH = EFK
A D G :
CDE- E J K
= AHJ
AEF: CGJ : DGK
FK = BGJ
CFK- - D F ]
2 bloques de 32: AGJ = CEF = BH]
4 bloques de 16: AGJ = CEF = BHJ
AGK = DEF = BHK
CD = BFG = AFH = JK

675

676

XD. Relaciones de alias para diseos factoriales fraccionados 2*? con k < 15 y n < 64 (c o n tin u a c i n )
______________________________________________ Diseos con 11 factores____________________________ ________ _________
) 2117; fraccin 1/128 de 11 factores
Resolucin n i
en 16 corridas
Generadores del diseo
E = A BC
F = BCD
G = A CD
H = ABD
J = A BCD
K = AB L = AC
Relacin de definicin: I = A B C E = B C D F = A D E F = A C D G = B D E G = A B F G = C E F G = A B D H
=
=
=
=

=
=
=

=
=

=
=

=
=
=
=

CD EH = A CFH = B EFH = B CG H = A EG H = D FG H = A B CD EFG H = A BCDJ


D EJ = A FJ = B CEFJ = BG J = A CEG J = CD FG J = A B D EFG J = CH J
A B EH J = BD FH J = A CD EFH J = A D G H J = B CD EG H J = A B CFG H J = EFG H J = A B K
CEK = A CD FK = BD EFK = B CD G K = A D EG K = FG K = A B CEFG K = D H K
A B C D E H K = B C F H K = A E F H K = A C G H K = B E G H K = A B D F G H K = C D E F G H K = C D JK
A B D E JK = B F JK = A C E F JK = A G JK = B C E G JK = A B C D F G JK = D E F G JK = A B C H JK
E H JK = A D F H JK = B C D E FH JK = B D G H JK = A C D E G H JK = C F G H JK = A B E F G H JK = A C L
BEL = A BD FL = CD EFL = D G L = A B CD EG L = B CFG L = A EFG L = BCD H L
A D E H L = F H L = A B C E F H L = A B G H L = C E G H L = A C D F G H L = B D E F G H L = B D JL
A C D E JL = C F JL = A B E F JL = A B C G JL = E G JL = A D F G JL = B C D E F G JL = A t f /L
B C E H JL = A B C D F H JL = D E F H JL = C D G H JL = A B D E G H JL = B F G H JL = A C E F G H JL = B C K L
A EK L = D FK L = A B CD EFK L = A B D G K L = CD E G K L = A CFG K L = BEFG K L = A CD H K L
B D EH K L = A B FH K L = C E FH K L = G H K L = A B C E G H K L = B C D FG H K L = A D E F G H K L = A D /K L
B C D E JK L = A B C F JK L = E F JK L = C G JK L = A B E G J K L = B D F G JK L = A C D E F G JK L = B H JK L
A C E H JK L = C D FH JK L - A B D E FH JK L = A B C D G H JK L = D E G H JK L = A F G H JK L = B C E F G H JK L

Alias
A
B
C
D
E
F
G
H

= FJ = B K = CL
= G J = A K = E L
= H J = E K = A L
= EJ = H K = G L
= D J = CK = B L
= A J = G K = H L
= BJ ~ FK = D L
= C J = D K = FL

J = D E = A F = B G = CH
K = AB = CE = FG = D H
L = A C = B E = D G = FH
AD = E F = C G = BH
A E = BC = D F = G H = KL
A G = C D = B F = E H = JK
A H = B D = C F = E G = JL

2 bloques de 8: A E = B C = D F = G H = L

v ) 2 11-6; fr a c c i n 1 /6 4 d e 11 fa c to r e s
e n 3 2 co rrid a s

Resolucin IV

Generadores del diseo


F = ABC G = BCD H = CDE J = ACD K = ADE L = BDE
Relacin de definicin: / = ABCF = BCDG = ADFG = CDEH = ABDEFH = BEGH = ACEFGH = ACD} = BDFJ = ABGJ = CFGJ
=AEHJ=BCEFHJ=ABCDEGHJ=DEFGHJ=ADEK=BCDEFK=ABCEGK=EFGK=A CHK=BFHK
= ABDGHK = CDFGHK = CEJK = ABEFJK = BDEGJK = ACDEFGJK = DHJK = ABCDFHJK = BCGHJK
= AFGHJK = BDEL = ACDEFL = CEGL = ABEFGL = BCHL = AF//L = DGHL = ABCDFGHL
= ABCEJL = EFJL = ADEGJL = BCDEFGJL = ABDHJL = CDFHJL = ACGHJL = BFGHJL = ABKL
= CFKL = ACDGKL = BDFGKL = ABCDEHKL = DEFHKL = AEGHKL = BCEFGHKL = BCDJKL
= ADFJKL = G/KL = ABCFGJKL = BEHJKL = ACEFHJKL = CDEGHJKL = ABDEFGHJKL
Alias
j4 = BCF = DFG = CDJ = BGJ = EH = DEK = CHK = FHL =
5
= ACF = CDG = G/f = F7 = AG/ = FHK = DEL = CHL = AKL
C = ABF = BDG = DEH = Afl/ = FGJ = AWf = /K = EGL = BtfL = FKL
D = BCG = AFG = CEf = AC7 = BFJ = AEK = /f/K = BEL = GHL
E = CDH = 5G7 = AHJ = ADK = FGK =CJK = BDL = CGL = FJL
F = ABC = ADG = SD/ = CG/ = EGK = SflK = AHL = EJL = CKL
G = BCD = ADF = SE// = ABJ = CE/ = EFK = CEL = DHL = JKL
H = CDE = BEG = AE/ = ACK = BFK = D/AT = BCL = AFL = DGL
J = XCD = BDF = ABG = CFG = AEH = CK = DHK = EFL = GJL
X = AD = EFG = ACH = BFff = CE! = D /// = ABL = CFL = G/L
L = BDE = CEG = BCH = AF// = DG// = EFJ = AB/f = CFK = G/K
AB=CF = GJ = KL
AE = HJ = DK
AH =EJ =CK = FL
AL = FH = BK
BH = EG = CL = FK
AC = BF = DJ = HK
AF = BC = DG = HL
AJ = CD = BG = EH
BD = CG = FJ = EL
CE = DH = JK = GL
AD = FG = CJ = EK
AG = DF = BJ
AK = DE = CH = BL
BE = GH = DL
EF = GK=JL
ABD = CDF = ACG = BFG = EFH = BC/ = AF/ = DGJ = BEK = G//K = AEL = HJL = DKL
ABE = CEF = DFH = AG// = G / = BHJ = BD/C = CGK = F//C = ADL = FGL = CJL = EKL
ABH = DEF = AEG = CFH = BEJ = GHJ = BCK = AFK = DGK = ACL = BFL = D/L = HKL
ACE = BEF = AD// = FG// = DE/ = CHJ = C.DK = BG/C = /ffi = A/K = DFL = AGL = BJL
AEF = BCE = DG = BD// = CG// = F /// = DFK = AGK = BJK = CDL = BGL = EHL = AJL
2 bloques de16: AB = CF = G/ = KL
4 bloques de 8 : AB = CF = GJ = KL
AD = FG = CJ = EK
_____________________________
BD = CG =FJ = EL

<3\

si
o

678

APNDICE

Xl!.

Relaciones de alias para diseos factoriales fraccionados

con k < 15 y n < 64 (continuacin)________

D is e o s c o n 1 2 f a c to r e s

w)

2 12 8; f r a c c i n

1/2 5 6

d e 1 2 fa cto re s

R e s o lu c i n f f l

e n 1 6 c o r r id a s
G e n e r a d o r e s d e l d is e o

E = ABC F = ABD G = ACD H = BCD


J ABCD K = AB L = AC M = AD
A lia s

____ __________________ 2

b lo q u e s

A = HJ = BK CL = DM
B = GJ = AK = EL = FM
C = FJ = EK = AL - GM
D = EJ = FK = GL = AM
E - DJ = CK = BL = HM
F = CJ = DK = HL = BM
G -B J = HK = DL = CM
H = AJ = GK = FL = EM
J - DE -C F = BG = AH
K = AB = CE = DF = GH
L = AC = BE = DG = FH
M = AD = BF - CG = EH
AE = BC = FG = DH = KL =JM
AF = BD = EG = CH - JL KM
AG = EF = CD = BH = J K - LM
d e 8 : AE = BC = FG = DH - KL = J
M

________________________________________________________ D i s e o s c o n

x)

2 13" 9; f r a c c i n 1 / 5 1 2

de 13

13 f a c t o

r e

_________ __________

s ___________________________________________________

fa c to re s

R e s o lu c i n i n

e n 1 6 c o r r id a s
G e n e r a d o r e s d e l d is e o

E = ABC F = ABD G = ACD H BCD


J ABCD K - AB L = AC M = AD N = BC
A lia s

A = HJ - BK = CL = DM = EN
B = GJ = AK = EL = FM = CN
C = FJ = EK = AL = GM = BN
D = EJ = FK = G L - AM = HN
E = DJ = CK=BL = HM = AN
F = CJ = DK - HL = BM = GN
G BJ = HK = DL = CM = FN
H = AJ = GK = F L - EM DN
J = DE = CF - BG = AH = MN
K = AB - CE = DF = GH = LN
L = AC = BE = DG = FH = KN
M = AD = BF = CG = EH = JN
N = BC - AE = FG = DH = KL = JM
AF = BD = EG = CH -JL = KM
AG = EF = CD = BH =JK = LM
2 b l o q u e s d e 8 : AF = BD = EG - CH = JL = KM

APNDICE
X IL

679

R ela cion es d e alias para d ise os factoriales fraccion ad os 2k-f c o n ic < 15 y n < 6 4 (continuacin )

___________________________________ Diseos con 14 factores___________________________________


y) 214- 10; fraccin 1/1024 de 14
Resolucin III
factores en 16 corridas
Generadores del diseo
E = ABC F = ABD G = ACD H = BCD J = ABCD
K = AB L = AC M = AD N = BC 0 = BD
Alias
A = HJ = BK = CL = DM = EN = FO
B = GJ = AK = EL = FM =CN = DO
C - FJ = EK = AL = GM = BN = HO
D = EJ FK = GL AM = HN = BO
E = DJ = CK BL = HM = AN = GO
F = CJ = DK = HL = BM = GN = AO
G = BJ HK = DL = CM = FN = EO
H AJ = GK = FL = EM = DN = CO
J = DE - CF = BG AH = MN = LO
K = AB = C = DF = GH = LN MO
L AC = BE = DG FH - KN = JO
M = AD = BF = CG EH JN = KO
N BC AE = FG = DH = KL = JM
O = BD AF = EG CH JL = KM
AG = EF = CD BH JK= LM = NO
___ __________ _______ 2 bloques de 8 :AG = EF = CP = BH = JK = LM = NO______________________
________________________ __________Diseos con 15 factores___________________________________
) 213- n; fi-acci5 n 1/2048 de 15
Resolucin III
factores en 16 corridas
Generadores del diseo
E = ABC F = ABD G = ACD H = BCD J = ABCD
K = AB L = AC M = AD N = BC 0 = BD P = CD
Alias
A = HJ = BK =CL = DM = EN = FO = GP
B = GJ - AK = EL = FM = CN = DO = HP
C = FJ = EK = AL = GM = BN = HO = DP
D = EJ = FK = GL = AM = HN = BO = CP
E = DJ = CK = BL = HM AN = GO = FP
F = CJ = DK = HL = BM = GN = AO = EP
G = BJ = HK = DL = CM = FN = EO = AP
H = AJ = GK = FL = EM = DN = CO = BP
J = DE CF = BG = AH = MN = LO = KP
K = AB = CE - DF = GH = LN = MO = JP
L = AC = BE DG = FH = KN - JO = MP
M = AD = BF - CG = EH =JN KO = LP
N = BC = AE FG = DH = KL = JM = OP
O = BD = AF = EG = CH = JL = KM = NP
P = CD = EF = AG = BH = JK = LM = NO

680

APNDICE

Tabla XIII.

Glosario para el uso de Design Expert

A c t u a l v a lu e
A d e q p re c is io n
A d j M S (a d ju ste d m e a n sq u a re )
A d j R -s q u a r e d
A d j S S (a d ju ste d su m o f sq u a re s)
A n a ly s is o f v a ria n c e

V a lo r

re al

P r e c is i n

ad ecu ad a

C u a d ra d o

m e d io

cu a d ra d a

S u m a

d e

A n lis is

a ju s t a d o

a ju s t a d a

cu a d ra d o s

a ju s t a d a

C o e ffic ie n t e stim ate

E s t im a c i n

d e l c o e f ic ie n t e

C . V (c o e ffic ie n t o f v a ria tio n )

C o e f ic ie n t e

d e

C l (c o n fid e n c e in te rv a l)
C o o k s d ista n c e
C o r to ta l (co rre cte d to ta l)

de

c o n f ia n z a

D is t a n c ia

de

C o o k

T b t a l c o r r e g id o .

S u m a

su m a

D F (d eg rees o f fre e d o m )

G ra d o s

d e

lib e r t a d

D D F (d e n o m in a to r d eg rees o f fre e d o m )

G ra d o s

d e

lib e r t a d

E s tim a t e d m e a n
E x p e c te d m e a n sq u a re
L a c k o f f it
L e a s t sq u a re s m e a n s f o r stren gth

E s t a d s t ic o s
T r m in o
M e d ia

de

de

lo s v a lo r e s
la

m e d ia .

cu a d ra d o s

d e

S e

lla m a

t o t a le s

d e l d e n o m in a d o r

d ia g n s t ic o

d el caso

d e l e rro r

e s t im a d a

C u a d ra d o
F a lt a

de

c o r r e g id o s p o r

co m n m e n te

E r r o r term

a ju s t a d a )

v a r ia c i n

In t e r v a lo

re sp u e sta

D ia g n o s t ic c a s e s ta tistic s

(S S

d e v a r ia n z a

de

m e d io

esp erad o

a ju s t e

M e d ia s

d e

m n im o s

cu a d ra d o s

de

la

r e s is t e n c ia

L e v e ra g e

A c c i n

d e

d is e o
a ju s t e

M ean
M e a n sq u a re

in f lu ir

D if e r e n c ia
C u a d ra d o
d e

la s

d e

lib e r t a d

d el n u m e rad o r

O p e r a d o r f ijo
O p e ra d o r
P u n to

a le a t o r io

a t ip ic o

P re d ic te d v a lu e

V a lo r

p r e d ic h o

P R E S S (P re d ic tio n e rro r su m o f sq u a re s)

S u m a

de

cu a d ra d a

p r e d ic h a

cu a d ra d o s

P u re e rro r

E rro r p u ro

R -s q u a re d

S td . D e v . (sta n d a rd d e v ia tio n )

d e l e rro r

d e

cu a d ra d a

S u m a

d e

d e l cu a d ra d o

cu a d ra d o s

D e s v ia c i n

m e d io

s e c u e n c ia l

e st n d a r

E rro r

e st n d a r

S E o f d iffe re n c e (sta n d a rd e rro r o f d iffe re n c e )

E rro r

e st n d a rd

Std . e rro r o f e stim a tio n

E rro r

e st n d a r

de

la

e s t im a c i n

S E m e a n (sta n d a rd e rro r o f the m e a n )

E rro r

e st n d a r

d e

la

m e d ia

S tu d e n t r e s id u a l
S u m o f sq u a re s
V a ria n c e co m p o n e n t

p r e d ic c i n

cu ad rad a

R a z

S ta n d a rd e rro r ( S E )

S ta n d a rd o rd e r

v a lo r e s

c o v a r ia b le s

P re d R -s q u a r e d

S e q S S (s e q u e n tia l su m o f sq u a re s)

e v it a r s e

del

d el

m e d ia

G ra d o s

R o o t M S E (ro o t m e a n sq u a re e rro r)

p u n to

m e d io

M e d ia s

O u t lie r t

u n

c o e f ic ie n t e s

M e d ia

M e a n s f o r c o v a ria te s

O p e ra to r ra n d o m

lo s

u n o

N D F (n u m e ra to r d e g re es o f fre e d o m )
O p e ra to r fix e d

en

d e l m o d e lo . D e b e n

ce rcan o s

M e a n d iffe re n ce

p a la n c a . P o t e n c ia l d e

p a ra

O rd e n

la

d if e r e n c ia

e st n d a r

R e s id u a l d e
S u m a

de

d e

S tu d e n t

cu a d ra d o s

C o m p o n e n te

d e

la

v a r ia n z a

d e l e rro r

Indice

Aberracin, 326
Aditividad del modelo de bloques aleatorizados, 136. Ver
tambin Prueba de interacciones (no aditividad)
Aleatorizacin, 12, 13, 61, 126, 148
Algoritmo de anlisis para el diseo 2*, 242
Algoritmo de intercambio, 469
Alias, 304
Alias parciales, 344, 380, 383
Anlisis cannico del modelo de superficie de respuesta de
segundo orden, 440
Anlisis de covarianza, 15, 126, 604
Anlisis de residuales, 76, 79, 185, 224, 400, 416, 563
Anlisis de varianza, 60, 63, 66
Anlisis de varianza de dos factores, 177
Anlisis de varianza de un solo factor, 64
Anlisis de varianza simple o de una variable, 64
Anlisis interbloques, 161
Anlisis intrabloques, 161
Arreglo exterior, 491
Arreglo interior, 491
Ascenso ms pronunciado, 227, 430, 435
Aumento del diseo, 409. Ver tambin Separacin de alias
en las interacciones y Contraccin de diseos facto
riales fraccionados

Bloque principal, 291, 297, 373


Bloques completos, 127
Bloques incompletos, 154

Clculos en el anlisis de varianza, 70, 72


Cambio en el efecto de la media en una operacin evoluti
va (EVOP), 484, 488
Carcter iterativo de la experimentacin, 17, 20. Ver tam
bin Experimentacin secuencial
Ciclo en la operacin evolutiva (EVOP), 484
Codificacin de los datos en nn anlisis de varianza, 72
Coeficiente de confianza, 42
Coeficiente de variacin, 104
Coeficientes de regresin parcial, 393
Combinacin de fracciones para estimar efectos, 303, 306,
315, 339, 347, 348

Combinacin de informacin interbloques e intrabloques,


162
Combinacin de los cuadrados medios para estimar el
error, 535
Comparacin de medias por pares, 96-104
Comparacin de todos los contrastes, 95
Comparacin de tratamientos con un control, 103
Comparacin grfica de medias, 89
Comparaciones mltiples, 88, 133, 182
Componente / de una interaccin, 366
Componente J de una interaccin, 366
Componente W de una interaccin, 372
Componente X de una interaccin, 372
Componente Y de una interaccin, 372
Componente 2 de una interaccin, 372
Componentes de la varianza, 65, 511, 512, 518, 565
Componentes de una interaccin, 204, 366
Condiciones ptimas, 427, 429, 430, 436
Conexin entre anlisis de varianza y regresin, 112
Confusin completa, 299
Confusin en el diseo 2*, 288
cuatro bloques, 296
dos bloques, 289
ms de cuatro bloques, 297
Confusin en el diseo 3*, 373
ms de nueve bloques, 378
nueve bloques, 377
tres bloques, 373
Confusin parcial, 299
Construccin de diseos factoriales fraccionados, 307, 318,
337, 379-381
Contraccin completa, 340
Contraccin parcial, 349
Contraste estandarizado, 92
Contraste ortogonal, 93, 221, 231
Contrastes, 90, 93, 221, 231, 290
Cordillera creciente, 448
Cordillera estacionaria, 448
Corridas axiales, 274, 365, 478
Covariable, 604
Covarianza, 26
Criterio de prediccin adecuada, 104
Criterio para seleccionar un diseo, 455

681

682

NDICE

Criterios de diseo, 455


Cuadrado latino estndar, 148
Cuadrados latinos ortogonales, 151, 365
Cuadrados medios, 68, 179
Cubo con centros en las caras, 459
Curioseo o sondeo de datos, 94
Curva de operacin caracterstica, 40, 107, 139, 189, 529
Curva OC, Ver Curva de operacin caracterstica
Curvatura, 174, 272, 432
D de Cook, 420
Datos no balanceados en el anlisis de varianza, 75, 600
Datos proporcionales en un diseo factorial no balanceado,
600
Definicin de contrastes, 290, 296, 373
Desviacin estndar muestral, 27
Determinacin analtica de una transformacin, 590
Determinacin del tamao de la muestra, 40, 107 110, 139,
189, 529
Diagrama de caja, 23, 62
Diagrama de dispersin, 662
Diagrama de puntos, 21, 22
Direccin del ascenso ms pronunciado. Ver Ascenso ms
pronunciado
Diseo anidado de dos etapas, 557
Diseo anidado de m etapas, 566
Diseo anidado de tres etapas, 566
Diseo balanceado, 154, 558, 600
Diseo bsico, 307, 317, 381
Diseo central compuesto, 11, 274, 275, 365, 441, 456
Diseo de aberracin mnima, 326
Diseo de arreglo combinado, 492, 494
Diseo de arreglo cruzado, 491
Diseo de bloques aleatorizados, 50, 126, 207
bloques completos, 127
bloques incompletos, 154
Diseo de Box-Behnken, 458
Diseo de comparaciones pareadas, 47, 50
Diseo del cuadrado latino, 144, 148, 209, 365
Diseo en parcelas subdivididas, 557, 573, 578
Diseo en parcelas subdivididas en franjas, 583
Diseo experimental completamente aleatorizado, 33, 64,
176, 207
Diseo experimental y diseo de productos, 8, 11
Diseo factorial 22, 5, 219
Diseo factorial 23, 6, 228
Diseo factorial 24, 7, 246
Diseo factorial 2k, 7, 218, 242
Diseo factorial anidado, 569
Diseo factorial no balanceado, 600
Diseo hexagonal, 461
Diseo jerrquico. Ver Diseos anidados
Diseo no balanceado, 75, 144, 600
Diseo no replicado. Ver Rplica nica
Diseo optimal A , 468
Diseo optimal D, 468

Diseo optimal G, 468


Diseo optimal V, 468
Diseo pentagonal, 461
Diseo robusto, 488. Ver tambin Estudios de robustez de
procesos
Diseo rotable, 457
Diseo simplex para el modelo de primer orden, 456
Diseos 2M, 304-317
Diseos 2*;-2, 317
Diseos 2*-*, 326
Diseos 3*, 363, 372
Diseo 3*-1, 379
Diseos 3t_, 382
Diseos alternados o entrecruzados, 150
Diseos anidados, 557-568
Diseos anidados por etapas escalonados, 566
Diseos centrales compuestos pequeos, 461
Diseos cuboidales, 450
Diseos de bloques incompletos balanceados, 154
Diseos de cuadrados grecolatinos, 151, 383
Diseos de puntos frontera, 478
Diseos de resolucin III, 306, 337
Diseos de resolucin IY 306, 347
Diseos de resolucin V, 307, 347
Diseos de segundo orden, 456
Diseos de superficie de respuesta, 11, 364, 429
Diseos en parcelas con doble subdivisin, 580
Diseos equirradiales, 461
Diseos esfricos, 457
Diseos generados por computadora, 409, 466, 479
Diseos hbridos, 461
Diseos mnimos de resolucin IV, 347
Diseos no geomtricos, 343
Diseos optimales, 468
Diseos optimales alfabticos, 468-469
Diseos ortogonales, 231, 404, 455
Diseos para modelos de primer orden, 455
Diseos Plackett-Burman, 343-347
Diseos saturados, 337
Diseos simtricos, 155
Diseos simplex de centroide para mezclas, 475
Diseos simplex de retcula para mezclas, 474
Distribucin de muestreo, 29
Distribucin de probabilidad, 23
Distribucin de probabilidad continua, 24
Distribucin de probabilidad discreta, 24
Distribucin de referencia, 35
Distribucin F, 32
Distribucin ji-cuadrada, 30
Distribucin normal, 29
Distribucin normal estndar, 29
Distribucin sesgada, 30
Distribucin t, 31
Doblez de diseos factoriales fraccionados, 339, 340, 347,
348. Ver tambin Separacin de alias en las interac
ciones

NDICE

Ecuaciones normales de mnimos cuadrados, 112, 151, 159,


186-187, 395
Ecuaciones normales. Ver Ecuaciones normales de mnimos
cuadrados
Efecto del tratamiento, 64
Efecto principal, 5, 170, 220
Efecto total de un factor, 221
Efectos cuadrticos, 88, 204, 432
Efectos cbicos, 88
Efectos de dispersin, 110, 241, 260, 264, 323
Efectos de localizacin, 111, 260, 323
Efectos de los factores, 5, 6, 220
Efectos de los tratamientos ajustados, 157, 161
Efectos ortogonales, 221, 231
Efectos residuales de tratamientos, 150
Eficiencia relativa de los diseos factoriales, 174
Eigenvalores (valores propios), 440
Eigenvectores (vectores propios), 446
Elemento identidad, 231
Enfoque de grupo en el diseo de experimentos, 14
Enfoque de la mejor conjetura para la experimentacin, 3
Enfoque no paramtrico del anlisis de varianza, 116
Error, 22
Error de la parcela completa, 575, 579, 584
Error de la subparcela, 575, 579, 584
Error estadstico, 22, 64, 412
Error estndar de los efectos en un diseo 2k, 241
Error estndar de un coeficiente de regresin, 239, 412
Error experimental, 11, 12, 34, 64
Error intrabloques, 163
Error puro, 239
Escala codificada, 172
Espacio inferencial de un experimento, 511
Estadstico del rango studentizado, 97, 102
Estadstico R2 ajustada, 104, 411. Ver tambin R2
Estimacin, 27
Estimacin de los componentes de la varianza, 513
mxima verosimilitud, 547
mtodo de mxima verosimilitud con restricciones, 549
mtodo del anlisis de varianza, 513, 518, 524
Estimacin de los parmetros del modelo en el anlisis de
varianza, 74, 112, 185
Estimacin de mxima verosimilitud, 547, 549, 595
Estimacin de mnimos cuadrados de parmetros, 88, 112,
141, 159, 186, 394
Estimacin de valores faltantes, 139, 148, 602
Estimaciones de efectos, 220
magnitud y direccin, 221
Estimador, 27
Estimador de la varianza mnima, 27
Estimador de momentos, 547
Estimador insesgado, 27
Estrategia de experimentacin, 1, 3
Estudios de capacidad o aptitud de los instrumentos de
medicin, 519, 524
Estudios de robustez de procesos, 1, 127, 176, 488

683

Experimentacin secuencial, 10, 17, 18, 20, 303, 315, 365,


429, 456
Experimentador, 2
Experimento aleatorizado. Ver Diseo experimental comple
tamente aleatorizado
Experimento comparativo, 21
Experimento con mediciones repetidas, 624
Experimento de caracterizacin, 8. Ver tambin Experimen
to de tamizado
Experimento de tamizado, 9, 15, 218, 303
Experimento factorial, 4, 170, 218
en bloques, 207, 287
en parcelas subdivididas, 578
Experimento factorial fraccionado, 7, 303, 379
Experimentos con un factor a la vez, 4
Experimentos de mezclas, 472
Experimentos de seguimiento. Ver Pruebas de confirmacin
Experimentos industriales y experimentos agrcolas, 18
Experimentos no planeados, 392
Factor cruzado, 170. Ver tambin Experimento factorial
Factores, 1, 2, 3, 5, 14, 21, 60
Factores controlables, 2, 14, 15, 489, 493
Factores cualitativos, 86, 201, 275, 368
Factores cuantitativos, 86, 171, 201, 272, 363, 368, 511
Factores de ruido. Ver Factores no controlables
Factores no controlables, 2, 15, 489
Factores que se mantienen constantes, 14
Falta de ajuste, 239, 272, 431
Familia de potencias de transformaciones, 84, 591
Familia exponencial de distribuciones, 594
Familia factorial fraccionada, 306
Fase en una operacin evolutiva (EVOP), 484
Forma no restringida del modelo mixto, 526, 540, 573
Forma restringida del modelo mixto, 523, 531, 539, 559,
569
Formacin de bloques, 12, 13, 15, 50, 126, 127, 130, 207,
209, 287, 289, 296, 298, 315, 331, 373, 462, 574, 576,
579, 580, 604
Formacin de bloques de diseos de superficie de respues
ta, 462-466
Fraccin alterna, 305, 319
Fraccin complementaria. Ver Fraccin alterna
Fraccin irregular, 346
Fraccin principal, 305
Fraccin un medio, 7, 304
Fuerza de una transformacin, 84
Funcin de enlace, 595
Funciones con condicin de deseables, 451-454
Funciones estimables, 113, 114, 188, 189
Generador de diseos. Ver Generador de diseos factoria
les fraccionados
Generador de diseos factoriales fraccionados, 304, 318
Grados de libertad, 29, 30, 31
Grfica de contorno, 10, 204

684_

NDICE

Grfica de cubo, 242, 262


Grfica de inferencia condicional para diseos factoriales
no replicados, 253
Grfica de probabilidad normal de los efectos, 246, 264
Graficacin de residuales, 76-86
Grficas de probabilidad normal, 38, 72
Herencia de la agricultura, 17, 18
Hipercuadrados, 154
Hiptesis alternativa, 34
Hiptesis alternativa de dos colas, 34
Hiptesis alternativa de una cola, 35
Hiptesis nula, 34
Histograma, 23
Importancia de los conocimientos no estadsticos, 19
ndice de error en el modo del experimento, 75
Influencia y accin de palanca, 419, 420
Informacin relativa para efectos confundidos, 300
Interaccin, 4, 137, 171, 174
Interaccin entre tratamientos y bloques, 137
Interaccin generalizada, 296, 299, 377
Intervalo de confianza, 42
Intervalo de confianza para la media de un tratamiento, 74,
75, 100
Intervalo de confianza para la respuesta promedio en el
modelo de regresin, 416
Intervalo de confianza simultneo, 75
Intervalo de prediccin, 416
Intervalos de confianza aproximados para los componentes
de la varianza, 543
Intervalos de confianza para los componentes de la varian
za, 516, 491
intervalos aproximados tipo Satterthwaite, 543
intervalos exactos, 516, 543
mtodo de grandes muestras modificado, 545
procedimientos de mxima verosimilitud, 552
Intervalos de confianza simultneos, 75, 95
Intervalos de confianza uno a la vez, 75
Jerarqua del modelo, 203, 286
Lmites de confianza, 42
Localizacin, como en la tendencia central, 22
Matriz de covarianza, 397
Matriz del diseo, 228
Matriz gorro, 417
Media, 12, 25
Media global, 64
Media muestral, 12, 26, 27
Medias ajustadas de los tratamientos en anlisis de cova
rianza, 607
Mediciones duplicadas en la respuesta, 265
Mtodo de Bonferroni de intervalos de confianza simult
neos, 75

Mtodo de Box-Cox, 590


Mtodo de grandes muestras modificado, 545
Mtodo de la diferencia significativa mnima (LSD) para
comparar medias, 99
Mtodo de Lenth para diseos sin rplicas, 254
Mtodo de los cuadrados de las medias ponderados, 603
Mtodo de medias no ponderadas, 603
Mtodo de mnimos cuadrados. Ver Estimacin de mnimos
cuadrados de parmetros
Mtodo de momentos, 547
Mtodo de Satterthwaite. Ver Pruebas F aproximadas
Mtodo del ascenso ms pronunciado. Ver Ascenso ms
pronunciado
Metodologa de superficies de respuesta (MSR), 11, 427
Mtodos de inedias no ponderadas en el anlisis de varian
za, 603
Mezclado lineal, 476
Mezclado sinrgico en mezclas, 476
Mezclas antagnicas en mezclas, 476
Mezclas binarias, 472
Mezclas de verificacin, 478
Mezclas puras, 474
Mnimos cuadrados esperados, 68, 179
reglas para, 531
Mnimos cuadrados ponderados, 595
Mitad de grfica normal de los efectos, 253
Modelo completo, 115, 116, 142, 413
Modelo con efectos aleatorios, 65, 511, 512, 557
Modelo con efectos fijos, 65, 511
Modelo de la respuesta o de reaccin de un diseo robus
to, 492
Modelo de las medias, 64, 128, 177
Modelo de los efectos, 64, 128, 145, 177
Modelo de primer orden, 226, 427, 455
Modelo de regresin, 87, 172, 177, 201, 204, 223, 235, 364,
392, 604
Modelo de regresin lineal mltiple, 393
Modelo de superficie de respuesta de segundo orden, 429
Modelo emprico, 17, 87, 392
Modelo estadstico, 34, 48, 64, 87, 128, 155, 177, 190, 191,
194, 207, 210, 393, 427, 429, 436, 476, 492, 493, 512,
517, 522, 526, 558, 567, 569, 575, 576, 578, 581, 584,
594, 605, 624
Modelo factorial sin interacciones, 190
Modelo jerrquico, 203, 286
Modelo lineal, 64. Ver tambin Modelo estadstico
Modelo lineal generalizado, 594
Modelo mixto, 522, 559, 569
error estndar de la media con efectos fijos, 524
estimacin de los componentes de la varianza, 524
formas alternativas, 526
modelo con restricciones, 523
modelo sin restricciones, 526
Modelo reducido, 116, 143, 413, 520
Modelos aditivos, 135, 145, 432
Modelos con mezclas, 476

NDICE
M uestreo aleatorio, 26

Navaja de Ockham, 310


Nivel de significacin, 34, 37
Niveles de los factores, 14, 21, 60, 245
Niveles de los factores naturales, 224, 226, 431
Niveles imprecisos de los factores del diseo, 405
Niveles mixtos de los factores en un diseo factorial, 383
Notacin geomtrica para experimentos factoriales, 228
Observaciones faltantes en un diseo de bloques aleatoriza
dos, 139
Observaciones faltantes en un diseo de cuadrado latino,
148
Observaciones faltantes en un diseo factorial 2, 404
Operacin evolutiva (EVOP), 484-488
Operador de la varianza, 25
Operador del valor esperado, 25
Optimizacin de un proceso, 9, 427
Orden de Yates. Ver Orden estndar
Orden estndar, 223, 228, 242
Ortogonalidad, 93, 221, 231
Palabras en la relacin de definicin, 318
Parcelas completas, 574, 579, 583
Pautas generales para el diseo de experimentos, 13
Pendiente de la superficie de respuesta, 493
Planeacin previa al experimento, 14, 16
Potencia, 34
Predictor lineal, 594
PRESS (Prediction Error Sum of Squares, Prediccin de
suma de cuadrados de error), 104
Principio de efectos esparcidos, 245, 303
Principio jerrquico en la construccin de modelos, 203,
286
Procesos robustos, 1. Ver tambin Estudios de robustez de
procesos
Programacin no lineal, 451
Propagacin del error, 495
Propiedad de reduccin de ruido con la formacin de blo
ques, 51, 132-133
Propiedades de los estimadores de mnimos cuadrados, 397
Proyeccin de diseos factoriales, 246, 303, 307, 331
Proyeccin del diseo, 247, 303, 310
Proyectividad, 345
Prueba de Bartlett para la igualdad de varianzas, 81
Prueba de Dunnett, 103
Prueba de hiptesis, 21, 33, 409
Prueba de interacciones (no aditividad), 192
Prueba de Kruskal-Wallis, 116
Prueba de Levene modificada. Ver Prueba de Levene
Prueba de Levene para la igualdad de la varianza, 82
Prueba d Newman-Keuls, 102
Prueba de Scheff, 95
Prueba de significacin. Ver Prueba de hiptesis
Prueba de significacin de una regresin, 409

685

Prueba de lkey, 96
Prueba del rango mltiple de Duncan, 100
Prueba F parcial, 413
Prueba general de la significacin de la regresin, 114, 141,
626
Prueba t combinada. Ver Prueba f de dos muestras
Prueba t de dos muestras, 35
varianzas diferentes, 44
Prueba t pareada, 49
Pruebas de aleatorizacin, 40, 73
Pruebas de confirmacin, 17, 317
Pruebas F aproximadas, 535, 539, 540
Pseudocomponentes, 479
Pseudopruebas F, Ver Pruebas F aproximadas
Punto de respuesta mxima, 436, 437
Punto de respuesta mnima, 436, 438
Punto estacionario, 436, 440
Punto silla, 436, 439
Puntos atpicos, 78, 417
Puntos centrales, 271, 365, 431, 458, 461
Puntos de accin de palanca, 420. Ver tambin Influencia y
accin de palanca

R 1, 104, 411. Ver tambin Estadstico R1 ajustada


R2 para prediccin, 104, 419
Realizacin de rplicas, 5, 12, 16, 60, 247
Regin crtica, 34
Regin de rechazo. Ver Regin crtica
Reglas para expectativas, 26
Reglas para los cuadrados medios esperados, 531
Relacin de definicin para un diseo factorial fraccionado,
304, 318, 379
Relacin generadora, 318
Relacin seal a ruido, 491
Repetibilidad, 519
Rplica oculta, 247, 619
Rplica nica, 191, 244. Ver tambin Una observacin por
celda
Rplicas de cuadrados latinos, 148
Reproducibilidad, 519
Residuales escalados, 417
Residuales estandarizados, 78, 417
Residuales PRESS, 418
Residuales studentizados, 418
Resolucin del diseo, 308
Resolucin de un diseo factorial fraccionado. Ver Resolu
cin del diseo
Respuestas mltiples, 448
Restriccin sobre la aleatorizacin, 130, 145, 207, 209
Restriccin sobre la aleatorizacin. Ver Restriccin sobre la
aleatorizacin; ver tambin Formacin de bloques
K-Student, 419

S eleccin em prica de una transform acin, 81, 84

686

NDICE

Separacin de alias en las interacciones, 306, 315, 339, 348,


407. Ver tambin Doblez de diseos factoriales frac
cionados
Significacin prctica vs significacin estadstica, 19
Sistemas de cordilleras, 447
Submuestreo, 578
Subparcelas, 574, 579
Suma de cuadrados corregida, 28
Suma de cuadrados de los residuales, 397
Sumas de cuadrados extras, 412
Sumas de cuadrados tipo III, 620
Superficie de respuesta, 10, 173, 201, 204, 225, 235, 364,
393, 427
Supuesto de desigualdad de la varianza, 80
Supuesto de independencia en la prueba t y el anlisis de
varianza, 38-40, 79
Supuesto de normalidad en las pruebas / y el anlisis de
varianza, 38, 77
Tendencia central, 22
Teorema de Cochran, 69
Teorema del lmite central, 30
Tbtales de los tratamientos ajustados, 157
Transformacin de datos, 40, 81, 84-86, 257
Transformacin de rangos, 117, 118
Transformacin para corregir la violacin de los supuestos,
40, 81, 84-86, 257, 590
Transformaciones para estabilizar la varianza, 81, 84-86,
257
Transmisin del error, 493, 495
Tratamiento de control, 103
Tratamientos, 21, 60

Tratamientos ortogonales a los bloques, 139


Trayectoria del ascenso ms pronunciado. Ver Ascenso ms
pronunciado
Una observacin por celda, 191
Unidad experimental, 13, 64, 126
Valor esperado, 25
Valores P, 37
Variabilidad, 22, 323
Variabilidad dentro de un tratamiento, 66
Variabilidad entre los tratamientos, 66
Variable aleatoria, 22
Variable aleatoria continua, 22
Variable aleatoria discreta, 22
Variable aleatoria F no central, 107
Variable concomitante, 604
Variable de regresin, 392
Variable de respuesta, 1, 2, 14, 15, 392
Variable dependiente, 392
Variable independiente, 392
Variable perturbadora, 13, 126
Variables aleatorias independientes, 26
Variables codificadas, 172, 223, 431
Variables indicadoras, 203
Varianza, 25
Varianza de la prediccin como criterio de diseo, 455,
457, 468
Varianza muestral, 26, 27
Varianza no constante, 38, 44, 79, 80
Verificacin de supuestos, 38, 76-86, 135, 185, 224, 242,
251, 258, 261, 416

L a e d ic i n , c o m p o s ic i n , d is e o e im p re s i n d e e s ta o b r a f u e r o n r e a liz a d o s
b a jo l a s u p e r v is i n d e G R U P O N O R IE G A E D IT O R E S .
B a l d e r a s 95, C o l . C e n t r o . M x ic o , D .F. C.P. 0 60 40

2 2 2 5 7 5 0 0 0 0 7 0 4 6 5 8 D P 9 2 3 3 IE

Cmo realizar una experimentacin industrial ptima.


Esta obra para ingenieros, cientficos y expertos en
probabilidad proporciona el enfoque ms eficaz para
aprender a disear, conducir y analizar experimentos
que optimicen la calidad y el desempeo de productos
y proceso. En esta nueva edicin completamente
revisada y actualizada, el autor trata con mayor de
tenimiento los diseos factoriales y factoriales fraccio
nados, y presenta nuevas tcnicas de anlisis, como
el modelo lineal generalizado. Asimismo, ofrece un
estudio ms amplio de los experimentos con factores
aleatorios, la metodologa de superficies de respuesta
los experimentos con mezclas y los mtodos para es
tudios de robustez de procesos.
El libro tambin ilustra dos de las herramientas de
software mas poderosas hoy en dia para el diseo ex
perimental. Design Expert1 y Minitab*. A lo largo del
texto se incluyen salidas de estos programas, junto
con una explicacin detallada de la forma en que se
estn usando las computadoras para el anlisis y el
diseo de experimentos.

* El sitio del libro en la web ofrece recursos adiciona


les para estudiantes y profesores.

e-mail: limusa@noriega.com.mx
www.noriega.com.mx

Potrebbero piacerti anche