Sei sulla pagina 1di 72

DiseodeExperimentos

UNIDAD I
Diseo de experimentos 1 1.1.- Introduccin.. 2 1.2.- Conceptos bsicos 4 1.3.- Principios bsicos.

1.3.1.- Realizacin de replicas o repeticin..4 4 1.3.2.- Aleatorizacin 1.3.3.- Formacin de bloques o bloqueo...5 5 1.4.- Metodologa para el diseo de experimentos.. 5 1.4.1.- Planeacin.. 1.4.2.- Anlisis..7 1.4.3.- Interpretacin.7 1.4.4.- Conclusiones finales.................................................................................... 7 1.5.- Aplicaciones tpicas del diseo de experimentos. 8 1.6.- Casos9 1.6.1.- Caracterizacin de un proceso.. 9 1.6.2.- Optimizacin de un proceso.. 10 1.6.3.- Ilustracin del diseo de un producto 11

UNIDAD II
Inferencia Estadstica 14 2.1.- Introduccin. 2.2.- Conceptos bsicos de estadstica14 17 2.3.- Pruebas de hiptesis
17 2.3.1.- Hiptesis estadsticas: Conceptos generales.. 2.3.2.- Hiptesis nula y alternativa 18 2.3.3.- Criterio de rechazo 19 2.3.4.- Errores tipo I y tipo II en la prueba de hiptesis 20 2.4.- Prueba con respecto a una sola media con varianza (2) conocida. 22 2.5.- Prueba con respecto a una sola media con varianza (2) desconocida... 25 2.6.- Prueba para la varianza con una muestra27 2.7.- Hiptesis para dos medias con distribucin normal. 29 2.8.- Hiptesis para dos medias utilizando distribucin T-student.. 31 2.8.1.- Caso 1: Pruebas para diferencias de medias con varianzas iguales y desconocidas...31 2.8.2.- Caso 2: Pruebas para diferencias de medias con varianzas diferentes y desconocidas. 33 2.9.- Prueba para la igualdad de varianzas... 35

UNIDAD III
Anlisis de varianza (ANOVA) 3.1.- Experimentos de un solo factor: procedimiento de prueba para la igualdad de medias poblacionales37 38 3.2.- Diseo completamente aleatorizado, muestras iguales.... 41 3.3.- Anlisis de varianzas para muestras diferentes 43 3.4.- Anlisis de varianza bilateral (dos factores).
43 3.4.1.- Notacin para experimentos de dos factores.. 44 3.4.2.- Variaciones para experimentos de dos factores. 3.4.3.- Experimento de dos factores con repeticin.. 48
M.C.RobertoRomeroLpezi

DiseodeExperimentos

UNIDAD IV
Diseo factorial Completo 4.1.- Definicin de experimento factorial. 53 4.2.- Ventajas de los Diseos Factoriales. 53 4.3.- Representacin del efecto de interaccin. 55 56 4.4.- Diseo factorial de dos factores...
Diseos factoriales fraccionados 2k-p

UNIDAD V

5.1.- Diseo factorial fraccionado 2k-1 62 5.1.2.- Representacin geomtrica del diseo 23-16 63 5.2.- El concepto de resolucin 64 5.3.- Diseos factoriales fraccionados 2k-2 66 5.4.- Diseo factorial fraccionado 2k-p. 67
Bibliografa..72 5.3.1.- Construccin en dos pasos de diseo 2k-2. 66 5.2.1.- Construccin de fracciones 2k-1. 65 5.1.1.- Diseo factorial fraccionado 23-1. 62

M.C.RobertoRomeroLpezii

DiseodeExperimentos

UNIDAD I
Diseo de Experimentos

1.1 Introduccin.Prcticamente en todos los campos de estudio se llevan a cabo experimentos, por lo general para descubrir algo acerca de un proceso o sistema particular. En ingeniera, la experimentacin desempea un papel importante en el diseo de productos nuevos, el desarrollo de procesos de manufactura y el mejoramiento de procesos. El diseo estadstico de experimentos se refiere al proceso para planear el experimento de tal forma que se recaben datos adecuados que puedan analizarse con mtodos estadsticos que llevaran a conclusiones vlidas y objetivas; es la forma eficaz de hacer pruebas en los procesos, ya que proporciona la tcnica y la estrategia necesarias para llevar de manera eficaz los procesos a mejores condiciones de operacin. Cuando el problema incluye datos que estn sujetos a errores experimentales, la metodologa estadstica es el nico enfoque objetivo de anlisis. Por lo tanto, cualquier problema experimental incluye dos aspectos: el diseo de experimento y el anlisis estadstico de los datos. El diseo de experimentos consiste en determinar cules pruebas y cmo es que se deben realizar, para obtener datos que al analizarlos estadsticamente se obtengan conclusiones y decisiones que deriven en mejoras del desempeo del proceso. En general, los experimentos se usan para estudiar el desempeo se procesos y sistemas. El proceso puede por lo general visualizarse como una combinacin de mquinas, mtodos, personas u otros recursos que transforman cierta entrada (en la mayora un material) en una salida que tiene una o ms respuestas observables. Algunas variables del proceso x1, x2,, xp son controlables, mientras que otras z1, z2,, zp son no controlables. El Esquema de un proceso se aprecia en la figura 1 que se muestra delante. Los objetivos de los experimentos podran comprender los siguientes:

1. Determinar cuales son las variables que tienen mayor influencia sobre la respuesta y. 2. Determinar cul es el ajuste de las x que tiene mayor influencia para que y est casi siempre cerca del valor nominal deseado. 3. Determinar cul es el ajuste de las x que tiene mayor influencia para que la variabilidad de y sea reducida. 4. Determinar cul es el ajuste de las x que tiene mayor influencia para que los efectos de las variables no controlables z1, z2,, zq sean mnimos.
M.C.RobertoRomeroLpez1

DiseodeExperimentos

1.2 Conceptos bsicos.Experimento. Se puede definir como una prueba o serie de pruebas en las que se hacen cambios deliberados en las condiciones de operacin (variables de entrada) de un proceso o sistema para observar e identificar las razones de los cambios sobre una o varias propiedades del producto que pudieran observarse (respuesta de salida), lo cual nos permite aumentar el conocimiento acerca del sistema. Diseo de experimentos. Consiste en planear un conjunto de pruebas experimentales, de tal manera que los datos obtenidos se puedan analizar de una manera estadstica para obtener conclusiones vlidas y objetivas acerca del sistema o proceso. Unidad experimental. Es la muestra de artculos que es necesario producir en una condicin de operacin del proceso para obtener una medicin o dato representativo de lo que all ocurre. Una parte importante en el momento de hacer el diseo de experimento es definir con cuidado la unidad experimental, que puede ser una pieza o un conjunto de piezas producidas, todo depende del proceso que se estudia. Variables, factores y niveles. Variable de respuesta. Es la caracterstica, variable de salida o propiedad del producto, cuyo valor interesa mejorar. Est valor determina algn aspecto de la calidad del producto.

Factores controlables. Variables de proceso que se pueden fijar en un punto o en un nivel de operacin. Algunos se controlan en la operacin normal del proceso, lo que los distingue es que para cada uno de ellos hay una manera de manipular su nivel de operacin. Esto es lo que hace que se pueda experimentar con ellos.

Tambin se les llama variables de entrada, condiciones de proceso, variables de diseo, parmetros del proceso, o factores.

Factores no controlables o de ruido. Variables que no se pueden controlar durante la operacin normal del proceso. Algunos factores que no son controlables pueden ser variables ambientales (luz, temperatura, partculas, ruido, etc), el nimo de los operadores, la calidad del material que se recibe del proveedor y los diversos usos que el cliente pueda dar al producto.

M.C.RobertoRomeroLpez2

DiseodeExperimentos

Factores estudiados. Son las variables que se investigan en el experimento, cmo influyen o afectan a la variable de respuesta. Pueden ser factores controlables o no controlables. Para que sea un factor estudiado, es necesario que durante el experimento se haya probado en al menos dos niveles o condiciones.

Cualquier factor puede influir en la variable de respuesta, por lo que en un diseo de experimentos se seleccionan factores que puedan tener efectos sobre la respuesta de inters. Parte de lo que se tiene que superar durante el diseo es ver la manera de controlar un factor que normalmente es no controlable.

Niveles y tratamientos. Los niveles son los valores que se le pueden asignar a cada factor estudiado en un diseo de experimentos. Una combinacin de niveles de todos los factores se llama tratamiento o punto de diseo. Cuando se experimenta con un solo factor podemos decir que la combinacin de niveles es a la vez un tratamiento. Error aleatorio y error experimental. En cualquier experimento realizado, las variables que se observan no las podemos explicar siempre por medio de los factores estudiados. Siempre habr un remanente de variabilidad que se debe a causas comunes o aleatorias, que hacen una variabilidad natural del proceso. Esta variabilidad es el error aleatorio, que es una variabilidad no explicada. Los errores graves que comete el experimentador durante el experimento es el llamado error experimental.

Figura 1.1 Modelo general de un proceso o sistema.

M.C.RobertoRomeroLpez3

DiseodeExperimentos

1.3 Principios bsicos.En el diseo de experimentos se tratan fenmenos que podemos observar y que se repiten. Lo que observamos siempre lo apreciamos con una variabilidad, nada ocurre exactamente de la misma manera dos veces. Hay preguntas que no podemos contestar sin el pensamiento estadstico como: Qu quiere decir cuando la ciencia demanda una observacin sea repetible? Qu repeticin es repeticin? Cundo un resultado es el mismo o difiere en confirmacin o contradiccin?

Para empezar correctamente la planeacin del diseo de experimentos se tienen que aplicar los tres principios bsicos que son la realizacin de replicas, la aleatorizacin y la formacin de bloques o bloqueo, donde la validez del anlisis de los datos se apoya en estos principios.

1.3.1 Realizacin de rplicas.Por realizacin de rplicas se entiende la repeticin (no consecutiva) del experimento bsico. En este principio lo que se hace es correr ms de una vez un tratamiento o combinacin de factores dada. Repetir es volver a correr el proceso, empezar desde las condiciones de operacin, para obtener un nuevo producto, hasta medir el resultado de la corrida del proceso. La realizacin de rplicas posee dos propiedades importantes. Primera, permite al experimentador obtener una estimacin del error experimental. Esta estimacin del error se convierte en una unidad de medicin bsica para determinar las diferencias observadas en los datos que son en realidad estadsticamente diferentes. Segunda, si se usa la media muestral () para estimar el efecto de un factor en el experimento, la realizacin de rplicas permite al experimentador obtener una estimacin ms precisa de este efecto. Si 2 es la varianza de una observacin individual y hay n rplicas, la varianza de la media muestral es

2 = 2/ n
1.3.2 Aleatorizacin.Esta es la piedra angular en la que se fundamenta el uso de los mtodos estadsticos en el diseo experimental. Por aleatorizacin se entiende que tanto la asignacin del material experimental como el orden en que se realizaran las corridas o ensayos individuales del experimento se determinan al azar. Uno de los requisitos de los mtodos estadsticos es que las observaciones (o los errores) sean variables aleatorias con distribuciones independientes. La aleatorizacin hace por lo general que este supuesto sea vlido. La aleatorizacin correcta del experimento ayuda tambin a sacar del promedio los efectos de factores extraos que pudieran estar presentes.

M.C.RobertoRomeroLpez4

DiseodeExperimentos

1.3.3 Formacin de bloques o bloqueo.Es una tcnica de diseo que se utiliza para mejorar la precisin de las comparaciones que se hacen entre los factores de inters. Muchas veces la formacin de bloques se emplea para reducir o eliminar la variabilidad transmitida por factores perturbadores; es decir, aquellos factores que pueden influir en la respuesta experimental pero en los que no hay un inters especfico. Al bloquear se supone que el subconjunto de datos que se obtengan dentro de cada bloque, deben resultar ms homogneos que el conjunto total de datos.

1.4 Metodologa para el diseo de experimentos.Lo principal que se debe tener en cuenta para aplicar el enfoque estadstico y anlisis de un experimento es que todos los participantes tengan una idea exacta de lo que se va a estudiar, cul ser la colocacin de los datos y cmo se van a analizar Un punto fundamental del diseo de experimentos es decidir que pruebas se van a correr en el proceso, y cuantas repeticiones de cada uno, de manera que se obtenga la mxima informacin al mnimo costo sobre lo que se estudia, a esto se le llama matriz de diseo o diseo. Esto se logra a travs de una secuencia de etapas que se deben realizar para llegar hasta el objetivo planteado.

1.4.1 Planeacin.1. Identificacin y enunciacin del problema. Algo comn en la prctica es que no es sencillo darse cuenta cuando existe un problema y no solo es decir que parece un problema importante, eso se debe demostrar por medio de datos y a la vez ver cual es su impacto. Tampoco es fcil hacer una enunciacin clara con la que todos estn de acuerdo. Se debe observar cual es nuestra situacin inicial que es de donde vamos a partir. Es fundamental tener conocimiento del proceso en donde tenemos nuestro problema y desarrollar todas las ideas acerca de los objetivos del experimento, por lo cual es importante solicitar aportaciones de las reas involucradas: ingeniera, calidad, manufactura, mercadotecnia, administracin, el cliente y los operadores (el que conoce a fondo el proceso y en la mayora de los casos no es tomado en cuenta). Es bueno tener un enfoque de equipo para disear experimentos. Es conveniente realizar algunas actividades para que sea mejor este paso: Hacer una lista de los problemas o las preguntas especificas que van a abordarse en el experimento. Una enunciacin clara del problema, que contribuye a alcanzar una mejor compresin del fenmeno bajo estudio y la solucin final del problema. Tener el objetivo global presente.

M.C.RobertoRomeroLpez5

DiseodeExperimentos

En esta etapa se puede dar cuenta de cuando un problema es extenso y no se podr responder a las preguntas claves, por lo que se utiliza, en una estrategia ms adecuada, una serie experimentos ms pequeos. 2. Eleccin de los factores, los niveles y los rangos. Tenemos que utilizar toda la informacin disponible para la solucin de nuestro problema. Al considerar factores encontramos que algunos pueden influir en el desempeo de un proceso, a los cuales se les llama factores potenciales del diseo o factores perturbadores, que son los que el experimentador quiera hacer variar en el experimento. Se pueden encontrar gran cantidad de estos factores por lo que hacemos una clasificacin de estos factores. Factores del diseo. Se seleccionan para estudiarlos en el experimento Factores que se mantienen constantes. Pueden tener efecto sobre la respuesta, pero para fines del experimento en curso no son de inters.

Una vez seleccionados los factores, se eligen los rangos en los que se va a variar estos factores, as como los niveles especficos con los que se realizaran las corridas. Hay que ver cmo se van a controlar los factores en los valores deseados y cmo van a medirse. Para esto es necesario tener un conocimiento del proceso, que suele ser una combinacin de experiencia practica y conocimientos tericos. 3. Seleccin de la variable de respuesta. Esta debe proporcionar informacin til acerca del proceso ya que es el objetivo del experimento. En la mayora de los casos, el promedio o la desviacin estndar de la caracterstica medida ser la variable de respuesta. Pero puede haber ms de una variable de respuesta. Se debe tener confianza en la eficiencia de los instrumentos de medicin que pueden ser un factor importante. Si la eficiencia es inadecuada quiz sea necesaria las replicas adicionales, en lo que se puede medir varias veces y usar el promedio de las mediciones repetidas. 4. Eleccin del diseo experimental. Esto implica la consideracin del tamao de la muestra (repeticiones que se harn para cada tratamiento), la seleccin de un orden de corridas adecuado para los ensayos experimentales y la determinacin de si entran o no la formacin de bloques u otras restricciones sobre la aleatorizacin. Todo se hace tomando en cuenta el tiempo, costo y la precisin deseada. En algunos casos se puede saber de antemano que algunos niveles de los factores producirn valores diferentes de la respuesta. En consecuencia, el inters se centra en identificar qu factores causan esta diferencia y en estimar la magnitud del cambio de la respuesta. 5. Planear y organizar el trabajo experimental. Aqu se organizan las personas que van a intervenir, la forma operativa en que se harn las cosas, etc.

M.C.RobertoRomeroLpez6

DiseodeExperimentos

6. Realizacin del experimento. Se sigue el plan antes hecho, y en caso de algn imprevisto que no se tena contemplado se seala a la persona a la que se le reportara y se seala lo que se har. Cuando se lleva a cabo el experimento se tiene que monitorear el proceso para asegurarse de que todo este con lo planeado. Los errores en el procedimiento experimental pueden destruir la validez experimental. Como sugerencia antes de realizar un experimento se pueden realizar corridas piloto. Con esto se nos proporcionara informacin de la consistencia del material experimental, una comprobacin del sistema de medicin, una idea aproximada del error experimental y la oportunidad de poner en prctica la tcnica experimental global, a la vez de revisar las decisiones tomadas en los pasos 1 al 4. 1.4.2 Anlisis.7. Anlisis estadstico de los datos. Si el experimento se ha llevado a cabo de acuerdo con el diseo, los mtodos estadsticos no deben ser complicados. Se debe determinar el anlisis de varianza o la tcnica estadstica que mejor describa el comportamiento de los datos. Los mtodos grficos desempean un papel importante en el anlisis e interpretacin de datos. Los mtodos estadsticos no pueden demostrar que un factor posee efecto particular, pero si proporciona pautas generales en cuanto a la confiabilidad y la validez del resultado. Aplicados en forma correcta, los mtodos estadsticos no permiten la demostracin experimental de nada, pero si sirven para medir el error posible en una conclusin o asignar un nivel de confianza a un enunciado. Con estos mtodos obtenemos la ventaja de agregar objetividad al proceso de toma de decisiones. Las conclusiones slidas se logran con las tcnicas estadsticas, una buena ingeniera o conocimiento del proceso y sentido comn. 1.4.3 Interpretacin.8. Interpretacin. Se analiza a detalle el proceso del experimento, como el contraste de las conjeturas iniciales con el resultado final, observar nuevos aprendizajes que se lograron en el trayecto, verificar supuestos y elegir el tratamiento ganador. 1.4.4 Conclusiones finales.9. Conclusiones y recomendaciones. Se decide las medidas a implementar para generalizar el resultado final y tratar de mantenerlo, donde los mtodos grficos son de mucha ayuda. Otra cosa que se debe hacer es realizar corridas de seguimiento o pruebas de confirmacin para dar validez a las conclusiones del experimento.

M.C.RobertoRomeroLpez7

DiseodeExperimentos

El experimentar es un proceso del aprendizaje, donde se formulan hiptesis de un sistema, se experimenta y tenemos nuevas hiptesis basadas en los resultados. Con esto llegamos a que la experimentacin es iterativa. En el tiempo que se va avanzando en un programa experimental, es comn abandonar algunas variables de entrada e incorporar otras, se pueden modificar las regiones de exploracin de algunos factores o incorporar nuevas variables de respuesta. Una regla general para el diseo de experimentos es no invertirse ms de 25% de los recursos disponibles en el primer experimento. Con lo que aseguramos que se contar con los recursos suficientes para realizar las corridas de confirmacin y que se alcanzara el objetivo final del experimento.

1.5 Aplicaciones tpicas del diseo de experimentos.Los mtodos del diseo experimental se encuentran en un amplio nmero de aplicaciones de diversas disciplinas. Un aprendizaje viene despus de una serie de actividades donde se hacen conjeturas acerca de un proceso, se llevan a cabo experimentos para generar datos del proceso y se usa esa informacin para nuevas conjeturas, lo que nos lleva a nuevos experimentos. El diseo de experimentos es importante en ingeniera para la mejora del desempeo de un proceso de manufactura y tiene varias aplicaciones en el desarrollo de procesos nuevos. Las aplicaciones de las tcnicas del diseo de experimentos en fases iniciales pueden redundar en: Mejoras en el rendimiento del proceso. Variabilidad reducida y conformidad ms cercana con los requerimientos nominales o proyectados. Reduccin del tiempo de desarrollo. Reduccin de costos globales.

Hay un papel importante del diseo de experimentos en actividades del diseo de ingeniera, para desarrollar productos nuevos y en el mejoramiento de productos existentes. Algunas aplicaciones del diseo experimental en el diseo de ingeniera se encuentran: La evaluacin y comparacin de configuraciones de diseos bsicos. La evaluacin de materiales alternativos. La seleccin de los parmetros del diseo para que el producto tenga un buen funcionamiento en una amplia variedad de condiciones de campo, es decir, para que el producto sea robusto. La determinacin de los parmetros clave del diseo del producto que afectan el desempeo del mismo.

M.C.RobertoRomeroLpez8

DiseodeExperimentos

Con esto podemos lograr que la fabricacin de los productos sea ms sencilla, que tengan un desempeo y confiabilidad de campo mejorado, costos de produccin ms bajos y tiempos ms cortos para el diseo y desarrollo del producto.

1.6 Casos.1.6.1 Caracterizacin de un proceso.En el proceso de fabricacin de tarjetas de circuitos impresos se utiliza una maquina de soldadura lquida. La maquina limpia las tarjetas en un fundente, las somete a un proceso de precalentamiento y despus las hace pasar por una onda de soldadura lquida mediante una transportadora. En este proceso de soldadura se hacen conexiones elctricas y mecnicas de los componentes recubiertos de plomo en la tarjeta. El proceso opera con un nivel de defectos de 1%. Es decir, cerca de 1% de las juntas de soldadura de una tarjeta son defectuosas y requieren correccin manual. Debido a que la tarjeta de circuitos impresos promedio contiene ms de 2000 juntas de soldadura, este nivel de 1% es un nmero alto que requiere correccin. Al ingeniero le interesa un experimento diseado para determinar los parmetros de la mquina que influyen en la ocurrencia de los defectos de soldadura y los ajustes que deberan hacerse en dichas variables para reducir los defectos de soldadura. En la maquina de soldadura lquida hay diversas variables que pueden controlarse. Como: La temperatura de la soldadura. La temperatura del precalentamiento. La velocidad de la transportadora. El tipo de fundente. La gravedad especifica del fundente. La profundidad de la onda de soldadura. El ngulo de la transportadora.

M.C.RobertoRomeroLpez9

DiseodeExperimentos

Hay otros que no son sencillos manejar durante el proceso de fabricacin como lo son: El espesor de la tarjeta de circuitos impresos. El tipo de componentes usados en la tarjeta. La disposicin de los componentes en la tarjeta. El operador. La rapidez de produccin.

Lo que interesa al ingeniero es caracterizar la maquina de soldadura liquida, lo que quiere decir que hay que determinar los factores que afectan la ocurrencia de defectos en las tarjetas de circuitos impresos. En este caso se puede disear un experimento que le permita estimar la magnitud y direccin de los efectos de los factores, es decir, cunto cambia la variable de respuesta cuando se modifica cada factor, y si la modificacin de los factores en conjunto produce resultados diferentes que los obtenidos mediante el ajuste individual de los factores. A este tipo de experimento se le conoce como experimento tamiz o de exploracin exhaustiva. La informacin obtenida se usar para identificar los factores crticos del proceso y determinar la direccin del ajuste de dichos factores a fin de conseguir una reduccin adicional del nmero de defectos por unidad.

1.6.2 Optimizacin de un proceso.En el caso anterior se centraba ms en determinar las variables del proceso que afectan la repuesta. En la optimizacin se determina la regin de los factores importantes que conduzca a la mejor respuesta posible. Como ejemplo, si la respuesta es el rendimiento, se buscara la regin del rendimiento mximo, mientras que si la respuesta es la variabilidad de una dimensin crtica del producto, se buscara una regin de variabilidad mnima. En la mejora del rendimiento de un proceso qumico. Tenemos por los resultados de un experimento de caracterizacin que las dos variables ms importantes del proceso que influyen en el rendimiento son la temperatura de operacin y el tiempo de reaccin. El proceso opera actualmente a 145 F y con 2.1 horas de tiempo de reaccin, produciendo rendimiento de cerca de 80%. La figura 2 nos muestra la vista de la regin tiempo- temperatura. Las lneas de rendimiento constante se unen para formar los contornos de respuesta, y se muestran las lneas de contorno para rendimiento de 60, 70, 80, 90 y 95 por ciento. Estos contornos son las proyecciones en la regin tiempotemperatura de las secciones transversales de la superficie del rendimiento

M.C.RobertoRomeroLpez10

DiseodeExperimentos

correspondiente a los rendimientos porcentuales arriba mencionados. A esta superficie se le llama superficie de respuesta. El personal no conoce la verdadera superficie de respuesta de la figura 2, por lo que se necesitaran mtodos experimentales para optimizar el rendimiento con respecto al tiempo y la temperatura. Para localizar el rendimiento ptimo, es necesario llevar a cabo un experimento en el que se hagan variar conjuntamente el tiempo y la temperatura, es decir, un experimento factorial. En la figura 2 se muestran los resultados de un experimento factorial inicial realizado con dos niveles tanto del tiempo como de la temperatura. Las respuestas que se observan en los cuatro vrtices del cuadrado indican que para incrementar el rendimiento, los cambios deberan hacerse en la direccin general de la temperatura y la reduccin del tiempo de reaccin. Se realizaran algunas corridas adicionales en esta direccin, y esta experimentacin adicional llevara a la regin del rendimiento mximo. Una vez encontrada la regin de rendimiento ptimo, el siguiente paso sera realizar un segundo experimento. El objetivo del segundo experimento es desarrollar un modelo emprico del proceso y obtener una estimacin ms precisa de las condiciones de operacin ptimas para el tiempo y la temperatura. A este enfoque se le llama metodologa de superficies de respuesta. El segundo diseo en la figura 2 es un diseo central compuesto, uno de los diseos ms importantes que se usan en los estudios de optimizacin.

M.C.RobertoRomeroLpez11

DiseodeExperimentos

Figura 1. 2 Grafica de contorno del rendimiento como una funcin del tiempo de reaccin y la temperatura de reaccin, la cual ilustra la experimentacin para optimizar un proceso

1.6.3 Ilustracin del diseo de un producto.Con frecuencia podemos observar que para el diseo de un producto se utilice un mtodo de diseo de experimentos. Un grupo de ingenieros est diseando un gozne de la puerta de un automvil. La caracterstica de calidad del producto que les interesa es el esfuerzo del amortiguador, es decir, la capacidad de retencin del tope que impide que la puerta se cierre cuando el vehculo se estaciona en una pendiente. El mecanismo amortiguador consta de un resorte, la cual produce el esfuerzo amortiguador. El equipo de ingenieros considera que el esfuerzo amortiguador es una funcin de los siguientes factores: La distancia que se desplaza el cilindro. La altura del resorte del pivote a la base. La distancia horizontal del pivote al resorte.

M.C.RobertoRomeroLpez12

DiseodeExperimentos

La altura libre del resorte auxiliar. La altura libre del resorte principal.

Los ingenieros pueden construir un prototipo del mecanismo del gozne en el que es posible variar todos estos factores dentro de ciertos rangos. Identificados los niveles apropiados de estos factores, puede disearse un experimento que conste de varias combinaciones de los niveles de los factores, y el prototipo del gozne puede probarse con estas combinaciones. Obteniendo informacin respecto de los factores que tienen una mayor influencia sobre el esfuerzo amortiguador del tope y, mediante el anlisis de esta informacin, podr mejorarse el diseo del tope.

M.C.RobertoRomeroLpez13

DiseodeExperimentos

UNIDAD II
Inferencia Estadstica

2.1 Introduccin.El campo de la estadstica tiene que ver con la recopilacin, presentacin, anlisis y uso de datos para tomar decisiones y resolver problemas. Cualquier persona tanto en su carrera profesional como en la vida cotidiana recibe informacin en forma de datos a travs de peridicos, de la televisin y de otros medios. A menudo es necesario obtener alguna conclusin a partir de la informacin contenida en los datos de manera rutinaria, el conocimiento de la estadstica tiene una importancia especial en estos campos. De manera especfica, el conocimiento de la estadstica puede constituirse en una herramienta poderosa para ayudar a los cientficos e ingenieros a disear nuevos productos y sistemas, a perfeccionar los existentes y disear, desarrollar y mejorar los procesos de produccin. Pero, Cules son las aplicaciones de la estadstica? A pesar de que manejamos la estadstica desde hace ya algunos aos y en muchas reas de nuestras vidas, la mayora de nosotros an no logramos entender el poder de su aplicacin. Por ejemplo si se desea estimar la edad promedio de los profesores de la UACJ, se toma una muestra de cinco profesores, seleccionados al azar de una lista de 100. Despus de tomar las observaciones, el inters podra centrarse en cuestiones como: La edad promedio de los profesores es menor que 37 aos?, o Cunta confianza puede tenerse en que la edad promedio se encuentra en el intervalo que va de 30 a 45? Los mtodos de la estadstica inferencial se emplean para dar respuestas a estas preguntas. Y a otras del mismo tipo. El campo de la estadstica inferencial se ha desarrollado principalmente desde comienzos del siglo pasado. La mayor parte del uso de moderno de la estadstica, particularmente en la ciencia y en la ingeniera, se dirige mucho haca la inferencia. Por ejemplo un ingeniero que disea un nuevo circuito de computadora fabricar un prototipo y entonces querr obtener conclusiones sobre la forma en que estos dispositivos funcionarn una vez que se produzcan a gran escala.

2.2 Conceptos bsicos de estadstica.Poblacin.- Es una coleccin o totalidad de observaciones posibles que nos interesen, ya sea de individuos, especmenes, objetos o medidas, sobre los que se hace un estudio con el fin de acrecentar el conocimiento que se tiene sobre ellos, cabe mencionar que hay poblaciones finitas e infinitas. Poblacin finita.- Es aquella en la que se pueden medir todos los individuos para tener un conocimiento de exacto de sus caractersticas. Por ejemplo si en la escuela hay 600 estudiantes que clasificamos de acuerdo a su tipo sanguneo, decimos que tenemos una poblacin finita de tamao 600. Los nmeros en las cartas de una baraja, las alturas de los residentes de cierta ciudad y las longitudes de los peces en un lago en particular, son otros ejemplos.

M.C.RobertoRomeroLpez14

DiseodeExperimentos

Poblacin infinita.- Es aquella en la que la poblacin es grande y es imposible e incosteable medir todos los individuos. Casos como un experimento de lanzamiento de un dado, las observaciones que se obtienen de medir la presin atmosfrica de cada da del pasado al futuro, o todas las mediciones de la profundidad de un lago desde cualquier posicin posible, son ejemplos de poblaciones cuyo tamao es infinito. Es necesario mencionar que algunas poblaciones finitas son tan grandes que en teora las suponemos infinitas. Esto es cierto si se considera la poblacin de la duracin de cierto tipo de batera de almacenamiento que se fabrica para su distribucin masiva en todo el pas. Muestra representativa.- Es una parte o subconjunto de una poblacin, seleccionada adecuadamente, que conserva los aspectos claves de la poblacin. Las muestras son muy importantes cuando se tienen poblaciones infinitas o grandes como los materiales, productos terminados, partes, componentes o procesos en la industria, ya que en una produccin masiva sera imposible o al menos imprctico medir cada pieza de cada material que llega o las propiedades de cada producto terminado. La manera de tomar una muestra representativa es disear de manera adecuada un muestreo al azar. Una mala seleccin de la muestra puede llevar a inferencias errneas con respecto a la poblacin, es cuando decimos que el procedimiento esta sesgado, lo que quiere decir que la seleccin se realiz de cierta forma que favorece ciertos elementos en particular o ciertas caractersticas de la poblacin que en la realidad no seran tan representativas. Para eliminar cualquier posibilidad de sesgo es necesario que todos los elementos de la poblacin tengan las mismas oportunidades de ser incluidos en la muestra. Parmetros.- Caractersticas o propiedades medibles que describen una poblacin o conjunto de individuos o elementos. El valor de un parmetro es usualmente desconocido. Algunos ejemplos de parmetros son la media, la varianza o la proporcin (en la industria, por ejemplo, un parmetro puede ser la proporcin de productos defectuosos en una lnea de produccin). Estimadores.- Tambin se le llaman estadsticos, se podra decir que son formulas que extraen informacin de una muestra proveniente de una poblacin y que adems no dependen de un parmetro poblacional desconocido. En otras palabras el valor de un estadstico slo depende de elementos seleccionados de la muestra, por lo que es lgico que el valor vare de una muestra a otra. Conocer la distribucin de un estadstico nos permitir hacer tanto estimaciones de parmetros como pruebas de validez de hiptesis o conjeturas que se tengan sobre una poblacin, hay que mencionar que sera imposible que un estadstico funcione sin error y de un valor exacto del parmetro desconocido. Para cada parmetro existen varios estimadores y escoger uno de ellos es un problema para la mayora de los estudiantes
M.C.RobertoRomeroLpez15

DiseodeExperimentos

pero los puntos a considerar para una buena eleccin son lo que en estadstica llamamos insesgadez y eficiencia. o Insesgadez.- Anteriormente se haba mencionado lo que significa que un procedimiento estadstico este sesgado, de acuerdo a eso un estimador insesgado es aquel que no favorece ciertas caractersticas de la poblacin que puedan hacer que cometamos errores al encontrar valores muy alejados de los que realmente tienen los parmetros poblacionales Por ejemplo, si se desea estimar la media de una poblacin, la media aritmtica de la muestra es un estimador insesgado de la misma. o Eficiencia.- Diremos que un estimador es ms eficiente o preciso que otro si la varianza del primero es menor que la del segundo. En la siguiente figura por ejemplo se ilustran las distribuciones muestrales de tres diferentes estimadores 1, 2, y 3 todos para . Es claro que slo 1 y 2 son insesgados, pues sus distribuciones estn centradas en . El estimador 1 tiene una varianza menor 2 y por lo tanto es ms eficiente. De aqu que nuestra eleccin de un estimador de , entre los tres que se consideran, sera 1.

Figura 2.1 Distribuciones muestrales de diferentes estimadores de . Finalmente una representacin de la relacin entre poblacin y muestra, parmetros y estadsticos.

Figura 2.2 Relacin entre poblacin y muestra, parmetros y estadsticos.

M.C.RobertoRomeroLpez16

DiseodeExperimentos

2.3 Pruebas de hiptesis.A menudo el problema al que se enfrenta el ingeniero no es tanto la estimacin de un parmetro poblacional, sino ms bien la formacin de un procedimiento de decisin que se base en los datos con los que contamos y pueda producir una conclusin acerca de algn sistema que nos ayude a aceptar o rechazar una hiptesis de determinada situacin. Algunos ejemplos de hiptesis o conjeturas que nos importaran probar en la industria son: a) b) c) d) e) Este proceso produce menos del 3% de artculos defectuosos. Hemos logrado mejorar nuestro proceso en 5% respecto al mes anterior. La edad de los operadores no influye en su rendimiento El contenido de los envases tiene mucha variabilidad. ste es el defecto ms comn que se observa y debe a la causa x.

Muchas veces no se tienen elementos para probar las afirmaciones anteriores o mostrar datos adecuados que afirmen la conjetura, el diseo de experimentos es la tcnica que no slo permite probar sino tambin cuantificar los riesgos y el impacto que traera si cualquiera de las hiptesis fuera valida. Para comenzar a adentrarnos en el tema podramos comenzar por dar una definicin de prueba de hiptesis. o Prueba de hiptesis.- Es una regla o procedimiento para decidir si se rechaza una hiptesis a favor de una segunda, con base en la informacin que provee o podemos observar en una muestra aleatoria de datos de la poblacin en estudio.

2.3.1 Hiptesis estadsticas: Conceptos generales.Una hiptesis estadstica es una conjetura o afirmacin sobre los valores de los parmetros de una poblacin. Cabe mencionar que nunca se sabe con absoluta seguridad la falsedad o verdad de una hiptesis estadstica a menos de que examinemos toda la poblacin. Esto por supuesto, sera muy poco prctico e incluso costoso en la mayora de las ocasiones. En su lugar tomamos una muestra aleatoria de la poblacin de inters y utilizamos los datos contenidos en esta muestra para proporcionar evidencia que apoye o no la hiptesis. Algo que debe quedar muy claro es que al momento de disear un procedimiento de decisin o una prueba de hiptesis se debe hacer con la idea de la probabilidad de una conclusin errnea. Por ejemplo, si un investigador mdico desea demostrar que beber caf aumenta el riesgo de contraer cncer, la hiptesis a probar debe ser no hay aumento en el riesgo de contraer cncer como producto de beber caf; de manera

M.C.RobertoRomeroLpez17

DiseodeExperimentos

similar para apoyar la afirmacin de que un tipo de medidores es ms preciso que otro, el ingeniero debe probar la hiptesis de que no hay diferencia en la precisin de los dos tipos de medidor. Esto debe ser as por la siguiente explicacin: suponga que un ingeniero establece que la fraccin de productos defectuosos en cierto proceso es de 0.10, y al probar 100 artculos se encuentra que 12 estn defectuosos. Con esto concluiramos que no hay suficiente evidencia para rechazar la hiptesis de que p = 0.10, lo que nos conducira a su aceptacin. Sin embargo, con la observacin anterior tambin se podran aceptar ms hiptesis como p = 0.12 o incluso p = 0.15. Como podemos ver la aceptacin de una hiptesis simplemente nos indica que no hay suficiente seguridad para rechazarla, lo que no ayuda de mucho. En cambio el encontrar un argumento falso nos ayuda a llegar a una conclusin con ms evidencia. En otros trminos una aceptacin podra ser igual a decir Puede ser una hiptesis verdadera pero no estoy seguro de que sea la real mientras que un rechazo sera igual a decir estoy seguro de que esa hiptesis es falsa. Ahora se ve con ms claridad por que al intentar probar algo debemos buscar el rechazo de lo contrario, para poder estar mucho ms seguros de nuestras pruebas. Para concluir se puede decir que el objetivo de formular una prueba de hiptesis es determinar, con base en la informacin de una muestra de datos elegida al azar de la poblacin en estudio, cul de las dos hiptesis que se pueden formular en un procedimiento de este tipo es la que se aceptar como correcta.

2.3.2 Hiptesis nula y alternativa.En un procedimiento de prueba, se sigue la regla de suponer la existencia de dos tipos de hiptesis, una de ellas se defender como verdadera a menos de que exista suficiente evidencia en contra, y es precisamente la que deseamos probar teniendo en cuenta lo que se menciono en el subtema anterior. sta se denomina hiptesis nula denotndose como H0, generalmente se deriva del hecho de que se plantea como una igualdad. La segunda hiptesis que se encontrar es la que se contrastar con la nula, ser la contraparte llamada hiptesis alternativa denotndose como HA. La hiptesis alternativa permite la posibilidad de varios valores. De aqu si H0 es la hiptesis nula p = 0.5, la hiptesis alternativa HA sera una de las siguientes: p < 0.5, Ejemplos: (a) En una empresa que ensamblan televisores hay una lnea de armado de uno de los componentes donde el tiempo estndar debe ser de 10 minutos en promedio. Debido a un cambio de proveedor de componentes, existe la sospecha de que lo anterior p > 0.5, o p 0.5

M.C.RobertoRomeroLpez18

DiseodeExperimentos

ha influido negativamente en el tiempo de ensamblado, incrementndose el tiempo promedio de armado. En este caso la hiptesis nula, es la afirmacin de que el tiempo promedio en el armado del componente es de 10 minutos y se escribe por H0: =10 min. y la hiptesis alternativa o contraria dice que el tiempo promedio es mayor a los 10 minutos puesto que si fuera menor el cambio no hubiera sido negativo, as que la hiptesis sera HA: >10 min. (b) Una empresa que fabrica bolgrafos compra balincillos de acero de dimetro 2 milmetros para su fabricacin y acepta una tolerancia en el dimetro de 0.5 mm. Para verificar que la empresa fabricadora de balines satisface los requerimientos del fabricante de bolgrafos se selecciona una muestra de 100 balincillos para contrastar la hiptesis nula y alternativa se plantearan como: H0: = 2mm y HA: 2mm (el signo se debe a que los balines no serviran para la fabricacin de bolgrafos si el dimetro no fuera de 2mm).

2.3.3 Criterio de rechazo.Como ya habamos visto una vez planteadas las hiptesis, se toma una muestra aleatoria de la poblacin para despus utilizar la informacin de sta en un estadstico de prueba que es una funcin que adems de depender de los datos de la muestra depende de H0, como lo son por ejemplo los estadsticos Z o T, como veremos ms adelante. En el valor de este estadstico se basar nuestra decisin de aceptar o rechazar la hiptesis nula. Dependiendo de cada caso habr una regin de rechazo de H0 y una regin de aceptacin de H0. La primera se refiere a todo el conjunto de valores que puede tomar el estadstico de prueba para los que la hiptesis nula ser rechazada. Mientras que la segunda describe todos aquellos valores que de manera contraria no conllevan a rechazar H0. El ltimo nmero que observamos al pasar de la regin de aceptacin a la regin crtica se llama valor crtico. La hiptesis nula ser entonces rechazada si y slo si el valor observado o calculado del estadstico de prueba se ubica en la regin de rechazo, regin que a vez depende de si la H0 (hiptesis nula) es bilateral o unilateral. Se dice que es bilateral o una prueba de dos colas cuando la hiptesis alternativa (HA) se plantea con el signo , y es unilateral o una prueba de una cola cuando en la alternativa se encuentran los signos mayor que (>) o menor que (<). Por lo tanto, en los ejemplos anteriores de los televisores y los bolgrafos, el primero se resolvera con una prueba unilateral al ser la siguiente la hiptesis alternativa HA: > 10 min., mientras que el segundo sera bilateral debido a la hiptesis HA: 2mm. Como ya se sabe se utiliza la distribucin normal para representar grficamente una prueba de hiptesis y sabemos adems que dicha grfica tiene forma de campana. En la siguiente figura se ilustra la manera de representar la prueba realizada tanto para el ejemplo de los televisores como para el de los bolgrafos.

M.C.RobertoRomeroLpez19

DiseodeExperimentos

Figura 2.3 Hiptesis unilateral y bilateral, regiones de aceptacin y rechazo. Hay que mencionar que los nmeros Z y Z/2 que separan la regin de rechazo, se leen en la tabla de la distribucin normal para el valor deseado o indicado por el problema. La regin de rechazo no es el rea sombreada bajo las curvas sino ms bien los valores en el eje X que ests en esa zona; el rea sombreada corresponde a la probabilidad de la regin de rechazo o el tamao de . Los pasos para un procedimiento de prueba son realmente fciles: Se plantean las hiptesis segn el caso. Grficamente se sombrean las reas de rechazo separadas de la regin de aceptacin por los valores Z y Z/2 encontradas en la tabla de distribucin normal. Se calcula el estadstico de prueba que se representar como Z0 sustituyendo en la formula correspondiente los valores encontrados en la muestra. Finalmente si el estadstico cae dentro de la regin de rechazo se rechazar H0 tomando la hiptesis alternativa (HA) como la verdadera; en caso de no rechazar H0 esta se aceptar como verdadera. En el ejemplo de los televisores esto equivaldra a que Z0 sea mayor que Z. En el de los bolgrafos se rechaza H0 si Z0 < - Z/2 o si Z0 > Z/2.

2.3.4 Errores tipo I y tipo II en la prueba de hiptesis.Un procedimiento de decisin como el descrito anteriormente podra conducir a dos conclusiones errneas. Dichas conclusiones reciben el nombre de error tipo I y error tipo II. Para ilustrar y entender mejor estos dos conceptos, considere el siguiente ejemplo. Se sabe que cierto tipo de vacuna contra el catarro slo es efectiva en 25% despus de un periodo de dos aos. Para determinar si una nueva vacuna y algo ms cara es superior al proporcionar la proteccin contra el mismo virus durante un periodo ms largo, suponga que se eligen 20 personas al azar y se vacunan. Si ms de ocho de

M.C.RobertoRomeroLpez20

DiseodeExperimentos

los que reciben la nueva vacuna pasan el periodo de dos aos sin contraer virus, la nueva vacuna se considerar superior a la que se usa en la actualidad. La nueva vacuna puede no ser mejor que la que se usa actualmente, pero puede suceder que en este grupo escogido de forma aleatoria, ms de ocho pasen el periodo de dos aos sin contraer el virus. Cometeramos un error al rechazar la hiptesis de que la nueva vacuna es igual a la que ya existe (H0) a favor de la hiptesis de que la nueva vacuna es superior (HA) cuando de hecho H0 es verdadera. Tal error se llama error tipo I. En pocas palabras el error tipo I es aquel que ocurre cuando se rechaza la hiptesis nula cuando en realidad es verdadera. A la probabilidad de cometer un error tipo I, se le llama nivel de significancia, se denota con la letra griega . La regin de rechazo se determina de antemano con el tipo de hiptesis alternativa y el valor del nivel de significancia, dado por el problema o decidido por el investigador desde un principio. Generalmente se utilizan los valores = 0.05 o 0.01. Para darnos una idea de su uso; utilizar = 0.05 significa que por cada 100 veces que se aplique el procedimiento de manera independiente y se rechace H0 se espera que en promedio 95 veces tal decisin sea correcta. Esa probabilidad del 95% viene de 1- = p como = 0.05, p = 1 0.05 = 0.95, o que es lo mismo 95%. Si volvemos al ejemplo de las vacunas una segunda clase de error se puede cometer si ocho personas o menos del grupo pasan el periodo de dos aos sin contraer el virus de forma exitosa y concluimos que la nueva vacuna no es mejor cuando realmente lo es. En este caso aceptaramos H0 cuando es falsa. ste se llama error tipo II y se denota por , normalmente se recomienda que tenga un valor del 0.10. A 1- se le llama potencia de la prueba. Por lo general en las pruebas de hiptesis se especifica el valor de y se disea la prueba de tal forma que el valor sea pequeo. Esto nos dice que el valor del error tipo I se puede controlar directamente, mientras que el error tipo II se controla indirectamente con el tamao de la muestra; a ms datos ser menor. En otras palabras cuando se tiene una muestra grande la potencia de la prueba es mayor, es decir se incrementa la posibilidad de rechazar H0 si sta es falsa. Es necesario mencionar que controlar el valor de puede parecer fcil sin embargo debido a que tambin el tamao de la muestra adecuado se debe estimar el valor de puede ser muy arbitrario. El objetivo deseado por todo estadstico es tener una prueba potente. Sin embargo cuando el tamao de la muestra se incrementa en exceso se llega a tener una potencia excesiva que podra resultar contraproducente amentando la probabilidad de un error tipo I. En la prctica es mucho ms delicado cometer un error tipo I que un error tipo II ya que en la mayora de los casos el rechazo de una hiptesis nula tiene como consecuencia un cambio de algo que ya era convencional originando a veces costos que de ser un error, traeran prdidas irreparables a la empresa. Por ejemplo, sera obviamente mucho mejor que el director del programa de prueba de las vacunas
M.C.RobertoRomeroLpez21

DiseodeExperimentos

cometiera un error tipo II, es decir, aceptar la hiptesis de que la actual y la nueva vacuna tienen la misma eficiencia cuando no es cierto; en vez de cometer el error tipo I de que la nueva vacuna es superior cuando no lo es, ya que de ser as se tomara la decisin de gastar mucho ms dinero en la nueva vacuna siendo que la actual, mucho ms barata, evitaba contraer la enfermedad exactamente igual. A continuacin un resumen de las posibles situaciones que se pueden dar al probar una hiptesis estadstica: Aceptar H0 Rechazar H0 H0 es verdadera H0 es falsa Decisin correcta Error tipo II Error tipo II Decisin correcta Tabla 2.1 Tipos de errores

2.4 Prueba con respecto a una sola media con varianza (2) conocida.Normalmente en el estudio de un proceso suelen interesarnos caractersticas como la media y la varianza (o desviacin estndar), ya que stas tienen que ver directamente con la posibilidad de que el producto cumpla con los requerimientos del proceso de produccin. En particular al estudiar la media de un proceso, es de inters preguntarse si sta es igual, mayor o menor a cierto valor 0, donde 0 representa la media que se obtiene de la muestra. Una pregunta as slo se podra responder a menos de que se plantee una hiptesis estadstica adecuada. Estas pruebas se pueden llevar acabo suponiendo una varianza poblacional (2) conocida o desconocida, en seguida se explicarn ambas a pesar de que muy difcilmente nos encontraremos con el caso donde sea conocida la varianza poblacional.

Tabla 2.2 Pruebas de hiptesis para una media poblacional.

M.C.RobertoRomeroLpez22

DiseodeExperimentos

Caso (i)

Caso (ii)

Caso (iii)

Figura 2.4 Regiones de rechazo para cada caso.

M.C.RobertoRomeroLpez23

DiseodeExperimentos

En la tabla 2.2 podemos observar que para rechazar cualesquiera delas dos hiptesis basta con comparar |Z| con Z, y de manera similar en el ltimo caso slo basta comparar a |Z| con Z/2. Haciendo las comparaciones de esta manera se lograra hacer un procedimiento mucho ms simple. Ejemplo 1: Un fabricante de sistemas de aspersin que se utilizan para proteccin contra incendios en edificios de oficinas afirma que el verdadero promedio de temperatura de activacin del sistema es de 130. Una muestra de n = 9 sistemas, cuando se prueba, produce un promedio muestral de temperatura de activacin de 131.08F. Si la distribucin de las temperaturas de activacin es una variable X normal con desviacin estndar de 1.5F, Contradicen los datos la afirmacin del fabricante al nivel de significancia = 0.01? Procedimiento de solucin: 1. 2. 3. 4. H0: = 130 HA: 130 = 0.01; como es una prueba bilateral se obtiene /2 = 0.01/2 = 0.005 Se busca -Z/2 y Z/2 en la tabla de distribucin normal es decir - Z0.005 = -2.58 y Z0.005 = 2.58. 5. Regin crtica o de rechazo: Z < - 2.58 y Z > 2.58. 6. Clculo de Z: n= 9, x = 131.08, = 1.5, 0 = 130. Z= x - 0 = 130.08 - 130 = 2.16 / n 1.5/9 7. Decisin: aceptar H0 ya que no cae en la regin de rechazo. Por lo tanto lo que se encontr no contradice la afirmacin del fabricante.

Ejemplo 2: Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar poblacional de 8.9, Esto parece indicar que la vida media hoy en da es mayor que 70 aos? Utilice un nivel de significancia de 0.05. Procedimiento de solucin: H0: = 70 aos HA: > 70 aos = 0.05 Se busca Z en la tabla de distribucin normal es decir Z0.05 = 1.645. Regin crtica o de rechazo: Z > 1.645. Clculo de Z: n= 100, x = 71.8, = 8.9, 0 = 70. Z= x - 0 = 71.8 - 70 = 2.02 / n 8.9/100 7. Decisin: rechazar H0 y concluir que la vida media hoy en da es mayor que 70 aos. 1. 2. 3. 4. 5. 6.

M.C.RobertoRomeroLpez24

DiseodeExperimentos

En este y en cualquier ejemplo se puede obtener el valor de la probabilidad de obtener una Z= 2.02 y est dado por el rea de la regin sombreada como se muestra. P = P (Z > 2.02) = 0.0217

Figura 2.5 Valor P para el ejemplo anterior Para finalizar vale la pena decir que este mtodo de prueba con varianza conocida tambin es aplicado mientras la muestra sea grande, es decir en aquellas donde n 30. Como se puede ver la tcnica para efectuar una prueba de hiptesis es relativamente simple; nicamente se debe conocer el estadstico de prueba correspondiente, calcular el valor crtico Z o Z/2, compararlos y decidir rechazar o no rechazar la hiptesis nula. Sin embargo podemos cometer unos de los dos posibles errores al tomar cualquier decisin durante la prueba.

2.5 Prueba con respecto a una sola media con varianza (2) desconocida.-

Tabla 2.3 Pruebas para con varianza poblacional desconocida.

M.C.RobertoRomeroLpez25

DiseodeExperimentos

Hacer una prueba con la varianza poblacional desconocida es prcticamente lo mismo que con varianza conocida, slo hay que tener presentes algunas modificaciones: Nuestro estadstico de prueba ahora es: T = x - 0 donde S= desviacin S / n; de la muestra Este estadstico maneja n 1 grados de libertad y esto se representa con la letra v Ejemplo 1: Un comprador de bateras tipo D requiere que tengan una duracin promedio de 22hrs. Un fabricante de dicho tipo de bateras afirma que su producto satisface la demanda requerida adems de estar distribuido normalmente. El comprador toma una muestra aleatoria de 9 bateras y las usa en diversos artculos electrnicos teniendo una vida til promedio de 20hrs. y una desviacin estndar de 3. Deber el comprador confiar en la palabra del fabricante y adquirir sus bateras? Utilizar un nivel de significancia de = 0.05. Procedimiento de solucin: 1. 2. 3. 4. H0: = 22 HA: 22 = 0.05 y v = n 1= 9 1 =8 Se busca -T/2 y T/2 en la tabla de distribucin t-student con v = 8 grados de libertad es decir - T0.025 = - 2.306 y T0.025 = 2.306. 5. Regin crtica o de rechazo: T < - 2.306 y T > 2.306. 6. Clculo de T: n= 9, x = 20, S = 3, 0 = 22. T= x - 0 = 20 - 22 = -2.0 / n 3/9 7. Decisin: no rechazar H0 ya que el valor del estadstico cae dentro de la regin de aceptacin. Por lo tanto el comprador puede confiar en la palabra del fabricante. El ejemplo anterior se puede representar grficamente de la siguiente manera:

Figura 2.6 Regiones o intervalos de rechazo y de aceptacin


M.C.RobertoRomeroLpez26

DiseodeExperimentos

Ejemplo 2: Un fabricante de dulces compra costales de azcar a un cierto ingenio. Segn los vendedores, los costales tienen un peso medio de 50.1 kg. EL comprador sospecha que el peso medio es menor. Ser cierta su sospecha, al realizar una prueba con un nivel de significancia del 5% ( = 0.05), sobre una muestra de 15 bultos en la que se obtiene un valor x = 49.4 y S2 = 1.2? Procedimiento de solucin: H0: = 50.1 HA: < 50.1 = 0.05 y los grados de libertad sern v = n 1= 15 1= 14 Como el signo de HA es < se busca -T con 14 grados de libertad en la tabla de distribucin t-student es decir -T0.05 = -1.761. 5. Regin crtica o de rechazo: T < -1.761. 6. Clculo de T: n= 15, x = 49.4, S = 1.2, 0 = 50.1. Z= x - 0 = 49.4 50.1 = -2.47 / n 1.2/15 7. Decisin: rechazar H0 debido a que -2.47 < -1.761, con ello rechazamos tambin la afirmacin de que los bultos tienen un peso medio de 50.1. La representacin grfica de la zona de rechazo sera: 1. 2. 3. 4.

Figura 2.7 Zona de rechazo para ejemplo de los costales. As como para las muestras 30 se puede usar el estadstico Z en las muestras menores que 30 el uso de la distribucin t en distribuciones en forma de campana es bastante buena debido a que con otras distribuciones es muy difcil detectar desviaciones de una distribucin normal.

2.6 Prueba para la varianza con una muestra.Las pruebas relacionadas con varianzas o desviaciones estndar poblacionales en realidad no son difciles de motivar. Los ingenieros y los cientficos constantemente se enfrentan a estudios en los que se les requiere demostrar que las mediciones involucradas con productos o procesos caen dentro de las especificaciones que fijan los consumidores. Las especificaciones a menudo se cumplen si la varianza del proceso es
M.C.RobertoRomeroLpez27

DiseodeExperimentos

suficientemente pequea. Otra aplicacin de este procedimiento es la experimentacin comparativa como se ver ms adelante. Caractersticas del procedimiento: Las hiptesis se plantean de la misma menara que cuando se hace para una prueba con respecto a la media. Siendo < > o = los signos que pueden ser utilizados para especificar la HA El estadstico de prueba ser X2 de la distribucin de ji cuadrada Al igual que en la distribucin t-student se utilizar el valor v = n 1, como los grados de libertad. Ejemplo1: Un fabricante de bateras para auto afirma que la duracin de sus bateras se distribuye de forma aproximadamente normal con una desviacin estndar igual a 0.9 aos. Si una muestra aleatoria de 10 de tales bateras tiene una desviacin estndar de 1.2 aos Considera que > 0.9 aos? Utilice un nivel de significancia de 0.05. Procedimiento de solucin: H0: 2 = 0.81 HA: 2 > 0.81 = 0.05 y los grados de libertad sern v = n 1= 10 1= 9 Se busca X2 con 9 grados de libertad en la tabla de distribucin ji cuadrada es decir X20.05 = 16.919. 5. Regin crtica o de rechazo: X2 > 16.919. 6. Clculo de X2: n= 10, S2= (1.2)2 = 1.44, 02 = 0.81, X2= (n 1) S2 = 9(1.44) = 16 0 2 0.81 7. Decisin: aceptar H0 ya que 16 no es mayor que 16.919, con ello rechazamos tambin la consideracin de que > 0.9 aos. 1. 2. 3. 4.

Figura 2.8 Regin crtica para la hiptesis alternativa 2 > 0.81 aos

M.C.RobertoRomeroLpez28

DiseodeExperimentos

Nuestra decisin se baso en que el estadstico no cae dentro de la regin de rechazo, en este caso unilateral como muestra la figura, puesto que dicha regin se concentra en una cola de la distribucin correspondiente.

2.7 Hiptesis para dos medias con distribucin normal (Z).En la industria un problema muy comn es la comparacin de dos productos similares como bateras para automviles, linternas, radios, celulares etc.; y cada uno de los fabricantes reclama que sus productos tienen una vida promedio de duracin mayor o al menos igual que el de la competencia. Otro de los problemas frecuentes es el comparar la media de dos procesos o dos tratamientos; sta es la situacin cuando motivados por algn problema de calidad, se comparan dos mquinas o dos mtodos de trabajo, por mencionar algunos casos de inters. Para utilizar el siguiente procedimiento es necesario cumplir con las siguientes condiciones: Las dos poblaciones en comparacin deben de tener una distribucin normal y sus varianzas 21 y 22 deben ser conocidas. Las muestras x1,.xm , y1,.yn extradas de cada una de las poblaciones deben ser independientes.

Tabla 2.4 Pruebas para diferencias de media Ejemplo 1: Suponga que un comprador desea decidir cual de dos marcas de focos que cuestan lo mismo, dura ms. Para ello selecciona al azar cien focos de cada una de las marcas y encuentra que la marca A tiene una media de muestra de 1180 horas y desviacin estndar de 120hrs. Para la marca B encuentra que la vida media de las muestras es de 1160 hrs con una desviacin estndar de 40hrs. Qu decisin deber tomar a un nivel del 95% de significancia? Suponga que se satisfacen las condiciones 1 y 2 antes mencionadas.

M.C.RobertoRomeroLpez29

DiseodeExperimentos

Procedimiento de solucin: 1. 2. 3. 4. H0: 1 - 2 = 0, probando que ambas marcas tengan el mismo promedio de vida. HA: 1 - 2 0 1 - = 0.95, = 1 0.95 = 0.05 Se busca -Z/2 y Z/2 en la tabla de distribucin normal es decir - Z0.025 = -1.96 y Z0.025 = 1.96. 5. Regin crtica o de rechazo: Z < - 1.96 y Z > 1.96. 6. Clculo de Z: Sustituyendo los siguientes datos: n 100 100 x 1180 1160 120 40

Marca A Marca B

Z = (X1 X2) 0 = (1180 1160) 0 = 1.58 12 + 22 14400 + 1600 n1 n2 100 100 7. Decisin: no rechazar H0 ya que 1.58 no cae en la regin de rechazo. Por lo tanto lo que se encontr no contradice la afirmacin de que ambas marcas de focos tienen la misma vida media. Ejemplo 2: Una empresa norteamericana que se dedica a fabricar ejes de motor para automviles de 4 cilindros tiene dos plantas en Mxico: una en Cd. Jurez y otra en Tijuana. El sindicato de la planta de Tijuana asegura que el salario promedio semanal de los tcnicos de Cd. Jurez es mayor que el de ellos y solicit a la empresa que se nivelen los salarios para que en Tijuana sus tcnicos ganen en promedio lo mismo que los de Cd. Jurez. La empresa solicit al departamento de estadstica que realizar un estudio para atender la peticin sindical. Para ello se tomaron dos muestras al azar de empleados en cada planta para estimar los salarios promedios y compararlos, obteniendo los siguientes resultados (nivel de significancia = 0.05): Planta Tijuana Cd. Jurez Procedimiento de solucin: 1. 2. 3. 4. 5. H0: 1 - 2 = 0, probando que ambas plantas tengan el mismo salario promedio. HA: 1 - 2 > 0 = 0.05 Se busca Z en la tabla de distribucin normal es decir Z0.05 = 1.645. Regin crtica o de rechazo: Z > 1.645. n 40 50 X 1540 1600 150 144

M.C.RobertoRomeroLpez30

DiseodeExperimentos

6. Clculo de Z: Sustituyendo los datos correspondientes: Z = (X1 X2) 0 = (1540 1600) 0 = - 1.92 12 + 22 (150)2 + (144)2 n1 n2 40 50 7. Decisin: no rechazar H0 ya que -1.92 no cae en la regin de rechazo. Por lo tanto se llega a la conclusin de que en las dos plantas se paga el mismo salario promedio por semana. Para concluir este tema es necesario dejar claro que el procedimiento explicado anteriormente es usado cuando 21 y 22 son conocidas y adems slo cuando n1 y n2 sean lo suficientemente grandes es decir se tengan muestras 30.

2.8 Hiptesis para dos medias utilizando distribucin T-student.Las situaciones que ms prevalecen que implican pruebas sobre dos medias son las que tienen varianzas desconocidas. Hay dos casos importantes de mencionar en las que se puede utilizar la prueba T combinada: Caso 1: Se da cuando el cientfico esta dispuesto a suponer que aunque no conozca su valor 1 = 2 es decir se plantean varianzas iguales y desconocidas. Caso 2: Ocurre cuando el analista no es capaz de suponer que 1 = 2, teniendo por lo tanto varianzas diferentes (1 2) y desconocidas. 2.8.1 Caso 1: Pruebas para diferencias de medias con varianzas iguales y desconocidas. En muchos estudios es razonable suponer que las varianzas desconocidas de los dos procesos a comparar son iguales, y un caso de stos sera cuando en las cartas de control de rangos o histogramas que se hayan realizado en cada proceso se observa ms o menos la misma dispersin de los puntos.

Tabla 2.5 Pruebas para diferencias de medias con 1 = 2 pero desconocidas


M.C.RobertoRomeroLpez31

DiseodeExperimentos

Ejemplo: Se lleva a cabo un experimento para comprar el desgaste por abrasivo de dos diferentes materiales laminados. Se prueban 12 piezas del material 1 mediante la exposicin de cada pieza a una mquina para medir el desgaste. Diez piezas del material 2 se prueban de manera similar. En cada caso, se mide la profundidad del desgaste. Las muestras arrojaron los siguientes datos: Material 1 2 N 12 10 x 85 81 S 4 5

Podemos concluir con un nivel de significancia del 0.05 que el desgaste abrasivo del material excede el del material 2 en ms de dos unidades? Procedimiento de solucin: 1. H0: 1 - 2 = 2, el 2 se debe a que queremos probar si el desgaste es en ms de 2 unidades en el material 1 que el del material 2. 2. HA: 1 - 2 > 2 3. = 0.05, v = (n1 + n2) 2 = (10 + 22) 2 = 20 grados de libertad. 4. Se busca T con 20 grados de libertad en la tabla de distribucin t- student es decir T0.05 = 1.725. 5. Regin crtica o de rechazo: T > 1.725. 6. Clculo de t: Sustituyendo los datos correspondientes: x1 = 85 x2 = 81 S2p = s1 = 4 s2 = 5 n1 = 12 n2 = 10

S12 (n1 - 1) + S22 (n2 - 1) = (11)(16) + (9)(25) = 4.478 n1 + n2 -2 12 + 10 -2

(85 81) 2 = 1.04 t = (X1 X2) 0 = Sp 1/n1 + 1/ n2 4.478 (1/12) + (1/10) 7. Decisin: no rechazar H0 ya que 1.04 no cae en la regin de rechazo. Por lo tanto se llega a la conclusin de que el desgaste del material 1 no excede por ms de 2 unidades el desgaste del material 2. El procedimiento de prueba anteriormente descrito para el primer caso es el ms utilizado en la practica para probar la igualdad de dos medias incluso hay software, como Statgraphics, que usan este mtodo por default.

M.C.RobertoRomeroLpez32

DiseodeExperimentos

2.8.2 Caso 2: Pruebas para diferencias de medias con varianzas diferentes y desconocidas. En la prctica generalmente se desconocen las varianzas poblacionales y por ende si son distintas o iguales. El problema es que no hay datos histricos sobre los dos procesos que permitan suponer algo pertinente sobre las varianzas. Sin embargo existe un procedimiento con el cual podremos realizar la prueba sin problemas, siempre y cuando se cumplan dos condiciones: Las muestras son totalmente independientes 1 2 y desconocidas.

Tabla 2.6 Prueba para diferencia de medias con 1 2 y desconocidas. Ejemplo: Un investigador de cierta universidad desea determinar si los estudiantes que ingresaron a un programa de ciencias el ao de 1990 tienen el mismo coeficiente intelectual IQ que los que entraron diez aos despus en el ao 2000. Se seleccionan dos muestras aleatorias de cuatro estudiantes cada una correspondientes a cada uno de los aos de inters de las bases de datos de la universidad y se encontraron los siguientes resultados de inteligencia: IQ Estudiantes Ao 1990: 110, 113, 116, 117 Ao 2000: 110, 111, 112, 112

M.C.RobertoRomeroLpez33

DiseodeExperimentos

Con un nivel de significancia del 0.05 Podra el investigador concluir que los estudiantes del ao 2000 tienen menos coeficiente intelectual de los de1990? De los datos se obtiene:

IQ Estudiantes Ao 1990 Ao 2000

n 4 4

x 114.00 111.25

S 3.16 0.957

Procedimiento de solucin: 1. H0: 1 - 2 = 0, 2. HA: 1 - 2 > 0 3. = 0.05 (S12/n1 + S22/n2)2 = (3.162/4 + 0.9572/4)2 = 3.4547 2 2 2 2 2 2 2 2 ((S1 /n1) /n1 1) + ((S2 /n2) /n2 - 1) ((3.16 /4) )/3 + (0.957 /4) )/3 Son 3.4547 grados de libertad al redondear hacia abajo tendremos: v = 3 5. Se busca T con 3 grados de libertad en la tabla de distribucin t-student es decir T0.05 = 2.353 6. Regin crtica o de rechazo: T > 2.353. 7. Clculo de t: Sustituyendo los datos correspondientes: t = (X1 X2) 0 = (114 111.25) 0 = 1.67 2 2 S1 /n1 + S2 / n2 (3.162/4) + (0.9752/4) 8. Decisin: no rechazar H0 ya que 1.67 no cae en la regin de rechazo. Con esto no rechazamos la afirmacin de que el coeficiente intelectual de los estudiantes que ingresan al programa de ciencias es el mismo para los aos de 1990 y 2000. 4. v = Un ejemplo en el que se podra aplicar el procedimiento de prueba anterior sera al comparar dos proveedores del mismo material ya que no hay suficientes razones para suponer de antemano que las varianzas de cada uno de ellos sean iguales o parecidas (estadsticamente). Cabe mencionar que este procedimiento trabaja bien aun en el caso de que las varianzas sean iguales as que resulta una prueba muy til en la prctica. Como se puede ver las pruebas con respecto a dos medias representan un conjunto de herramientas analticas muy importantes para un ingeniero, y el procedimiento experimental resulta muy fcil ya que prcticamente implica una sencilla sustitucin de datos en la formula adecuada.

M.C.RobertoRomeroLpez34

DiseodeExperimentos

2.9 Prueba para la igualdad de varianzas.Para evitar suponer de antemano que las varianzas son iguales o diferentes, se puede proceder a realizar una prueba de igualdad de varianzas antes de realizar la prueba de igualdad de medias. Las hiptesis planteadas en este procedimiento podran ser las siguientes: H0: 12 = 22 HA: 12 < 22, 12 > 22, o 12 22 Para muestras aleatorias independientes de tamao n1 y n2, el estadstico de prueba ser: F = S12 S22 2 2 Donde S1 y S2 so las varianzas calculadas de las dos muestras. La prueba tiene las siguientes caractersticas: La distribucin a utilizar ser la F Esta distribucin exige un valor v1 y v2, que son los grados de libertad para cada muestra. o v1 = n1 1 o v 2 = n2 1 Las regiones criticas de tamao que corresponden a las alternativas unilaterales son: o 12 < 22 F < f1-(v1,v2) o 12 > 22 F > f(v1,v2) Para la alternativa bilateral: o 12 22 F < f1-/2 (v1,v2) y F > f/2 (v1,v2) Ejemplo: Al probar la diferencia en el desgaste abrasivo de los dos materiales del ejemplo para el tema 2.6.1, supusimos que las dos varianzas poblacionales desconocidas eran iguales. Se justifica esta suposicin? Utilice un nivel de significancia de 0.10. Procedimiento de solucin: 1. H0: 12 = 22 2. HA: 12 22 3. = 0.10 y los grados de libertad sern: v1 = n1 1= 12 1= 11 v2 = n2 1= 10 1= 9 4. Se busca f 1-/2(11,9) y f/2(11,9) con v1 = 11 y v2 = 9 grados de libertad en la tabla de distribucin F es decir f0.05(11,9) = 3.11 f0.95(11,9) = 0.34. esta ltima pudo haber sido calculada con 1/ f0.05(11,9) es decir 1/3.11 = 0.34 5. Regin crtica o de rechazo: F < 0.34 y F > 3.11. Clculo de F: F = S12 = 16 = 0.64 S22 25 6. Decisin: aceptar H0 ya que 0.64 no entra en la regin de rechazo. No hay suficientes evidencia de que las varianzas sean diferentes.

M.C.RobertoRomeroLpez35

DiseodeExperimentos

Figura 2.9 Regin crtica para la alternativa 12 22 Esta es una gran herramienta, ya que el valor de la varianza muestral es un determinante del desempeo y capacidad de los procesos para cumplir con las especificaciones de calidad. A menor varianza, mejor calidad.

M.C.RobertoRomeroLpez36

DiseodeExperimentos

UNIDAD III
Anlisis de varianza (ANOVA) 3.1 Experimentos de un solo factor: procedimiento de prueba para la igualdad de medias poblacionales.
Anlisis de varianza es una tcnica estadstica para realizar la prueba de hiptesis siguiente: H0 : 1 = 2 == k vs H1 : Al menos dos de las medias no son iguales y se dice de un factor porque las medias a prueba se refieren a una sola caracterstica o factor de cada una de las poblaciones, como por ejemplo: Rendimiento en kilmetros por litro de gasolina para cinco marcas (poblaciones o tratamientos del factor) distintas. Tiempo de duracin en horas de varias marcas de focos de 100 watts. Tiempo en minutos para que surta efecto cierto tipo de anestesia administrada en cuatro dosis distintas aplicadas a cuatro grupos de individuos. Duracin en aos para cinco marcas distintas de acumuladores para automvil. Las hiptesis anteriores se pueden escribir de forma equivalente como H0 : 1 = 2 == k H1 : i 0 para algn i donde i es el efecto del tratamiento i sobre la variable de respuesta. Si se acepta H0 se confirma que los efectos sobre la respuesta de los k tratamientos son estadsticamente nulos (iguales a cero), y en caso de rechazar se estara concluyendo que al menos un efecto es diferente de cero. La equivalencia de las dos hiptesis anteriores se puede ver fcilmente en la figura 3.1, que es una manera de representar el diseo completamente al azar. En la figura se ve que i = i - , es decir, el efecto del tratamiento i (i) es la distancia entre la respuesta media del tratamiento, i, y la respuesta media global, , y cuando un efecto es igual a cero, equivale a decir que la media del tratamiento correspondiente es igual a la media global. Para que todas las respuestas medias de tratamientos sean iguales a la respuesta media global representadas por la lnea horizontal, se requiere que todos los efectos i sean iguales a cero.

Figura 3.1 Representacin de los efectos de tratamientos completamente al azar.


M.C.RobertoRomeroLpez37

DiseodeExperimentos

3.2 Diseo completamente aleatorizado, muestras iguales.


Se seleccionan muestras aleatorias de tamao n de cada una de las k poblaciones. Las k poblaciones diferentes se clasifican sobre la base de un solo criterio, como tratamientos o grupos diferentes. Tratamiento se usa para referirnos a las diversas clasificaciones, ya sea mezclas diferentes, anlisis diferentes, fertilizadores diferentes o regiones del pas diferente. Las k poblaciones son independientes y normalmente distribuidas con medias 1, 2,, k y varianza comn 2. Como se menciono en un principio debemos probar a hiptesis H0 : 1 = 2 == n vs H1 : Al menos dos de las medias no son iguales Denotemos yij la j-sima observacin del i-simo tratamiento y los datos se acomodan como en la tabla 3.1. Yi es el total de todas las observaciones en la muestra i-simo tratamiento, i es la media de todas las observaciones de la muestra del i-simo tratamiento. Cada observacin se puede escribir en la forma yij = i + ij donde ij representa el error aleatorio. Tratamiento: 1 y11 y12 Total Media y1n Y1 1 2 y21 y22 y2n Y2 2 ... i yi1 yi2 yin Yi i k yk1 yk2 ykn Yk k Y

Tabla 3.1 k muestras aleatorias Nuestra prueba se basar en una comparacin de dos estimaciones independientes de la varianza poblacional comn 2. Estas estimaciones se obtendrn al dividir la variabilidad total de nuestros datos. Representados en la doble sumatoria

en dos componentes.

M.C.RobertoRomeroLpez38

DiseodeExperimentos

Identidad de suma de cuadrados

Es conveniente identificar los trminos de la identidad de la suma de cuadrados mediante la siguiente notacin:

La identidad de cuadrados la podemos representar de la siguiente manera SST = SSA + SSE Si H0 es verdadera, una estimacin de 2, que se basa en k 1 grados de libertad, la proporciona la siguiente expresin Cuadrado medio del tratamiento

Para un segundo e independiente estimador de 2, que se basa en k(n 1) grados de libertad, es la frmula Cuadrado medio del error

Cuando H0 es verdadera, la razn f = s12 / s2 es un valor de la variable F que tiene una distribucin F con k 1 y k(n 1) grados de libertad. Como s12 sobrestima 2 cuando H0 es falsa, tenemos una prueba de una cola con la regin crtica completamente en la cola derecha de la distribucin.

M.C.RobertoRomeroLpez39

DiseodeExperimentos

La hiptesis nula H0 se rechaza en el nivel de significanca cuando

Otro enfoque, la aproximacin del valor P, sugiere que la evidencia a favor o en contra de H0 es

Los clculos para un problema de anlisis de varianza lo podemos resumir en forma tabular como se ve en la tabla 3.2. Fuente de la Suma de Grados variacin cuadrados libertad Tratamientos SSA k1 Error Total SSE SST de Cuadrado medio s12= SSA k-1 k(n 1) s2 = SSE k(n 1) nk 1 f calculada s1 2 s2

Tabla 3.2 Anlisis de varianza para la clasificacin unilateral Ejemplo Pruebe la hiptesis 1 = 2 == 5 en el nivel de significancia de 0.05 para los datos que se muestran en la siguiente tabla sobre la absorcin de la humedad por varios tipos de mezclas de cemento. Mezcla: 1 551 457 450 731 499 632 3320 553.33 2 595 580 508 583 633 517 3416 569.33 3 639 615 511 573 648 677 3663 610.50 4 417 449 517 438 415 555 2791 465.17 5 563 631 522 613 656 679 3664 610.67

Total Media Solucin

16.854 561.80

H0 : 1 = 2 == 5 H1 : Al menos dos de las medias no son iguales = 0.05 Regin critica: f > 2.76 con v1 = 4 y v2 = 25 grados de libertad. Clculos: SST = (551 561.8)2 + (457 561.8)2 + + (679 561.8)2 = 209,377 , SSA = 6[(553.33 561.8)2 + (569.33 561.8)2 + + (610.67 561.8)2] = 85,356 , SSE = 209,377 85,356 = 124,021.

M.C.RobertoRomeroLpez40

DiseodeExperimentos

Fuente de la Suma de Grados variacin cuadrados libertad Tratamientos 85356 4 Error 124021 25 Total 209377 29

de Cuadrado medio 21339 4960.84

f calculada 4.3014

P = 0.0088 La decisin es rechazar H0 y concluir k las mezclas no tienen la misma absorcin media. El valor P para f = 4.3014 es menor que 0.01.

3.3 Anlisis de varianza para muestras diferentes.


Durante el trabajo experimental con frecuencia se pierden algunas de las observaciones que se desean. Los animales e experimentacin se mueren, el material experimental se puede daar y los sujetos humanos pueden abandonar el estudio. El anlisis anterior para tamaos iguales de muestras an ser vlido al modificar ligeramente las frmulas de tamao n1, n2,, nk, respectivamente. Suma de cuadrados; tamaos diferentes de muestras

Los grados de libertad se dividen como antes: N 1 para SST, k 1 para SSA, y N 1 (k 1) = N k para SSE. Ejemplo Parte de un estudio que se llev a cabo en el Instituto Politcnico y Universidad Estatal de Virginia se diseo para medir los niveles de actividad de fosfatasa alcalina en suero (unidades en Bessey-Lowry) de nios con crisis convulsivas que reciben terapia contra convulsiones bajo el cuidado de un mdico particular. Se encontraron 45 sujetos para el estudio y se clasificaron en cuatro grupos segn el medicamento administrado: G-1: Control (no reciben anticonvulsivos y no tienen historial de crisis . convulsivas) G-2: Fonobartibal G-3: Carbamacepina G-4: Otros anticonvulsivos Se determin el nivel de actividad de la fosfatasa alcalina en suero a partir de muestras sanguneas obtenidas de cada sujeto y se registran en la tabla. Pruebe la hiptesis al nivel de significancia de 0.05 de que el nivel promedio de actividad de fosfatasa alcalina en suero es el mismo para los cuatro grupos.

M.C.RobertoRomeroLpez41

DiseodeExperimentos

G-1 49.20 44.54 45.80 95.84 30.10 36.50 82.30 87.85 105.00 95.22

97.50 105.00 58.05 86.60 58.35 72.80 116.70 45.15 70.35 77.40

G-2 97.07 73.40 68.50 91.85 106.60 0.57 0.79 0.77 0.81

G-3 62.10 94.95 142.50 53.00 175.00 79.50 29.50 78.40 127.50

G-4 110.60 57.10 117.60 77.71 150.00 82.90 111.50

Solucin H0 : 1 = 2 = 5 = 4 H1 : Al menos dos de las medias no son iguales = 0.05 Regin crtica: f > 2.836 Clculos: Y1 = 1460.25, Y2 = 440.36, Y3 = 842.45, Y4 = 707.41, y Y = 3450.47.

Fuente de la Suma de Grados variacin cuadrados libertad Tratamientos 13939 3 Error 53376 41 Total 67315 44

de Cuadrado medio 4646 1302

f calculada 3.57

P = 0.022 La decisin es rechazar H0 y concluir que los niveles promedio de actividad de fosfatasa alcalina en suero para los cuatro grupos no son los mismos. El valor P es 0.02

3.4 Anlisis de varianza bilateral (dos factores).El mtodo utilizado en el anlisis de varianza de clasificacin simple o experimentos de un factor puede generalizarse logrando un procedimiento para clasificacin doble o experimentos de dos factores. Este experimento bilateral de ANOVA permite estudiar simultneamente los efectos de dos fuentes de variacin y se usa para dar solucin a problemas como el siguiente:

M.C.RobertoRomeroLpez42

DiseodeExperimentos

Ejemplo de problemas a los que se dara solucin: Supngase que un experimento agrcola consiste en examinar los rendimientos por acre de cuatro variedades diferentes de trigo, donde cada variedad se cultiva en cinco parcelas diferentes. Luego se necesita un total de (4)(5)= 20 parcelas. Es conveniente en tal caso combinar las parcelas en bloques, por ejemplo 4 parcelas en un bloque, con una variedad diferente de trigo cultivado en cada parcela dentro de un bloque. Necesitndose por lo tanto 5 bloques. El problema anterior es un ejemplo que slo puede ser resuelto con un experimento de dos factores debido a que existen dos clasificaciones o factores, puesto que pueden existir diferencias en el rendimiento por acre debido a: El tipo particular de trigo cultivado. O el bloque particular utilizado (fertilidad del suelo etc.)

En este tipo de experimentos con frecuencia se suele referirse a las dos clasificaciones o factores en un experimento como tratamientos y bloques, pero lgicamente podramos simplemente referirnos a ellos como factor 1, factor 2, etc. 3.4.1 Notacin para experimentos de dos factores.Suponiendo que tenemos a tratamientos y b bloques, se construye la siguiente tabla donde se supone que hay un valor experimental (por ejemplo rendimiento por acre) correspondiente a cada tratamiento y bloque.

Tabla 3.3 Notacin para experimentos de dos factores. Para el tratamiento j y el bloque k denotamos este valor por xjk. La media de los valores en la fila j se denota por xj donde j = 1,,.a, mientras que la media de los valores en la columna k se denota por xk, donde k = 1,b. La gran media o media total se denota por x. En smbolos: ba xj =1/b xjk xk = 1/a xjk
k =1

x = 1/ab

xjk

j = 1j,k

M.C.RobertoRomeroLpez43

DiseodeExperimentos

3.4.2 Variaciones para experimentos de dos factores.Tal como se hizo en los experimentos de un factor, podemos definir variaciones para experimentos de dos factores. Dichas variaciones se definirn y obtendrn como se indica en las siguientes formulas: v = (xjk - x)2
j,k

o bien

v = ve + vr + vc donde:
j,k

ve = Variacin debida al error o al azar = (xjk - xj - xk + x)2 vr = Variacin entre filas (tratamientos) = b ( xj - x)2
j,k a

vc = Variacin entre columnas (bloques) = a ( xk - x)2


j,k

La variacin debida al error o residual se conoce tambin como variacin residual. A continuacin se darn unas formulas cortas utilizadas en computacin, que resultan de mucha prctica para obtener las respectivas variaciones de una forma un poco ms rpida. v = xjk2 2 j,k ab vr = 1 j2 - 2 b j=1 ab vc = 1 k2 - 2 a k=1 ab ve = v vr vc Donde j es el total de valores en la fila j, k es el total de valores d la columna k y es el total de todos los valores. Al igual que en cualquier experimento visto anteriormente ste tambin requiere del planteamiento de ciertas hiptesis para su comprobacin y posterior solucin de nuestro problema, con la diferencia de que no tendremos slo una hiptesis nula sino dos como las siguientes:
b
a

H0(1) : Todas las medias de tratamientos son iguales, es decir xj = 0 cuando j = 1, 2., a. H0(2) : Todas las medias de bloques son iguales, es decir xk = 0 cuando k = 1, 2., b.

M.C.RobertoRomeroLpez44

DiseodeExperimentos

Si H0(1) y H0(2) son ciertas, entonces es necesario calcular los siguientes datos: r2 = Vr , c2 = Vc , 2 = V . a1 b1 ab 1 Los datos anteriores sern utilizados para obtener el estadstico correspondiente para la prueba de cada hiptesis nula como lo indica el siguiente teorema:

Bajo la hiptesis H0(1) el estadstico r2/c2 tiene la distribucin F con a 1 y (a 1)(b 1) grados de libertad. Bajo la hiptesis H0(1) el estadstico c2/c2 tiene la distribucin F con b 1 y (a 1)(b 1) grados de libertad.

Este teorema nos permite aceptar o rechazar H0(1) H0(2) a niveles de significacin especificadas. Por conveniencia, como en el caso de un slo factor, una tabla de anlisis de varianza puede construirse como se muestra en la siguiente tabla: Variacin Entre tratamientos, vr Entre bloques, vc Residual o aleatorio ve Total V Grados de libertad a -1 b-1 (a-1)(b - 1) ab -1 Media de cuadrados 2 r = vr a -1 2 c= vc b-1 2 e = ve (a-1)(b-1) F 2r/2e g.l. = a-1,(a-1)(b-1) 2c/2e g.l. = b-1,(a -1)(b-1)

Tabla 3.4 Tabla de anlisis de varianza para experimentos de dos factores.

Ejemplo: La siguiente tabla muestra el rendimiento por acre de cuatro cosechas de plantas diferentes cultivadas en parcelas tratadas con tres tipos diferentes de fertilizantes. Utilizando el mtodo largo, ensayar al nivel de significacin de 0.05 si (a) hay diferencia significativa en rendimiento por acre debida a los fertilizantes, (b) hay una diferencia significativa en rendimiento por acre debido a las cosechas.

M.C.RobertoRomeroLpez45

DiseodeExperimentos

Cosecha I Fertilizante A Fertilizante B Fertilizante C 4.5 8.8 5.9

Cosecha II 6.4 7.8 6.8

Cosecha III 7.2 9.6 5.7

Cosecha IV 6.7 7.0 5.2

Procedimiento de solucin: 1.-Calculamos los totales de fila y medias de fila, como tambin los totales de columna, las medias de columna, la gran media como se indica enseguida. Cosecha Cosecha Cosecha Cosecha I II III IV Fertilizante A Fertilizante B Fertilizante C Totales de columna Medias de columna 4.5 8.8 5.9 19.2 6.4 6.4 7.8 6.8 21.0 7.0 7.2 9.6 5.7 22.5 7.5 6.7 7.0 5.2 18.9 6.3 Totales de fila 24.8 33.2 23.6 Gran total = 81.6 Gran media = 6.8 Media de fila 6.2 8.3 5.9

2.-Calculamos variaciones con las formulas correspondientes: vr = Variacin de medias de fila con respecto a la gran media (tratamientos). = b ( xj - x)2 = 4[(6.2 6.8)2 + (8.3 6.8)2 + (5.9 6.8)2] = 13.68
j,k a

vc = Variacin de medias de columna con respecto a la gran media (bloques) . = a ( xk - x)2 = 3[(6.4 6.8)2 + (7.0 6.8)2 + (7.5 6.8)2 + (6.3 6.8)2] = 2.82
j,k

v = Variacin total = (xjk - x)2 = (4.5 6.8)2 + (6.4 6.8)2 + (7.2 6.8)2 + (6.7 6.8)2 + (8.8 6.8)2 + (7.8 6.8)2 + (9.6 6.8)2 + (7.0 6.8)2 + (5.9 6.8)2 + (6.8 6.8)2 + (5.7 6.8)2 + (5.2 6.8)2 = 23.08
M.C.RobertoRomeroLpez46

DiseodeExperimentos

ve = v - vr - vc = 23.08 13.68 2.82 = 6.58 3.- Se crea la tabla de anlisis de varianza: Variacin Grados de libertad Media de cuadros vr = 13.68 vc = 2.82 ve = 6.58 v = 23.08

2 3 6 11

F F = r /2e = 6.24 2r = 13.68/2 = 6.84 gl: 2,6 2 F = c /2e = 0.86 2c = 2.82/3 = 0.94 gl: 2,6 2e = 6.58/6 = 1.097
2

4.-Criterio de decisin: Buscan en tabla de distribucin F al nivel de significacin de 0.05 con 2,6 grados de libertad, F = 5.14. Entonces, ya que 6.24 (valor obtenido en tabla) > 5.14, podemos rechazar la hiptesis de que las medias de fila son iguales y concluir que al nivel 0.05 hay una diferencia significativa en el rendimiento debida a los fertilizantes. Algo muy importante es que ya que el valor de F correspondiente a las diferencias en las medias de columnas es menor que 1 podemos concluir que no hay diferencia significativa en el rendimiento debido a las cosechas. Enseguida se mostrar como utilizar el mtodo rpido es decir las formulas cortas para obtener los resultados del problema anterior: De la tabla: x2jk = (4.5)2 + (6.4)2 + + (5.2)2 = 577.96 = 24.8 + 33.2 + 23.6 = 81.6 j2 = (24.8)2 + (33.2)2 + (23.6)2 + = 2274.24 k2 = (19.2)2 + (21.0)2 + (22.5)2 + (18.9)2 = 1673.10 Entonces: v = xjk2 2 = 577.96 - [(81.6)2/ (4)(3)] = 23.08 j,k ab vr = 1 j2 - 2 = (2274.24) 554.88 = 13.68 b j=1 ab vc = 1 k2 - 2 = 1/3(1673.10) 554.88 = 2.82 a k=1 ab ve = v vr vc = 23.08 13.68 2.82 = 6.58
b
a

M.C.RobertoRomeroLpez47

DiseodeExperimentos

Si verifica son los mismos resultados obtenidos con las formulas largas. De aqu en adelante se contina desde el paso 3 para llegar a la solucin del problema. 3.4.3 Experimento de dos factores con repeticin.En el tema anterior solamente exista un valor correspondiente a un tratamiento dado y a un bloque dado. Se puede dar el caso en el que se tenga ms informacin como por ejemplo dos o tres valores en vez de uno por tratamiento y bloque. Considerando los factores puede a veces obtenerse la solucin a un problema as repitiendo el experimento anteriormente explicado por esto es que a este proceso se le conoce como repeticin. En tal caso como ya dijimos habr ms de un valor correspondiente a un tratamiento dado y a un bloque dado. Supondremos que hay c valores para cada posicin, pero debe tomarse en cuenta que se pueden hacer cambios apropiados para aquellos casos en los que los nmeros de repeticiones no son todos iguales. La notacin usada en el mtodo de repeticin seguir el mismo esquema que el del tema anterior habr slo unas pequeas diferencias, una de ellas es que aadiremos un nuevo factor conocido como interaccin fila-columna o tratamiento-bloque (a veces denominado interacciones). Una segunda diferencia lo son las formulas aqu tambin obtendremos variaciones y estarn dadas segn lo siguiente: v = (xjkl - x)2
j,k,l

o bien

v = ve + vr + vc + vi donde:

ve = Variacin debida al error o al azar = (xjk - xjk)2


j,k,l

vr = Variacin entre filas (tratamientos) = bc ( xj - x)2


j=1

vc = Variacin entre columnas (bloques) = ac ( xk - x)2 vi = Variacin debida a interacciones = c (xjk - xj - xk + x)2
j,k
k=1

Utilizando el nmero apropiado de grados de libertad para cada fuente de variacin, podemos establecer una tabla de anlisis de varianza como la siguiente:

M.C.RobertoRomeroLpez48

DiseodeExperimentos

Variacin Entre tratamientos, vr Entre bloques, vc Inetraccin, vi Residual o aleatorio, ve Total, V

Grados de libertad a -1 b-1 (a - 1)(b-1) ab(c - 1) abc -1

Media de cuadrados vr . a -1 2 c= vc . b-1 2 i= vi . (a - 1)(b-1) 2 e = ve . ab(c - 1) 2 r =

F 2r/2e g.l. = a-1, ab(c-1) 2c/2e g.l. = b-1, ab(c-1) 2i/2e g.l. = (a-1)(b-1), ab(c-1)

Tabla 3.5 Tabla de anlisis de varianza para experimentos de dos factores con repeticin. Como se puede ver en la ltima columna de relaciones F en este experimento hay tres estadsticos por los tanto existen tres hiptesis nulas y son las siguientes: H0(1) : Todas las medias de tratamiento (fila) son iguales, es decir xj = 0 cuando j = 1, 2., a. H0(2) : Todas las medias de bloque (columna) son iguales, es decir xk = 0 cuando k = 1, 2., b. H0(3) : No hay interacciones entre tratamientos y bloques esto es xkj = 0 Desde un punto de vista prctico debemos primero decidir si se puede rechazar o no H0 a un nivel apropiado de significacin utilizando la relacin F de i2 / e2. Dos casos posibles se presentan:
(3)

Caso I.- H0(3) no puede rechazarse. En este caso podemos concluir que las interacciones no son muy grandes, luego de obtener un valor mayor que 1 en el estadstico de prueba i2 / e2 o un valor menor al indicado por la tabla de distribucin F con los grados de libertad correspondientes. Luego podemos ensayar H0(1) H0(2) utilizando sus respectivos estadsticos. Caso II.- H0(3) puede rechazarse. En este caso podemos concluir que las interacciones son considerablemente grandes, luego de obtener un valor menor que 1 en el estadstico de prueba i2 / e2 o un valor mayor al indicado por la tabla de distribucin F con los grados de libertad correspondientes. Luego podemos ensayar H0(1) H0(2) utilizando sus respectivos estadsticos y el mismo mtodo de prueba para conocer la solucin al problema.

M.C.RobertoRomeroLpez49

DiseodeExperimentos

Al igual que en el tema anterior el proceso de solucin no implica ms que sustitucin de formulas y comparacin de estadsticos con valores de la tabla de distribucin F. A continuacin se resolver un problema en el que se propondr un procedimiento alterno en donde se podr observar que es mucho ms sencillo efectuar este experimento al totalizar primero los valores de repeticin que corresponden a tratamientos (filas) y bloques (columnas) particulares. Esto generar una tabla con valores singulares que puede analizarse tal y como se hizo en el tema de anlisis de dos factores sin repeticin. Ejemplo: Un productor desea determinar la efectividad de cuatro tipos de maquina A, B, C, D en la produccin de tornillos. Para llevarlo a cabo se obtiene el nmero de tornillos defectuosos producidos por cada mquina durante los das de una semana en cada uno de los dos turnos. Los resultados se indican en la siguiente tabla. Efectuar un anlisis de varianza para ensayar al nivel de significacin del 0.05 si hay (a) una diferencia en la mquinas, (b) una diferencia en los turnos.
Lun 6 10 7 8 Primer Turno Mar Mie Jue 4 5 5 8 7 7 5 6 5 4 6 5 Vie 4 9 9 5 Lun 5 7 9 5 Segundo Turno Mar Mie Jue 7 4 6 9 12 8 7 5 4 7 9 7 Vie 8 8 6 10

A B C D

Procedimiento de solucin: 1.- Organizar los datos en una tabla que nos permita ver ms claros los dos factores mquina y turno. Ntese que para cada mquina se han indicado dos turnos:

Factor 1 Mquina A B C D

Factor II Turno 1 2 1 2 1 2 1 2 Totales Lun 6 5 10 7 7 9 8 5 57

REPETICIONES Mar 4 7 8 9 5 7 4 7 51 Mie 5 4 7 12 6 5 6 9 54 Jue 5 6 7 8 5 4 5 7 47 Vie 4 8 9 8 9 6 5 10 59 Totales 24 30 41 44 32 31 28 38 268

M.C.RobertoRomeroLpez50

DiseodeExperimentos

2.- Obtenemos variacin total de repeticiones en donde tenemos un total de (5)(8) = 40datos:

a(b) =

v = xjkl 2 - 2= 62 + 42 + 52 + .+ 72 +102 (268)2 = 1946 1795.6 = 150.4 j,k,l ab (5)(8) 3.- Para considerar los dos factores principales, mquina y turno, concentramos nuestra atencin al total de los valores de repeticin correspondientes a cada combinacin de factores. Estos se ordenarn como muestra la tabla que como se puede ver ya es de dos factores con valores simples y no de repeticin.

Primer turno A B C D Totales 24 41 32 28 125

Segundo Turno 30 44 31 38 143

Totales 54 85 63 66 268

4.- Obtenemos variaciones como sigue: Primeramente la variacin de la tabla anterior que llamaremos variacin subtotal vs, que viene dada por: vs = (24)2 + (41)2 + (32)2 + (28)2 + (30)2 + (44)2 + (31)2 + (38)2 - (268)2 = 65.6 5 5 5 5 5 5 5 5 40 Se puede observar que son tomados cada uno de los datos de la ltima tabla donde el ltimo dato es el gran total, el 40 es por el nmero de repeticiones que ya se haba mencionado anteriormente y el 5 representa el nmero de das. La variacin entre filas viene dada por: vr = (54)2 + (85)2 + (63)2 + (66)2 - (268)2 = 1846.6 1795.6 = 51.0 10 10 10 10 40 El 10 se debe a que por cada da tenemos dos datos el del primer turno y el del segundo turno. La variacin entre columnas viene dada por: vc = (125)2 + (143)2 (268)2 = 1803.7 1795.6 = 8.1 20 20 40 El 20 se refiere a que por cada maquina hay 5 das de prueba (5)(4) = 20. La variacin debida a las interacciones se calcular como sigue: vi = vs - vr - vc = 65.6 51.0 8.1 = 6.5

Finalmente la variacin residual, que puede considerarse como la aleatoria o de error ve (si se cree que los diferentes das de la semana no producen diferencia importante) se da de la siguiente manera:

M.C.RobertoRomeroLpez51

DiseodeExperimentos

ve = v (vr + vc + vi) = v - vs = 150.4 65.5 = 84.8 5.- Hacemos la tabla de anlisis de varianza correspondiente:
Variacin Filas (mquinas), vr = 51.0 Columnas (turnos), vc = 8.1 Interaccin vi = 6.5 Subtotal vs = 65.6 Aleatoria o residual ve = 84.8 Total, v = 150.4 Grados de libertad 3 1 3 7 32 39 2e = 2.65 Media de cuadrados 2r = 17 2c = 8.1 2i = 2.167 F 17/2.65 = 6.42 8.1/2.65 = 3.06 2.167/2.65 =0.817

Grados de libertad correspondientes: Basndonos en la tabla anterior a la del anlisis de varianza los grados de libertad se obtendran como sigue: Como en dicha tabla hay 4 filas la variacin debida a las filas tendr 4 1 = 3 grados de libertad. Existen 2 columnas as que los grados de libertad de la variacin de columnas estar dada por 2 1 = 1 grado de libertad. Para la interaccin hay 8 valores as que para vs habr 8 1 grados de libertad. Los grados de libertad para vi =7 (3 +1) = 3 Ya que hay 40 valores en la tabla original el total de grados de libertad ser 40 1 = 39. Finalmente para la variacin residual sern 39 7 = 32 grados de libertad. 6.- Ahora analizamos y determinamos si hay alguna interaccin significativa entre los factores bsicos (es decir filas columnas de la tabla). En la tabla de anlisis de varianza vemos que para interaccin hay F= 0.817, lo cual nos india que la interaccin no es significativa, esto es, podemos rechazar la hiptesis H0(3). Siguiendo las reglas al principio del tema explicadas vemos que F para las filas es 6.42. Puesto que F.95 = 2.90 para 3, 32 grados de libertad podemos rechazar la hiptesis H0(1) de que las filas tienen medias iguales. Esto por conclusin es equivalente a decir que al nivel de 0.05 las mquinas no son igualmente efectivas es decir no rechazamos H0(2).

Las tcnicas de anlisis de varianza discutidas anteriormente se emplean despus de que han obtenido los resultados de un experimento. Sin embargo, puede ganar tata informacin como sea posible, los detalle de un experimento deben planearse cuidadosamente con anterioridad.

M.C.RobertoRomeroLpez52

DiseodeExperimentos

UNIDAD IV
Diseo Factorial Completo
El objetivo de un diseo factorial es estudiar el efecto de varios factores sobre una o varias respuestas o caractersticas de calidad, es decir, lo que se busca es estudiar la relacin entre factores y la respuesta, con la finalidad de conocer mejor como es esta relacin y generar conocimientos que permita tomar acciones y decisiones que mejoren el desempeo del proceso.

4.1 Definicin de experimento factorial.Un diseo de experimentos factorial o arreglo factorial es el conjunto de puntos experimentales o tratamientos que pueden formarse considerando todas las posibles combinaciones de los niveles de los factores. Por ejemplo, con k = 2 factores, ambos con dos niveles de prueba, se forma el diseo factorial 2 X 2 = 22 que consiste en cuatro combinaciones o puntos experimentales. Considerando otra vez k = 2 factores, pero ahora uno con tres niveles y el otro con dos niveles, se puede construir 3 X 2 combinaciones que dan lugar al diseo factorial 3 X 2. Observe que en el nombre del diseo factorial va implcito el nmero de tratamientos que lo componen. Los factores pueden ser de dos tipos: Cualitativos.- Maquinas, tipos de material, operador, la presencia o ausencia de una operacin previa, etc. Cuantitativos.- Temperatura, humedad, velocidad, presin, etc. Para poder estudiar la manera que influye cada factor sobre la variable de respuesta, es necesario elegir al menos dos niveles de prueba para cada uno de ellos. Con el diseo factorial completo se corren aleatoriamente en el proceso todas las posibles combinaciones que pueden formarse con los niveles seleccionados. Para obtener el numero de corridas experimentales se multiplica el numero de tratamientos por el numero de replicas, donde una replica se lleva a cabo cada vez que se repite el arreglo completo.

4.2 Ventajas de los Diseos Factoriales.1. Son diseos que se pueden aumentar para formar diseos compuestos en caso de que se requiera una exploracin mas completa. 2. Se pueden correr fracciones de diseos factoriales, las cuales son de gran utilidad en las primeras etapas de una investigacin que involucra muchos factores, cuando interesa descartar de manera econmica los que no son importantes, antes de hacer un estudio ms detallado con los factores que si son importantes.

M.C.RobertoRomeroLpez53

DiseodeExperimentos

3. Pueden utilizarse en combinacin con diseos de bloques en situaciones en las que no puede correrse todo el diseo factorial completo bajo las mismas condiciones o circunstancias. 4. La interpretacin y clculo de los efectos en los experimentos factoriales se pueden hacer con aritmtica elemental, en particular cuando cada factor se prueba en dos niveles. El efecto de un factor se define como el cambio observado en la variable de respuesta debido a un cambio de nivel de tal factor. El efecto principal se define como el cambio en la media de la variable de respuesta producido por un cambio en el nivel de cada factor. Por ejemplo: Supongamos que se tienen dos factores A: Velocidad y B: Temperatura, cada uno con dos niveles (bajo y alto) denotado por A1= 80 Km. / h, A2= 120 Km. / h y B1= 20 C, B2: 33 C, respectivamente. Temperatura B1: 20C B2: 33C 25 35 35 42

Velocidad

A1: 80 km/h A2: 120 Km/h

Matemticamente el efecto principal del factor A se obtiene como la diferencia entre la respuesta promedio observada cuando el factor estuvo en el primero y segundo nivel de ese factor, es decir: Efecto A = A2B1 + A2B2 A1B1 + A1B2 2 2 Velocidad = 35 + 42 25 + 35 = 8.5 2 2 Efecto B = A1B2 + A2B2 A1B1 + A2B1 2 2 Temperatura = 35 + 42 25 +35 = 8.5 2 2 Esto quiere decir que si incrementamos el factor A del nivel 1 al 2, se produce un cambio en la respuesta promedio de 8.5 unidades. Si incrementramos el efecto principal del factor B seria tambin de 8.5 unidades. Por otra parte, se dice que dos factores interactan entre si o que tienen un efecto de interaccin sobre la variable de respuesta, cuando el efecto de un factor depende del nivel en que se encuentra el otro. Si existieran ms niveles para cada factor, este procedimiento cambia. El efecto de A en el primer nivel de B es:

M.C.RobertoRomeroLpez54

DiseodeExperimentos

A = 35 25 = 10 El efecto de A en el segundo nivel de B es: A = 42 35 = 7 Sin embargo en muchos casos puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la misma en todos los niveles de los otros factores. Por ejemplo: Factor B B1 B2 25 35 40 10

Factor A

A1 A2

El efecto de A en el primer nivel de B es: A = 40 25 = 15 El efecto de A en el segundo nivel de B es: A = 10 35 = 25 Si estos dos efectos de A en funcin del nivel de B fueran diferentes, entonces eso seria evidencia de que la eleccin ms conveniente del nivel de A depende del nivel de B, y viceversa. Esto seria evidencia de que los factores A y B interactan entre si. En este caso puede suponerse que entre los factores A y B existe una iteracin ya que el efecto de A depende del nivel elegido de B.

4.3 Representacin del efecto de interaccin.El efecto de interaccin se puede graficar, poniendo en el eje vertical una escala que represente la magnitud de la variable de respuesta, luego uno de los factores se representa con sus dos niveles en el eje horizontal y en direccin vertical de cada uno de estos niveles, se anota un punto que represente la respuesta promedio de cada nivel del otro factor. Finalmente cada punto del lado izquierdo se une con sus correspondientes puntos del lado derecho mediante una lnea recta. Resulta que cuando existe interaccin entre las lneas obtenidas tienen una pendiente muy diferente y si no hay interaccin las lneas tienen pendientes muy similares, que son aproximadamente paralelas.

M.C.RobertoRomeroLpez55

DiseodeExperimentos

Estos datos pueden graficarse de la siguiente manera:


Re
50

Re A1B2=35 A2B2=42 A2B1=35 A1B1=25


20 10

50 40 30 20

s
40

s p u

A2B1 A1B2 A1B1 A2B2

p u e s t
A1 30

e s t FactorA
A2 A1 10

FactorA

A2

Experimentosiniteracin

Experimentoconiteracin

Cuando la iteracin es grande (un factor depende de otro), los efectos principales no tienen sentido. Por ejemplo, de la tabla de la iteracin: Efecto de A = 40 + 10 25 + 35 = 5 2 2 Efecto de B = 35 + 10 25 + 40 = 10 2 2 Estos valores son muy pequeos, por lo cual se corre el riesgo de concluir que no existe un efecto debido al factor A.

4.4 Diseo factorial de dos factores.A este diseo factorial tambin se le conoce como diseo bifactorial y contiene todas las combinaciones de tratamiento ab. En general hay n repeticiones. Para diseos factoriales de dos factores considere los factores A y B con a y b (a, b 2) niveles de prueba, respectivamente. Con ellos se puede construir el diseo factorial a x b, que consiste en a x b tratamientos. Los diseos factoriales que involucran menos de cuatro factores se corren replicados para poder tener la potencia necesaria en las pruebas estadsticas sobre los efectos de inters, de tal forma que si se hacen n replicas, el nmero total de corridas experimentales es n(a x b). Con un diseo factorial se pueden estudiar los dos efectos individuales y el efecto de interaccin de ambos factores. En trminos estadsticos lo que se afirma es

M.C.RobertoRomeroLpez56

DiseodeExperimentos

que el comportamiento de la respuesta Y en el experimento con k replicas se podr describir mediante el modelo de efectos. Modelo Estadstico;

Donde, = Es la media general. i = Es el efecto debido al i-esimo nivel del factor A. j= Es el efecto de j-esimo nivel del factor B. () ij = Es el efecto de interaccin en la combinacin ij . ijk; = Error aleatorio. Ejemplo: Un ingeniero disea una batera para un dispositivo el cual ser sometido a diferentes temperaturas (15, 70 y 125F), el nico parmetro de diseo que puede seleccionar es el material de la cubierta de la batera, sin embargo puede elaborar un diseo bifactorial que le permita poder variar la temperatura (tres niveles). La siguiente tabla muestra la duracin en horas de la batera: Tipo de Material 1 2 3 Temperatura F 15 70 130 155 34 74 180 40 150 188 136 159 126 106 138 110 174 168 160 150 125 40 82 25 58 96 82

40 74 122 115 120 139

70 58 70 45 104 60

Un importante problema de ingeniera, es que un producto sea robusto, es decir que no se vea afectado por factores externos. El arreglo general de un diseo factorial de dos factores es el siguiente:
FactorB

1 2 a

1 Y111,Y112...Y11n Y211,Y212...Y21n Ya11,Ya12...Ya1n

2 Y121,Y122...Y12n Y221,Y222...Y22n Ya21,Ya22...Ya2n

3 Y131,Y132...Y13n Y231,Y232...Y23n Ya31,Ya32...Ya3n

b Y1b1,Y1b2...Y1bn Y2b1,Y2b2...Y2bn Yab1,Yab2...Yabn

FactorA

M.C.RobertoRomeroLpez57

DiseodeExperimentos

Donde Yijk es la observacin: i = factor A nivel i j = factor B nivel j k = nmero de combinaciones (3/3) (nmero de replica) As mismo el anlisis de varianza para el modelo bifactorial es: Fuente de la Suma de variacin cuadrados Efecto A SSA Efecto B Efecto AB Error Total SSB SSAB SSE SST Grados de libertad a1 b1 (a -1)(b 1) ab(n 1) abn - 1 Cuadrado medio MSA = SSA (a-1) MSB = SSB (b 1) MSAB = SSAB (a-1)(b-1) MSE = SSE ab(n-1) Fo Fo = MSA MSE Fo = MSB MSE Fo = MSAB MSE P-value P(F>FA0) P(F>FB0) P(F>FAB0)

Las hiptesis a probar son:


H0:1=2=3=...=a=0 H1:almenosunaa0 H0:1=2=3=...=b=0 H1 :almenosunab0 Igualdad de los efectos de tratamiento de columna. Igualdad de los efectos de tratamiento de rengln.

H0:1=2=3=...=ab=0 H1:almenosunaab0

Si los tratamientos de rengln y columna interactan.

Notacin de puntos para representar sumas y medias: Y Es el total general de todas las observaciones. Yi Es total de las observaciones bajo el i-simo nivel del factor A. Yj Es el total de las observaciones bajo el j-simo nivel del factor B. Yij Es el total de las observaciones bajo el ij-simo celda. i Es la media de las observaciones bajo el i-simo nivel del factor A (promedio del rengln). j Es la media de las observaciones bajo el j-simo nivel del factor B (promedio de la columna). ij Es la media de las observaciones bajo el ij-simo celda. Es la media global.

M.C.RobertoRomeroLpez58

DiseodeExperimentos

Con esta notacin la suma de los cuadrados totales es:

1) SST=Yijk2_Y2..._ abn 2 2) SSA=_Yi __Y2..._ bn abn 3) SSB=_Yj2__Y2..._ an abn 4) SSAB=_Yij2__Y2..._ SSAB=SSsubtotalesSSASSB nabn SST=SSA+SSB+SSAB+SSE

5) SSE=SSTSSASSBSSABSSE=SSTSSsubtotales

M.C.RobertoRomeroLpez59

DiseodeExperimentos

Solucin del ejemplo de la batera: 1) SST = 478547 _37992_ = 77,646.97 36 478547 Yijk2 =(1302 + 1552 + 742 + 1802 + 342 + 402 + 802 + 752 + ... + 602) = Y2... ( )2 = (130 + 155 + 74 + 180 + 34 + 40 + 80 + 75 + ... + 60) = (3799)2 2) SSA = _Yi..2_= 9982 + 13002 + 15012 37992 = 10683.72 bn 12 36 3) SSB = 17382 + 12912 + 7702 37992 = 39118.72 12 36 4) SSAB= 59416.22 10683.72 39118.72 = 9613.78 SSsubtotales = (5392 + 2292 + 2302 + ... + 5832 + 3422) 37992 = 59416.22 4 36 5) SSE =SST - SSsubtotales = 77646.97 59416.22 = 18230.75 Vaciando estos datos a la tabla de anlisis de varianza en dos direcciones, tenemos lo siguiente:

Fuente de la Suma de variacin cuadrados Tipo de SSA=10683.72 material Temperatura SSB=39118.72 Iteracin AB SSAB=9613.78 Error SSE=18230.75 Total SST=77646.97

Grados de libertad a 1= 2 b 1= 2

Cuadrado medio MSA = 5341.86 MSB = 19558.36

Fo Fo = 7.91 Fo = 28.97 Fo = 3.56

P-value P(F>FA0) P(F>FB0) P(F>FAB0)

(a -1)(b 1)=4 MSAB = 2403.44 ab(n 1)=27 MSE = 675.21 abn - 1=35

M.C.RobertoRomeroLpez60

DiseodeExperimentos

= 95%

F0.05,2,27 = 3.35

F0.05,4,27 = 2.73

175 150
i.Duracinpromedio

125 100

75 50 1 2

25

15

70

125

Temperatura

M.C.RobertoRomeroLpez61

DiseodeExperimentos

Diseos factoriales fraccionados 2k-p


Son los diseos en los que se elige adecuadamente una parte o fraccin de los tratamientos de un factorial completo, con la intencin de poder estudiar el efecto de los factores utilizando menos corridas experimentales. La teora de diseos factoriales fraccionados se basa en una jerarquizacin de los efectos: son ms importantes los efectos principales, seguidos por las interacciones dobles, luego las triples, cudruples, etc. En la tabla 5.1 se muestra el nmero de efectos de mayor inters para diseos factoriales 2k, y el primer diseo factorial completo que genera exceso de informacin es el 25. Con este diseo se estiman 31 efectos, donde 15 son importantes y los otros 16 se pueden ignorar. Con una fraccin del diseo factorial completo 25(1/2 25 = 25-1) se pueden estimar los 15 efectos importantes, sacrificando la informacin de los 16 que no interesan. As, con el diseo factorial fraccionado 25-1 se puede obtener la misma informacin que el diseo completo 25, pero con la mitad del costo experimental. En la tabla 5.1 se observa que para k<5 los efectos importantes superan a los que se pueden ignorar, y al fraccionarios se pierde informacin importante. Por lo tanto, si k5 los efectos ignorables supera a los importantes, por lo cual se pueden fraccionar sin perder mucha informacin. Mientras k es ms grande, se permite un grado de fraccionamiento mayor. Diseo 2k 22 23 24 25 26 27 Total de efectos 3 7 15 31 63 127 Efectos no ignorables 3 6 10 15 21 28 Efectos ignorables 0 1 5 16 42 99

UNIDAD V

Tabla 5.1 Efectos en los factoriales 2k

5.1 Diseo factorial fraccionado 2k-1.La notacin 2k-1 significa una fraccin ala mitad del diseo factorial completo 2k, k>2( 2k = 2k-1). 5.1.1 Diseo factorial fraccionado 23-1.El diseo factorial completo 23 es el primero que se puede fraccionar. Si se quiere fraccionar a la mitad es necesario seleccionar cuatro entre los ocho tratamientos. Existen (84)= 70 posibles maneras de elegir una fraccin a la mitad. Slo existen dos elecciones adecuadas. Con el diseo 23 completo se pueden estimar siete efectos: A, B, C, AB, AC, BC y ABC. El efecto menos importante es la interaccin triple ABC y es la ms sacrificable

M.C.RobertoRomeroLpez62

DiseodeExperimentos

y perder menos informacin. Para generar la fraccin se hace en base a signos de contraste ABC: los signos + del contraste ABC sealan a los tratamientos que conforman la llamada fraccin principal, y los signos -sealan la fraccin complementaria. Los dos diseos 23-1generados proporcionan la misma informacin de los efectos importantes. En la tabla 5.2 la fraccin 1 es la principal generada por I = +ABC y la fraccin 2 por I = -ABC. La letra I hace las veces de identidad o neutro multiplicativo. El efecto no estimable de ABC se llama generador de la fraccin. Fraccin 1 (I = +ABC) B C -1 -1 a 1 -1 b -1 1 c 1 1 abc Fraccin 2 (I = -ABC) B C -1 -1 1 -1 -1 1 1 1

A 1 -1 -1 1

A -1 1 1 -1

(1) ab ac bc

Tabla 5.2 Dos posibles fraccionados 23-1 5.1.2 Representacin geomtrica del diseo 23-1 En la figura 5.1 se ve la representacin de las dos fracciones del diseo 23.

Figura 5.1 Representacin de los diseos factoriales fraccionales 23-1 Estructura de alias del diseo 23-1 con I=ABC consiste en escribir explcitamente cules son los alias de cada efecto, y se deduce del generador de la fraccin, considerando el signo utilizado. De la tabla 5.2, el contraste del efecto A sta dado por Contraste A = (a + abc b c)

M.C.RobertoRomeroLpez63

DiseodeExperimentos

Mientras que al multiplicar las columnas B x C Contraste BC = (a + abc b c) Donde los dos son iguales, lo que significa que son alias y se esta estimando A + BC. Y en resumen, la estructura de alias es A + BC B + AC C + AB Estructura de alias del diseo 23-1 con I= -ABC esta dada por A BC B AC C AB Combinando las estructuras alias de ambas fracciones se pueden separar los efectos alias; primero para separar los efectos principales las estructuras se suman y se divide entre dos, y segundo, para los efectos de interaccin las estructuras se restan y se divide entre dos. Para el efecto A

Y la interaccin doble BC se separa

5.2 El concepto de resolucin.Al correr el diseo factorial fraccionado se estiman las sumas (o restas) de efectos alias. Se elige siempre que sea posible diseos fraccionados en los cuales los efectos potencialmente importantes sean alias de efectos de antemano irrelevantes. Suponiendo que los efectos principales son ms importantes que las de dos factores, y estas que la de tres, es conveniente usar diseos factoriales fraccionados de alta resolucin. Definicin de resolucin.- un diseo factorial fraccionado es de resolucin R si los efectos formados por la interaccin de P factores no son alias de efectos de interaccin que tengan menos R P factores. 1. Diseos de resolucin III. Los efectos principales no son alias entre ellos, pero existen efectos principales que son alias de alguna interaccin doble. 2. Diseos de resolucin IV. Los efectos principales no estn alias entre ellos ni con las interacciones dobles, pero algunas interacciones dobles estn alias con otra interaccin doble. 3. Diseos de resolucin V. Los efectos principales y las interacciones dobles estn alias con interacciones triples o de mayor orden, es decir, los efectos principales e interacciones dobles estn limpiamente estimados.

M.C.RobertoRomeroLpez64

DiseodeExperimentos

En los diseos 2k-1 la resolucin es igual al nmero de letras del generador, ya que este es al mismo tiempo la relacin definidora. Las fracciones 23-1, 24-1 y 25-1 tienen resolucin III, IV y V respectivamente. 5.2.1 Construccin de fracciones 2k-1 Se puede construir de dos pasos con ms alta resolucin: 1. Se lista el diseo factorial completo para k 1 factores, y se tienen las primeras k 1 columnas de la fraccin deseada. 2. La columna fltate (la k-sima) se construye multiplicando entre si las columnas previas. Si se quiere la fraccin complementaria se cambian los signos de esta ltima. Por ejemplo en la construccin del diseo 24-1 con resolucin IV y generador I = -ABCD: 1. Se lista el diseo factorial completo 24-1=23 A + + + + B + + + + C + + + + D

2. La columna faltante se obtiene al multiplicar las columnas A, B y C de acuerdo al generador. A + + + + B + + + + C + + + + D= -ABC + + + + -

M.C.RobertoRomeroLpez65

DiseodeExperimentos

5.3 Diseos factoriales fraccionados 2k-2.En ocasiones es necesario correr una fraccin ms pequea del diseo factorial completo 2k. El diseo 2k-2 representa la cuarta parte del factorial completo ( 2k = 2k-2) Para obtener este diseo se necesitan dos efectos generadores, de entre las interacciones del ms alto orden, que deben ser elegidos de manera que su producto sea tambin una interaccin del ms alto orden. Estos diseos tendrn tres generadores: los primeros dos que se seleccionaron ms su producto entre s. El nmero de palabras de la relacin definidora indica el nmero de alias que tendr cada efecto y multiplicando un efecto dado por esta relacin se determinan sus alias. La palabra con menos letras en la relacin definidora indica la resolucin de la fraccin. 5.3.1 Construccin en dos pasos de diseo 2k-2.1. Se escribe el diseo 2k-2 como si fuera un factorial completo en k-2 factores, y de esta forma se tienen los niveles de los primeros k-2 factores 2. Los niveles que corresponden a los factores de las dos ltimas columnas (factores k-1 y k) se obtienen multiplicando columnas previas de acuerdo a los generadores. Ejemplo de fraccin 25-2. 1. Se escribe el diseo completo 25 para A, B y C, dejando en blanco D y E. A + + + + B + + + + C + + + + D E

2. Los niveles para los factores D y E se obtienen al seleccionar de manera adecuada generadores. En este caso I=ABD e I=ACE y el tercero es el producto BCDE. Al final con las relaciones definidoras obtenemos que AB y AC se generan los niveles del factor D y E.

M.C.RobertoRomeroLpez66

DiseodeExperimentos

A + + + +

B + + + +

C + + + +

D + + + +

E + + + +

La estructura de alias se obtiene al multiplicar cada efecto por la relacin definidora dada por I = ABD = ACE = BCDE

Los grupos de efectos alias tienen ahora cuatro elementos y no es posible construir una fraccin 25-2 con resolucin mayor que III. A + BD + CE + ABCDE B + AD +ABCE + CDE C + ABCD + AE + BDE D + AB + ACDE + BCE E + ABDE + AC + BCD BC + ACD + ABE + DE BE + ADE + ABC + CD + ABD + ACE + BCDE Toda la informacin importante la contiene la estructura de alias reducida, que involucra slo hasta las interacciones dobles. A + BD + CE B + AD C + AE D + AB E + AC BC + DE BE + CE

5.4 Diseo factorial fraccionado 2k-p.Es una fraccin 1/2p del diseo factorial completo 2k. Para construir un diseo 2 se eligen p generadores inciales del ms alto orden posibles, y sus productos tambin del ms alto orden.
k-p

M.C.RobertoRomeroLpez67

DiseodeExperimentos

Con los p generadores el diseo se puede construir en dos pasos. 1) Se escribe el diseo 2k-p como si fuera diseo factorial completo para k-p factores. 2) Para los ltimos p factores las columnas de signos se obtienen multiplicando las columnas que indican los generadores. La relacin definidora tiene tantos trminos como productos se puedan hacer con los p generadores. Cada efecto tiene (p1)+ (p2)+ (p3)++ (pp) alias. De aqu se obtiene la estructura alias y la resolucin de la fraccin resultante. Lo ms difcil es encontrar los mejores generadores de la fraccin que se desea utilizar, y una alternativa es utilizar tablas donde se proporciona generadores adecuados para diferentes valores de k y p (tabla 5.3) Los efectos y las sumas de cuadrados en los diseos factoriales 2k-p se obtienen a partir de los contrastes. Se obtiene un contraste para cada grupo de efectos alias y se pondera por una constante apropiada `para estimar el efecto correspondiente como una diferencia de medias. El efecto de un grupo de efectos alias X se estima como

Y su correspondiente suma de cuadrados es

La cual tiene un grado de libertad.

M.C.RobertoRomeroLpez68

DiseodeExperimentos

Tabla 5.3 Factoriales fraccionados con resolucin IV, con mximo 64 corridas

M.C.RobertoRomeroLpez69

DiseodeExperimentos

Bibliografa

1. Montgomery, Douglas C, Diseo y Anlisis de Experimentos, Editorial: Grupo Editorial Iberoamrica 2. Gutierrez Humberto y De la Vara Romn, Anlisis y Diseo de Experiementos 3. Hines, William W.; Montgomery Douglas C., Probabilidad y Estadstica para Ingeniera y Administracin, Editorial: CECSA

M.C.RobertoRomeroLpez70

Potrebbero piacerti anche