Sei sulla pagina 1di 17

INTRODUCCIN Los modelos de diseo de experimentos son modelos estadsticos clsicos cuyo objetivo es averiguar si unos determinados factores

influyen en una variable de inters y, si existe influencia de algn factor, cuantificar dicha influencia. Unos ejemplos donde habra que utilizar estos modelos son los siguientes: En el rendimiento de un determinado tipo de mquina (unidades producidas por da): se desea estudiar la influencia del trabajador que la maneja y la marca de la mquina. Se quiere estudiar la influencia de un tipo de pila elctrica y de la marca, en la duracin de las pilas. Una compaa telefnica est interesada en conocer la influencia de varios factores en la variable duracin de una llamada telefnica. Los factores que se consideran son los siguientes: hora a la que se produce la llamada; da de la semana en que se realiza la llamada; zona de la ciudad desde la que se hace la llamada; sexo del que realiza la llamada; tipo de telfono (pblico o privado) desde el que se realiza la llamada. Una compaa de software est interesada en estudiar la variable porcentaje en que se comprime un fichero, al utilizar un programa de compresin teniendo en cuenta el tipo de programa utilizado y el tipo de fichero que se comprime. Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para ello, se desean controlar diferentes factores: profesor que imparte la asignatura; mtodo de enseanza; sexo del alumno. La metodologa del diseo de experimentos se basa en la experimentacin. Es sabido que si se repite un experimento, en condiciones indistinguibles, los resultados presentan una cierta variabilidad. Si la experimentacin se realiza en un laboratorio donde la mayora de las causas de variabilidad estn muy controladas, el error experimental ser pequeo y habr poca variacin en los resultados del experimento. Pero si se experimenta en procesos industriales o administrativos la variabilidad ser mayor en la mayora de los casos. El objetivo del diseo de experimentos es estudiar si cuando se utiliza un determinado tratamiento se produce una mejora en el proceso o no. Para ello se debe experimentar aplicando el tratamiento y no aplicndolo. Si la variabilidad experimental es grande, slo se detectar la influencia del uso del tratamiento cuando ste produzca grandes cambios en relacin con el error de observacin. La metodologa del diseo de experimentos estudia cmo variar las condiciones habituales de realizacin de un proceso emprico para aumentar la probabilidad de detectar cambios significativos en la respuesta; de esta forma se obtiene un mayor conocimiento del comportamiento del proceso de inters. Para que la metodologa de diseo de experimentos sea eficaz es fundamental que el experimento est bien diseado. Un experimento se realiza por alguno de los siguientes motivos: Determinar las principales causas de variacin en la respuesta. Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable de inters o respuesta. Comparar las respuestas en diferentes niveles de observacin de variables controladas. Obtener un modelo estadstico-matemtico que permita hacer predicciones de respuestas futuras. La utilizacin de los modelos de diseo de experimentos se basa en la experimentacin y en el anlisis de los resultados que se obtienen en un experimento bien planificado. En muy pocas ocasiones es posible utilizar estos mtodos a partir de datos disponibles o datos histricos, aunque tambin se puede aprender de los estudios realizados a partir de datos recogidos por observacin, de forma aleatoria y no planificada. En el anlisis estadstico de datos histricos se pueden cometer diferentes errores, los ms comunes son los siguientes: 1. Inconsistencia de los datos: Los procesos cambian con el tiempo, se producen cambios en el personal (cambios de personas, mejoras del personal por procesos de aprendizaje, motivacin, ...), cambios en las mquinas (reposiciones, reparaciones, envejecimiento, ...). Estos cambios tienen influencia en los datos

recogidos, lo que hace que los datos histricos sean poco fiables, sobre todo si se han recogido en un amplio espacio de tiempo. 2. Variables con fuerte correlacin: Puede ocurrir que en el proceso existan dos o ms variables altamente correlacionadas que pueden llevar a situaciones confusas. Por ejemplo, en el proceso hay dos variables X1 y X2 fuertemente correlacionadas que influyen en la respuesta, pero si en los datos que se tiene aumenta al mismo tiempo el valor de las dos variables no es posible distinguir si la influencia es debida a una u otra o a ambas variables(confusin de los efectos). Otra situacin problemtica se presenta si solo se dispone de datos de una variable(por ejemplo de X1 y no de X2), lo que puede llevar a pensar que la variable influyente es la X1 cuando, en realidad, la variable influyente es la X2 (variable oculta). 3. El rango de las variables controladas es limitado: Si el rango de una de las variable importante se influyente en el proceso es pequeo, no se puede saber su influencia fuera de ese rango y puede quedar oculta su relacin con la variable de inters o lo cambios que se producen en la relacin fuera del rango observado. Esto suele ocurrir cuando se utilizan los datos recogidos al trabajar el proceso en condiciones normales y no se experimenta (cambiando las condiciones de funcionamiento) para observar el comportamiento del proceso en situaciones nuevas. EXPERIMENTO Definicin: El trmino "Experimento" se refiere a la creacin y preparacin de lotes de prueba que verifiquen la validez de las hiptesis establecidas sobre las causas de un determinado problema o defecto, objeto de estudio. Concepto: En un Experimento, el experimentador escoge ciertos factores para su estudio, los altera deliberadamente de forma controlada y despus, observa el efecto resultante. El Experimento puede realizarse bien en laboratorio o bien en el exterior: En la fbrica, en unos almacenes, en los locales del usuario, etc. DISEO DE EXPERIMENTOS Definicin: Metodologa estadstica destinada a la planificacin y anlisis de un Experimento. Concepto: El Diseo de un Experimento debe garantizar que este cumpla ciertos requisitos mnimos: a) Debe poder comprobar las hiptesis objeto de estudio, no dejndose confundir por variables insospechadas (=ruido), como errores de medida desproporcionados, etc. b) Debe poder revelar la existencia de cualquier causa importante de variacin, aunque no haya sido adelantada como hiptesis. c) Debe mantener los costes de experimentacin a un nivel razonable, en comparacin con el problema objeto de estudio. d) Debe tener un alto grado de seguridad en las respuestas. e) Si el Experimento se realiza en un laboratorio, ste ha de ser, respecto a las variables estudiadas, un buen indicador de las pruebas que se obtendran en el taller o "in situ". f) Si el Experimento se realiza durante el desarrollo normal del proceso en estudio, se tendr adems cuidado de interferir lo menos posible en el trabajo normal y protegerse de las interferencias no autorizadas o involuntarias en la prueba por parte del personal adepto. VARIABLE Definicin: Caracterstica de un objeto que puede ser observada y que puede tomar diferentes valores, tanto en el mismo objeto como entre diferentes objetos. Concepto: En base a la posibilidad de medida se distinguen dos tipos fundamentales de variables; Variables cualitativas: Son aquellas cuyos valores, de carcter nominal, slo pueden ser comparados como diferentes entre s.

Ejemplos: La variable "color" puede tomar los valores rojo, azul, amarillo, etc. La variable "empleado" puede tomar los valores Juan, Jos, Cristina, etc. Variables continuas: Son aquellas cuyos valores, de carcter numrico, permiten realizar un mayor nmero de comparaciones. Una variable continua permite tericamente, un infinito nmero de valores entre dos valores consecutivos. (En la realidad la precisin de los instrumentos de medida pone un lmite operativo). Ejemplos: La variable "peso de la tableta de chocolate" puede tomar cualquier valor entre 95 y 110 gr. La variable "consumo de gasolina por 100 Km" puede tomar cualquier valor entre 9 y 15 litros etc. SUJETO O UNIDAD EXPERIMENTAL Definicin: El sujeto o unidad experimental es la unidad bsica sobre la que se efecta el proceso de medida. Ejemplo: El contenido de azcar en el zumo de naranja producido se medir recogiendo cada hora una unidad experimental de 1 litro de zumo. OBSERVACIN Definicin: Una observacin es una toma de medida de una variable y consta entonces de un valor de la misma. Dependiendo del tipo de Diseo, las observaciones pueden tomarse a diferentes sujetos o al mismo sujeto de manera secuencial. DIFERENTES TIPOS DE VARIABLES EN EL DISEO DE UN EXPERIMENTO En un Diseo de Experimento se distinguen los siguientes tipos de variables, segn el contenido conceptual, o papel que tienen en el mismo. Variable independiente: Es el factor (causa) que su ponemos influye sobre la caracterstica que medimos (defecto, error, etc). Para comprobar su influencia, el investigador la manipular durante el Experimento, en el sentido que le asignar valores diferentes a cada observacin. Esta variable se llama tambin "tratamiento" y cada uno de los valores que se le asignarn "nivel de tratamiento". En este Procedimiento se consideran slo Experimentos con una nica variable independiente. Si se quiere o necesita manipular ms de una variable independiente, ser necesaria la colaboracin de un experto en estadstica, puesto que el Diseo del Experimento y la interpretacin de los resultados se complican notablemente.

Variable dependiente: Es aquella variable que se mide en cada observacin del Experimento, para establecer si la variable independiente efectivamente influye sobre sus valores. Variables extraas: Son todas aquellas que el investigador no puede manipular, pero influyen en la variable dependiente. Son la causa de que las observaciones en un mismo nivel de tratamiento no necesariamente arrojen el mismo valor de medida. El conjunto de variables extraas se denomina generalmente en el Diseo y Anlisis de Experimentos "ruido" o "error experimental". Variable de bloqueo: Es una variable que sabemos puede intervenir en los niveles de la variable dependiente y decidimos eliminar su influencia mediante el control de la misma, creando bloques de observaciones, en los que esta variable, asume respectivamente un valor constante. A cada bloque se asignarn todos los niveles de tratamiento. Con la creacin de bloques se persiguen dos objetivos: Aislar el efecto de los tratamientos, eliminando la influencia de la variable de bloqueo. Estimar los efectos de los bloques. REPETICIN

Definicin: Reiteracin de una observacin o medida al mismo nivel de tratamiento. Proporciona una oportunidad para que los efectos de las variables extraas, incontroladas se compensen y permite, adems, medir el error experimental. ALEATORIZACIN Definicin: Tcnica utilizada para reducir la influencia no predeterminable de variables extraas sobre los resultados del Experimento. Concepto: La aleatorizacin consiste en asignar los sujetos a los distintos niveles de tratamiento al azar, con la esperanza de que los efectos extraos se contrarresten entre los distintos sujetos y observaciones que componen cada nivel de tratamiento (condicin experimental). La aleatorizacin es fundamental en el Diseo de Experimentos ya que: a) Previene la existencia de sesgo. b) Evita la dependencia entre observaciones. c) Confirma la adecuacin de los procedimientos estadsticos para el anlisis de los resultados del Experimento.

DIAGRAMA DE FLUJO DEL PROCESO

DISEO DE EXPERIMENTOS (DOE): PARA QU SIRVE Y CMO REALIZARLO (EJEMPLO) La metodologa de diseo de experimentos (DOE) es una herramienta estadstica para la mejora de la calidad usada frecuentemente en proyectos Seis Sigma. Esta metodologa sirve para disear las condiciones ideales de un producto, proceso o servicio para que cumpla con nuestras expectativas usando el mnimo nmero de experimentos o pruebas. DOE es muy til cuando tenemos entre manos un producto complicado cuyo resultado puede depender de una gran cantidad de variables que no controlamos y que debemos ajustar para optimizarlo.

Introduccin al Diseo de experimentos (DOE) Para explicar el DOE vamos a poner un ejemplo sencillo: A nuestro telfono mvil se le descarga la batera muy rpido, y queremos que la batera dure lo mximo posible sin perder mucha funcionalidad. Nosotros sabemos que los factores que ms afectan a la duracin de la batera son los siguientes: Factor A: Tener el WIFI activado. Factor B: Tener la pantalla encendida con el brillo alto. Factor C: Hacer muchas llamadas. Factor D: Usar el modo powersafe de ahorro de batera. Factor E: Ponerle al telfono una batera de mayor capacidad. De forma intuitiva podemos pensar que para maximizar la duracin de la batera debemos hacer lo siguiente: Factor A=0, Factor B=0, Factor C=0, Factor D=1, Factor E=1. (Siendo 0=No y 1=S). Por lo que estableciendo estas variables as nuestra batera durara lo mximo posible. Pero ahora llegan las siguientes dudas cunto durara si slo hago muchas llamadas (C=1)? tiene ms efecto tener el WIFI encendido (A=1) o hacer muchas llamadas (C=1)? Tener las dos cosas a la vez (A=1, C=1) potencia mucho ms el gasto de batera? etc Para resolver estas dudas la metodologa del diseo de experimentos nos dar una solucin a todo esto haciendo el mnimo nmero de pruebas posible. Por lo tanto tras aplicar esta metodologa sabremos exactamente cmo influye cada factor (y cada combinacin de factores, ya que a veces varios factores producen efectos inesperados) para as poder tomar una decisin de qu nos conviene poner o quitar en nuestro producto. Al final tendremos una funcin de regresin que nos relaciona el resultado (duracin de la batera) con cada una de las variables: Resultado = constante0 + constante1 * Factor A + constante2 * Factor B + constante3 * Factor C Cada uno de los sumandos de la funcin nos da la aportacin de cada uno de los factores, pudiendo ser estos valores discretos o niveles (0=No, 1=S), o bien pudiendo ser valores continuos. Adems a veces conviene considerar tambin los posibles efectos potenciadores que tienen los factores entre s, en este caso la funcin sera as: Resultado = constante0 + constante1 * Factor A + constante2 * Factor B + constante3 * Factor C + constante4 * Factor AB + constante5 * Factor AC + constante6 * Factor BC + constante7*Factor ABC Por lo tanto, continuando con el ejemplo del telfono mvil, el DOE nos permitir calcular cunto va a durar la batera en funcin de si tenemos activo o no el WIFI, si hacemos muchas llamadas, etc.

Realizar un diseo de experimentos con minitab Existen varias formas de realizar un diseo de experimentos. Aqu explicaremos dos de ellas: Usando la aplicacin informtica Minitab (lo ms fcil) y haciendo los clculos a mano. Minitab es una aplicacin para ordenador para Windows (o para Linux/Mac si tienes Wine instalado), la ventaja de usar esta aplicacin es que simplifica mucho las cosas ya que slo tienes que introducir los datos y el programa calcula lo dems. El primer paso para realizar un DOE es determinar los factores a analizar y sus niveles. Siguiendo el ejemplo del mvil:

Factor A: Nivel 1=WIFI apagado, Nivel -1=WIFI encendido Factor B: Nivel 1=Pantalla encendida 1hora/da, Nivel -1=Pantalla encendida 5horas/da Factor C: etc En este ejemplo hemos puesto slo 2 niveles para cada factor por ser lo ms sencillo, pero se podran poner ms (por ejemplo, Factor B: Nivel 0=1hora/da, Nivel 1=2horas/da, Nivel 2=5horas/da). En Minitab, vamos a Estadsticas > DOE > Factorial > Crear diseo, seleccionamos el nmero de factores y en diseos seleccionamos factorial completo para considerar la posible interrelacin entre factores. Adems seleccionamos una repeticin (replica) de cada prueba.

Como hemos introducido 3 factores de dos niveles (llamados 1 y -1 en este caso) y factorial completo tenemos que hacer un total de 8 pruebas, cada una configurando los factores como muestra en la tabla.

Esto significa que tendremos que coger nuestro telfono mvil y probar lo que dura la batera una vez para cada una de las configuraciones que nos dice el programa. (Si no queremos hacer tantas pruebas podemos disear un DOE con 4 pruebas en vez de 8, aunque los resultados no tendrn en cuenta los efectos de interrelacin de los factores. Muy bien, ahora llega el turno de hacer los experimentos y apuntar los resultados en la columna de Resultado. Aqu apuntamos las horas que ha durado la batera en cada prueba:

Para ver las conclusiones del DOE vamos a Estadsticas > DOE > Factorial > Grficas factoriales y configuramos lo que queremos ver:

Ahora ya podremos ver cules son los efectos de cada uno de los factores para cada uno de los niveles (e interpolando tambin para valores intermedios):

Posteriormente, para obtener la funcin de regresin vamos a Estadsticas > DOE > Factorial > Analizar diseo facotial.

Obtendremos algo as: Trmino Constante A Efecto -2,500 Coef 22,500 -1,250

B C A*B A*C B*C A*B*C Por lo tanto la funcin de regresin ser:

-3,000 3,500 -1,500 -4,000 2,500 -4,000

-1,500 1,750 -0,750 -2,000 1,250 -2,000

Resultado = 22,500 -1,250 * Factor A -1,500 * Factor B + 1,750 * Factor C -0,750* Factor AB -2,000 * Factor AC + constante6 * 1,250 -2,000*Factor ABC PRUEBAS DE HIPTESIS PARA MEDIAS En vez de estimar el valor de un parmetro, a veces se debe decidir si una afirmacin relativa a un parmetro es verdadera o falsa. Es decir, probar una hiptesis relativa a un parmetro. Se realiza una prueba de hiptesis cuando se desea probar una afirmacin realizada acerca de un parmetro o parmetros de una poblacin. Una hiptesis es un enunciado acerca del valor de un parmetro (media, proporcin, etc.). Prueba de Hiptesis es un procedimiento basado en evidencia muestral (estadstico) y en la teora de probabilidad (distribucin muestral del estadstico) para determinar si una hiptesis es razonable y no debe rechazarse, o si es irrazonable y debe ser rechazada. La hiptesis de que el parmetro de la poblacin es igual a un valor determinado se conoce como hiptesis nula. Una hiptesis nula es siempre una de status quo o de no diferencia.

En toda prueba de hiptesis se presentan 3 casos de zonas crticas o llamadas tambin zonas de rechazo de la hiptesis nula, estos casos son los siguientes:

En toda prueba de hiptesis se pueden cometer 2 tipos de errores:

PRUEBA MEDIAS DE UNA MUESTRA

Se utiliza una prueba de una muestra para probar una afirmacin con respecto a una media de una poblacin nica.

Nota: Se considera prctico utilizar la distribucin t solamente cuando se requiera que el tamao de la muestra sea menor de 30, ya que para muestras ms grandes los valores t y z son aproximadamente iguales, y es posible emplear la distribucin normal en lugar de la distribucin t.

EJEMPLOS ILUSTRATIVOS: 1) La duracin media de una muestra de 300 focos producidos por una compaa resulta ser de 1620 horas.

Como se tiene como dato el tamao de la poblacin se tiene que verificar si cumple con la condicin para utilizar el factor finito de correccin.

Los clculos en Excel se muestran en la siguiente imagen:

El grfico elaborado con Winstats y Paint se muestra en la siguiente imagen:

2) La duracin media de lmparas producidas por una compaa han sido en el pasado de 1120 horas. Una muestra de 8 lmparas de la produccin actual dio una duracin media de 1070 horas con una desviacin tpica de 125 horas.

Los clculos en Excel se muestran en la siguiente imagen:

El grfico elaborado con Winstats y Paint se muestra en la siguiente imagen:

PRUEBA MEDIAS DE DOS MUESTRAS Las pruebas de dos muestras se utilizan para decidir si las medias de dos poblaciones son iguales. Se requieren dos muestras independientes, una de cada una de las dos poblaciones. Considrese, por ejemplo, una compaa investigadora que experimentan con dos diferentes mezclas de pintura, para ver si se puede modificar el tiempo de secado de una pintura para uso domstico. Cada mezcla es probada un determinado nmero de veces, y comparados posteriormente los tiempos medios de secado de las dos muestras. Una parece ser superior, ya que su tiempo medio de secado (muestra) es 30 minutos menor que el de la otra muestra. Pero, son realmente diferentes los tiempos medios de secado de las dos pinturas, o esta diferencia muestral es nada ms la variacin aleatoria que se espera, aun cuando las dos frmulas presentan idnticos tiempos medios de secado? Una vez ms, las diferencias casuales se deben distinguir de las diferencias reales. Con frecuencia se utilizan pruebas de dos muestras para comparar dos mtodos de enseanza, dos marcas, dos ciudades, dos distritos escolares y otras cosas semejantes.

La hiptesis nula puede establecer que las dos poblaciones tienen medias iguales:

Para tamaos ms pequeos de muestra, Z estar distribuida normalmente slo si las dos poblaciones que se muestrean tambin lo estn.

EJEMPLO ILUSTRATIVO La media de las calificaciones de dos muestras de 15 estudiantes de primer semestre en la asignatura de Estadstica de la universidad UTN resulta ser de 7 y 8,5. Se sabe que la desviacin tpica de las calificaciones en esta asignatura fue en el pasado de 1,5.

Los clculos en Excel se muestran en la siguiente figura:

El grfico elaborado con Winstats y Paint se muestra en la siguiente imagen:

Potrebbero piacerti anche