Tercera Parte Prob y Estad Plan Especial 2012 PDF

VIII.- INFERENCIA ESTADSTICA PARAMETRICA 8.1.
- Definiciones Preliminares El campo de la inferencia estadstica est formado por los mtodos utilizados para tomar decisiones o para obtener conclusiones sobre una Poblacin, Lote, Proceso. Estos mtodos utilizan la informacin contenida en una muestra de la Poblacin, Lote, Proceso para obtener conclusiones. La inferencia estadstica la podemos dividir en tres grandes reas: 1).- Estimacin de parmetros 2).- Prueba de hiptesis e intervalos de confianza para parmetros poblacionales. 3).- Ajuste de modelos tericos a un conjunto de datos empricos y medir la bondad de dicho ajuste. De lo anterior, podemos desprender de que la calidad de la informacin obtenida, como tambin la acertividad de la decisin tomada, dependen esencialmente de la muestra. (Que es de donde obtenemos los datos). Poblacin, Lote, Proceso.
En muchos problemas estadsticos, es necesario utilizar una muestra de observaciones tomadas de la poblacin de inters con objeto de obtener conclusiones acerca de ella. Muestra
Para que las inferencias sean vlidas, la muestra debe ser representativa de la poblacin. Un mecanismo de seleccin que asegura la representatividad es la aleatorizacin. En consecuencia la seleccin de una muestra es un experimento aleatorio, y cada observacin de la muestra es el valor observado de una variable aleatoria. Las observaciones en la poblacin determinan la distribucin de probabilidad de la variable aleatoria. La calidad de las medida(s) o valor(es) obtenidos de las muestras dependen, entre otros factores, de los equipos de medicin (exactitud, precisin, capacidad, etc.). Una muestra representativa, evita que se produzca una informacin sesgada.
150
8.2.- Estimacin Estimador, Estadstica.
Estimacin Puntual
Propiedades de los estimadores: 1.- Insesgado: Un estimador debe arrojar, en promedio, valores muy prximo al verdadero valor del parmetro. 2.- Mnima Varianza: Si se consideran todos los estimadores insesgados de del parmetro ,el que tiene la menor varianza recibe el nombre de estimador insesgado de varianza mnima. 3.- Consistentes: A medida de que el tamao de la muestra aumenta, (n N), el estimador tiende a coincidir con el parmetro. 4.- Eficientes: Si se utilizan dos estadgrafos o estimadores del mismo parmetro , aquel cuya distribucin muestral tenga menor error estndar , es un estimador ms eficaz que otro . 5.- Suficiente: Un estimador suficiente del parmetro , es aquel que agota toda la informacin pertinente sobre de que se pueda disponer en la muestra. Por ejemplo, el promedio (desconocido) de la Poblacin, puede ser estimado a travs del promedio aritmtico de la muestra, X ; tambin puede ser estimado por la Mediana de la muestra, X . Pero X ~ ~ tiene menor varianza que X . (Es decir X , es ms eficiente que X ) Uno de los mejores mtodos para obtener un estimador puntual de un parmetro es el mtodo de Mxima Verosimilitud. Tal como su nombre lo seala, el estimador ser el valor del parmetro que maximiza la funcin de verosimilitud. (No ser expuesto en el presente desarrollo , pero puede ser revisado en Textos de Estadstica Matemtica o de Probabilidades y Estadstica)
151
8.3.- Distribuciones de muestreo
Por ejemplo, la distribucin de probabilidad del promedio aritmtico X , se conoce como distribucin de muestreo (muestral) de la media. La distribucin de muestreo de una estadstica o estimador depende de la distribucin de la poblacin, del tamao de muestra y del mtodo utilizado para seleccionar la muestra. Teorema del Lmite Central
Error Estndar
Por ejemplo el promedio aritmtico X , tiene un error estndar de oportunidades el parmetro
2
n
. Pero en muchas
debe ser estimado por la varianza muestral , obtenindose entonces
S2 . un error estndar estimado igual a n

El error estndar da alguna idea sobre la precisin de la estimacin
152
8.4.- Prueba de Hiptesis e intervalo de confianza. En muchos problemas de Ingeniera, Ciencias Naturales, Ciencias Sociales, Administracin y Negocios , etc ., requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el nombre de Hiptesis, y el procedimiento de toma de decisin sobre la hiptesis se conoce como Prueba de Hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en el mundo de la Ingeniera, pueden formularse como problemas de prueba de hiptesis. Es conveniente considerar la prueba de hiptesis estadsticas como la etapa de anlisis de datos de un experimento comparativo, en el que el ingeniero est interesado, por ejemplo, en mejorar un rendimiento promedio en un proceso, despus de haber hecho una innovacin en el mismo. La finalidad es probar hiptesis con respecto a los parmetros de las dos situaciones.
En la prueba de hiptesis intervienen siempre dos hiptesis denominadas como: H : conocida como hiptesis nula o hiptesis de prueba. H : denominada hiptesis alternativa
1 0
La estructura general de una Prueba de Hiptesis, la podemos resumir en el siguiente cuadro
Los procedimientos de pruebas de hiptesis dependen del empleo de la informacin que obtiene al procesar los datos contenidos en una muestra aleatoria de la poblacin de inters. Es por esto que la verdad o falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente esto es imposible en muchas situaciones prcticas. Dado que estamos trabajando con informacin muestral para aceptar o rechazar la hiptesis de prueba, es que debemos asumir que podemos cometer alguno de estos dos tipos de errores denominados: Error Tipo I , Error Tipo II.
153
Este es el tipo de Error con el que usualmente se realiza la prueba de Hiptesis
Al utilizar una muestra para obtener conclusiones sobre una poblacin existe el riesgo de llegar a una conclusin incorrecta. Cuando se toma una decisin referente a una hiptesis basada en la teora de la probabilidad, sta puede ser: Decisin Correcta: Se acepta una hiptesis cuando es verdadera. Se rechaza una hiptesis cuando no es verdadera. Decisin Incorrecta Error Tipo I ().- Se rechaza un hiptesis que es verdadera, es decir, se rechaza la Hiptesis Nula (H ) cuando en realidad es cierta. Error Tipo II ().- Se acepta una hiptesis que no es verdadera, es decir, no se rechaza la Hiptesis Nula (H ) cuando es falsa y se debiera rechazar.
0 0
Para mayor claridad observamos el siguiente cuadro:
154
De estos dos errores el ms frecuente es , pero es el ms difcil de controlar. De ah que el ms usado en la prctica es .
La regin crtica o de rechazo es la medida del resultado del proceso de una muestra (Estadstico de Prueba) cuando es mayor o igual que un valor fijado (Valor Crtico), entonces se rechaza la hiptesis nula (H0); como tambin se rechaza la hiptesis nula en el caso de que la medida sea menor que un valor fijado (Valor Crtico).
El nivel de significacin debe ser especificado antes de que una prueba sea hecha, de otra manera, el resultado obtenido en la prueba puede influir en la decisin. Los niveles de significacin ms utilizados son: = 0,05 y = 0,01 Al emplear un nivel de significacin del 5% tenemos la confianza del 95% de que hemos tomado una decisin correcta, aunque pudimos estar equivocados en un 5%.
155
El error de Tipo II () se puede determinar solamente respecto a un valor especfico incluido en el rango de la Hiptesis Alternativa (H ).
1
8.4.1.- Etapas bsicas a considerar en la prueba de hiptesis: A continuacin se enunciarn un conjunto secuenciados de procedimientos a tener en consideracin, para prueba de hiptesis en el caso de muchos problemas prcticos. 1.- Del contexto del problema, identificar el parmetro de inters. 2.- Establecer la hiptesis nula, H . 3.- Establecer una apropiada hiptesis alternativa, H 5.- Establecer una estadstico de prueba apropiado.
0
4.- Seleccionar un nivel de significancia , para probar la hiptesis H
1.
0.
6.- Establecer la Regin de Rechazo para el estadstico de prueba, que est sealada por la hiptesis alternativa ( < , > , ). 7.- Calcular todas las cantidades o estimadores a partir de los datos muestrales, para sustituirlas en la expresin del estadstico de prueba, obtener el valor correspondiente. 8.- Decidir si debe o no rechazarse H y expresar o redactar esto, en el contexto del problema.
0
8.4.2.- Aplicaciones de la Distribucin Normal en la Prueba de Hiptesis y la construccin de intervalos de confianza. En forma muy general, podemos decir que la distribucin normal se aplica en temas relacionados con la inferencia estadstica cuando la Variable en estudio tiene un comportamiento que es modelizado por esta distribucin, se conoce el valor del parmetro denominado varianza, o el tamao de la muestra es suficientemente grande, como para invocar que el estadgrafo muestral tiene un comportamiento normal. 8.4.2.1.- Prueba de hiptesis e intervalo de confianza acerca una proporcin "p". En muchos problemas de ingeniera, se tiene inters en una variable aleatoria que sigue o se comporta como una distribucin Bernoulli. Por ejemplo, considrese un proceso productivo que fabrica artculos que son clasificados como aceptables o defectuosos; o bien un proceso de monitoreo que controla una variable especfica mediante una lectura muestral, y la muestra se clasifica como contaminada ( + ) o no contaminada ( - ). El parmetro binomial " p " representa la proporcin de artculos (o muestras) defectuosos (contaminados) producidos.
156
es la proporcin de unidades con la caracterstica buscada. Entonces X = n p es la El valor de p cantidad de unidades muestrales con la caracterstica buscada. El valor p es la proporcin que
hipotticamente existe en la poblacin. El valor " n p " representa entonces el valor esperado de unidades con la caracterstica buscada, en la muestra de tamao "n". Intervalo de Confianza para p de nivel (1 - ) Tamao de la muestra
0
Z 1 / 2 p
(1 p ) p n
Z n =
Z /2 n=
p 0 (1 p 0 ) + Z p p0
p 0 (1 p 0 ) + Z p p0
p (1 p ) prueba bilateral
2
p (1 p )
prueba unilateral
8.4.2.2.- Prueba de hiptesis acerca de la diferencia entre dos proporciones " p1 y p2. Las pruebas de hiptesis del punto 6.4.2.2 pueden extenderse al caso donde existen dos parmetros binomiales de inters (por ejemplo p1 y p2 ) y se desea probar que son iguales o que difieren en una cantidad . Esta prueba de hiptesis, para asegurar la convergencia a la distribucin normal de los parmetros muestrales, necesita que los tamaos de las respectivas muestras tomadas independientemente en cada una de las poblaciones sean de tamao grande (preferentemente superior o igual a 100). Los estimadores de las proporciones poblacionales son distribuciones aproximadamente normales. Para probar la hiptesis H0, se debe calcular =
1 = p
X1 n1
2 = p
X2 n2
y que tienen
X1 + X 2 , donde X1 y X2 representan las n1 + n2
cantidades de unidades, en cada una de las muestras, que poseen la caracterstica en estudio.
157
H0 : p1 - p2 = H1: p1 - p2 < H1 : p1 - p2 > H1 : p1 - p2
Estadstico de prueba ZObs =

1 p 2) (p
(1 )(
1 1 + ) n1 n2
Intervalo de confianza de nivel (1 - )
Tamao de la muestra
1 p 2 ) Z1 /2 (p
1 1 (1 )( + ) n1 n2
(Z n=
( p1 + p 2 )(q1 + q 2 ) / 2 + Z ( p1 p 2 ) 2
p1 q1 + p 2 q 2
La frmula que permite calcular el tamao muestral est dada en el caso de realizar una prueba de hiptesis con alternativa unilateral. En el caso de que se desee realizar una prueba bilateral ( ), entonces es necesario remplazar Z por Z/2 Si el inters del investigador estuviese en probar si la cantidad esperada de unidades, X, que tienen una cierta caracterstica cuando se extrae de esa poblacin, lote, o proceso una muestra de tamao "n, entonces la estructura de la prueba de hiptesis sera: H0 : np =n p0 = X0 H1 : n p < X0 H1 : n p > X0 H1: np X0 Estadstico de prueba Z0bs =
( X np 0 ) np 0 (1 p 0 )
Ejercicio 1.- En una ciudad, que se dividi en dos sectores, A y B, se colectaron muestras de 160 y 200 hogares respectivamente, para tomar informacin acerca del consumo de un cierto producto para el lavado de ropa (ACE). Contestaron favorablemente 80 hogares en "A" 115 hogares en "B". a).- Redacte las hiptesis para probar de que existe una diferencia estadsticamente significativa en la preferencia por el producto, entre ambas ciudades. b).- Determine un intervalo de confianza del 90 % para la verdadera diferencia entre la preferencia por el producto entre ambas ciudades. c).- Cul es el tamao muestral adecuado en la ciudad A, para estimar la proporcin de personas que prefieren el producto con un 90 % de confianza y un error de muestreo del 4 %?
158
2.- Los administradores (no mdicos) de los hospitales en muchos casos se encargan de obtener y calcular algunas estadsticas que son de suma importancia para los mdicos y para los encargados de decidir en el hospital. En los registros de un hospital se tiene que 52 hombres (mayores de 50 aos) en una muestra de 500; y que 25 mujeres (mayores de 50 aos) de una muestra de 550, ingresaron al hospital y necesitan intervencin quirrgica cardiovascular. a).- Con estos datos, existe evidencia suficiente como para pensar de que existe una mayor tasa de afecciones cardacas en los hombres que en las mujeres?. Plantee y prueba esta hiptesis.b).- Determine un intervalo de confianza del 90 % para la diferencia en la proporcin de hombres y mujeres que necesitan intervencin quirrgica cardiovascular. c) Con un intervalo de confianza del 95 %, estime la proporcin de hombres mayores de 50 aos que necesitan intervencin quirrgica cardiovascular.2.- En una muestra aleatoria de 450 telfonos residenciales tomada en cierta ciudad A en el ao 1990, se encontr que 130 no aparecen en el directorio. En el mismo ao, en otra muestra aleatoria de 600 telfonos para una ciudad B, se encontr que 120 no aparecen en el directorio (Telfono privado). a) Redacte y Realice todos los pasos de la prueba de hiptesis y use = 0,05 para probar si existe una tendencia mayoritaria en la ciudad A, respecto de B, a la existencia de una mayor proporcin de telfonos privados. b) Determine un intervalo de confiabilidad del 95%, para la proporcin de telfonos privados en la ciudad B c) Si se desea estimar la proporcin de telfonos privados en la ciudad B con una confiabilidad del 95 % y un error de muestreo no mayor a 0.06 Cuntas hogares seleccionados debe tener la muestra?
159
8.4.3.- Aplicaciones de la Distribucin t - Student en la Prueba de Hiptesis y la construccin de intervalos de confianza. Cuando se prueban hiptesis a cerca del promedio de una poblacin o la diferencia entre promedios de dos poblaciones diferentes y cuando 2 es desconocida, es posible utilizar los por ) siempre y cuando el tamao de la muestra procedimientos antes descritos (remplazando p sea grande. Sin embargo, cuando la muestra es pequea y 2 es desconocida, debe plantearse una hiptesis sobre la forma de la distribucin subyacente con la finalidad de obtener un procedimiento de prueba. En muchos casos, una hiptesis razonable es que la distribucin que modeliza el comportamiento de los datos, es normal. Pero en el caso de muestras pequeas y varianza desconocida, se ha desarrollado una distribucin denominada t de Student. Esta distribucin se origina como el cuociente de dos distribuciones, donde una de ellas es la distribucin normal. De hecho, la distribucin t de Student tiene una forma muy parecida a la Normal. (Tabla al final del texto) Muchas de las poblaciones que se encuentran en la prctica, quedan bien aproximadas por la distribucin normal, razn por la cual esta hiptesis conduce a un procedimiento de prueba de gran aplicabilidad. De hecho, un alejamiento moderado de la normalidad estadstica tiene poco efecto sobre la validez de la prueba. Cuando la hiptesis no es razonable, entonces puede especificarse otra distribucin (Exponencial, Weibull, lognormal, etc.) y usar algn mtodo general para la construccin de pruebas de hiptesis con la finalidad de obtener un procedimiento vlido, o tambin pueden utilizarse pruebas no- paramtricas que son vlidas para cualquier distribucin estadstica. 8.4.3.1.- Prueba de hiptesis e intervalo de confianza para el promedio Supngase que la poblacin tiene una distribucin normal con media y varianza 2 , con ambos parmetros desconocidos. Se desea probar la hiptesis de que es igual a una constante 0. Necesitamos la informacin muestral del promedio aritmtico X y la varianza muestral S2 . H0 : = 0 H1 : < 0 H0 : > 0 H0 : 0 Estadstico de prueba TObs
=
Intervalo de confianza
( X u0 2 S n
X T1 / 2,
2 S n
T1 - /2 , , es un valor obtenido de una tabla que contiene la distribucin t - student y el valor = n - 1. Este smbolo nos indica los grados de libertad de la distribucin, los cuales estn indicados en la fila de la tabla. Es igual al nmero de datos muestrales menos 1. Para rechazar la hiptesis H0 , a favor de H1 , se debe cumplir que el valor del estadstico de prueba caiga en la regin de rechazo indicada por la hiptesis alternativa H1
Adems, recordemos que
2 = S
(X
i =1
i =n
X )2
;
n 1
S2 =
(X
i =1
i =n
X )2
160
8.4.3.2.- Prueba de hiptesis e intervalo de confianza para los promedio de dos distribuciones muestras independientes Ahora se considerar una prueba de hiptesis sobre la diferencia de los promedio 1 - 2 = , de dos 2 distribuciones normales donde las varianza 12 y 2 son desconocidas pero iguales, estimadas a
2 y S 2 . Las muestras obtenidas de cada travs de sus respectivas varianzas muestrales S 1 2 poblacin son independientes entre si. Tal como se indic en la prueba homnima en puntos anteriores, se requiere la hiptesis de normalidad para desarrollar el procedimiento de prueba, pero los alejamientos o distanciamientos moderados de la normalidad estadstica no tendrn efectos adversos sobre el procedimiento (Concepto de prueba robusta).
H0 : 1 - 2 Estadstico de Prueba
H1 : 1 - 2 <
H1: 1 - 2
>
H1: 1 - 2
Tobs =
(X1 X 2 ) 2 + (n 1) S 2 1 (n1 1) S 1 1 2 2 + n1 + n2 2 n1 n 2
El valor del Estadstico de prueba se compara con valores obtenidos de una Tabla Estadstica de la distribucin t-Student , adjunta al final del texto, segn se la hiptesis alternativa H1 que se est utilizando. Los grados de libertad, son iguales al tamao de la muestra menos 1. El intervalo de confianza de nivel (1- ), para la diferencia entre los promedios poblacionales 1 - 2, est dado por
( X 1 X 2 ) T(1 / 2);
2 + (n 1) S 2 (n1 1) S 1 2 2 n1 + n2 2
1 1 n + n 2 1
Los grados de libertad para la distribucin son = n1 + n2 2 Ejercicios: 1.- Dos proveedores fabrican un engranaje plstico utilizado en una impresora lser. Una caracterstica importante de estos engranajes es la resistencia al impacto, la cual se mide en pieslibras. Una muestra aleatoria de 10 engranajes suministrados por el proveedor "A" y de 15 engranajes suministrados por el proveedor "B", entregan los siguientes resultados: Proveedor A B Tamao Muestra 10 15 Promedio 290 321 Desv. Estndar 12 15
161
a).- Existe evidencia que apoye la afirmacin de que los engranajes del proveedor "B" tienen una mayor resistencia promedio al impacto ?. Utilice = 0,05. b).- Los datos apoyan la afirmacin de que la resistencia promedio al impacto de los engranajes del proveedor "B" es al menos 20 pies-libra mayor que la del proveedor "A" c).- Construya un intervalo de confiabilidad del 95 %, para la diferencia promedio entre las resistencias de los engranajes suministrados por ambos proveedores. 2.- Las organizaciones de empresas de manufactura incurren en costos considerables para la capacitacin de nuevos empleados. Estas empresas buscan programas de capacitacin que puedan llevar a los empleados a un grado mximo de eficiencia en el menor tiempo posible. Los datos siguientes presentan el tiempo, en minutos, que demoran los empleados para ensamblar la misma componente bajo dos mtodos: uno estndar y uno nuevo Procedimiento Estndar 32 37 35 28 41 40 35 31 34 36 30 33 34 35 24 31 Procedimiento Nuevo 35 31 29 25 34 31 38 27 32 29 26 28 26 29 28 33 30
a).- Existe alguna diferencia estadsticamente significativa en la disminucin entre los tiempos promedios de ensamblaje ?. Realice todos los pasos de la prueba de hiptesis y use = 0,05. b).- Determine un intervalo de confianza del 95% para la diferencia entre los tiempos promedio de ensamblaje. c).- Determine un intervalo de confianza del 95 % para la desviacin estndar del tiempo de ensamblaje del nuevo procedimiento. 3.- Se realizan pruebas de dureza en dos tipos de bolas, X e Y, que se utilizan en molinos de la gran minera. Se desea estudiar el desempeo de estas bolas en el proceso de molienda. Se toman muestras independientes de cada uno de los tipos y se encuentran los siguientes resultados. Bola X Bola Y 75 52 46 41 57 43 43 47 58 32 39 49 61 52 56 44 44 57 65 60 60 45 50 50 55
a).- Redacte y pruebe la hiptesis de que ambos tipos de bolas no presentan diferencias estadsticamente significativas en su resistencia promedio. Use alfa = 0,05. Que recomendacin dara usted, respecto de cual tipo de bola usar? Justifique su respuesta. b).- Determine con 95% de confianza entre que valores se encuentra la resistencia promedio de cada uno de los tipos de bolas. c).- Determine un intervalo de confianza del 90% para la desviacin estndar de la dureza del tipo de bola Y. d).- Se desea estimar la dureza promedio de la bola tipo X con una confiabilidad del 95 % y un error de estimacin no mayor a 1,5 unidades, Cuntas muestras sera necesario seleccionar para cumplir estas exigencias? 3 Pts
162
8.4.3.3.- Prueba de hiptesis e intervalo de confianza para los promedio de dos distribuciones, muestras dependientes. En el caso las muestras obtenidas de cada poblacin son dependientes entre si , como ejemplo , cuando la misma muestra es sometida a anlisis por laboratorios diferentes que utilizan la misma metodologa ; la misma unidad muestreada es sometida a una medicin pre y post ; puede ser tambin cuando las observaciones sobre las dos poblaciones de inters se recopilan por pares , tomadas bajo condiciones homogneas , pero ests pueden cambiar de un par a otro . Esta prueba recibe el nombre de prueba " t pareada. Se calcula la diferencia entre cada par de observaciones di = X i - Yi desde i = 1 , 2.........n
Con los valores de di, se obtiene su promedio aritmtico d = Para remplazarlos en el estadstico de prueba H0 : 1 - 2
d
i =1
i =n
2 = , S d
(d
i =1
i =n
d )2
n 1
Estadstico de Prueba
H1 : 1 - 2 <
H1: 1 - 2
>
H1: 1 - 2
TObs =
(d ) 2 S
d
El valor del Estadstico de prueba se compara con valores obtenidos de una Tabla Estadstica de la distribucin t-Student , adjunta al final del texto, segn se la hiptesis alternativa H1 que se est utilizando. Los grados de libertad, son iguales al tamao de la muestra menos 1. El intervalo de confianza de nivel (1- ), para la diferencia entre los promedios poblacionales 1 - 2, est dado por
d T1 / 2
Ejercicios :
2 S d 1 - 2 d + T1 / 2 n
2 S d n
Quince hombres adultos trabajadores de una Empresa Minera de la II Regin, cuyas edades fluctan entre los 35 y 50 aos , participaron en un estudio aerbico para evaluar el efecto de la dieta y el ejercicio sobre los niveles de colesterol en la sangre . El colesterol total fue medido al inicio del estudio en cada trabajador, y tres meses despus de participar en el estudio y de haber cambiado la alimentacin a una dieta baja en grasas y un programa de acondicionamiento fsico, se obtuvieron los siguientes resultados:
163
Nivel de Colesterol Total en la Sangre Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Antes 265 240 258 295 251 245 287 314 260 279 283 240 238 225 247 Despus 229 231 227 240 238 241 234 256 247 239 246 218 219 226 233 a).- Estos datos apoyan la afirmacin de que la dieta baja en grasas y el ejercicio son de gran valor en la disminucin de los niveles de colesterol total en la sangre, de a lo menos 10 puntos en 3 meses? b).- Construya un intervalo de confianza del 95 %, para establecer la reduccin promedio conseguida en el estudio, por los trabajadores. 2.- Se desea determinar el contenido de grasa en la carne para establecer el precio de venta al consumidor. Un a compaa empacadora de carne est considerando el uso de dos mtodos diferentes para determinar el porcentaje de grasa. Ambos mtodos fueron probado para evaluar el contenido de grasa en ocho muestras diferentes de carne.. Los resultados son M u e s t r a s
Mtodo
1 2
1 23,1 22,7
2 27,1 27,4
3 25,0 24,9
4 27,6 27,2
5 22,2 22,5
6 27,1| 27,4
7 23,2 23,6
8 24,7 24,4
a).- Sugieren estos datos que los dos mtodos difieren en su medicin del contenido de grasa en la carne? Redacte y Pruebe esta hiptesis con un nivel de significancia del 5 % . b).- Determine un intervalo de confianza del 95 % para el contenido promedio de grasa con el Mtodo1 c).- Determine un intervalo de confianza del 95 % para el contenido promedio de grasa con el Mtodo 2
164
8.4.4.- Aplicaciones de la Distribucin Chi-Cuadrado. La distribucin de probabilidad Chi-cuadrado, o distribucin 2 , fue descrita por primera vez por Karl Pearson alrededor del ao 1900. Es una variable aleatoria y que a la vez se utiliza como estadgrafo de contraste o de prueba, al igual que las distribuciones Normal, t de Stdudent. Tiene amplias aplicaciones y variadas utilizaciones, las que entre las ms frecuentes se cuentan: o o o Prueba de hiptesis e intervalos de confianza para la varianza de la poblacin Prueba de Independencia en tablas de contingencia o de asociacin Prueba de la Bondad de Ajuste
8.4.4.1.- Prueba de hiptesis e intervalos de confianza para la varianza de una sola poblacin. En algunas oportunidades se necesitan pruebas sobre la varianza o la desviacin estndar de una poblacin (dispersin) o distribucin. Supngase que se desea probar la hiptesis de la varianza de una poblacin normal 2 es igual a 2 un valor especfico, por ejemplo, 0 . De una muestra aleatoria de tamao "n" extrada de la
2 poblacin, se calcula el valor S

2 H0 : 2 = 0
Estadstico de prueba H1 :
2 2 0
H1 : <
2
2 0
H1 : >
2
2 0
2 Obs
2 (n 1) S
02
El valor del Estadstico de prueba se compara con valores obtenidos de una Tabla Estadstica de la distribucin Chi-cuadrado , adjunta al final del texto, segn se la hiptesis alternativa H1 que se est utilizando. Los grados de libertad, al igual que en la distribucin muestra menos 1. t Student, son iguales al tamao de la
Un intervalo de confianza de nivel (1 - ) para la varianza de la poblacin est dado por la expresin
2 (n 1) S
12 / 2
Ejemplo:
2 (n 1) S
2 /2
La desviacin estndar de cierto proceso de produccin es de 2 pulgadas. Se sospecha que la varianza se ha hecho demasiado grande (ha aumentado). Se toma una muestra de 9 partes producidas en dicho proceso y sus medidas son: 50 , 57 , 52 , 54 , 58 , 59 , 58 , 56 , 55
165
La prueba de hiptesis, de forma simblica, tiene la siguiente estructura:
H0: 2 = 4
v / s H1: 2 > 4 a un nivel de significancia = 0,05
8.4.4.2.-Prueba de Independencia en tablas de contingencia o de asociacin En muchas ocasiones, los "n" elementos de una muestra tomada de una poblacin pueden clasificarse de forma conjunta de acuerdo con dos criterios o variables diferentes. Sea estas variables " R " y " C". Es decir, podemos observar en cada elemento dos variables, que generalmente tiene como respuesta una caracterstica cualitativa o atributo. La tabla estadstica que se genera se denomina tabla de contingencia o de asociacin, que tiene " i " filas y " j " columnas Resulta de inters saber si existe algn grado de dependencia o de asociacin entre los niveles de clasificacin de las variables. Por ejemplo, se desea averiguar si hay alguna asociacin estadsticamente significativa entre "Nivel de Formacin Acadmica "y el "Rendimiento Laboral". Si existe alguna asociacin estadsticamente significativa entre el " Ausentismo Laboral " y la " Edad , etc. La hiptesis nula a probar es la de que las Variables " R " y " C " son independientes. Esto es de que no hay asociacin o relacin entre las dos variables. La hiptesis alternativa es la negacin de la hiptesis nula. Bajo el contexto de la hiptesis H 0 , es decir de independencia entre las variables , es de esperar que la Probabilidad Conjunta entre las variables se igual al producto de las probabilidades Marginales de cada una de ellas, es decir P (Ri , Cj ) = P ( Ri ) x P ( Cj) Los valores de las frecuencias conjuntas en cada una de las casillas, se comparan con los valores esperados para cada casilla. Los valores esperados para cada casilla se calculan multiplicando los totales en cada fila por los totales en cada columna y luego este producto se divide por el total " n " de la tabla
) se obtiene multiplicando el total Por ejemplo el valor esperado conjunto en la columna 2, fila 3 ( f 23 de fila 2 por el total en la columna 3 . Luego dividir por el total de datos
Es decir,
= f 2 f 3 f 23 n
0
Se probar la hiptesis H frecuencia esperada.
comparando cada frecuencia conjunta observada con su respectiva
166
El estadstico de prueba es:
2 ( j 1)( k 1)
)2 ( fij f ij = f j =1 k =1
J K ij
(Estadstico de Prueba)
Aqu el contraste es unilateral y el valor del estadstico de prueba se compara con el valor obtenido de una tabla de Distribucin Chi-cuadrado con grados de libertad igual al producto (nmero de filas - 1)x( nmero de columnas - 1 ) , para un nivel de confianza especfico 8.4.4.3.- Prueba de la Bondad de Ajuste El procedimiento de prueba requiere de una muestra aleatoria de tamao " n " proveniente de la poblacin la cual tiene una distribucin de probabilidad desconocida. Estas "n" observaciones se ubican en los " k " intervalos reales, cada uno de ellos conteniendo una cantidad "f i ". Seguidamente se representan grficamente en un histograma de frecuencia. Se supone o propone una distribucin de probabilidad, bajo la cual se calculan las frecuencias esperadas para cada uno de los intervalos, ". las que se denotan por " f i Hiptesis nula Ho es: " Los datos muestrales se distribuyen segn la distribucin propuesta" Hiptesis Alternativa H distribucin propuesta.
1
es " Los datos muestrales no se ajustan o no provienen de la
El estadstico de prueba es La prueba de Bondad del Ajuste
2 Observado
)2 ( fi f i = f i =1
i =k i
es slo una de varios procedimientos utilizados para tal efecto.

2
Cuando se trabaja con variables aleatorias continuas, la prueba chi-cuadrada ( ) tal vez no sea el mejor procedimiento, pero est ampliamente difundida su utilizacin. Desde el desarrollo de aspecto tericos de la estadstica matemtica, se demuestra que si la 2 tiene poblacin sigue o se distribuye segn el modelo de probabilidad propuesto, el valor de Observado de manera aproximada una distribucin Chi-cuadrada con " k p 1 " grados de libertad, donde k representa la cantidad de intervalos utilizados; p es el nmero de parmetros estimados a partir de los datos muestrales. La aproximacin a la distribucin puede mejorar si el tamao de la muestra aumenta.
2 La hiptesis nula Ho es rechazada cuando el valor de Observado > que el valor entregado por la tabla
con un nivel de confianza " 1 y k p 1 " grados de libertad.
Existe una tcnica grfica para probar si Ho se cumple . Esto se realiza por medio de la "grafica de probabilidad. Si el modelo de probabilidad propuesto ajusta a los datos, entonces el grfico de probabilidad mostrar que los datos tendern a alinearse en torno a una lnea recta.
167
Observaciones:
Este procedimiento de prueba est muy relacionado con la "magnitud o cantidad" de las frecuencias esperadas. Si estas frecuencias son muy pequeas, entonces el estadstico de prueba 2 no reflejar cabalmente el alejamiento entre lo observado y lo esperado, sino slo la Observado pequea magnitud de las frecuencias esperadas. No existe un acuerdo respecto de cual sera la cantidad mnima a aceptar como frecuencia esperada, pero en general los valores 3, 4 y 5 son los que ms se utilizan como mnimos. Algunos autores sugieren que la frecuencia esperada puede se tan pequea como 1 o 2, siempre y cuando que muchas de ellas en la tabla de distribucin de los datos resulten ser mayores que 5.
una frecuencia esperada en un intervalo es pequea, entonces pueden juntarse con la frecuencia esperada del intervalo adyacente. Las frecuencias observadas correspondientes tambin se combinan, por lo que entonces el N "k " de intervalos tambin disminuye.
Si
Tambin se debe destacar entonces de que no es necesario de que los intervalos tengan la misma longitud o ancho.
8.4.4.4.- Desarrollo de Ejercicios de Aplicacin. 1.- Supngase, que se desea averiguar si hay alguna asociacin significativa entre el nivel de formacin acadmica y el rendimiento laboral Rendimiento Excelente Bueno Regular Enseanza HumanistaCientfica Enseanza Tcnica Profesional Tcnica Universitaria
10 30 10
40 30 30
10 20 20
En primer lugar se debe construir la tabla con las frecuencias esperadas Rendimiento Excelente Bueno Regular TOTAL Enseanza Humanista-Cientfica 15 =(50 X60)/200 20=(50 X80)/200 15=(50 X60)/200 50 Enseanza Tcnica Profesional 30=(100 X60)/200 40=(100 X80)/200 30=(100 X60)/200 100 Tcnica Universitaria 15=(50 X60)/200 20=(50 X80)/200 15=(50 X60)/200 50 TOTAL 60 80 60 200
El Estadstico de Prueba es
2 Obs =
(10 15) 2 (40 30) 2 (10 15) 2 (20 15) 2 + + + ..........+ = 17,5 15 30 15 15
168
En la tabla de distribucin
% y con grados de libertad = (nmero de filas - 1) x( nmero de columnas - 1) = 2 x 2 = 4 el valor es de 9,48773.
al final del texto, encontramos que para un nivel de confianza del 95
Por lo tanto se debe rechazar la hiptesis nula de que no existe relacin significativa entre la formacin acadmica de los empleados y su rendimiento laboral El Coeficiente de Contingencia es una medida del grado de interrelacin, asociacin o dependencia de las clasificaciones en una tabla de contingencia que se calcula de la siguiente forma
C.C =
2 Obs +N
2 Obs
Donde N es el Total de datos
Cuanto mayor es el valor del C.C , mayor es el grado de asociacin entre las variables En este caso el C.C =
17.5 = 0,0897 17.5 + 200
Este coeficiente vara entre cero y uno. Para tablas de contingencia con "i" filas y "j" columnas, el mayor valor que puede tomar dicho coeficiente es
(k 1) donde k = mnimo{ i, j}. k
La Correlacin de Atributos es una medida del grado de dependencia, asociacin o interrelacin entre los niveles de medicin (atributos o clasificaciones) de las variables que definen la tabla. Un coeficiente de esta naturaleza es el Coeficiente V de Cramer`s V=
2 Obs
N (k 1)
17.5 200 (3 1)
donde k = mnimo { i , j}.
En este ejemplo el V =
= 0,2092
169
2.- En un proceso de embalaje de manzanas de calidad 1 , que se exportan a la Comunidad Econmica Europea , se realiza un muestre en 60 cajas . Se observan la totalidad de manzanas envasadas y se cuentan cuantas de ellas resultan "disconformes " con la definicin de calidad 1 y por lo tanto se les considera defectuosa. Nmero de Defectos
Frecuencia Observada
0
32
1
15
2
9
3
4
La cantidad de manzanas defectuosas por cajas se distribuye o proviene de una distribucin de Poisson? Ho: La cantidad de manzanas defectuosas por cajas se distribuye o proviene de una distribucin de Poisson H 1: La cantidad de manzanas defectuosas por cajas NO se distribuye o NO proviene de una distribucin de Poisson Dado que el parmetro de la distribucin de Poisson se estima a travs del promedio de los datos muestrales entonces = 0.75 Manzanas defectuosas por caja. Con este valor se determinan las probabilidades esperadas en cada intervalo y que multiplicado por el total de cajas n = 60, se obtiene la respectiva frecuencia esperada en el intervalo. a continuacin se detalla el procedimiento a seguir. P(X=0)=
0,75 0 e 0,75 = 0.472 0!
= 0,472 60 = 28,32 f 1 = 0,354 60 = 21,24 f 2

= 0,133 60 = 7,98 f 3
P(X=1) =
0,751 e 0,75 = 0,354 1!
0,75 2 e 0, 75 = 0,133 P(X=2)= 2!
P ( X 3 ) = 1 - P (X=0) - P(X=1) - P(X=2) = 0,041 Tenemos entonces que Nmero de Defectos

Frecuencia Observada Frecuencia Esperada
= 0,041 60 = 2,46 f 4
1
15 21,24
2
9 7,98
3 o ms
4 2,46
fi
f i
i =k
32 28,32
Y por lo tanto
2 Observado
)2 ( fi f i = = 2,94 f i =1
i
170
El valor de tabla Chi-cuadrado, con nivel de confianza del 95 % y grados de libertad igual a 3-1- 1 = 1 es de 3,84. Como el valor de Chi-cuadrado observado es menor que el valor de tabla ,entonces concluimos de que no es posible rechazar la hiptesis nula Ho, con cual podemos afirmar con 95 % de confianza que la cantidad de manzanas defectuosas por cajas se comporta segn el modelo de probabilidad Poisson. 8.4.4.5.- Ejercicios de Aplicacin Propuestos 1.- Se realiz una encuesta para evaluar la eficacia de una nueva vacuna contra la gripe y el resfro, que fue aplicada en una ciudad, en el perodo de otoo La vacuna se proporcion de forma gratuita en una secuencia de dos inyecciones en un perodo de dos semanas a quienes desearan aprovecharla. Algunas personas recibieron las dos inyecciones, otras se presentaron solamente a la primera inyeccin y otras no recibieron ninguna inyeccin. Una encuesta aplicada a 1000 personas de la ciudad al inicio del perodo de verano, proporcion la siguiente informacin. Ninguna inyeccin Una inyeccin Dos inyecciones Total Gripe No gripe Total
24 289 9 100 13 565
46 954 1000
313
109
578
Presentan los datos suficiente evidencia para indicar una dependencia entre la clasificacin segn la vacunacin y la ocurrencia o no de la gripe? 2.- Una compaa opera cuatro mquinas en tres turnos al da. De los registros de produccin , se obtienen los datos siguientes sobre el nmero de fallas. Mquinas TURNO
1 2 3
A
41 31 15
B
20 11 17
C
12 9 16
D
16 14 10
Pruebe la hiptesis (con = 0,05) de que el nmero de fallas es independiente de l turno.
171
3.- Un estudio que se realiz con una muestra de 81 personas referente a la relacin entre la cantidad de violencia vista en la televisin y la edad del televidente entreg los siguientes resultados. E D A D Grado de violencia vista en televisin Poca violencia Mucha violencia 16 8 18 34 35 12 15 54 55 o ms 21 7
Indican los datos que ver violencia en la televisin depende de la edad del televidente? Use =0,05 4.- El nmero de llamadas que se reciben en un tablero de central telefnica desde la 8:01 a las 8:01 de la maana durante un perodo de 100 das es el siguiente Nmero de llamadas Frecuencia 0 3 1 10 2 25 3 30 4 15 5 12 6 5 7 0 Total 100
A un nivel de significancia =0,05 pruebe la hiptesis de la frecuencia observada proviene de : a).- Una distribucin de Poisson b).- Una distribucin Binomial 5.- La estatura de 205 empleados en una industria presenta la siguiente distribucin de frecuencia Estatura ( cm )
150 - 155 155 - 160 160 - 165 165 - 170 170 - 175 175 180 185 180 185 190
Frecuencia Observada
9 20 45 55 43 17 11 5
A un nivel de significancia =0,05 pruebe la hiptesis de la frecuencia observada proviene de una distribucin Normal:
172
VIII.- ANLISIS DE VARIANZA Las tcnicas de Diseo Experimental basadas en la estadstica son particularmente tiles en el mundo de la Ingeniera en lo que corresponde a la mejora del rendimiento de los procesos de manufactura. Estas tcnicas tambin tienen una extensa aplicacin en el desarrollo de nuevos procesos. Muchos procesos pueden describirse en trminos de varias variables controladas o controlables, tales como temperatura, presin, Ph, concentracin, etc. Mediante el empleo de experimentos diseados , los ingenieros pueden determinar el subconjunto de variables del proceso que tienen mayor influencia sobre el rendimiento de ste.. Los resultados de estos experimentos pueden conducir a: 1.2.3.4.Mejorar el rendimiento del proceso Reducir la variabilidad del proceso y acercarlo a los requerimientos nominales Disminucin de los tiempos de diseo y desarrollo Disminucin de los costos de operacin
Los mtodos de diseo experimental tambin son tiles en las actividades de ingeniera de diseo, donde se desarrollan nuevos productos y se mejoran los existentes. Algunas aplicaciones representativas de los experimentos diseados de manera estadstica en la ingeniera de diseo incluyen: 1.- Evaluacin y comparacin de configuracin de diseos bsicos 2.- Evaluacin de materiales diferentes ocupados con un mismo fin 3.- Seleccin de parmetros de diseo de modo que el producto funcione bien bajo una amplia gama de condiciones de campo o de operacin ( diseo robusto ). 4.- Determinacin de los parmetros de diseo importantes del producto que tienen impacto sobre el funcionamiento de ste. El empleo del diseo experimental en el proceso de diseo puede dar como resultado productos que son ms fciles de fabricar, productos que tienen un desempeo y una confiabilidad mejores que los de la competencia, y productos que pueden disearse, desarrollarse y producirse en menor tiempo. Los experimentos diseados se utilizan, de manera usual, secuencialmente. Esto es, el primer experimento con un sistema complejo (quizs un proceso de fabricacin) que tiene muchas variables controladas es, a menudo, un experimento de diagnstico diseado para determinar qu variables son las ms importantes. Los experimentos que siguen a ste se utilizan para refinar la informacin y determinar los ajustes que deben hacerse a las variables crticas para mejorar el proceso. Finalmente el objetivo del experimentador es la optimizacin, es decir, la determinacin de los niveles que deben tener las variables crticas para obtener el mejor desempeo del proceso. Todo experimento implica una secuencia de actividades: 1.2.3.4.Conjetura : La hiptesis original que motiva el experimento Experimento : Prueba efectuada para investigar la conjetura. Anlisis : Anlisis estadstico de los datos obtenidos del experimento. Conclusin : Lo que se ha aprendido de la conjetura original con la realizacin del experimento. A menudo , ste conduce a una nueva conjetura y a un nuevo experimento , y as sucesivamente.
173
Los experimentos diseados estadsticamente permiten eficiencia y economa en el proceso experimental, y el empleo de los mtodos estadsticos para el anlisis de los datos brinda objetividad cientfica al obtener conclusiones Uno de los mtodos estadsticos para analizar los experimentos diseados estadsticamente es el Anlisis de Varianza . 9.1.Experimento completamente aleatorizado , de un solo factor.
Es evidente que en una investigacin determinada podemos estudiar el efecto o la respuesta que se produce en la unidad de experimentacin por el hecho de haberles aplicado alguna variable independiente controlable. En diseo , particularmente estas variables reciben el nombre genrico de tratamientos ( o combinacin de tratamientos ) , que implica el conjunto particular de condiciones experimentales que deben imponerse a una unidad experimental dentro de los marcos en que se efecta el diseo. La combinacin de tratamientos y su accin combinada recibe el nombre de interaccin. En muchas oportunidades el trmino tratamiento se indica o denomina como Factor , el cual puede ser: 1.- Cualitativos: Como mquinas diferentes, operarios, ubicacin geogrfica, tipo de material utilizado, etc. 2.- Cuantitativos: Como temperatura, presin, dosificacin de reactivos , concentracin, tiempo de residencia , etc. Debido a su simplicidad, este diseo es ampliamente utilizado. Sin embargo, el ingeniero o investigador debe ser cauteloso de que su uso debe limitarse a aquellos casos en que se dispone de material o unidades experimentales lo ms homogneas posibles, y el nmero de tratamientos es pequeo (menor o igual que 5 ). La matriz de datos obtenidos de un diseo experimental a un factor, el que tiene k tratamientos, generalmente presenta la siguiente estructura. Tratamientos 4 Y41 Y42 Y43 Y44 Y45 . . . Y4 n4 niveles o
1 Y11 Y12 Y13 Y14 Y15 . . . Y1 n1
2 Y21 Y22 Y23 Y24 Y25 . . . Y2 n2
3 Y31 Y32 Y33 Y34 Y35 . . . Y3 n3
k Yk1 Yk2 Yk3 Yk4 Yk5 . . . Yk n k
Totales por tratamientos Promedios por tratamientos
174
En el Anlisis de Varianza a un Factor en inters est centrado en probar la igualdad de los promedios 1, 2 , 3 ,............, k. Las observaciones de la tabla anterior pueden describirse con el Modelo estadstico Lineal Yij = + i + ij i = 1 , 2 , 3,............k ; j = 1 ,2, 3, ni
Donde Yij = Es una variable aleatoria que denota la (ij)-sima observacin. es una parmetro comn a todos los tratamientos denominado Media Global i es un parmetro asociado con el i-simo tratamiento denominado efecto del i-simo tratamiento ij es un componente de error aleatorio que se comporta segn el modelo normal de probabilidades , con promedio igual a cero y varianza 2 constante , y no correlacionados entre s La prueba de hiptesis consiste en probar H0 de que no existen diferencias estadsticamente significativas, en los efectos promedios de los distintos niveles del factor contra la hiptesis alternativa H1 de que existe algn efecto promedio que difiere significativamente de los dems. Es decir : H0 : 1 = 2 = .............= k v/s H1 : i j para algn i j Ejemplo: Se estn investigando cuatro catalizadores que pueden afectar la concentracin de un componente en una mezcla lquida. Se obtuvieron las siguientes concentraciones Catalizador 1 58,2 57,2 58,4 55,8 54,9 56,3 2 56,3 54,5 57,0 55,3 54,8 3 50,1 52,3 54,6 51,3 53,7 4 52,9 49,9 50,0 51,7 50,8 48,4 50,2
Desarrollo: a) Las hiptesis a probar son: H0 : No existen diferencias estadsticamente significativas en las concentraciones promedios de los catalizadores utilizados. H1 : Existe algn catalizador que produce un efecto promedio en la concentracin, que difiriere significativamente de los dems.
175
Este procedimiento requiere completar una tabla que tiene la siguiente estructura: Fuente de Variacin Entre Tratamientos Dentro de Tratamientos Suma de cuadrados Grados de Libertad K -1 Cuadrado Medio Cociente F
SCT =
i=k i =1
(T i ) 2 T 2 ni N
j =k 2
SCT CMT = K 1
SCE N K
CMT CME
SCE = ( X ij )
i =1 j =1
i = K j = ni i =1 j =1
i =k j =ni
(T j ) 2 nj
N-K N -1
j =1
CME =
Total
( X ij ) 2
T2 N
Donde: N: Es el total de observaciones o de mediciones realizadas en el experimento : Es el total de observaciones o mediciones en cada tratamiento i-simo Ti Es la suma total de las observaciones o mediciones en cada tratamiento. X ij Es la medicin obtenida en cada uno de los tratamientos Para completar la tabla anterior se puede utilizar la planilla Excel y con ella calcular los valores solicitados.
ni
176
Fuente de Variacin Entre Tratamientos
Suma de cuadrados
Grados de Libertad K -1
Cuadrado Medio
Cociente F
SCT =
i=k i =1
(T i ) 2 T 2 ni N
SCT CMT = K 1
CMT CME
209281,238 (1243,60)^2/23 = Dentro de Tratamientos
SCE = ( X ij ) 2
i =1 j =1
i = K j = ni i =1 j =1
i =k j =ni
j =k
(T j ) 2 nj
N-K
CME =
SCE N K
j =1
Total
( X ij ) 2
T2 N
N -1
La tabla anterior se puede obtener directamente de Excel si hacemos usos de los siguientes comandos
177
Y la tabla se recupera en una nueva hoja o en un Rango de Salida que uno desee.
178
Intervalos de 95% de confianza, para los valores promedios Intervalos de la menor diferencia significativa
59 57
Concent
55 53 51 49 1 2 3 4
Catali
Con los valores promedios de cada tratamiento, catalizador en este caso, las desviaciones estndares de cada uno de ellos y una tabla t de Student, podemos construir intervalos de confianza para cada tratamiento (catalizador). En este caso, Al observar el grfico, vemos que los intervalos de confianza de los catalizadores 1 y 2 tienen una importante zona de interseccin. A si mismo, pero en valores ms bajos, tienen un poco interseccin los catalizadores 3 y 4.
9.2.-
Anlisis de la varianza de experimentos con dos factores controlables.
Con frecuencia interesa examinar los efectos de dos tipos de Factores ,cada uno con varios niveles de medicin. Por ejemplo un Factor A con niveles de medicin A1 , A2 ,........ Aj. Adems un factor B con niveles de medicin B1 , B2 , ..........Bk , Se supone que para cada combinacin conjunta entre los niveles de los factores, se hacen dos o ms observaciones ( la misma cantidad para todos ).Este requisito se hace para que pueda efectuarse un contraste respecto de la existencia del efecto de interaccin. Las observaciones se registran en una tabla, cuya estructura es la siguiente: Factor B B1 A1 A2 .......... AJ B2 ............ BK
179
El modelo estadstico lineal que lo describe es: Yij = + i + j + ()ij ijk i = 1 , 2 , 3,.......a ; j = 1 ,2, 3, .. b ; k = 1,2,.n
Donde Yij = Es una variable aleatoria que denota la ij-sima observacin. es una parmetro comn a todos los tratamientos denominado Media Global i es el efecto del i -simo nivel factor j es el efecto del j-simo nivel del factor ( )ij es el efecto de interaccin de los factores y ij k es un componente de error aleatorio que se comporta segn el modelo normal de probabilidades , con promedio igual a cero y varianza 2 constante , y no correlacionados entre s. En este modelo se deben probar tres hiptesis a saber: 1.- En primer lugar debe establecerse si es significativo es el efecto de interaccin entre los factores principales.
2.- Si existen diferencias significativas en los efectos promedio del factor A . 3.- Si existen diferencias significativas en los efectos promedio del factor B
Para discutir o analizar las hiptesis planteadas se necesita una base de datos emprica que contenga los datos maestrales que represente a los efectos planteados en las hiptesis. Para ello, se descompone la medida de la variabilidad total, en trminos que recojan la variabilidad debido a los tratamientos o niveles del Factor A . La variabilidad debida debido a los tratamientos o niveles de medicin del factor B , la variabilidad debida a la interaccin entre los factores , y por ltimo , la ocasionada por el error aleatorio muestral ij k. Por ejemplo, en la investigacin de mercados , se pueden clasificar los vendedores por dos factores, tales como el segmento o intervalo de edad (A) y su nivel de escolaridad (B). El objetivo podra ser determinar si la edad y el nivel de escolaridad o formacin alcanzada tiene algn efecto significativo sobre el volumen de ventas. Tal vez interese no solo el efecto individual de cada uno de estos dos factores sino tambin el efecto conjunto o interaccin. Los clculos fundamentales del anlisis de varianza se realizarn utilizando un software estadstico. En todo caso a continuacin se plantea un problema para visualizar mejor los aspectos enunciados.
180
Ejemplo Un ingeniero disea una batera para su uso en un dispositivo que ser sometido a ciertas variaciones extremas de temperatura. El nico parmetro de diseo que el puede seleccionar en este punto es el material de la cubierta de la batera, y tiene tres alternativas. Cuando el dispositivo se manufactura y se enva al campo de prueba, el ingeniero no tiene control sobre las temperaturas extremas a que ser expuesto el dispositivo, y sabe por experiencia que es probable que la temperatura influya en la duracin efectiva de la batera. Sin embargo , si es posible controlar la temperatura en el laboratorio de desarrollo del producto para los fines de ensayo. El ingeniero decide probar los tres materiales de la cubierta a tres niveles de temperatura (15 , 70 y 125 F ) consistentes en el entorno del uso final del producto. Se prueban cuatro bateras en cada combinacin de material de material de la cubierta y temperatura. Las 36 pruebas se ejecutan al azar . Se registra el tiempo de duracin, en horas , de las bateras.
Temperatura F Tipo de material A B C 130 174 150 159 138 168 15 155 180 188 126 110 160 34 80 126 106 174 150 70 40 75 122 115 120 139 125 50 82 55 58 96 82 70 58 70 45 104 90
181
Metodologa de solucin y anlisis del problema 1 Paso: Para resolver este tipo de problemas o ejemplos ,debe crear un archivo en Statgraphics que contenga tres columnas o variables . Es decir, construir la Base de Datos. Una de ellas deben contener el tipo de material ( Factor ). Otra columna de contener los niveles de temperatura (Factor B ) . Una tercera columna debe contener el valor de la medicin (respuesta cuantitativa) .Por ejemplo:
Tip_ Mat
Temp
A A A A A A A A A A A A B B B B . C C C C
15 15 15 15 70 70 70 70 125 125 125 125 15 15 15 15 .. 125 125 125 125
Duracin 130 155 174 180 34 40 80 75

50 70 82 58 150 188 159 126
..
96 104 82 90
2 Paso: Redactar las hiptesis a probar , en el contexto del enunciado del problema H0 : No existen diferencias estadsticamente significativas en la duracin de las bateras , segn el tipo de material utilizado. H1 : Existe algn tipo de material utilizado en la fabricacin de las bateras que produce una duracin promedio significativamente diferente a los dems. H0 : No existen diferencias estadsticamente significativas en la duracin de las bateras , segn la temperatura de trabajo a la que sean sometidas. H1 : Existe alguna temperatura de trabajo a la que se someten las bateras de las bateras que produce una duracin promedio significativamente diferente a las dems.
182
H0: No existe una interaccin significativa entre tipo de material utilizado y la temperatura de trabajo, que produzca duraciones promedios significativamente diferentes en la duracin de las bateras. H1: Existe una interaccin significativa entre algn tipo de material utilizado y alguna temperatura de trabajo, que producen duraciones promedios significativamente diferentes en la duracin de las bateras.
ANOVA Factorial - Duracin
-------------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado Medio Cociente-F P-Valor --------------------------------------------------------------------------------
EFECTOS PRINCIPALES
A:Temp B:Tip_ Mat INTERACCIONES AB 40110,4 6772,06 12948,8 2 2 4 20055,2 3386,03 3237,19 53,58 9,05 8,65 0,0000 0,0010 0,0001
RESIDUOS 10105,7 27 374,287 -------------------------------------------------------------------------------TOTAL (CORREGIDO) 69937,0 35 -------------------------------------------------------------------------------Los cocientes F estn basados en el error cuadrtico medio residual.
Grficos para los valores promedios, en cada uno de los niveles del factor Grficos para los valores promedio de las interacciones o combinaciones de niveles de los factores involucrados.
183
184
Taller de Anlisis de la Varianza A.- Anlisis de la Varianza a un Factor

1.- Se estn investigando cuatro catalizadores que pueden afectar la concentracin de un componente en una mezcla lquida formada por tres componentes. Se obtuvieron las siguientes concentraciones: Catalizador 1 Catalizador 2 Catalizador 3 Catalizador 4 58,2 56,3 50,1 52,9 57,2 54,5 54,2 49,9 58,4 57,0 55,4 50,0 55,8 55,3 51,7 54,9
a).- Producen los catalizadores el mismo efecto promedio en la concentracin del componente en la mezcla lquida?. Redacte y pruebe las hiptesis planteadas. b).- Determine los intervalos de confianza del 95 % para el efecto promedio producido por cada catalizador. Muestre la situacin anterior, de forma grfica. c).- En caso de ser rechazada la hiptesis H0, aplique pruebas de comparaciones mltiples para identificar los que tienen efectos promedios similares y los que son diferentes. 2.- Se estn estudiando tres marcas de bateras. Se sospecha que la duracin (en semanas) de las tres marcas es diferente. Se prueban cinco bateras de cada marca y los resultados que se obtienen son los siguientes. Semanas de duracin
Marca 1
100 96 92 96 92
Marca 2
76 80 75 84 82
Marca 3
108 100 96 98 100
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en la duracin promedio de las bateras. a).- Tienen las bateras el mismo tiempo promedio de duracin?. Redacte y pruebe las hiptesis planteadas. b).- Determine los intervalos de confianza del 95 % para el tiempo promedio por cada batera. Muestre la situacin anterior, de forma grfica. Cul batera usara usted y por qu? c).- En caso de ser rechazada la hiptesis H0 , aplique pruebas de comparaciones mltiples para identificar las bateras que tienen duracin promedios similares y las que son diferentes. d).- Determine un intervalo de confianza del 95 % para la diferencia entre los tiempo promedios de duracin entre las bateras 2 y 3.
185
3.- Se est estudiando la resistencia a la tensin de Cemento Prtland. Cuatro tcnicas de mezclado pueden ser usadas econmicamente. Se han recolectado los siguientes datos.
Tcnica de mezclado Resistencia a la tensin (lb / plg 2 )
1 2 3 4
3129 3200 2800 2600
3000 3300 2900 2700
2865 2975 2985 2600
2890 3150 3050 2765
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen si la resistencia a la tensin del cemento, vara segn la tcnica de mezclado. a).- Redacte y pruebe las hiptesis para probar si existen diferencias estadsticamente significativas en la resistencia promedio a la tensin, segn la tcnica de mezclado. b).- Determine intervalos de confianza para la resistencia media de cada una de la tcnicas de mezclado. Construya la grfica para cada caso. 4.- Una pequea fbrica de textiles cuenta con cinco telares. Se supone que tienen la misma produccin de tela por minuto. Para investigar esta suposicin, se mide la cantidad de tela producida en cinco tiempos diferentes. Se obtienen los datos siguientes. Telar
1 2 3 4 5 14,0 13,9 14,1 13,6 13,8
Produccin (lb / min)

14,1 13,8 14,2 13,8 13,6 14,2 13,9 14,1 14,0 13,9 14,0 14,0 14,0 13,9 13,8 14,1 14,0 13,9 13,7 14,0
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en la produccin media de los Telares. a).- Redacte y pruebe las hiptesis para probar si existen diferencias estadsticamente significativas en la produccin promedio de los telares. b).- Determine intervalos de confianza para la produccin media para cada uno de los telares. Construya la grfica para cada caso. 5.- Se desea comprobar si ciertos cambios en el proceso de fabricacin del cemento aumentan su resistencia a la compresin. Para ello, se compara la resistencia de probetas construidas con el mtodo tradicional, (mtodo A), con aquellas fabricadas mediante los procedimientos que se desean probar (mtodos B y C). Los datos originales se han expresado en unidades convenientes para facilitar los clculos. Mtodo A 16 14 42 38 23 Mtodo B 27 30 26 20 76 Mtodo C 61 33 37 63 65
186
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en la resistencia promedio a la compresin, segn el mtodo utilizado. Qu resultados podemos concluir de los datos anteriores, aplicando los conceptos vistos para el anlisis de la varianza a un factor?. 6.- Cuatro grupos de vendedores de una agencia de ventas de revistas fueron sometidos a diferentes programas de entrenamiento en ventas. Debido a que hubo varias deserciones durante el entrenamiento, el nmero de personas fue diferente para cada grupo. Al final del programa de entrenamiento, a cada vendedor le fue asignada aleatoriamente una zona de ventas de entre un grupo de zonas que tienen aproximadamente el mismo potencial de ventas. En la tabla siguiente aparece el nmero de ventas efectuadas por cada uno de los vendedores de cada grupo durante la primera semana posterior al entrenamiento. Grupo de entrenamiento
1 65 87 73 79 81 69 2 75 69 83 81 72 79 90 3 59 78 67 62 83 76 4 94 89 80 88
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en las ventas promedio, segn el programa de entrenamiento. Hay suficiente evidencia que indique una diferencia estadsticamente significativa en los resultados promedio de los cuatro programas de entrenamiento?. Redacte un informe completo de la situacin analizada.
187
7.- Con el propsito de compara los precios del pan ( de un tipo especfico) , se llev a cabo un experimento en cuatro zonas de una ciudad. En cada una de las zonas , 1, 2, 3 y 4 , se tomaron muestras en los lugares donde se expende el producto. Se consulto por el precio del kilo de pan. El precio est dado en pesos ($ ) Zona 1 590 630 650 610 640 580 600 610 2 580 610 640 630 570 600 630 600 3 550 590 550 580 590 560 600 550 4 690 700 680 700 660 710 690
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en el precio promedio del pan , segn la zona de la ciudad. Usando un intervalo de confianza del 95 % , estime la diferencia de precio promedio entre las zonas 1 y 4. 8.- Una agencia gubernamental para la proteccin del medio ambiente ha establecido reglamentos muy estrictos para el control de los desechos de las fbricas. Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por el gobierno, pero quisiera determinar cul es la situacin de las otras tres. Para tal efecto se toman cinco muestras de los lquidos residuales de cada una de las plantas y se determina la cantidad de contaminantes. Los resultados del experimento aparecen en la tabla siguiente: Planta A B C D 1,65 1,70 1,40 2,10 Cantidad de Contaminantes 1,72 1,85 1,75 1,95 1,50 1,46 1,38 1,65 1,37 2,05 1,65 1,88 1,60 1,80 1,55 2,00
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en la cantidad media de contaminantes para las cuatros plantas. Adems use intervalos de confianza del 90% para estimar la diferencia de la cantidad promedio de desechos contaminantes en las plantas A y B : Entre las plantas A y C . Entre las plantas A y D
188
9.- Se ha realizado un experimento para determinar si cuatro temperaturas especficas de horneado afectan la densidad de un cierto tipo de ladrillo. El experimento proporciona los siguientes datos: Temperatura 100 21,8 21,9 21,7 21,6 21,7 125 21,7 21,4 21,5 21,4 150 21,9 21,8 21,8 21,6 21,5 175 21,9 21,7 21,8 21,4
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia en la densidad del ladrillo, segn la temperatura de horneado. Qu densidades medias, segn la temperatura de horneado difieren significativamente? 10.- Un fabricante de equipos de televisin est interesado en el efecto que tienen sobre la conductividad de los cinescopios de televisin a color, cuatro diferentes tipos de recubrimiento. Se obtuvieron los siguientes datos de conductividad: Tipo de Recubrimiento 1 143 141 150 146 2 152 149 137 143 3 134 136 132 127 4 129 127 132 129
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en la conductividad promedio, segn el tipo de recubrimiento. Cul es el tipo de recubrimiento que produce la mxima conductividad, y entre que valores se comporta el 95% de la veces? 11.- Se estudia la duracin efectiva de lquidos aislantes a una carga acelerada de 35 Kw. Se han obtenido datos de prueba para cuatro tipos de lquidos. Se obtienen los siguientes resultados. Tipo de Lquido 1 17,6 2 16,9 3 21,4 4 19,3
189
18,9 16,3 17,4 20,1 21,6
15,3 18,6 17,1 19,5 20,3
23,6 19,4 18,5 20,5 22,3
21,1 16,9 17,5 18,3 19,8
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en la duracin promedio entre los tipos de lquidos aislantes?. 12.- Un fabricante supone de que existen diferencias en el contenido de calcio en lotes de materia que le son suministrados por su proveedor. Actualmente hay cinco lotes en la bodega. Un analista qumico realiza cinco pruebas sobre cada lote y obtiene los siguientes resultados: Lote 1 23,46 23,48 23,56 23,39 23,40 Lote 2 23,59 23,46 23,42 23,49 23,50 Lote 3 23,51 23,64 23,46 23,52 23,49 Lote 4 23,39 23,49 23,52 23,46 23,32 Lote 5 23,40 23,50 23,49 23,39 23,38
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en el contenido de calcio de un lote a otro.
13.- En una forja se utilizan tres hornos para calentar muestras de metal. Se supone que todos los hornos operan a la misma temperatura, aunque se sospecha que quizs esto probablemente no es cierto. Se calientan los hornos y se registran sus temperaturas. Los resultados son: Horno
190
1 491,50 498,30 498,10 493,50 493,60
2 488,50 484,65 479,90 477,35
3 490,10 484,80 488,25 473,00 471,85 478,65
Aplique la metodologa de trabajo indicada al inicio del taller, para verificar si los datos proporcionan evidencia suficiente que indiquen una diferencia significativa en las temperatura promedio alcanzada por cada horno. BAnlisis de la Varianza a dos Factores
B.1.- En un artculo publicado en Industrial Quality Control , se describe un experimento para investigar el efecto del tipo de vidrio y el tipo de fsforo sobre la brillantez de un cinescopio de televisor. La variable de respuesta es la corriente necesaria ( en micro amperes) para obtener un nivel de brillantez especificado. Los datos son: Tipo de vidrio 1 1 280 290 285 230 2 235 240 Tipo de fsforo 2 300 310 295 260 240 235 3 290 285 290 220 225 230
a).- Existe evidencia de que alguno de los factores influya en la brillantez b).- Interactan entre si ambos factores B.2.- Se encuentra en estudio el rendimiento de un proceso qumico. Se cree que las dos variables ms relevantes son la presin y la temperatura. Se seleccionan tres niveles de cada factor y se realiza un experimento factorial con dos rplicas. Se recopilan los siguientes datos:
191
Temperatura Baja Intermedia Alta
200 90,4 90,2 90,1 90,3 90,5 90,7
Presin 215 90,7 90,6 90,5 90,6 90,8 90,9
230 90,2 90,4 89,9 90,1 90,4 90,1
a) Analice los datos segn la metodologa indicada y obtenga las conclusiones b) Prepare las grficas para lo errores o residuos y comente la adecuacin del modelo. c) Si lo que se busca es el mayor rendimiento del proceso, en que condiciones debe operarse este proceso. B.3.- Se est estudiando los factores que influyen en la resistencia de ruptura de una fibra sinttica. Se cuenta con cuatro mquinas y tres operadores. Se realiza un experimento factorial usando fibras de un mismo lote de produccin. Los resultados son:
Mquina Operario 1 2 3 1 109 110 110 112 116 114 2 110 115 110 111 112 115 3 108 109 111 109 114 119 4 110 108 114 112 120 117
a) Analice los datos segn la metodologa indicada y obtenga las conclusiones. b) Prepare las grficas para lo errores o residuos y comente la adecuacin del modelo. c) cul es la combinacin operario - mquina que produce la mxima resistencia?, y la menor resistencia? B.4.- Se realiz un experimento para determinar si la temperatura de ignicin o la posicin del horno influyen en la densidad de coccin de un nodo de carbono. Los datos son los siguientes
192
Posicin 1
800 570 565 583 528 547 521
Temperatura 825 1063 1080 1043 988 1026 1004
850 565 510 590 526 538 532
a) Analice los datos segn la metodologa indicada y obtenga las conclusiones. b) Prepare las grficas para lo errores o residuos y comente la adecuacin del modelo. c) Qu combinacin Temperatura Posicin recomendara usted si se desea una mayor densidad a un menor costo? (observacin: se supone que una mayor temperatura eleva los costos) B.5.- Un ingeniero mecnico estudia la fuerza de empuje producida por un taladro. Sospecha que los factores ms importantes son las revoluciones de la broca y la alimentacin. Ser realiza un experimento con cuatro niveles de alimentacin, y se usan los niveles de rotacin baja y alta para representar las condiciones de operacin de la mquina. Se obtienen los siguientes datos. Velocidad de la broca
Rapidez de alimentacin 0,015 2,70 2,78 2,83 2,86 0,030 2,45 2,49 2,85 2,80 0,045 2,60 2,72 2,86 2,87 0,060 2,75 2,86 2,94 2,88
125 200
a) Analice los datos segn la metodologa indicada y obtenga las conclusiones. b) Prepare las grficas para lo errores o residuos y comente la adecuacin del modelo.
193
B.6.- Una ingeniera de manufactura sospecha que la terminacin de la superficie de una pieza metlica depende de la alimentacin y de la profundidad de corte. Se prueban tres niveles de alimentacin con cuatro niveles de profundidad de corte. Se colectan los siguientes datos: Rapidez de Alimentacin (plg/min) 0,20 0,15 74 64 60 92 86 88 99 98 102 Profundidad de corte (plg) 0,18 0,20 79 68 73 98 104 88 104 99 95 82 88 92 99 108 95 108 110 99 0,25 99 104 96 104 110 99 114 111 107
0,25
0,30
a) Analice los datos segn la metodologa indicada y obtenga las conclusiones. b) Prepare las grficas para lo errores o residuos y comente la adecuacin del modelo. c) Qu combinacin de los niveles de los factores hace que se obtenga la mejor calidad de terminacin en la superficie?, Cul combinacin hace que se obtenga la peor calidad? Los datos de los siguientes problemas, son el resultado de experimentos con dos factores controlados u observados. Un aspecto a considerar es que solo tienen una observacin o dato en cada combinacin de niveles de los factores. Esto implica un ligera variacin en el anlisis de los datos, en el sentido de que no se puede plantear hiptesis de interaccin entre los factores. B.7.- Jonson y Leone describen un experimento para investigar el alabeo de placas de cobre. Los dos factores estudiados fueron temperatura y contenido de cobre de las placas. La variable de respuesta fue una medida de la cantidad de alabeo. Los datos son: Temperatura ( C ) C o n t e n i d o 40 17,20 12,90 16,12 21,17 de cobre (%) 60 16,21 18,13 18,21 23,21 80 24,22 17,12 25,23 23,22 90 28,27 27,31 30,23 29,31
50 75 100 125
194
a) Analice los datos segn la metodologa indicada y obtenga las conclusiones. b) Analice los residuos del experimento. c) Si lo que se desea es un mnimo de alabeo en la placa, Qu nivel de contenido de cobre especificara usted como investigador? B.8.- Se cree que la adhesividad de un pegamento depende de la presin y de la temperatura al ser aplicado. Se realiza un experimento con estos dos factores y se obtienen los siguientes resultados: Presin (lb / plg2 ) Temperatura F 250 120 130 140 150 9,60 9,69 8,43 9,98 260 11,28 10,10 11,01 10,44 270 9,00 9,57 9,03 9,80
a) Analice los datos segn la metodologa indicada y obtenga las conclusiones. b) Analice los residuos del experimento. c) Si lo que se desea es aumentar la adhesividad , Cul es la mejor combinacin?. Los datos de los siguientes problemas, son el resultado de experimentos con tres factores controlados u observados. Tienen ms de una observacin o dato en cada combinacin de niveles de los factores. Esto implica un ligera variacin en el anlisis de los datos, en el sentido de que se puede plantear hiptesis de hasta tres interaccin entre los factores. B.9.- Se estn investigando los efectos sobre la resistencia que producen el porcentaje de la concentracin de fibra de madera (harwood) en la pulpa , presin del tanque y el tiempo de coccin de la pulpa. Se seleccionan tres niveles de la concentracin de ,madera y de la presin, y dos niveles de tiempo de coccin. El experimento se realiza con dos replicas y reobtienen los siguientes datos: Tiempo 3,0 horas Concentracin Porcentual De Fibra 2 4 8 Presin durante tiempo de Coccin de 3,0 hrs 400 196,6 196,0 198,5 197,2 197,5 196,6 500 197,7 196,0 196,0 196,9 195,6 196,2 650 199,8 199,4 198,4 197,6 197,4 198,1 de coccin 4,0 horas Presin durante tiempo de Coccin de 4,0 hrs 400 198,4 198,6 197,5 198,1 197,6 198,4 500 199,6 200,4 198,7 198,0 197,0 197,8 650 200,6 200,9 199,6 199,0 198,5 199,8
195
a) Analice los datos del experimento segn la metodologa indicada y obtenga las respectivas conclusiones. b) Analice los residuos del experimento. c) Bajo qu conjunto de condiciones debe operarse este proceso? , por qu?
196
B.10.- En el Departamento de Control de Calidad de una planta de acabado de telas se est estudiando el efecto de diversos factores que influyen sobre el teido de tela de algodn y fibra sinttica, la cual se utiliza en la confeccin de camisas para hombre. Se realiz una experimento donde participaron tres operadores, con tres niveles de tiempo y dos niveles de temperatura y se tieron tres muestras de tela dentro de cada conjunto de condiciones. La tela teida fue comparada con un estndar y se le asign una calificacin numrica. Los datos resultantes fueron:
Tiempo de Ciclo
Temperatura a 300
Temperatura a 400
Operario Operario 1 23 24 25 36 35 36 28 24 27
40
2 27 28 26 34 38 39 35 35 34
3 31 32 29 33 34 35 26 27 25
1 24 23 28 37 39 35 26 29 25
2 38 36 35 34 38 36 36 37 34
3 34 36 39 34 36 31 28 26 24
50
60
a) Analice los datos del experimento segn la metodologa indicada y obtenga las respectivas conclusiones. b) Analice los residuos del experimento, es decir , la idoneidad del modelo. c) Bajo qu conjunto de condiciones debe operarse este proceso? , por qu?
197

Tercera Parte Prob y Estad Plan Especial 2012 PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Tercera Parte Prob y Estad Plan Especial 2012 PDF

Caricato da

Copyright:

Formati disponibili

VIII.- INFERENCIA ESTADSTICA PARAMETRICA 8.1.

8.2.- Estimacin Estimador, Estadstica.

8.3.- Distribuciones de muestreo

Por ejemplo el promedio aritmtico X , tiene un error estndar de oportunidades el parmetro

debe ser estimado por la varianza muestral , obtenindose entonces

S2 . un error estndar estimado igual a n

La estructura general de una Prueba de Hiptesis, la podemos resumir en el siguiente cuadro

Este es el tipo de Error con el que usualmente se realiza la prueba de Hiptesis

Para mayor claridad observamos el siguiente cuadro:

4.- Seleccionar un nivel de significancia , para probar la hiptesis H

X1 + X 2 , donde X1 y X2 representan las n1 + n2

H0 : p1 - p2 = H1: p1 - p2 < H1 : p1 - p2 > H1 : p1 - p2

Estadstico de prueba ZObs =

Intervalo de confianza de nivel (1 - )

Adems, recordemos que

2 poblacin, se calcula el valor S

La prueba de hiptesis, de forma simblica, tiene la siguiente estructura:

v / s H1: 2 > 4 a un nivel de significancia = 0,05

Se probar la hiptesis H frecuencia esperada.

comparando cada frecuencia conjunta observada con su respectiva

El estadstico de prueba es:

es " Los datos muestrales no se ajustan o no provienen de la

El estadstico de prueba es La prueba de Bondad del Ajuste

es slo una de varios procedimientos utilizados para tal efecto.

con un nivel de confianza " 1 y k p 1 " grados de libertad.

% y con grados de libertad = (nmero de filas - 1) x( nmero de columnas - 1) = 2 x 2 = 4 el valor es de 9,48773.

al final del texto, encontramos que para un nivel de confianza del 95

Donde N es el Total de datos

17.5 = 0,0897 17.5 + 200

(k 1) donde k = mnimo{ i, j}. k

donde k = mnimo { i , j}.

0,75 0 e 0,75 = 0.472 0!

= 0,472 60 = 28,32 f 1 = 0,354 60 = 21,24 f 2

0,751 e 0,75 = 0,354 1!

0,75 2 e 0, 75 = 0,133 P(X=2)= 2!

P ( X 3 ) = 1 - P (X=0) - P(X=1) - P(X=2) = 0,041 Tenemos entonces que Nmero de Defectos

Pruebe la hiptesis (con = 0,05) de que el nmero de fallas es independiente de l turno.

1 Y11 Y12 Y13 Y14 Y15 . . . Y1 n1

2 Y21 Y22 Y23 Y24 Y25 . . . Y2 n2

3 Y31 Y32 Y33 Y34 Y35 . . . Y3 n3

k Yk1 Yk2 Yk3 Yk4 Yk5 . . . Yk n k

Totales por tratamientos Promedios por tratamientos

Fuente de Variacin Entre Tratamientos

209281,238 (1243,60)^2/23 = Dentro de Tratamientos

Anlisis de la varianza de experimentos con dos factores controlables.

15 15 15 15 70 70 70 70 125 125 125 125 15 15 15 15 .. 125 125 125 125

Duracin 130 155 174 180 34 40 80 75

Taller de Anlisis de la Varianza A.- Anlisis de la Varianza a un Factor

3129 3200 2800 2600

3000 3300 2900 2700

2865 2975 2985 2600

2890 3150 3050 2765

Produccin (lb / min)

18,9 16,3 17,4 20,1 21,6

15,3 18,6 17,1 19,5 20,3

23,6 19,4 18,5 20,5 22,3

21,1 16,9 17,5 18,3 19,8

1 491,50 498,30 498,10 493,50 493,60

2 488,50 484,65 479,90 477,35

3 490,10 484,80 488,25 473,00 471,85 478,65

Temperatura Baja Intermedia Alta

200 90,4 90,2 90,1 90,3 90,5 90,7

Presin 215 90,7 90,6 90,5 90,6 90,8 90,9