Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
P. Reyes / 15/11/2013
H 0 1 2 3 .... k
Fc
Donde
2 sb 2 sw
F (k 1, k (n 1))
Donde el nmero de grados de libertad para el numerador es k-1 y para el denominador es k(n1), siendo el nivel de significancia. k = nmero de muestras. Por ejemplo: 1. Cuatro catalizadores que pueden afectar la concentracin de un componente en una mezcla lquida de tres componentes estn siendo investigado. Se obtienen las siguientes concentraciones: Catalizador B 56.3 54.5 57 55.3
Pgina 1
P. Reyes / 15/11/2013
54.9
Pgina 2
P. Reyes / 15/11/2013
Ho mu1=mu2=mu3=mu4 alfa(1/2) 0.025 Catalizadores A 1 2 3 4 5 sumatoria promedio g.promedio n c r gl SCT gl SCTR gl SCE SCT SCTR SCE CMT CMTR CME Fc Ft(0.025,3,12) B 58.2 57.2 58.4 55.8 54.9 284.5 56.9 54.4875 Prom 56.3 50.1 58.2 54.5 54.2 57.2 57 55.4 58.4 55.3 55.8 54.9 56.3 223.1 159.7 204.5 54.5 55.775 53.2333 51.13 57 55.3 50.1 54.2 55.4 52.9 49.9 50 51.7 C D 52.9 49.9 50 51.7 SC 13.8384 7.3984 15.3664 1.7424 0.1764 3.3124 0.0004 6.3504 0.6724 19.1844 0.0784 0.8464 2.4964 20.9764 20.0704 7.7284 # SCR renglones 29.1128 5 6.63578 4 4.71504 3 45.2122 4 85.6758 SCTR
SCT
120.238
9.915 es mayor que 4.47, por lo tanto cae en la zona de rechazo, se rechaza Ho.Los catalizadores tienen efectos diferentes
Tabla de Anlisis de varianza Suma de cuadrados Entre muestras 85.67584 Dentro de muestras Varianza total Valor P 0.00143578 34.56256 120.2384
Grados de libertad 3 12 15
Valor F 9.915
Como el valor P es menor que alfa(1/2) por lo que se confirma que Ho se rechaza. Prueba de Tukey T 4.11529534 q(0.01,4,12) 4.2 Diferencia minima significativa DMS 2.339 F(0.05,1,12) 4.75
x1-x2
Pgina 3
P. Reyes / 15/11/2013
3.66666667 menor que T 5.775 mayor que T 2.54166667 menor que T 4.65 mayor que T 2.10833333 menor que T
mayor que 3.667 DMS mayor que 5.775 DMS mayor que 2.542 DMS mayor que 4.65 DMS menor que 2.108 DMS
Basandonos en la diferencia minima significativa que es mas precisa, concluimos que solamente A es igual con B y C es igual con D. La maxima concentracion se obtiene con el catalizador A Residuales 1.3 0.3 1.5 -1.1 -2 0.52 -1.28 1.22 -0.48 -3.13 0.97 2.17 1.77 -1.23 -1.13 0.57 Utilizando los paquetes de Excel y Minitab se tiene: Ejemplo 1: Tres tipos distintos de motores de gasolina fueron probados para determinar cunto tiempo son tiles antes de necesitar una reparacin; si los tiempos de vida de los motores de cada tipo se distribuyen normalmente y tienen la misma varianza, haga una prueba usando 0.05 para determinar si difieren las medias de vida til antes de requerir una reparacin. En la tabla aparecen los tiempos de vida til, en decenas de miles de millas para cada tipo de motor.
A 6 2 4 1 7
B 8 7 7 2 6
C 3 2 5 4 1
Mediante Minitab determinamos si las muestras provienen de una poblacin Normal. Seleccione en el menu para cada muestra:
Pgina 4
P. Reyes / 15/11/2013
Stat > Basic statistics > Normalita test Variable Columnas de datos Test for normality Seleccionar Ryan Joiner OK >=0.05 .
Probability Plot of A
Normal
99
95 90 80
Percent
70 60 50 40 30 20 10 5
-2
4 A
10
Probability Plot of B
Normal
99 Mean StDev N RJ P-Value 6 2.345 5 0.909 >0.100
95 90 80
Percent
70 60 50 40 30 20 10 5
6 B
10
12
Pgina 5
P. Reyes / 15/11/2013
Probability Plot of C
Normal
99 Mean StDev N RJ P-Value 3 1.581 5 0.998 >0.100
95 90 80
Percent
70 60 50 40 30 20 10 5
-1
3 C
Analizando las grficas nos damos cuenta de que las muestras provienen de poblaciones normales.
Si denotamos por
1, 2 y 3 las medias poblacionales de los tiempos de vida til para los tipos
H 0 : 1 2 3
H1: Al menos dos medias poblacionales no son iguales.
Procedimiento en Excel:
En el men herramientas seleccione la opcin Anlisis de datos, en funciones para anlisis seleccione Anlisis de varianza de un factor. En Rango de entrada seleccionar la matriz de datos.
Pgina 6
P. Reyes / 15/11/2013
Alfa = 0.05 En Rango de salida indicar la celda donde se inciar la presentacin de resultados.
Anlisis de varianza de un factor RESUMEN Grupos Columna 1 Columna 2 Columna 3
Cuenta 5 5 5
Suma 20 30 15
Promedio 4 6 3
ANLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos Total
Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crtico para F 23.33333333 2 11.66666667 2.413793103 0.13150932 3.885290312 58 12 4.833333333 81.33333333 14
En la tabla observamos que el estadstico de prueba Fc es menor al valor crtico para F 2.41<3.88, por lo cual no rechazamos al Hiptesis nula H0. No tenemos evidencia estadstica para afirmar que los tiempos de vida til de los motores, antes de requerir una reparacin son diferentes.
Pgina 7
P. Reyes / 15/11/2013
ANOVA en Minitab.
Utilice Seleccionar:
Stat > ANOVA > One Way (Unstacked) Response in separate columns A, B, C Seleccionar ! Store Residuals ! Store Fits Graphs Seleccionar Normal plot of residuals Comparisons Seleccionar Tukeys Family error rate OK
Resultados: La grfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el modelo:
95 90 80
Percent
70 60 50 40 30 20 10 5
-5.0
-2.5
0.0 Residual
2.5
5.0
One-way ANOVA: A, B, C
Source Factor Error Total DF 2 12 14 SS 23.33 58.00 81.33 MS 11.67 4.83 F 2.41 P 0.132
Como este valor P es mayor a 0.05 se rechaza la hiptesis nula y A, B y C no tienen efecto en la respuesta.
S = 2.198 R-Sq = 28.69% R-Sq(adj) = 16.80%
Level A
N 5
Mean 4.000
StDev 2.550
Pgina 8
P. Reyes / 15/11/2013
Los intervalos de confianza de los tres niveles A, B, C del factor se pueden traslapar por tanto sus efectos no son diferentes.
Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons Individual confidence level = 97.94% A subtracted from: B C Lower -1.707 -4.707 Center 2.000 -1.000 Upper 5.707 2.707 ---------+---------+---------+---------+ (----------*---------) (---------*----------) ---------+---------+---------+---------+ -3.5 0.0 3.5 7.0
B subtracted from: C Lower -6.707 Center -3.000 Upper 0.707 ---------+---------+---------+---------+ (---------*----------) ---------+---------+---------+---------+ -3.5 0.0 3.5 7.0
Como el cero pertenece al intervalo de confianza de las diferencias entre A y B; A y C y entre B y C no hay diferencia entre el efecto entre estos niveles.
A continuacin se muestran los residuos y los valores estimados para la respuesta Y por el modelo:
RESI1 2 -2 0 -3 3
RESI2 2 1 1 -4 0
RESI3 0 -1 2 1 -2
FITS1 4 4 4 4 4
FITS2 6 6 6 6 6
FITS3 3 3 3 3 3
Donde cada residuo es Eij = Yij observado Yij estimado Yij estimado es el promedio en cada columna.
Ejemplo: La tabla adjunta contiene el nmero de palabras escritas por minuto por cuatro secretarias de la universidad en cinco ocasiones diferentes usando la misma mquina.
A 82 79 75 68 65 B 55 67 84 77 71 C 69 72 78 83 74 D 87 61 82 61 72
Pgina 9
P. Reyes / 15/11/2013
La grfica de residuos los muestra apegados a la recta, indicando que el modelo es vlido:
Normal Probability Plot of the Residuals
(responses are A, B, C, D)
99
95 90 80
Percent
70 60 50 40 30 20 10 5
-20
-10
0 Residual
10
20
One-way ANOVA: A, B, C, D
Source Factor Error Total DF 3 16 19 SS 52.2 1367.6 1419.8 MS 17.4 85.5 F 0.20 P 0.892
Como el valor P de 0.892 es mayor a alfa de 0.05 no hay efecto en la respuesta cambiando los niveles del factor A, B, C y D.
S = 9.245 R-Sq = 3.68% R-Sq(adj) = 0.00% Individual 95% CIs For Mean Based on Pooled StDev -------+---------+---------+---------+-(--------------*--------------) (--------------*--------------) (-------------*--------------) (--------------*--------------) -------+---------+---------+---------+-66.0 72.0 78.0 84.0
Level A B C D
N 5 5 5 5
Se pueden traslapar los intervalos de confianza de los niveles del factor, por tanto no hay diferencia significativa en sus efectos.
Tukey 95% Simultaneous Confidence Intervals All Pairwise Comparisons Individual confidence level = 98.87% A subtracted from: B C D Lower -19.745 -15.345 -17.945 Center -3.000 1.400 -1.200 Upper 13.745 18.145 15.545 --------+---------+---------+---------+(-------------*------------) (-------------*-------------) (-------------*-------------) --------+---------+---------+---------+-12 0 12 24
Pgina 10
P. Reyes / 15/11/2013
B subtracted from: C D Lower -12.345 -14.945 Center 4.400 1.800 Upper 21.145 18.545 --------+---------+---------+---------+(-------------*-------------) (------------*-------------) --------+---------+---------+---------+-12 0 12 24
C subtracted from: D Lower -19.345 Center -2.600 Upper 14.145 --------+---------+---------+---------+(-------------*-------------) --------+---------+---------+---------+-12 0 12 24
En la prueba de Tukey como el cero pertenece a los intervalos de confianza de todas las diferencias entre niveles A, B, C y D, no hay diferencia entre sus efectos en la respuesta. Los residuos y valores estimados Fits se muestran a continuacin: RESI1 8.2 5.2 1.2 -5.8 -8.8 RESI2 -15.8 -3.8 13.2 6.2 0.2 RESI3 -6.2 -3.2 2.8 7.8 -1.2
1
Prueba de Tukey-Snedecor
Cuando la hiptesis nula Ho es rechazada, estamos interesados en identificar el grupo o grupos particulares que inducen a la diferencia estadsticamente significativa. Los pasos para realizar la prueba son los siguientes: 1. Se ubican las medias de los tratamientos, primero la de mayor valor y por ltimo la de menor, as como la diferencia entre ellas. 2. Se calcula el error estndar de la media :
Sx
2 Sw n
3. Determinamos el valor Q en la tabla de valores crticos Tukey-Snedecor del apndice, mediante el nmero de tratamientos k y los grados de libertad dentro de grupos. 4. Se calcula D, utilizando: D QSx 5. Se compara el valor D con la diferencia de los pares de medias de los tratamientos. La presencia de pares mayores que D significa que dichos tratamientos difieren significativamente del nivel .
Estadstica para las ciencias sociales y del comportamiento. Haroldo Elorza. Segunda Edicin. Oxford University Press.
Pgina 11
P. Reyes / 15/11/2013
A
75 93 78 71 63 76
B
78 91 97 82 85 77
C
55 66 49 64 70 68
D
64 72 68 77 56 95
Xij
A) Mtodo Manual a) Establecimiento de las hiptesis:
H 0 1 2 3 .... k
Cada Mu representa el promedio de calificacin por cada grupo
SCT
i 1
( Xij X )
j 1
r = No. de renglones
c = No. de Columnas
Pgina 12
P. Reyes / 15/11/2013
MSTR = SCTR / Gl SCTR MSE = SCE / Gl SCE g) Estadstico Fc Fc = MSTR / MSE h) Estadstico de alfa el cual define la regin de rechazo Falfa = Distr.f.inv (Alfa, Gl SCTR, Gl SCE) i) Observar si Fc cae en la zona de rechazo lo que indicara que todas las medias poblacionales no son iguales. j) Determinar el valor P de la prueba y compararlo con alfa para decidir si se rechaza Ho P = Distr.f(Fc, Gl MSTR, GL MSE)
B) En Excel (Anlisis de datos - ANOVA de un factor) C) Con Minitab (Stat > ANOVA > One Way (unstacked) ) Qu grupo tiene el mayor nivel y cual el menor nivel? Problema 2 Las calificaciones en el examen a 18 empleados de tres unidades de negocio Se muestran a continuacin: Probar si no hay diferencia entre las unidades a un 5% de nivel de significancia.
A 85 75 82 76 71 85 B 71 75 73 74 69 82 C 59 64 62 69 75 67
Qu unida de negocio tiene la ms alta calificacin? Problema 3 Excel y Minitab Probar si hay diferencia en los tiempos de servicio de 4 unidades de negocio para el mismo servicio a un nivel de significancia del 10%.
A 5.4 7.8 5.3 7.4 8.4 B 8.7 7.4 9.4 10.1 9.2 C 11.1 10.3 9.7 10.3 9.2 D 9.9 12.8 12.1 10.8 11.3
Pgina 13
P. Reyes / 15/11/2013
7.3
9.8
8.8
11.5
Problema 4 Excel y Minitab Cuatro catalizadores que pueden afectar la concentracin de un componente en una mezcla lquida de tres componentes estn siendo investigados. Se obtienen las siguientes concentraciones:
Catalizador B 56.3 54.5 57 55.3
Problema 5 Excel y Minitab La resistencia a la tensin observada en funcin del peso porcentual del algodn en una fibra sinttica es: Peso porcentual del algodn
15 7 7 15 11 9 20 12 17 12 18 18 25 14 18 18 19 19 30 19 25 22 19 23 35 7 10 11 15 11
Probar si hay diferencia en la resistencia al usar peso porcentuales diferentes a un 5% de significancia o 95% de confianza. Qu peso proporciona la mayor resistencia? a) En Excel los datos se introducen como estn en la tabla (Anlisis de Datos). b) Para Minitab los datos se deben arreglar como sigue: Otra opcin (Response y Factor):
%Algodon Resistencia 15 7 15 7 15 15 15 11 15 9
Pgina 14
P. Reyes / 15/11/2013
20 20 20 20 20 25 25 25 25 25 30 30 30 30 30 35 35 35 35 35
12 17 12 18 18 14 18 18 19 19 19 25 22 19 23 7 10 11 15 11
Taxista 1 2 3 4 5
1 12 18 10 13 18
Factor - Ruta 2 3 15 17 18 18 11 15 12 12 14 12
4 13 17 9 15 15
a) En Excel los datos se introducen como estn en la tabla (Anlisis de Datos ANOVA de dos factores con una muestra por grupo). b) Para Minitab los datos se deben arreglar como sigue: (Stat > ANOVA > Two ways Response Row factor Column factor) Arreglo de datos
Taxi_Renglon Ruta_Columna Tiempo_Resp 1 1 12
Pgina 15
P. Reyes / 15/11/2013
2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4
18 10 13 18 15 18 11 12 14 17 18 15 12 12 13 17 9 15 15
Alumno
1 2 3 4 5
A 16 19 14 13 18
Reng 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Col A A A A A B B B B B C C C C C
Tiempo 16 19 14 13 18 16 17 13 12 17 24 22 19 18 22
Problema 8 Excel y Minitab Se quiere probar si los tiempos de verificacin de autos probados en Analizador computarizado y en probadores electrnicos son iguales, para lo cual se usan tres tamaos de autos. Probar a un 5% de significancia.
Pgina 16
P. Reyes / 15/11/2013
Reng C M G C M G
Problema ejemplo:
Suponga que usted tenga un restaurante y haya creado una nueva receta de salsa para las enchiladas. Por alguna razn parece ser que a sus clientes varones les gusta ms la salsa anterior que la nueva. Pero tambin parece ser que a sus clientes femeninas prefieren la nueva salsa que la anterior. Usted decide realizar una prueba con un grupo de 10 mujeres y 10 varones dndole a probar las dos salsas, basndose en una escala de 100 puntos para el sabor de las dos salsas. Existe alguna relacin significativa desde el punto de vista de los clientes varones y clientes femeninas y cmo ven la nueva y la anterior salsa para las enchiladas? Encuesta: Resultado sobre el sabor de la nueva salsa Hombres Mujeres 85 69 74 65 96 63 Opinin 62 70 de la 80 72 salsa de 78 59 la 90 64 receta 79 70 anterior 85 68 80 73 68 85 64 75 62 97 Opinin 69 80 de la 73 88 salsa de 61 81 la 64 91 receta 72 83 nueva 70 84 71 82
Observaciones
Esta funcin permite realizar un anlisis de varianza de dos factores con varias muestras por grupo. En general, el anlisis de varianza es un procedimiento estadstico que se utiliza para determinar si las medias de dos o ms muestras han sido extradas de poblaciones con la misma media. La funcin de ANOVA: dos factores con varias muestras por grupo le pide que provee la siguiente informacin. Input Range: Rango de entrada. Escriba la referencia correspondiente al rango de datos de la hoja de clculo que desee analizar. El rango de entrada deber contener dos
Pgina 17
P. Reyes / 15/11/2013
o ms rangos adyacentes organizados en columnas (como se ve arriba) o filas. Si el rango de entrada contiene ttulos de fila o de columna, deber seleccionar la casilla de verificacin Output Range: Rango de salida. Escriba la referencia correspondiente a la celda superior izquierda del rango en el cual desea que aparezcan los resultados. Para utilizar las herramientas de anlisis, seleccione Data Analysis del men de Tools. Dentro de la caja de herramienta de anlisis, escoja "ANOVA: Two-factor With Replication." En seguida, registre el Rango de entrada y el Rango de salida, refirindose a la direccin de las celdas requeridas. Cuando utilize una herramienta de analisis, Excel crea una tabla de resultados. Si usted incluye ttulos en el rango de entrada, Excel los utiliza para los datos de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar abajo.
Anova: Dos factores con varias muestras por grupo Resumen Hombres Mujeres Receta Anterior Cuenta 10 10 Suma 809 673 Promedio 80.9 67.3 Varianza 84.77 19.57 Receta Nueva Cuenta 10 10 Suma 674 846 Promedio 67.4 84.6 Varianza 18.71 38.04 Total Cuenta 20 20 Suma 1483 1519 Promedio 74.15 75.95 Varianza 96.98 106.1
Grados Libertad 1 1 1 36 39
El resultado del ANOVA (Anlisis de varianza) indica el valor estadstico de la "F." En este caso el valor de la "F" de la muestra (receta anterior y receta nueva) es 0.896. Para saber si estos resultados son significativos (o sea, si la probabilidad "P" tiene un valor menor a 0.05), el valor de la "F" necesita ser al menos 4.11 (o sea, el valor crtico de la F). Entonces, como el valor de nuestra "F" es de 0.896 y es no es mayor que el valor crtico de la F, no podemos decir que existe alguna diferencia significativa. Sin embargo, a la vez necesitamos interpretar qu significa el valor de F que est relacionado al efecto de una interaccin. Siempre un efecto de interacin sobrepasa el efecto principal. En este caso tenemos un gran efecto de interaccin (el valor de la "F"=58.89). En otras palabras, s existe una diferencia significativa entre la opinin de los hombres y de las mujeresa relacionada a la receta anterior y a la nueva. La probabilidad demuestra a qu nivel los resultados son estadsticamente significativos.
Pgina 18
P. Reyes / 15/11/2013
Pos-Modificacin
Anova: Dos factores con varias muestras por grupo Resumen Chihuahua Monclova Saltillo Pr-Modificacin Cuenta 10 10 10 Suma 298 233 311 Promedio 29.8 23.3 31.1 Varianza 109.96 100.67 86.98 Ps-Modificacin Cuenta 10 10 10 Suma 193 230 194 Promedio 19.3 23.0 19.4 Varianza 41.79 91.11 52.93 Total Cuenta 20 20 20 Suma 491 463 505
Pgina 19
uia Ing. en Alimentos CEP: Ejercicios de ANOVA Promedio Varianza 24.55 100.89 23.15 90.87 25.25 102.30
P. Reyes / 15/11/2013
29.95 99.10
Grados Libertad 1 3 3 72
Ntese: El valor de F signficativo para las muestras (i.e., pre- y pos-modificacin nos indica que hay una diferencia significativa en el cambio en el nmero de paquetes sobrantes. El valor de F no significativo para las columnas (i.e., las cuatro ciudades) nos indica que los cambios tenan el mismo efecto en todas las ciudades, no hubo diferencia entre las ciudades. El valor de F no significativo para la interaccin nos indica que no hay un efecto de interaccin entre las variables (eso es bueno, pues una interaccin muchas veces neiga la validez de los otros valores de F.)
Pgina 20