Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Ejercicio 1
La Dra. Bslavi es una investigadora que intenta aislar el virus del SIDA. Planea realizar un experimento usando cuatro catalizadores (C1, C2, C3 y C4) durante la produccin de una sustancia qumica para ver sus efectos en las clulas de un paciente infectado con el virus. Durante el desarrollo de la investigacin la Dra. Bslavi decide estudiar el efecto de cada uno de estos catalizadores en tres niveles de temperaturas diferentes (T1, T2 y T3). Los datos recogidos en porcentaje de concentracin se muestran en la siguiente tabla.
Replicacin I C1 73 T1 T2 T3 71 72 79 81 76 83 84 82 C2 68 C3 74
II C4 C1 81 67 71 76 C2 73 79 78 C3 76 82 81 C4 84 85 84
III C1 75 74 76 C2 77 78 83 C3 79 76 85 C4 81 84 81
Realice un anlisis de varianza para este experimento. Solucin Deberemos probar las siguientes hiptesis: Para los tratamientos(tipos de Catalizador): H0: No hay diferencia significativa entre el catalizador y la concentracin H1: Si hay diferencia significativa entre el catalizador y la concentracin Para los bloques(Niveles de Temperatura): H0: No hay diferencia significativa en la concentracin por niveles de temperatura H0: Si hay diferencia significativa en la concentracin por niveles de temperatura Para las interacciones entre Catalizador y Temperatura(interacciones) H0: No hay ninguna relacin entre los catalizadores y los niveles de temperaturas
C1 T1 T1 T1 T2 T2 T2 T3 T3 T3 73 67 75 71 71 74 72 76 76
C2 68 73 77 79 79 78 81 78 83
C3 74 76 79 76 82 76 83 81 85
C4 81 84 81 84 85 84 82 84 81
Las columnas constituyen los tratamientos (k = 4) con [(k-1,rk(l-1)] grados de libertad Las filas constituyen los bloques (r = 3) con [(r-1, rk(l-1)] grados de libertad Las interacciones (l=3) entre Tratamiento y Bloque tiene [(k-1)(r-1), rk(l-1)] gdos. lib. Ingrese los datos de acuerdo a la siguiente hoja: Temp. Cat. 1 Cat. 2 Cat. 3 Cat. 4 T1 T1 T1 T2 T2 T2 T3 T3 T3 73 67 75 71 71 74 72 76 76 68 73 77 79 79 78 81 78 83 74 76 79 76 82 76 83 81 85 81 84 81 84 85 84 82 84 81 Concent. 73 67 75 71 71 74 72 76 76 68 73 77 79 Temperat. T1 T1 T1 T2 T2 T2 T3 T3 T3 T1 T1 T1 T2 Cataliz. 1 1 1 1 1 1 1 1 1 2 2 2 2
----------+---------+---------+---------+-
Individual 95% CI Cataliz. 1 2 3 4 Mean --------+---------+---------+---------+--72.78 77.33 79.11 82.89 73.50 77.00 (----*----) (----*----) (----*----) (----*----) 80.50 84.00
--------+---------+---------+---------+---
De acuerdo al valor del p-value se puede comprobar que las dos hiptesis nulas sern rechazadas; es decir, hay diferencia en el porcentaje de la concentracin tanto debido al uso de los catalizadores como el sometimiento a una determinada temperatura; sin embargo, la interaccin entre los niveles de temperatura y los catalizadores es insignificante, lo que implica que no se rechaza la hiptesis nula.
Ejercicio 2
El siguiente problema, que nada tiene de particular respecto a los anteriores, ser resuelto utilizando la opcin < Balanced ANOVA...> del Anlisis de Varianza, ANOVA, del comando < Stat > del Minitab.
Se realiz un experimento que consista en tomar el tiempo que tardaban 6 empleados de una financiera para resolver un determinado problema mediante la hoja de clculo Excel y una calculadora. Los problemas a resolver eran de dos tipos: Financieros (F) y Estadsticos (E). Los tiempos obtenidos se muestran en el siguiente cuadro.
Empleados de la financiera
5
Carlos F Excel Calculadora E Pablo F 3.8 8.1 E 2.8 5.3 Jos F 3.0 7.6 E 2.0 4.9 Lucas F 3.4 7.8 E 2.7 5.5 Manuel F 3.3 6.9 E 2.5 5.4 Luis F 3.6 7.8 E 2.4 4.8
Hay diferencia en los tiempos promedio de clculo entre el tipo de problema y la forma de resolverlo? Solucin Sin duda este tipo de problema nos sugiere que los tiempos de clculo deben ser la variable de respuesta (Response), los empleados deben ser tomados como factores, as como el tipo de clculo y la forma de resolverlo. Por ello este es un caso especial del ANOVA que es posible resolverlo por la opcin antes mencionada. Los datos deben ser ingresados a la hoja de trabajo segn se indica, en C1, C2, C3, C4
Particip.
Tpo. Rpta.
Tipo prob.
Modelo
< Stat > - < ANOVA > - < Balanced ANOVA ... > . En la siguiente ventana
Factor Type Levels Values Particip random 6 Carlos Jose Lucas Luis Manuel Pablo Tipo pro fixed 2 Estad Matem
DF 5 1 1 16 23
MS
0.211 0.72 0.619 16.667 56.84 0.000 72.107 245.91 0.000 0.293
Por el valor del p value podemos decir que s hay diferencia en el tiempo de respuesta debido a los participantes; mientras que los tiempos de respuesta promedio no difieren por el tipo de problema, as como tampoco por el modelo de clculo usado
Ejercicio 3
En The Wall Street Journal Almanac 1998 aparecieron datos sobre el desempeo de las aerolneas estadounidenses. A continuacin vemos los datos sobre el porcentaje de vuelos que llegan puntuales y la cantidad de quejas por 10,000 pasajeros.
Aerolneas Southwest Continental NorthWest US Airways United American Delta America West TWA
% de puntualidad 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5
% de Quejas 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25
Ajuste una relacin lineal, cuadrtica o cbica para el diagrama de dispersin de estos datos. Indique la variable dependiente y la independiente.
Sin duda las quejas dependern de cun puntuales fueron las aerolneas. Por ello la variable Quejas ser la variable dependiente y la variable Puntualidad ser la independiente.
El modelo es entonces
9
Queja = F (Puntualidad) + E
Hagamos uso del programa Minitab para seleccionar una adecuada estimacin de estos parmetros. Antes de ajustar el problema a un modelo lineal, convendra disponer del diagrama de dispersin para ver si la hiptesis de formular un modelo lineal se adecua. Trace un diagrama de dispersin usando <Graph> - <ScatterPlot> Como variable X: Puntualidad y variable Y: % de quejas. El siguiente es el grfico
10
Creemos que un modelo lineal puede ser un ajuste adecuado para estos datos, aunque habra que medir la relacin entre las dos variables pues parece que el porcentaje de dependencia es algo conservador.
Paso 1: Ingresamos los datos de la tabla en las columnas C1, C2 y C3 de una hoja de trabajo del Minitab. Paso 2: Tratemos de ajustar los datos a una lnea de ploteo usando la secuencia: < Stat > - < Regression > - < Fitted line Plot >. En la ventana que se obtenga
ingresar C3 como variable endgena(dependiente) y C2 como variable predictora o independiente( % de Puntualidad). Seleccionemos primero la opcin < Linear > y con el mismo procedimiento seleccione despus la opcin < Cubic >.
11
Mientras que al usar la opcin < Cubic >, la ecuacin de estimacin obtenida es Y = 414.437 - 16.4312X + 0.218026X**2 - 9.67E-04X**3 R-Sq = 81.1 % Con un diagrama de dispersin y recta de ajuste dada en la siguiente figura
Con slo observar el r podemos afirmar que los datos se ajustan mejor a una funcin cbica y no a una lineal. Para mayor detalle veamos qu sucede con la varianza de los errores, lo que lo conseguiremos tomando en cuenta los residuales.
12
Los datos y resultados de este ejemplo lo encontramos en el archivo Regre02.mtw. All encontramos que las columnas C8 y C9 contienen el cuadrado de los residuales y las celdas de las columnas C10 y C11 contienen las varianzas y las desviaciones estndares para los dos modelos. Se puede apreciar que el modelo cbico tiene menor dispersin que el modelo lineal. Ahora vamos a realizar el anlisis de regresin correspondiente al problema. Para ello usemos la siguiente secuencia: < Stat > - < Regression ... > - < Regression >. Obtendremos la siguiente ventana:
En ella ingresemos en < Response > la variable dependiente C3 y en < Predictors > se ingresar todas las variables predictoras o independientes; en este caso, C2. Ingresando por <Options> active < Durbin Watson >
13
R-Sq = 77.9%
R-Sq(adj) = 74.7%
0.63812 0.02586
Residual Error 7
0.81916
a) El trmino independiente llamado tambin intercepto E = 6.02, representa el valor inicial de Y; es decir, el 6.02% de quejas se recibira si ninguna aerolnea fuera puntual. En muchos casos esta constante no es lgicamente significativa. b)
14