Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Un factor puede se entendido como cada variable o tratamiento que se desea estudiar. En general, cada factor presentar diferentes niveles siendo estos los que producen los distintos tratamientos en un ensayo. El nmero de factores y niveles que pueden ser comparados en una experiencia est limitado slo por consideraciones prcticas. Como se estudian dos o ms variables se genera un nuevo efecto llamado INTERACCION que puede ser definida como la variacin debida a la combinacin de factores, no debida a ellos por separado sino al que acten en forma conjunta sobre la variable. Por lo general, las letras maysculas son usadas para sealar los factores como A, B, C,....,etc., en donde A puede ser Estrato socioeconmico, B Tramo de ingresos,....,etc. Las letras minsculas como a, b, c,....,etc, pueden ser utilizadas para indicar el nmero de niveles de cada factor. Por ejemplo: a = 4 Estrato socioeconmico es usado en 4 niveles B = 3 Tramo de ingreso es usado en 3 niveles Como nomenclatura podemos generar, por ejemplo, 4x5 Factorial Primer factor a 4 niveles Segundo factor a 5 niveles Primer factor a 2 niveles Segundo factor a 4 niveles Tercer factor a 6 niveles Cuarto factor a 6 niveles
2x4x62
Factorial
Dado la simpleza de su exposicin y que el estudio de l permite acceder al total de conceptos e ideas que por lo general estn implcitas en este diseo, en esta oportunidad slo se analizara el modelo de dos factores.
MODELO DE DOS FACTORES (O FACTORIAL DE DOS POR DOS) POBLACION Poblacin finita en la que se estudia el comportamiento de una variable Y cuya respuesta se supone que es funcin lineal de dos variables fijas ( no aleatorias ), mas un tercer efecto generado por la accin conjunta de ambas y una componente de error e denominada Error Experimental. MODELO POBLACIONAL A B r Niveles c Niveles ( r del Ingls row que significa fila ) ( c del Ingls column que significa columna )
En este diseo se debe considerar dos o ms observaciones para cada combinacin de niveles de factores. Adems Asumimos que los efectos de los dos factores en conjunto son posiblemente dependientes actuando del mismo modo, unos sobre otros. As las cosas, el efecto de interaccin es un tipo de efecto producido por los factores A y B en conjunto. La expresin funcional de este modelo es:
yijk = + i + j + ( ) ij + eijk
i = 1, 2, ..., r
j = 1, 2, ..., c
k = 1, 2, ..., n
yijk: Observacin de la k-sima respuesta en el nivel i del Factor A y nivel j del Factor B . : Media global ( de la poblacin ) o efecto comn presente en todas las observaciones i: Efecto Factor A en su nivel i j: Efecto Factor B en su nivel j eijk: Error experimental k-sima observacin nivel i Factor A y nivel j Factor B. Supuestos Las observaciones en cada una de las rc celdas constituyen una muestra aleatoria independiente de tamao n extrada de la poblacin definida por la combinacin particular de los niveles de los dos factores. eijk siguen un modelo de probabilidad normal con media 0 y varianza comn 2 . Los dos factores son de efectos fijos asumindose interaccin entre ellos. NOTA Si k = 1 ( modelo sin replica ), la varianza del modelo no ser estimable y no hay forma de contrastar la significatividad de los parmetros. En los diseos factoriales nicamente se tiene residuos no nulos y por tanto la posibilidad de contrastar el modelo cuando: Suponemos que las interacciones son nula Replicamos el experimento, tomando varias observaciones para cada combinacin de factores
DISPOSICION DE LOS DATOS En este diseo el tratamiento de las formulas implcitas se har en base a la siguiente organizacin de los datos donde las filas representan el Factor A y la columnas el Factor B.
yijk = + i + j + ( ) ij + eijk
se puede re-escribir como,
yijk
= i + j + ( ) ij + eijk
Aqu, se puede demostrar que la variacin total - VT - del modelo ( definida de base por la expresin Yijk - y conocida como Variacin Total Corregida del modelo ) se puede generar como la suma de dos componentes de variacin parciales que se encuentran implcitos en el modelo segn sigue: VF: Variacin debido al efecto del factor Fila o A VC: Variacin debido al efecto del factor Columna o B. VI: Variacin debido al efecto de la Interaccin de ambos factores ( Fila y Columna juntos o AB) VE: Variacin debido al efecto de la componente de error del modelo ( variable e ) As las cosas,
Pivotes Empricos (Estadstica de prueba) Basados en una muestra aleatoria se procede a estimar los componentes de la varianza segn:
Donde,
Para Interaccin ( AB )
NOTAS La dcima ms importante se refiere a la existencia de interacciones ( )ij. Si no las hay, el modelo es aditivo y las inferencias respecto a i ( j ) son vlidas para todos los niveles de A ( B ). La interaccin es imposible de evaluar si slo tenemos 1 observacin por celda. El nivel de significacin ( riesgo ) no presenta problemas si slo se prueba una de las tres hiptesis. Cuando se prueban las tres hiptesis, la situacin se complica ya que las tres son independientes e un sentido probabilstico. Si se fija como y los el nivel de significacin total de la prueba y se definen como , niveles asociados a las hiptesis, se puede demostrar que,
< 1 - ( 1 - )( 1 - )( 1 - )
Vale decir, si se ha seleccionado un nivel de significacin de 0.05 y todas son verdaderas, entonces la probabilidad de rechazar una o ms de las tres hiptesis es menos que 0.143
ALGUNAS VENTAJAS Y DESVENTAJAS VENTAJAS Se puede estudiar el efecto interaccin Se hace uso ms eficiente de los recursos experimentales ya que cada unidad experimental es utilizada simultneamente para obtener la respuesta de muchos factores
DESVENTAJAS La principal es que es necesaria para su clculo la presencia de todas las posibles combinaciones. A medida que aumenta el nmero de factores o los niveles, el nmero de todas las posibles combinaciones se hace tan grande que lo torna impracticable.
n*r
n*c
EJEMPLO Los siguientes datos corresponden a Porcentaje de hogares en pobreza extrema por Pas ( 5 pases ) y Area ( Urbano, Rural ).
EFECTUE EL ANALISIS DE LA VARIANZA Y CONCLUYA Clculos primarios Aqu la descomposicin de la varianza viene dada por: SCT Donde, = SCF + SCC + SCI + SCE
Interaccin
As,
Area
As,
Pas
Conclusiones El modelo no debe considerar la interaccin entre Area y Pas. Podemos ver que pasa con la comparacin mltiple de las medias por Pas ( Queda de ejercicio ). Podramos re-plantear el modelo como un diseo en bloques considerando como tal a las Areas ( urbano, Rural ). Finalmente, el aceptar la hiptesis de Interaccin nula lleva implcito que el modelo es estadsticamente aditivo todo esto, claro est, asumiendo los riesgos respectivos.
ppobreza<c(12.31,9.06,7.02,5.33,12.80,18.96,16.81,22.45,12.61,14.01,11.92,13.89,8.43,8.75,7.58,7.93,7. 96,5.54,6.62,5.76) pais<-as.factor(c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5)) area<-as.factor(c(1,1,2,2,1,1,2,2,1,1,2,2,1,1,2,2,1,1,2,2)) factor.data <- data.frame(ppobreza, pais, area) fit<-aov(ppobreza ~ pais + area + pais*area,data=factor.data) # crea objeto fit con ANOVA factorial summary(fit,data=factor.data) # muestra resumen ANOVA error<-resid(fit) # obtiene residuales del modelo ajustado factor.data2 <- data.frame(ppobreza, error, pais, area) TukeyHSD(fit, data= factor.data) # Tukey test comparaciones multiples
> ppobreza<c(12.31,9.06,7.02,5.33,12.80,18.96,16.81,22.45,12.61,14.01,11.92,13. 89,8.43,8.75,7.58,7.93,7.96,5.54,6.62,5.76) > pais<-as.factor(c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5)) > area<-as.factor(c(1,1,2,2,1,1,2,2,1,1,2,2,1,1,2,2,1,1,2,2)) > factor.data <- data.frame(ppobreza, pais, area) > fit<-aov(ppobreza ~ pais + area + pais*area,data=factor.data) # crea objeto fit con ANOVA > factorial function (x) gamma(x + 1) <bytecode: 0x00000000144da270> <environment: namespace:base> > summary(fit,data=factor.data) # muestra resumen ANOVA Df Sum Sq Mean Sq F value Pr(>F) pais 4 339.9 84.97 17.731 0.000155 *** area 1 1.3 1.31 0.274 0.612361 pais:area 4 34.3 8.57 1.788 0.207851 Residuals 10 47.9 4.79 --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 > error<-resid(fit) # obtiene residuales del modelo ajustado > factor.data2 <- data.frame(ppobreza, error, pais, area) > TukeyHSD(fit, data= factor.data) # Tukey test comparaciones multiples Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = ppobreza ~ pais + area + pais * area, data = factor.data) $pais diff lwr upr p adj 2-1 9.3250 4.2308449 14.4191551 0.0009369 3-1 4.6775 -0.4166551 9.7716551 0.0758285 4-1 -0.2575 -5.3516551 4.8366551 0.9997955 5-1 -1.9600 -7.0541551 3.1341551 0.7159266 3-2 -4.6475 -9.7416551 0.4466551 0.0781238 4-2 -9.5825 -14.6766551 -4.4883449 0.0007556 5-2 -11.2850 -16.3791551 -6.1908449 0.0001978 4-3 -4.9350 -10.0291551 0.1591551 0.0586440 5-3 -6.6375 -11.7316551 -1.5433449 0.0107917 5-4 -1.7025 -6.7966551 3.3916551 0.8030132 $area diff lwr upr p adj 2-1 -0.512 -2.693251 1.669251 0.6123611
$`pais:area` diff 2:1-1:1 5.195 3:1-1:1 2.625 4:1-1:1 -2.095 5:1-1:1 -3.935 1:2-1:1 -4.510 2:2-1:1 8.945 3:2-1:1 2.220 4:2-1:1 -2.930 5:2-1:1 -4.495 3:1-2:1 -2.570 4:1-2:1 -7.290 5:1-2:1 -9.130 1:2-2:1 -9.705 2:2-2:1 3.750 3:2-2:1 -2.975 4:2-2:1 -8.125 5:2-2:1 -9.690 4:1-3:1 -4.720 5:1-3:1 -6.560 1:2-3:1 -7.135 2:2-3:1 6.320 3:2-3:1 -0.405 4:2-3:1 -5.555 5:2-3:1 -7.120 5:1-4:1 -1.840 1:2-4:1 -2.415 2:2-4:1 11.040 3:2-4:1 4.315 4:2-4:1 -0.835 5:2-4:1 -2.400 1:2-5:1 -0.575 2:2-5:1 12.880 3:2-5:1 6.155 4:2-5:1 1.005 5:2-5:1 -0.560 2:2-1:2 13.455 3:2-1:2 6.730 4:2-1:2 1.580 5:2-1:2 0.015 3:2-2:2 -6.725 4:2-2:2 -11.875 5:2-2:2 -13.440 4:2-3:2 -5.150 5:2-3:2 -6.715 5:2-4:2 -1.565
lwr -3.4705536 -6.0405536 -10.7605536 -12.6005536 -13.1755536 0.2794464 -6.4455536 -11.5955536 -13.1605536 -11.2355536 -15.9555536 -17.7955536 -18.3705536 -4.9155536 -11.6405536 -16.7905536 -18.3555536 -13.3855536 -15.2255536 -15.8005536 -2.3455536 -9.0705536 -14.2205536 -15.7855536 -10.5055536 -11.0805536 2.3744464 -4.3505536 -9.5005536 -11.0655536 -9.2405536 4.2144464 -2.5105536 -7.6605536 -9.2255536 4.7894464 -1.9355536 -7.0855536 -8.6505536 -15.3905536 -20.5405536 -22.1055536 -13.8155536 -15.3805536 -10.2305536
upr 13.8605536 11.2905536 6.5705536 4.7305536 4.1555536 17.6105536 10.8855536 5.7355536 4.1705536 6.0955536 1.3755536 -0.4644464 -1.0394464 12.4155536 5.6905536 0.5405536 -1.0244464 3.9455536 2.1055536 1.5305536 14.9855536 8.2605536 3.1105536 1.5455536 6.8255536 6.2505536 19.7055536 12.9805536 7.8305536 6.2655536 8.0905536 21.5455536 14.8205536 9.6705536 8.1055536 22.1205536 15.3955536 10.2455536 8.6805536 1.9405536 -3.2094464 -4.7744464 3.5155536 1.9505536 7.1005536
p adj 0.4230225 0.9563148 0.9889406 0.7255230 0.5837047 0.0416323 0.9839323 0.9216102 0.5874168 0.9612312 0.1225287 0.0368854 0.0253635 0.7688529 0.9153981 0.0712576 0.0256114 0.5323130 0.1940657 0.1352959 0.2246427 1.0000000 0.3494900 0.1365951 0.9954210 0.9730261 0.0108157 0.6321596 0.9999913 0.9740135 0.9999997 0.0035330 0.2479578 0.9999584 0.9999997 0.0025285 0.1746674 0.9984826 1.0000000 0.1752124 0.0064520 0.0025504 0.4328316 0.1763070 0.9985871