Sei sulla pagina 1di 10

TALLER DE REPASO ANÁLISIS DE VARIANZA

I) Se realizó un estudio de ingeniería de tránsito sobre los retrasos en las intersecciones con semáforos en las calles
de una ciudad. Se usaron tres tipos de semáforos: 1) programado, 2) semiactivado y 3) activado. Se usaron cinco
intersecciones para cada tipo de semáforo. La medida de retraso utilizada fue el promedio de tiempo que cada
vehículo permanece detenido en cada intersección (segundos/vehículo). Los datos son los siguientes:

programado semiactivado activado a) Escriba el modelo estadístico para este estudio y explique sus
36.6 17.5 15.0 componentes
39.2 20.6 10.4 b) Establezca las suposiciones necesarias para un análisis de varianza de los
30.4 18.7 18.9 datos.
37.1 25.7 10.5 c) Calcule el análisis de varianza.
34.1 22.0 15.2 d) Calcule las medias del retraso en el tránsito y sus errores estándar por
tipo de semáforo.
e) Calcule el intervalo de confianza del 95% estimado para las medias de los tipos de semáforo y para sus efectos.
f) Pruebe la hipótesis de que no hay diferencia entre las medias de retraso para los tipos de semáforo a un nivel de
significancia de 0.05.
g) Estime los siguientes contrastes y sus errores estándar:
1) Los semáforos programados vs. los semiactivados y activados
2) Los semáforos semiactivados vs. los activados
h) Pruebe la hipótesis nula para cada contraste en g), H0: W=0, con la prueba t de student a un nivel de
significancia de 0.05.
i) Pruebe la hipótesis nula para cada contraste en g), H0: W=0, con la prueba F a un nivel de significancia de 0.05
j) cuál es la relación entre las pruebas de los incisos h) e i) ?
k) Valide los supuestos del modelo
l) Utilice los datos del ejercicio para determinar cuántas intersecciones necesita el ingeniero de tránsito con cada
tipo de semáforo para rechazar la hipótesis nula a un nivel de significancia de 0.01, con una potencia de 0.90, si los
retrasos medios respectivos en los tres tipos de señal fueron 20, 18 y 16 segundos.

PROGRAMA SAS:
options nodate nocenter nonumber;
goptions colors=(black,black,black) cback=white cback=white ftext=simplex
ftitle=simplex htitle=0.9 htext=0.7;
data transito;
do i=1 to 3;
input tiemporet @;
output;
end;
cards;
36.6 17.5 15.0
39.2 20.6 10.4
30.4 18.7 18.9
37.1 25.7 10.5
34.1 22.0 15.2
;
run;
data transito (drop=i);
set transito;
if i=1 then tiposemaf='programado';
if i=2 then tiposemaf='semiactiv';
if i=3 then tiposemaf='activado';
run;
proc sort data=transito;
by tiposemaf;
run;
title1'Boxplot Comparativo de tiempos de detencion';
title2'Tres tipos de Semaforo';
proc boxplot data=transito;
plot tiemporet*tiposemaf;
run;
quit;
title1'Graficos de medias de tiempos de detencion';
title2'Tres tipos de Semaforo';
proc gplot data=transito;
plot tiemporet*tiposemaf=1/frame;
symbol1 i=stdj v=star c=black l=1;
run;
quit;
title'ANOVA Y ESTIMACIONES';
PROC GLM DATA=TRANSITO;
class tiposemaf;
FIJOS: model tiemporet=tiposemaf/SS1 CLPARM;
means tiposemaf;
means tiposemaf/hovtest=bartlett duncan tukey;
estimate 'efecto activado' tiposemaf 2 -1 -1/divisor=3;
estimate 'efecto programado' tiposemaf -1 2 -1/divisor=3;
estimate 'efecto semiactiv' tiposemaf -1 -1 2/divisor=3;
estimate 'programado vs. otros' tiposemaf -1 2 -1/divisor=2;
contrast 'programado vs. otros' tiposemaf -1 2 -1;
estimate 'semiactivado vs. activado' tiposemaf -1 0 1;
contrast 'semiactivado vs. activado' tiposemaf -1 0 1;
output out=ESTAD residual=res predicted=pred stdp=std lclm=lim_infc uclm=lim_supc;
run;
quit;
proc print data=estad;run;
title'Grafico de residuales';
proc gplot data=estad;
plot res*tiposemaf=1/vref=0 lvref=2;
plot res*pred=2/vref=0 lvref=2;
symbol1 i=none v=star;
symbol2 i=none v=star;
run;
quit;
proc univariate data=estad normaltest noprint;
var res;
probplot res;
inset normaltest probn;
run;
quit;
/*CALCULO DE TAMAÑO DE MUESTRAS*/
/*VARIANZA ESTIMADA=MSE=(137.828/12), ALPHA(activado)=-2,
ALPHA(semiactiv)=0, ALPHA(programado)=2*, v1=2, v2=3(n-1)
potencia deseada=0.90, significancia=0.01*/
data tamano;
do n=2 to 30;
v2=3*(n-1);
fcr=finv(0.99,2,v2);
nc=(96/137.828)*n;
pot=1-probf(fcr,2,v2,nc);
output;
end;
run;
title'tamaño de muestra';
proc print data=tamano;run;
SALIDAS SAS:
ANOVA Y ESTIMACIONES
The GLM Procedure
Class Level Information
Class Levels Values
tiposemaf 3 activado programado semiactiv
Number of observations 15
Dependent Variable: tiemporet
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 2 1202.628000 601.314000 52.35 <.0001
Error 12 137.828000 11.485667
Corrected Total 14 1340.456000
R-Square Coeff Var Root MSE tiemporet Mean
0.897178 14.44608 3.389051 23.46000
Source DF Type I SS Mean Square F Value Pr > F
tiposemaf 2 1202.628000 601.314000 52.35 <.0001
Medias y Desviaciones Estándar
Level of ----------tiemporet
----------tiemporet----------
tiemporet----------
tiposemaf
tiposemaf N Mean Std Dev

activado 5 14.0000000 3.59374457


programado 5 35.4800000 3.37001484
semiactiv 5 20.9000000 3.19139468

Bartlett's Test for Homogeneity of tiemporet Variance


Source DF Chi-Square Pr > ChiSq
tiposemaf 2 0.0510 0.9748

Duncan's Multiple Range Test for tiemporet


NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error
rate.
Alpha 0.05
Error Degrees of Freedom 12
Error Mean Square 11.48567
Number of Means 2 3
Critical Range 4.670 4.888
Means with the same letter are not significantly different.
Grouping
Mean N tiposemaf
A 35.480 5 programado
B 20.900 5 semiactiv
C 14.000 5 activado

Tukey's Studentized Range (HSD) Test for tiemporet


NOTE: This test controls the Type I experimentwise error rate, but it generally has a
higher Type II error rate than REGWQ.
Alpha 0.05
Error Degrees of Freedom 12
Error Mean Square 11.48567
Critical Value of Studentized Range 3.77278
Minimum Significant Difference 5.7181
Means with the same letter are not significantly different.
Grouping
Mean N tiposemaf
A 35.480 5 programado
B 20.900 5 semiactiv
C 14.000 5 activado
Contrast DF Contrast SS Mean Square F Value Pr > F
programado vs. otros 1 1083.603000 1083.603000 94.34 <.0001
semiactivado vs. activado 1 119.025000 119.025000 10.36 0.0074

Efectos y contrastes estimados


estimados
Standard
Parameter Estimate Error t Value Pr > |t|
efecto activado -9.4600000 1.23750645 -7.64 <.0001
efecto programado 12.0200000 1.23750645 9.71 <.0001
efecto semiactiv -2.5600000 1.23750645 -2.07 0.0608
programado vs. otros 18.0300000 1.85625968 9.71 <.0001
semiactivado vs. activado 6.9000000 2.14342405 3.22 0.0074

Intervalos de Confianza para efectos y contrastes


Parameter 95% Confidence Limits
efecto activado -12.1562949 -6.7637051
efecto programado 9.3237051 14.7162949
efecto semiactiv -5.2562949 0.1362949
programado vs. otros 13.9855576 22.0744424
semiactivado vs. activado 2.2298802 11.5701198
V) En un naranjal se llevó a cabo un experimento de irrigación con un diseño de bloques completos aleatorizado en
el que se usaron seis tratmientos de irrigación en ocho bloques de árboles. Los siguientes datos se refieren al peso
en libras de la fruta cosechada en cada parcela:

Bloque a) Escriba el modelo para el experimento, explique los


Método 1 2 3 4 5 6 7 8 términos y clacule el análisis de varianza.
goteo 450 469 249 125 280 352 221 251 b) ¿Cuáles son las suposiciones necesarias para que el
canal 358 512 281 058 352 293 283 186 análisis de varianza sea válido? ¡cómo se relacionan con el
rocio 331 402 183 070 258 281 219 046 experimento?
aspesor 317 423 379 063 289 239 269 357 c) Estime las medias de tratamiento, los efectos y sus
asp_rocio 479 341 404 115 182 349 276 182 intervalos de confianza del 95%, haga las comparaciones
anegado 245 380 263 062 336 282 171 098 múltiples para establecer grupos de tratamientos.
d) Calcule la eficiencia relativa de este diseño respecto a un diseño totalmente aleatorizado. Concluya.
e) Obtenga gráfica de residuales e interprételas.

PROGRAMA SAS:
options nodate nocenter nonumber;
goptions colors=(black,black,black) cback=white cback=white ftext=simplex
ftitle=simplex htitle=0.9 htext=0.7;
data naranjas;
input metodo $ @;
do arbol=1 to 8;
input peso @;
output;
end;
cards;
goteo 450 469 249 125 280 352 221 251
canal 358 512 281 058 352 293 283 186
rocio 331 402 183 070 258 281 219 046
aspesor 317 423 379 063 289 239 269 357
asp_rocio 479 341 404 115 182 349 276 182
anegado 245 380 263 062 336 282 171 098
;
run;
proc sort data=naranjas;
by arbol;
run;
proc boxplot data=naranjas;
plot peso*arbol;
run;
quit;
proc sort data=naranjas;
by metodo;
run;
proc boxplot data=naranjas;
plot peso*metodo;
run;
quit;
proc gplot data=naranjas;
plot peso*metodo=arbol/frame;
symbol1 i=stdj v='1' c=black l=1;
symbol2 i=stdj v='2' c=blue l=2;
symbol3 i=stdj v='3' c=red l=3;
symbol4 i=stdj v='4' c=green l=4;
symbol5 i=stdj v='5' c=brown l=5;
symbol6 i=stdj v='6' c=orange l=6;
symbol7 i=stdj v='7' c=green l=7;
symbol8 i=stdj v='8' c=orange l=8;
run;
quit;
title'ANOVA y Estimaciones';
proc glm data=naranjas;
class metodo arbol;
model peso=metodo arbol/ss1 clparm;
means metodo arbol;
means metodo/duncan tukey;
estimate 'efecto anegado' metodo 5 -1 -1 -1 -1 -1/divisor=6;
estimate 'efecto asp_roci' metodo -1 5 -1 -1 -1 -1/divisor=6;
estimate 'efecto aspersor' metodo -1 -1 5 -1 -1 -1/divisor=6;
estimate 'efecto canal' metodo -1 -1 -1 5 -1 -1/divisor=6;
estimate 'efecto goteo' metodo -1 -1 -1 -1 5 -1/divisor=6;
estimate 'efecto rocio' metodo -1 -1 -1 -1 -1 5/divisor=6;
estimate 'efecto arbol1' arbol 7 -1 -1 -1 -1 -1 -1 -1/divisor=8;
estimate 'efecto arbol2' arbol -1 7 -1 -1 -1 -1 -1 -1/divisor=8;
estimate 'efecto arbol3' arbol -1 -1 7 -1 -1 -1 -1 -1/divisor=8;
estimate 'efecto arbol4' arbol -1 -1 -1 7 -1 -1 -1 -1/divisor=8;
estimate 'efecto arbol5' arbol -1 -1 -1 -1 7 -1 -1 -1/divisor=8;
estimate 'efecto arbol6' arbol -1 -1 -1 -1 -1 7 -1 -1/divisor=8;
estimate 'efecto arbol7' arbol -1 -1 -1 -1 -1 -1 7 -1/divisor=8;
estimate 'efecto arbol8' arbol -1 -1 -1 -1 -1 -1 -1 7/divisor=8;
estimate 'rocio vs. otros' metodo -1 -1 -1 -1 -1 5/divisor=5;
contrast 'rocio vs. otros' metodo -1 -1 -1 -1 -1 5;
estimate 'anegado y rocio vs. otros' metodo 2 -1 -1 -1 -1 2/divisor=4;
contrast 'anegado y rocio vs. otros' metodo 2 -1 -1 -1 -1 2;
estimate 'anegado vs rocio ' metodo 1 0 0 0 0 -1;
contrast 'anegado vs rocio ' metodo 1 0 0 0 0 -1;
output out=ESTAD residual=res predicted=pred;
run;
quit;
output out=ESTAD residual=res predicted=pred;
run;
quit;
title'Grafico de residuos';
proc gplot data=estad;
plot res*metodo=1/vref=0 lvref=2;
plot res*arbol=2/vref=0 lvref=2;
plot res*pred=3/vref=0 lvref=2;
symbol1 i=none v=star;
symbol2 i=none v=dot;
symbol3 i=none v=diamond;
run;
quit;
proc univariate data=estad normaltest noprint;
var res;
probplot res;
inset normaltest probn;
run;
quit;
ANOVA y Estimaciones
The GLM Procedure

Class Level Information


Class Levels Values
metodo 6 anegado asp_roci aspesor canal goteo rocio
arbol 8 1 2 3 4 5 6 7 8
Number of observations 48
Dependent Variable: peso
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 12 505348.3333 42112.3611 10.03 <.0001
Error 35 146888.4792 4196.8137
Corrected Total 47 652236.8125
R-Square Coeff Var Root MSE peso Mean
0.774793 23.89959 64.78282 271.0625
Source DF Type I SS Mean Square F Value Pr > F
metodo 5 47841.6875 9568.3375 2.28 0.0678
arbol 7 457506.6458 65358.0923 15.57 <.0001

Medias y Desviaciones estándar por tratamiento


Level of -------------peso------------
metodo N Mean Std Dev
anegado 8 229.625000 111.407793
asp_roci 8 291.000000 124.751181
aspesor 8 292.000000 110.432914
canal 8 290.375000 132.303696
goteo 8 299.625000 117.127449
rocio 8 223.750000 122.266395
Medias y Desviaciones estándar por bloque
Level of -------------peso------------
arbol N Mean Std Dev
1 6 363.333333 87.307884
2 6 421.166667 61.694138
3 6 293.166667 83.422819
4 6 82.166667 29.728213
5 6 282.833333 60.730278
6 6 299.333333 43.720323
7 6 239.833333 43.700877
8 6 186.666667 110.293548

Duncan's Multiple Range Test for peso


NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha 0.05
Error Degrees of Freedom 35
Error Mean Square 4196.814
Number of Means 2 3 4 5 6
Critical Range 65.76 69.13 71.32 72.90 74.09
Means with the same letter are not significantly different.
Duncan
Groupi
ng Mean N metodo
A 299.63 8 goteo
A
B A 292.00 8 aspesor
B A
B A 291.00 8 asp_roci
B A
B A 290.38 8 canal
B A
B A 229.63 8 anegado
B
B 223.75 8 rocio

Tukey's Studentized Range (HSD) Test for peso


NOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate
than REGWQ.
Alpha 0.05
Error Degrees of Freedom 35
Error Mean Square 4196.814
Critical Value of Studentized Range 4.26141
Minimum Significant Difference 97.604
Means with the same letter are not significantly different.
Grouping
Mean N metodo
A 299.63 8 goteo
A
A 292.00 8 aspesor
A
A 291.00 8 asp_roci
A
A 290.38 8 canal
A
A 229.63 8 anegado
A
A 223.75 8 rocio

Contrast DF Contrast SS Mean Square F Value Pr > F


rocio vs. otros 1 21489.33750 21489.33750 5.12 0.0300
anegado y rocio vs. otros 1 47259.37500 47259.37500 11.26 0.0019
anegado vs rocio 1 138.06250 138.06250 0.03 0.8571
Efectos estimados
Parameter Estimate Error t Value Pr > |t|
efecto anegado -41.437500 20.9085651 -1.98 0.0554
efecto asp_roci 19.937500 20.9085651 0.95 0.3468
efecto aspersor 20.937500 20.9085651 1.00 0.3235
efecto canal 19.312500 20.9085651 0.92 0.3620
efecto goteo 28.562500 20.9085651 1.37 0.1806
efecto rocio -47.312500 20.9085651 -2.26 0.0300
efecto arbol1 92.270833 24.7393478 3.73 0.0007
efecto arbol2 150.104167 24.7393478 6.07 <.0001
efecto arbol3 22.104167 24.7393478 0.89 0.3777
efecto arbol4 -188.895833 24.7393478 -7.64 <.0001
efecto arbol5 11.770833 24.7393478 0.48 0.6372
efecto arbol6 28.270833 24.7393478 1.14 0.2609
efecto arbol7 -31.229167 24.7393478 -1.26 0.2152
efecto arbol8 -84.395833 24.7393478 -3.41 0.0016

I.C para efectos


Parameter 95% Confidence Limits
efecto anegado -83.884144 1.009144
efecto asp_roci -22.509144 62.384144
efecto aspersor -21.509144 63.384144
efecto canal -23.134144 61.759144
efecto goteo -13.884144 71.009144
efecto rocio -89.759144 -4.865856
efecto arbol1 42.047287 142.494379
efecto arbol2 99.880621 200.327713
efecto arbol3 -28.119379 72.327713
efecto arbol4 -239.119379 -138.672287
efecto arbol5 -38.452713 61.994379
efecto arbol6 -21.952713 78.494379
efecto arbol7 -81.452713 18.994379
efecto arbol8 -134.619379 -34.172287

Contrastes Estimados
Standard
Parameter Estimate Error t Value Pr > |t|
rocio vs. otros -56.775000 25.0902781 -2.26 0.0300
anegado y rocio vs. otros -66.562500 19.8356065 -3.36 0.0019
anegado vs rocio 5.875000 32.3914097 0.18 0.8571

I.C para contrastes


Parameter 95% Confidence Limits
rocio vs. otros -107.710972 -5.839028
anegado y rocio vs. otros -106.830922 -26.294078
anegado vs rocio -59.883058 71.633058

Potrebbero piacerti anche