diseño de experimentos dca-dbca

Upload: vm-victormanuel

Post on 29-Oct-2015

145 views

Category:

Documents


0 download

TRANSCRIPT

  • TALLER DE REPASO ANLISIS DE VARIANZAI) Se realiz un estudio de ingeniera de trnsito sobre los retrasos en las intersecciones con semforos en las calles de una ciudad. Se usaron tres tipos de semforos: 1) programado, 2) semiactivado y 3) activado. Se usaron cinco intersecciones para cada tipo de semforo. La medida de retraso utilizada fue el promedio de tiempo que cada vehculo permanece detenido en cada interseccin (segundos/vehculo). Los datos son los siguientes:

    a) Escriba el modelo estadstico para este estudio y explique sus componentes b) Establezca las suposiciones necesarias para un anlisis de varianza de los datos. c) Calcule el anlisis de varianza. d) Calcule las medias del retraso en el trnsito y sus errores estndar por tipo de semforo.

    e) Calcule el intervalo de confianza del 95% estimado para las medias de los tipos de semforo y para sus efectos. f) Pruebe la hiptesis de que no hay diferencia entre las medias de retraso para los tipos de semforo a un nivel de significancia de 0.05. g) Estime los siguientes contrastes y sus errores estndar: 1) Los semforos programados vs. los semiactivados y activados 2) Los semforos semiactivados vs. los activados h) Pruebe la hiptesis nula para cada contraste en g), H0: W=0, con la prueba t de student a un nivel de significancia de 0.05. i) Pruebe la hiptesis nula para cada contraste en g), H0: W=0, con la prueba F a un nivel de significancia de 0.05 j) cul es la relacin entre las pruebas de los incisos h) e i) ? k) Valide los supuestos del modelo l) Utilice los datos del ejercicio para determinar cuntas intersecciones necesita el ingeniero de trnsito con cada tipo de semforo para rechazar la hiptesis nula a un nivel de significancia de 0.01, con una potencia de 0.90, si los retrasos medios respectivos en los tres tipos de seal fueron 20, 18 y 16 segundos. PROGRAMA SAS:options nodate nocenter nonumber; goptions colors=(black,black,black) cback=white cback=white ftext=simplex ftitle=simplex htitle=0.9 htext=0.7; data transito; do i=1 to 3; input tiemporet @; output; end; cards; 36.6 17.5 15.0 39.2 20.6 10.4 30.4 18.7 18.9 37.1 25.7 10.5 34.1 22.0 15.2 ;run; data transito (drop=i); set transito; if i=1 then tiposemaf='programado'; if i=2 then tiposemaf='semiactiv'; if i=3 then tiposemaf='activado'; run; proc sort data=transito; by tiposemaf; run; title1'Boxplot Comparativo de tiempos de detencion';

    programado semiactivado activado36.6 17.5 15.0 39.2 20.6 10.4 30.4 18.7 18.9 37.1 25.7 10.5 34.1 22.0 15.2

  • title2'Tres tipos de Semaforo'; proc boxplot data=transito; plot tiemporet*tiposemaf; run; quit; title1'Graficos de medias de tiempos de detencion'; title2'Tres tipos de Semaforo'; proc gplot data=transito; plot tiemporet*tiposemaf=1/frame; symbol1 i=stdj v=star c=black l=1; run; quit; title'ANOVA Y ESTIMACIONES'; PROC GLM DATA=TRANSITO; class tiposemaf; FIJOS: model tiemporet=tiposemaf/SS1 CLPARM; means tiposemaf; means tiposemaf/hovtest=bartlett duncan tukey; estimate 'efecto activado' tiposemaf 2 -1 -1/divisor=3; estimate 'efecto programado' tiposemaf -1 2 -1/divisor=3; estimate 'efecto semiactiv' tiposemaf -1 -1 2/divisor=3; estimate 'programado vs. otros' tiposemaf -1 2 -1/divisor=2; contrast 'programado vs. otros' tiposemaf -1 2 -1; estimate 'semiactivado vs. activado' tiposemaf -1 0 1; contrast 'semiactivado vs. activado' tiposemaf -1 0 1; output out=ESTAD residual=res predicted=pred stdp=std lclm=lim_infc uclm=lim_supc; run; quit; proc print data=estad;run; title'Grafico de residuales'; proc gplot data=estad; plot res*tiposemaf=1/vref=0 lvref=2; plot res*pred=2/vref=0 lvref=2; symbol1 i=none v=star; symbol2 i=none v=star; run; quit; proc univariate data=estad normaltest noprint; var res; probplot res; inset normaltest probn; run; quit; /*CALCULO DE TAMAO DE MUESTRAS*/ /*VARIANZA ESTIMADA=MSE=(137.828/12), ALPHA(activado)=-2, ALPHA(semiactiv)=0, ALPHA(programado)=2*, v1=2, v2=3(n-1) potencia deseada=0.90, significancia=0.01*/ data tamano; do n=2 to 30; v2=3*(n-1); fcr=finv(0.99,2,v2); nc=(96/137.828)*n; pot=1-probf(fcr,2,v2,nc); output; end; run; title'tamao de muestra'; proc print data=tamano;run;

  • SALIDAS SAS:ANOVA Y ESTIMACIONESANOVA Y ESTIMACIONESANOVA Y ESTIMACIONESANOVA Y ESTIMACIONESThe GLM ProcedureThe GLM ProcedureThe GLM ProcedureThe GLM Procedure

    Class Level Information Class Levels Values tiposemaf 3 activado programado semiactiv Number of observations 15 Dependent Variable: tiemporet

    Sum of Source DF Squares Mean Square F Value Pr > F Model 2 1202.628000 601.314000 52.35 F tiposemaf 2 1202.628000 601.314000 52.35

  • Medias y Desviaciones EstndarMedias y Desviaciones EstndarMedias y Desviaciones EstndarMedias y Desviaciones EstndarLevel of Level of Level of Level of ----------------------------------------tiemporettiemporettiemporettiemporet---------------------------------------- tiptiptiptiposemaf N Mean Std Devosemaf N Mean Std Devosemaf N Mean Std Devosemaf N Mean Std Dev

    activado 5 14.0000000 3.59374457 programado 5 35.4800000 3.37001484 semiactiv 5 20.9000000 3.19139468

    Bartlett's Test for Homogeneity of tiemporet VarianceBartlett's Test for Homogeneity of tiemporet VarianceBartlett's Test for Homogeneity of tiemporet VarianceBartlett's Test for Homogeneity of tiemporet VarianceSource DF Chi-Square Pr > ChiSq tiposemaf 2 0.0510 0.9748

    Duncan's Multiple Range Test for tiemporetDuncan's Multiple Range Test for tiemporetDuncan's Multiple Range Test for tiemporetDuncan's Multiple Range Test for tiemporetNOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 11.48567 Number of Means 2 3 Critical Range 4.670 4.888 Means with the same letter are not significantly different. Grouping

    Mean N tiposemaf A 35.480 5 programado B 20.900 5 semiactiv C 14.000 5 activado

    Tukey's Studentized Range (HSD) Test for tiemporetTukey's Studentized Range (HSD) Test for tiemporetTukey's Studentized Range (HSD) Test for tiemporetTukey's Studentized Range (HSD) Test for tiemporetNOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 11.48567 Critical Value of Studentized Range 3.77278 Minimum Significant Difference 5.7181 Means with the same letter are not significantly different. Grouping

    Mean N tiposemaf A 35.480 5 programado B 20.900 5 semiactiv C 14.000 5 activado ContrastContrastContrastContrast DF Contrast SS Mean Square F Value Pr > F programado vs. otros 1 1083.603000 1083.603000 94.34 |t| efecto activado -9.4600000 1.23750645 -7.64

  • V) En un naranjal se llev a cabo un experimento de irrigacin con un diseo de bloques completos aleatorizado en el que se usaron seis tratmientos de irrigacin en ocho bloques de rboles. Los siguientes datos se refieren al peso en libras de la fruta cosechada en cada parcela:

    a) Escriba el modelo para el experimento, explique los trminos y clacule el anlisis de varianza. b) Cules son las suposiciones necesarias para que el anlisis de varianza sea vlido? cmo se relacionan con el experimento? c) Estime las medias de tratamiento, los efectos y sus intervalos de confianza del 95%, haga las comparaciones mltiples para establecer grupos de tratamientos.

    Bloque Mtodo 1 2 3 4 5 6 7 8goteo 450 469 249 125 280 352 221 251canal 358 512 281 058 352 293 283 186rocio 331 402 183 070 258 281 219 046aspesor 317 423 379 063 289 239 269 357asp_rocio 479 341 404 115 182 349 276 182anegado 245 380 263 062 336 282 171 098

  • d) Calcule la eficiencia relativa de este diseo respecto a un diseo totalmente aleatorizado. Concluya. e) Obtenga grfica de residuales e interprtelas. PROGRAMA SAS:options nodate nocenter nonumber; goptions colors=(black,black,black) cback=white cback=white ftext=simplex ftitle=simplex htitle=0.9 htext=0.7; data naranjas; input metodo $ @; do arbol=1 to 8; input peso @; output; end; cards; goteo 450 469 249 125 280 352 221 251 canal 358 512 281 058 352 293 283 186 rocio 331 402 183 070 258 281 219 046 aspesor 317 423 379 063 289 239 269 357 asp_rocio 479 341 404 115 182 349 276 182 anegado 245 380 263 062 336 282 171 098 ;run; proc sort data=naranjas; by arbol; run; proc boxplot data=naranjas; plot peso*arbol; run; quit; proc sort data=naranjas; by metodo; run; proc boxplot data=naranjas; plot peso*metodo; run; quit; proc gplot data=naranjas; plot peso*metodo=arbol/frame; symbol1 i=stdj v='1' c=black l=1; symbol2 i=stdj v='2' c=blue l=2; symbol3 i=stdj v='3' c=red l=3; symbol4 i=stdj v='4' c=green l=4; symbol5 i=stdj v='5' c=brown l=5; symbol6 i=stdj v='6' c=orange l=6; symbol7 i=stdj v='7' c=green l=7; symbol8 i=stdj v='8' c=orange l=8; run; quit; title'ANOVA y Estimaciones'; proc glm data=naranjas; class metodo arbol; model peso=metodo arbol/ss1 clparm; means metodo arbol; means metodo/duncan tukey; estimate 'efecto anegado' metodo 5 -1 -1 -1 -1 -1/divisor=6; estimate 'efecto asp_roci' metodo -1 5 -1 -1 -1 -1/divisor=6; estimate 'efecto aspersor' metodo -1 -1 5 -1 -1 -1/divisor=6; estimate 'efecto canal' metodo -1 -1 -1 5 -1 -1/divisor=6; estimate 'efecto goteo' metodo -1 -1 -1 -1 5 -1/divisor=6; estimate 'efecto rocio' metodo -1 -1 -1 -1 -1 5/divisor=6; estimate 'efecto arbol1' arbol 7 -1 -1 -1 -1 -1 -1 -1/divisor=8; estimate 'efecto arbol2' arbol -1 7 -1 -1 -1 -1 -1 -1/divisor=8; estimate 'efecto arbol3' arbol -1 -1 7 -1 -1 -1 -1 -1/divisor=8; estimate 'efecto arbol4' arbol -1 -1 -1 7 -1 -1 -1 -1/divisor=8;

  • estimate 'efecto arbol5' arbol -1 -1 -1 -1 7 -1 -1 -1/divisor=8; estimate 'efecto arbol6' arbol -1 -1 -1 -1 -1 7 -1 -1/divisor=8; estimate 'efecto arbol7' arbol -1 -1 -1 -1 -1 -1 7 -1/divisor=8; estimate 'efecto arbol8' arbol -1 -1 -1 -1 -1 -1 -1 7/divisor=8; estimate 'rocio vs. otros' metodo -1 -1 -1 -1 -1 5/divisor=5; contrast 'rocio vs. otros' metodo -1 -1 -1 -1 -1 5; estimate 'anegado y rocio vs. otros' metodo 2 -1 -1 -1 -1 2/divisor=4; contrast 'anegado y rocio vs. otros' metodo 2 -1 -1 -1 -1 2; estimate 'anegado vs rocio ' metodo 1 0 0 0 0 -1; contrast 'anegado vs rocio ' metodo 1 0 0 0 0 -1; output out=ESTAD residual=res predicted=pred; run; quit; output out=ESTAD residual=res predicted=pred; run; quit; title'Grafico de residuos'; proc gplot data=estad; plot res*metodo=1/vref=0 lvref=2; plot res*arbol=2/vref=0 lvref=2; plot res*pred=3/vref=0 lvref=2; symbol1 i=none v=star; symbol2 i=none v=dot; symbol3 i=none v=diamond; run; quit; proc univariate data=estad normaltest noprint; var res; probplot res; inset normaltest probn; run; quit;

  • ANOVA y EstimacionesANOVA y EstimacionesANOVA y EstimacionesANOVA y EstimacionesThe GLM ProcedureThe GLM ProcedureThe GLM ProcedureThe GLM Procedure

    Class Level Information Class Levels Values metodo 6 anegado asp_roci aspesor canal goteo rocio arbol 8 1 2 3 4 5 6 7 8 Number of observations 48 Dependent Variable: peso

    Sum of Source DF Squares Mean Square F Value Pr > F Model 12 505348.3333 42112.3611 10.03 F metodo 5 47841.6875 9568.3375 2.28 0.0678 arbol 7 457506.6458 65358.0923 15.57

  • Medias y Desviaciones estndar por bloqueMedias y Desviaciones estndar por bloqueMedias y Desviaciones estndar por bloqueMedias y Desviaciones estndar por bloqueLevel of -------------peso------------ arbol N Mean Std Dev 1 6 363.333333 87.307884 2 6 421.166667 61.694138 3 6 293.166667 83.422819 4 6 82.166667 29.728213 5 6 282.833333 60.730278 6 6 299.333333 43.720323 7 6 239.833333 43.700877 8 6 186.666667 110.293548

    Duncan's Multiple Range Test for pesoDuncan's Multiple Range Test for pesoDuncan's Multiple Range Test for pesoDuncan's Multiple Range Test for pesoNOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 35 Error Mean Square 4196.814 Number of Means 2 3 4 5 6 Critical Range 65.76 69.13 71.32 72.90 74.09 Means with the same letter are not significantly different. Duncan Groupi ng Mean N metodo

    A 299.63 8 goteo A

    B A 292.00 8 aspesor B AB A 291.00 8 asp_roci B AB A 290.38 8 canal B AB A 229.63 8 anegado BB 223.75 8 rocio

    Tukey's Studentized Range (HSD) Test for pesoTukey's Studentized Range (HSD) Test for pesoTukey's Studentized Range (HSD) Test for pesoTukey's Studentized Range (HSD) Test for pesoNOTE: This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 35 Error Mean Square 4196.814 Critical Value of Studentized Range 4.26141 Minimum Significant Difference 97.604 Means with the same letter are not significantly different. Grouping

    Mean N metodo A 299.63 8 goteo AA 292.00 8 aspesor AA 291.00 8 asp_roci AA 290.38 8 canal AA 229.63 8 anegado AA 223.75 8 rocio

    Contrast Contrast Contrast Contrast DF Contrast SS Mean Square F Value Pr > F rocio vs. otros 1 21489.33750 21489.33750 5.12 0.0300 anegado y rocio vs. otros 1 47259.37500 47259.37500 11.26 0.0019 anegado vs rocio 1 138.06250 138.06250 0.03 0.8571

  • Efectos estimadosEfectos estimadosEfectos estimadosEfectos estimadosParameter Estimate Error t Value Pr > |t| efecto anegado -41.437500 20.9085651 -1.98 0.0554 efecto asp_roci 19.937500 20.9085651 0.95 0.3468 efecto aspersor 20.937500 20.9085651 1.00 0.3235 efecto canal 19.312500 20.9085651 0.92 0.3620 efecto goteo 28.562500 20.9085651 1.37 0.1806 efecto rocio -47.312500 20.9085651 -2.26 0.0300 efecto arbol1 92.270833 24.7393478 3.73 0.0007 efecto arbol2 150.104167 24.7393478 6.07