diseño factorial 2

Upload: agustin-mirafuentes

Post on 12-Jul-2015

411 views

Category:

Documents


4 download

TRANSCRIPT

5.3 DISEO FACTORIAL 2^K En estadstica, un experimento factorial completo es un experimento cuyo diseo consta de dos o ms factores, cada uno de los cuales con distintos valores o "niveles", y cuyas unidades experimentales cubren todas las posibles combinaciones de esos niveles en todo los factores. Este tipo de experimentos permiten el estudio del efecto de cada factor sobre la variable respuesta, as como el efecto de las interacciones entre factores sobre la dicha variable. Por ejemplo, con dos factores y dos niveles en cada factor, un experimento factorial tendra en total cuatro combinaciones de tratamiento, y se le denominara diseo factorial de 22. Si el nmero de combinaciones en un diseo factorial completo es demasiado alto para su procesamiento, puede optarse por un diseo factorial fraccional, en el que se omitan algunas de las combinaciones posibles.

Para ahorrar el espacio, los puntos en un experimento factorial de dos niveles se abrevian a menudo con las cadenas de ms y signos de menos. Las secuencias tienen tantos smbolos como factores, y sus valores dictan el nivel de cada factor: convencionalmente, para el primer (o bajo) llano, y + para el segundo (o alto) llano. Los puntos en este experimento se pueden representar as como , + , + , y + + . Los puntos factoriales se pueden tambin abreviar cerca (1), a, b, y el ab, donde la presencia de una letra indica que el factor especificado est en su alto (o en segundo lugar) nivel y la ausencia de una letra indica que el factor especificado est en su (o primero) nivel bajo (por ejemplo, a indica que el factor A est en su alto ajuste, mientras que el resto de los factores estn en su ajuste del punto bajo (o primero)). (1) se utiliza indicar que todos los factores estn en sus (o primero) valores ms bajos. Para poder finalmente obtener un modelo estadstico que nos indique el valor de respuesta al modificar los factores. Calculo del efecto Contraste = (suma de niveles+)-(suma de niveles-) Efecto Contraste /replica*2^k b= efecto/2 bo= suma total/nmero total Modelo estadstico: Y= bo+ b1X1 + b2X2

EJEMPLO

El experimento factorial ms simple contiene dos niveles para cada uno de dos factores. Suponga los deseos de un ingeniero para estudiar la energa total usada por cada uno de dos diversos motores, A y B, funcionando en cada uno de dos diversas 2000 o 3000 RPM de las velocidades. El experimento factorial consistira en cuatro elementos experimentales: viaje en automvil A en 2000 RPM, viaje en automvil B en 2000 RPM, viaje en automvil A en 3000 RPM, y viaje en automvil B en 3000 RPM. Cada combinacin de un solo nivel seleccionado de cada factor est presente una vez. Este experimento es un ejemplo de 22 (o 2x2) experimento factorial, nombrado as porque considera dos niveles (la base) para cada uno de dos factores (la energa o el exponente), o #lniveles#factores, produciendo 22puntos factoriales =4. Los diseos pueden implicar muchas variables independientes. Como otro ejemplo, los efectos de tres variables entradas se pueden evaluar en ocho condiciones experimentales demostradas como las esquinas de un cubo. Esto se puede conducir con o sin la rplica, dependiendo de su propsito previsto y recursos disponibles. Proporcionar los efectos de las tres variables independientes en la variable dependiente y las interacciones posibles(en caso de haber ms de 3 se habla de un hiperespacio).

5.4 DISEO DE CUADRADOS LATINOS

Un cuadrado latino es una matriz de nn elementos, en la que cada casilla est ocupada por uno de los n smbolos de tal modo que cada uno de ellos aparece exactamente una vez en cada columna y en cada fila. Las siguientes matrices son cuadrados latinos:

Los cuadrados latinos se dan como una Tabla de multiplicar (Tabla Cayley) de quasigrupos. Estos tienen su aplicacin en el diseo de experimentos. El nombre de Cuadrado latino se origina con Leonhard Euler quin utiliz caracteres latinos como smbolos. Un cuadrado latino se dice que est reducido (o normalizado o de forma estandarizada) si la primera fila y la primera columna estn en orden natural. Por ejemplo, el primer cuadrado est reducido, porque la primera fila y la primera columna son 1, 2, 3. Es posible hacer un cuadrado latino permutando (reordenando) las filas y las columnas.

Clases equivalentes de cuadrados latinos Muchas operaciones sobre un Cuadrado latino produce otro Cuadrado latino (por ejemplo, alternar filas). Si permutamos las filas, permutamos las columnas, y permutamos los smbolos de un Cuadrado latino obtenemos un nuevo Cuadrado latino que decimos que es isotpico del primero. El isotopismo es una relacin de equivalencia, basndose en esto se dice que todos los Cuadrados latinos estn divididos en subgrupos, llamados clases isotpicas, segn esto dos Cuadrados de la misma clase se dice que son isotpicos, y dos de clases diferentes son no isotpicos. Otro tipo de operacin es simple de explicar usando la representacin de estos por arreglos ortogonales. Si reorganizamos consciente y sistemticamente los tres elementos de cada tripleta (f, c, s) por (c, f, s) lo cual corresponde a una transposicin del cuadrado (reflejado en la diagonal principal), o podemos reemplazar cada tripleta (f, c, s) por (c, s, f), lo que es una operacin ms complicada. Todas juntas nos dan 6 posibilidades, incluida no hacer nada, dndonos 6 Cuadrados Latinos llamados conjugados del cuadrado original. Finalmente, podemos combinar estas dos operaciones equivalentes: Dos Cuadrados Latinos son paratpicos si uno de ellos es conjugado del otro. Esto es nuevamente una relacin de equivalencia, con la clase de equivalencia principal llamada Clase Principal, especies o clase paratpica. Cada clase contiene 6 clases isotpicas.

EJEMPLO Un investigador quiere evaluar la productividad de cuatro variedades de aguacate y decide realizar el ensayo en un terreno que posee un gradiente de pendiente de oriente a occidente y adems, diferencias en la disponibilidad de Nitrgeno de norte a sur, para controlar los efectos de la pendiente y la disponibilidad de Nitrgeno, utiliz un diseo de cuadrado latino, las variedades son: A, B, C y D, los datos corresponden a la produccin en kg/parcela. Se quiere estudiar la posible influencia de los aditivos de combustible T en la reduccin de xido de nitrgeno en las emisiones de los automviles(variable respuesta) controlando la influencia del conductor (factor bloque B ) y del tipo de coche ( factor-bloque, B ). Se consideran cuatro conductores: C1, C2, C3, C4. Cuatro tipos de coche: Seat, Ford, Opel, Renault. Cuatro aditivos de combustible: A1, A2, A3, A4. Los resultados del experimento diseado segn la tcnica del cuadrado latino son los de la tabla adjunta, tambin se presenta el cuadrado latino utilizado.

Seat C1 C2 C3 C4 C. Latino 1 4 2 3 2 3 4 1 21 A1 23 A4 15 A2 17 A3

Ford 26 A2 26 A3 13 A4 15 A1

Opel 20 A4 20 A1 16 A3 20 A2

Renault 25 A3 27 A2 16 A1 20 A4

4 1 3 2

3 2 1 4

Solucin. Estimacin de los parmetros. Se obtienen los siguientes estimadores Estimacionesi i

.i 3 4 -5 -2 19 20 19 22 .. = = 20

j

..k -1 0 -1 2 18 22 21 19 -2 2 1 -1

23 24 15 18

Los residuos del modelo son: Residuos Seat C1 C2 C3 C4 1 A1 1 A4 -1 A2 -1 A3 Ford 1 A2 1 A3 -1 A4 -1 A1 Opel -1 A4 -1 A1 1 A3 1 A2 Renault -1 A3 -1 A2 1 A1 1 A4

Aqu el juego de hiptesis a probar sera: Ho = A = B = C = D Ha = i j para cualquier i diferente de j. El anlisis de varianza queda: (Tarea: Verificarlo) F de V GL S de C CM FC P value Tratamientos 3 5556.25000 1852.08333 Nitrgeno (Filas) 3 92518.75000 30839.58333 98.78 < 0.005

Pendiente (Columnas) 3 52556.25000 17518.75000 Error 6 112.5000 18.7500 Total 15 150743.7500 A partir de la cual se rechaza la hiptesis nula y se concluye que existen por lo menos dos variedades de aguacate con diferentes niveles de produccin, para evaluar entre quienes est la diferencia debe realizarse una prueba de comparacin de medias, esto te queda de tarea.

Con los resultados obtenidos se realiza la sig. Tabla anova

Tabla ANOVA Fuentes de variacin Factor conduc tor Factor coche Factor aditivo Variab. Explicada Residual Global Suma de cuadrad os 216 24 40 280 16 296 Grados de libertad 3 3 3 9 6 15 2'66 19'73 Varianza p - valor

72 8 13'33

27 3 5

0'0007 0'1117 0'0452

De esta tabla se deducen los siguientes contrastes:

[1] El contraste de la hiptesis: el factor por el estadstico

(aditivo) no influye. Se realiza

Se tienen dudas acerca de si aceptar o no esta hiptesis ya que su pvalor 0'05. Es el contraste ms interesante ya que se contrasta la posible influencia del factor tratamiento en el que se est interesado.

[2] El contraste de la hiptesis: el factor

(conductor) no influye.

Se rechaza esta hiptesis de no influencia del factor conductor.

[3] El contraste de la hiptesis: el factor

(coche) no influye.

Se acepta, a un nivel inferior razonable (< 0'11) la no influencia del factor coche. Los coeficientes de determinacin de los tres factores son:

De los contrastes anteriores se deduce que ha sido conveniente bloquear el tipo de conductor pero no conviene bloquear el tipo de coche. Se puede eliminar el factor coche, basta con sumar la fila correspondiente al factor coche con la fila de la variabilidad residual, aunque se pueden hacer crticas al diseo resultante. Se obtiene la siguiente tabla ANOVA Tabla ANOVA 2 Fuentes de Variacin Factor conduc tor Factor aditivo Variab. Exp. Total Residual Global Suma de. Cuadrad os 216 40 256 40 296 Grados libertad 3 3 6 9 15 4'44 19'73 Varianza p valor

72'00 13'33

16'20 3'00

0'0006 0'0877

Trabajando con un nivel de significacin de = 0'05 se acepta la no influencia del factor tratamiento tipo de aditivo. 5.5 DISEO DE CUADRADOS GRECOLATINOS En los arreglos por bloques, se pueden analizar 4 factores, introduciendo un cuarto factor o bloque en un diseo cuadrado latino, siguiendo las mismas reglas utilizadas para introducir un tercer factor en un diseo cuadrado de dos factores. A este cuarto factor o bloque se le denomina componente griego, ya que se utilizan letras griegas para identificar sus niveles, a la adicin de un diseo cuadrado latino y un cuarto factor, se le llama Diseo Cuadrado Greco-Latino. Es un diseo con cuatro factores a k niveles Se asume que no hay interacciones Requiere k2 observaciones El diseo factorial completo requiere k4 Cada nivel de un factor aparece una vez con cada nivel de los otros factores Superposicin de dos cuadrados latinos Superposicin de dos cuadrados latinos Cada letra griega aparece una vez en cada fila, en cada columna y una con cada letra latina El modelo es donde i es el efecto fila, j efecto columna, k efecto De la letra latina y l efecto de letra griega La notacin yij (kl) indica que k y l dependen de ij.

Ejemplo Un experimentador, desea probar en un arreglo cuadrado por bloques, que efecto tienen el factor lote de materia prima y el operador que prepara Dinamita, en la respuesta Explosividad de la misma. Tambin desea bloquear el arreglo con la Formula que se utiliza para preparar la dinamita, para esto considera a el bloque Formula como su Factor o Bloque Latino. El arreglo queda como sigue (desea tambin probar 5 niveles): Un experimentador, desea probar en un arreglo cuadrado por bloques, que efecto tienen el factor lote de materia prima y el operador que prepara Dinamita, en la respuesta Explosividad de la misma. Tambin desea bloquear el arreglo con la Formula que se utiliza para preparar la dinamita, para esto considera a el bloque Formula como su Factor o Bloque Latino. El arreglo queda como sigue (desea tambin probar 5 niveles): Para hacer esto, decide utilizar un arreglo Cuadrado Greco-Latino, el cual se muestra a continuacin (Por razones prcticas, se utilizaran los mismos datos que en el ejemplo anterior) Ya que son los mismos datos del ejemplo anterior, los clculos y resultados para las sumas de cuadrados para los componentes Lote, Operador, Frmula y Suma Total son los mismos tambin: SSFrmula= (82295/5) (635/25) = 330 Para calcular la suma de cuadrados del componente Griego, tendremos que obtener las sumas naturales totales por nivel: Total= 635 80,955 SSLinea = (80955/5) - = 62 La suma de cuadrados del error, se calcula nuevamente por diferencia: SSerror = SSTotales - SSLote -SSOperador -SSFormula - SSLinea SSerror = 676 - 68 - 150 - 330 - 62 = 66 Se divide la suma de cuadrados y los gl Una vez calculados todos los componentes de la variacin por separado, se puede elaborar la tabla anova: Error/ grados medios n-1 (n-3) (n-1) Como este es tambin un arreglo cuadrado (todos los factores tienen la misma cantidad de niveles), solo es necesario consultar un F de Fisher para compararse despus con las calculadas por factor y evaluar nuestra hiptesis (que es la misma analizada en el ejemplo anterior), a un 95% de

nivel de confianza Fo, g1, g2 -= F0.05, 4, 8 = 3.84, Entonces tenemos: Este es el valor de la tabla de la distribucin F. V1 = 4 y V2 = 8 Para el lote: Como la Fo (2.06) < F0.05, 4, 8 = 3.84, entonces se Acepta Ho, el lote de material no es fuente de variacin para la respuesta. Para el Operador: Como la Fo (4.55) > F0.05, 4, 8 = 3.84, entonces se Rechaza Ho, el operador es fuente de variacin para la respuesta. Para la Formula Como la Fo (10.0) > F0.05, 4, 8 = 3.84, entonces se Rechaza Ho, el tipo de formula es fuente de variacin para la respuesta. Para La Lnea de ensamble: Como la Fo (1.88) < F0.05, 4, 8 = 3.84, entonces se Acepta Ho, la lnea de ensamble no es fuente de variacin para la respuesta.

5.2 DISEO DE EXPERIMENTOS FACTORIALES En estadstica, un experimento factorial completo es un experimento cuyo diseo consta de dos o ms factores, cada uno de los cuales con distintos valores o "niveles", y cuyas unidades experimentales cubren todas las posibles combinaciones de esos niveles en todo los factores. Este tipo de experimentos permiten el estudio del efecto de cada factor sobre la variable respuesta, as como el efecto de las interacciones entre factores sobre la dicha variable. Por ejemplo, con dos factores y dos niveles en cada factor, un experimento factorial tendra en total cuatro combinaciones de tratamiento, y se le denominara diseo factorial de 22. Si el nmero de combinaciones en un diseo factorial completo es demasiado alto para su procesamiento, puede optarse por un diseo factorial fraccional, en el que se omitan algunas de las combinaciones posibles. La tcnica fundamental es el repartir del total suma de cuadrados en componentes se relacion con los efectos usados en el modelo. Por ejemplo, demostramos el modelo para un ANOVA simplificado con un tipo de tratamiento en diversos niveles.

El nmero de los grados de libertad se puede repartir de una manera similar y especifican distribuciones chi-cuadrado que describen las sumas asociadas de cuadrados.

Prueba F de Fisher Se utiliza para las comparaciones de los componentes de la desviacin total. Por ejemplo, en una forma, o el solo-factor ANOVA, la significacin estadstica es probada para comparando la estadstica de la prueba de F

donde:

, I = nmero de tratamientos y: , nT = nmero total de casos a F-distribucin con el del I-1, secundario< del > n< T> /sub grados de libertad. Usar la F-distribucin es un candidato natural porque la estadstica de la prueba es el cociente de dos sumas malas de los cuadrados que tienen a distribucin del chi-cuadrado. El diseo de un experimento es la secuencia completa de pasos tomados de antemano para asegurar que los datos apropiados se obtendrn de modo que permitan un anlisis objetivo que conduzca a deducciones vlidas con respecto al problema establecido.