web

43
EL MÉTODO ESTADÍSTICO PARA EL DISEÑO DE EXPERIMENTOS

Upload: rilara

Post on 31-May-2015

2.951 views

Category:

Technology


1 download

TRANSCRIPT

Page 1: Web

EL MÉTODO ESTADÍSTICO PARA EL DISEÑO DE EXPERIMENTOS

Page 2: Web

Contenido

• El análisis de varianza.• Modelos clásicos de diseño experimental.• La homogeneidad estadística de las

comparaciones: diseños factoriales.• Diseños por bloques aleatorios.

Page 3: Web

El Análisis de Varianza

• Introducción:– Cuando definimos el diseño de experimentos,

diferenciamos dos aspectos:• La planeación del experimento.• El método estadístico.

Page 4: Web

El Análisis de Varianza

– El análisis de varianza fue creado por R.A. Fisher (1925).

– Consideraremos el problema de definir si las diferencias observadas entre más de dos medias de una muestra pueden atribuirse al azar.

Page 5: Web

La Metodología

1. Representar gráficamente los datos: Diagramas de caja si se disponen de 10 datos o mas.

2. Formulación de las hipótesis.3. Comprobación de requisitos

1. Representar gráficamente los datos: Diagramas de caja si se disponen de 10 datos o mas.

2. Formulación de las hipótesis.3. Comprobación de requisitos

Page 6: Web

Análisis de Varianza en un Solo Sentido• Ejemplo: Supóngase que se desea comparar la acción de

limpieza de tres detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de tela blanca manchada con una tinta común y después lavada con los detergentes respectivos en una máquina con agitador.

Registros de Blancura

Detergente A Detergente B Detergente C

77 72 76

81 58 85

71 74 82

76 66 80

80 70 77

Page 7: Web

Registro de blancura

Detergente: niveles del factor fijos! Se analizar

los existentes sin necesidad de tomar una

muestra.

Page 8: Web

Análisis de Varianza en un Solo Sentido

kj

ikijii

kj

kj

kj

yyyy

yyyy

yyyy

yyyy

kj

......

......

..................

......

......

......

......21

21

21

333231

222221

111211

Tratamientos

Medias

Suposiciones sobre las variables yij:

1)Son independientes.2)Tienen distribuciones

normales con las medias respectivas μi

3)Tienen varianza común σ2

Suposiciones sobre las variables yij:

1)Son independientes.2)Tienen distribuciones

normales con las medias respectivas μi

3)Tienen varianza común σ2

Page 9: Web

El modelo de las observaciones esta

dado por:

Yij = μ+τj+εij; donde:

μ es la media globalτj son los efectos del tratamiento (τj= μj-

μ)εij : variables

aleatorias independientes con con medias cero y

varianza común σ2. (εij : Yij – μj)

El modelo de las observaciones esta

dado por:

Yij = μ+τj+εij; donde:

μ es la media globalτj son los efectos del tratamiento (τj= μj-

μ)εij : variables

aleatorias independientes con con medias cero y

varianza común σ2. (εij : Yij – μj)

Análisis de Varianza en un Solo Sentido

kj

ikijii

kj

kj

kj

TTTT

yyyy

yyyy

yyyy

yyyy

kj

..........

......

..................

......

......

......

......21

21

21

333231

222221

111211

Tratamientos

Totales/columnaNúmeroMedias

n1 n2 … nj … nk NY.1 Y.2 … Y.j … Y.k Y..

Page 10: Web

Análisis de Varianza en un Solo Sentido

kjH

vs

H

j

k

,...2,1,0:

.

0...:

1

10

Si la hipótesis nula es verdadera, toda la variabilidad se debe al azar.

Page 11: Web

Ecuación Fundamental del Análisis de Varianza (Niveles del Factor Fijo)

k

j

n

i jij

k

j

n

i j

k

j

n

i ijjjj YYYYYY

1 1

2.1 1

2...1 1

2.. )()()(

Suma de cuadrados de las desviaciones de la gran media

Suma de cuadrados de las desviaciones de la gran media

Suma de cuadrados de las desviaciones entre los tratamientos

Suma de cuadrados de las desviaciones entre los tratamientos

Suma de cuadrados de las desviaciones dentro de tratamientos

Suma de cuadrados de las desviaciones dentro de tratamientos

Page 12: Web

Tabla ANOVA (Niveles del Factor Fijo)Fuente df SS MS F Valor p

Tratamiento k-1 SS tratamientos

SS tratamientos/(k-1)

P(F(ν1, ν2)≥f)

Error N-k SS error SS error/(N-k)

TOTAL N-1 SS total

error

ostratamient

MS

MSf

Page 13: Web

Análisis de Varianza en un Solo Sentido• Ejemplo: Supóngase que se desea comparar la acción de limpieza de tres

detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de tela blanca manchada con una tinta común y después lavada con los detergentes respectivos en una máquina con agitador.

Pruebe en el nivel de significancia 0.01 si las diferencias entre las medias son significativas.

Registros de Blancura

Detergente A Detergente B Detergente C

77 72 76

81 58 85

71 74 82

76 66 80

80 70 77

Page 14: Web

Análisis de Varianza en un Solo SentidoAnova: Single Factor

SUMMARYGroups Count Sum Average Variance

Detergente A 5 385 77 15,5Detergente B 5 340 68 40Detergente C 5 400 80 13,5

ANOVASource of Variation SS df MS F P-value F crit

Between Groups 390 2 195 8,48 0,01 6,93Within Groups 276 12 23

Total 666 14

Estadística DescriptivaEstadística Descriptiva

Debe rechazarse la hipótesis nula, concluimos que los tres detergentes no son igualmente efectivos

Page 15: Web

Después de ANOVA… qué?

• Si el analista decide seleccionar las comparaciones para luego del resultado del ANOVA, las comparaciones se pueden realizar.

• Sin embargo, el valor α se altera, debido a que la decisión de comparaciones no es aleatoria.

• Métodos:– Student - Newman – Keuls (SNK)– Scheffé test

• Si el analista decide seleccionar las comparaciones para luego del resultado del ANOVA, las comparaciones se pueden realizar.

• Sin embargo, el valor α se altera, debido a que la decisión de comparaciones no es aleatoria.

• Métodos:– Student - Newman – Keuls (SNK)– Scheffé test

Page 16: Web

Pasos para la prueba: Student - Newman – Keuls (SNK)

Page 17: Web

Pasos para la prueba: Student - Newman – Keuls (SNK)

1. Ordene las k medias muestrales de menor a mayor.2. Tome la media cuadrada del error y los grados de libertad del

error.3. Obtenga el error estándar de la media para cada tratamiento,

dicho valor será el denominador de la prueba F.

4. Tome los valores de la tabla: “Studentized Range”, con el valor de α deseado. Usando n2 como los grados de libertad del error y p = 2,3,..k.

5. Multiplique los rangos por el error estándar de la media para cada tratamiento, para encontrar los LSR (least significant ranges)

6. Analice los rangos entre las medias por pares comenzando con el valor mas alto y mas bajo.

j

errorY yennesobservaciodecantidad

MSS

j

.____.

Page 18: Web

Método de Scheffé• Usa el método de contrastes, sin embargo esos contrastes no

necesitan ser ortogonales.• Pasos:1. Establezca los contrastes de interés y calcule sus valores numéricos.2. Determine el valor de f para el que3. Calcule usando el valor de f del paso 2. 4. Calcule el error estándar de cada contraste. Para el contraste:

, el error estándar esta dado por:

5. Sea cm el valor que denote a Cm. Rechace la hipótesis de que el contraste de medias es cero si

fFP kNk ,1(fkA )1(

kkmmm TcTcC .1.1 ...

)...)(( 212

1 kmkmerrorm cncnMSSC

mm Ascc

Page 19: Web

Ejemplo

• La tabla adjunta muestra la vida de un tipo específico de bacteria (en minutos) expuesta a 4 temperaturas distintas.

• Encuentre la tabla ANOVA y defina si la temperatura tiene efecto en la vida de la bacteria.

• Establezca un contraste para comparar el promedio de vida de la bacteria entre la temperatura 1 y 2.

• Establezca un contraste para comparar la vida de la bacteria bajo la temperatura 1 y las tres restantes.

T1 T2 T3 T4

1,93 2,55 2,4 2,33

2,38 2,72 2,68 2,40

2,20 2,75 2,31 2,28

2,25 2,70 2,28 2,25

Page 20: Web

COMPONENTES DE VARIANZA

Page 21: Web

Componentes de la Varianza

Page 22: Web

Tabla ANOVA (Niveles del Factor Aleatorios)

Fuente df SS MS EMS (Valor esperado)

Tratamiento k-1 SS tratamientos SS tratamientos/(k-1)

Error N-k SS error SS error/(N-k)

TOTAL N-1 SS total

22 nerror

2error

Page 23: Web

Tabla ANOVA (Niveles del Factor Aleatorios)

• Ejemplo:Una empresa provee a un cliente con varios cientos de lotes de materia prima cada año. El cliente esta interesado en un mayor rendimiento del porcentaje de químico usable del producto.

Usualmente se toman tres muestras del rendimiento de cada lote para verificar la calidad de la materia prima. Ocurre variación dentro del lote, pero el cliente sospecha que existe variación significativa entre los lotes.

Para revisar esto, se han tomado cinco lotes aleatoriamente de varios lotes disponibles y tres rendimientos por lote. Los rendimientos se muestran en la tabla adjunta.

Cuánta varianza del experimento puede ser atribuida a las diferencias entre lotes?Cuánta varianza del experimento puede ser atribuida al error aleatorio?

Page 24: Web

Tabla ANOVA (Niveles del Factor Aleatorios)

1 2 3 4 5

74 68 75 72 79

76 71 77 74 81

75 72 77 73 79

Lotes

Rendimiento del químico por lotes

Page 25: Web

Tabla ANOVA (Niveles del Factor Aleatorios)

Factor Type Levels ValuesLote random 5 1. 2. 3. 4. 5

Analysis of Variance for Yield

Source DF SS MS F PLote 4 147,733 36,933 20,52 0,000Error 10 18,000 1,800Total 14 165,733

Expected Mean Square for Each Term (using Variance Error unrestricted Source component term model)1 Lote 11,711 2 (2) + 3 (1)2 Error 1,800 (2)

)(22otratamienterror MSEn

errorerror MSE2

Diferencia significativa

entre los lotes

Diferencia significativa

entre los lotes

511,138,1711,112222 SSStotaltotal

Page 26: Web

REVISIÓN DEL MODELO

Page 27: Web

Revisión del Modelo

• Las técnicas que se presentaron en este capítulo están basadas en:– Independencia– Muestras aleatorias– Distribuciones normales– Varianzas iguales

• En la práctica no se espera que las suposiciones del modelo sean satisfechas exactamente.

• Sin embargo, para que el procedimiento de resultados confiables las suposiciones deben ser satisfechas de forma razonable.

Page 28: Web

Revisión del Modelo

• Los residuos deben ser normales.– Los residuos de un experimento son los restos,

luego de que los efectos estimados en el modelo se han sustraído de los valores de la variable de respuesta.

– es el valor de que se predice utilizando el modelo.

ijijij YYE ˆ

ijY ijY

jijij YYE .

Page 29: Web

Revisión del Modelo

• Las varianzas deben ser homogéneas.– Analizar el rango de las observaciones en cada

tratamiento.– Utilizar criterio de control estadístico.

RD4

Page 30: Web

Revisión del Modelo

• Los errores deben ser independientes.– Los datos del experimento deben ser obtenidos de

una forma completamente aleatoria.– La falta de independencia afecta seriamente las

inferencias.– Se deben hacer esfuerzos para evitar errores

correlacionados.

Page 31: Web

Revisión del Modelo

• Procedimientos para revisar independencia:– Cálculo de auto-correlaciones.• La independencia de los errores se debe cuestionar si el

valor absoluto de la auto-correlación es mayor a:

– Durbin-Watson (DW)• Si el valores de DW mayores a 1.7 soportan la

suposición de independencia.

n96,1

n

i i

n

i ii

e

eeDW

1

22

21)(

Page 32: Web

Qué ocurre si el modelo no es adecuado?

• Qué ocurre si no se cumplen las suposiciones del modelo?– Considere un modelo distinto.– Transforme los datos a fin de lograr normalidad.

Page 33: Web

DISEÑO POR BLOQUES ALEATORIOS

Page 34: Web

Diseños por bloques aleatorios

• Son aquellos en los que se introduce una variable “bloque”.

• Se denomina variable bloque a aquella variable o factor que se introduce en el experimento para obtener comparaciones homogéneas. La variable bloque es un factor que:– Suponemos (a priori) que influye en la variable de

respuesta. – No tiene interacción con el resto de factores

incluidos en el experimento.

Page 35: Web

Diseños por bloques aleatorios

• El diseño aleatorizado por bloques permiten remover el efecto del bloque y concentrarse en los efectos de la variable de interés.– De ahí, que se reduce el estimado de la varianza del

error.• Ejemplos:– Probar el efecto de métodos de enseñanza en

diferentes estudiantes.– Probar el efecto de los de materiales en varias

máquinas.– Probar el efecto de los fertilizantes en distintos tipos

de suelos.• Bloques: estudiantes, máquinas y suelos

Page 36: Web

Diseño por Bloques Aleatorios

• El modelo:

• Donde representa el efecto del bloque.

ijjiijY

i

Page 37: Web

Tabla ANOVA (Diseño por bloques aleatorios)

Fuente df SS MS F

Entre los bloques

n-1 SS bloques SS bloques/(n-1) MS bloques/MS error

Entre los tratamientos

k-1 SS tratamientos

SS tratamientos/(k-1) MS tratamientos/MS error

Error (n-1)(k-1) SS error SS error/(n-1)(k-1)

TOTAL nk-1 SS total

Page 38: Web

Ejemplo• El jefe de transporte de una firma, desea determinar si

el desgaste de 4 marcas de llantas es el mismo luego de haber utilizado las mismas por 20,000 Km.

• Las marcas a considerar son A, B, C y D. El jefe de transporte desea probar el desempeño de las llantas en las condiciones actuales de las vías que utilizan los cuatro camiones de la empresa.

• La tabla adjunta muestra la pérdida del labrado de las llantas por vehículo y por tipo de llanta.– Se puede confirmar la variación entre los vehículos de la

flota?– El desgaste de las llantas es el mismo para todas las

marcas?

Page 39: Web

EjemploVehículo 1 Vehículo 2 Vehículo 3 Vehículo 4

Distribución de marcas y desgaste del labrado

B(14) D(11) A(13) C(9)

C(12) C(12) B(13) D(9)

A(17) B(14) D(11) B(8)

D(13) A(14) C(10) A(13)

Page 40: Web

Anova: Ejemplo de Desgaste de Neumáticos

Analysis of Variance for Desgaste

Source DF SS MS F PVehículo 3 38,688 12,896 10,04 0,003Marc 3 30,688 10,229 7,96 0,007Error 9 11,563 1,285Total 15 80,938

Se rechaza la hipótesis de igualdad entre las

medias de desgaste por vehículo y por marca.

Page 41: Web

Ejemplo• Se desea determinar la efectividad

de un fertilizante orgánico en suelos de cultivo de un producto a lo largo del año. En la tabla adjunta se registra la efectividad del fertilizante en las cuatro estaciones del año: invierno, verano, otoño y primavera.

• Formule un modelo para este diseño• Describa sus hipótesis.• Analice los datos utilizando un

modelo aleatorizado por bloques y describa sus conclusiones.

• Revise la validez del modelo.

resp fert estación4,0 1 14,8 1 25,0 1 34,6 1 44,8 2 15,0 2 25,2 2 34,6 2 44,0 3 14,8 3 25,6 3 35,0 3 4

Page 42: Web

Anexos

Page 43: Web

Sofía A. López MSc.

Cartas de Control para la Media y el Rango

Tabla 1. Factores para límites de control en gráficos de medias y rangos

Gráfico de medias

Gráfico de Rangos

Tamaño de muestra n

Factor A2 Factor D3

Factor D4

2 1.88 0 3.27

3 1.02 0 2.57

4 0.73 0 2.28

5 0.58 0 2.11

6 0.48 0 2.00

7 0.42 0.08 1.92

8 0.37 0.14 1.86

9 0.34 0.18 1.82

10 0.31 0.22 1.78