diseÑo experimental y optimizaciÓn de sistemas con

166
3 - METODOLOGÍA DE LA SUPERFICIE DE RESPUESTA (RSM) M.S Cámara M.M. De Zan L. Vera Candioti H. Goicoechea 2016 DISEÑO EXPERIMENTAL Y OPTIMIZACIÓN DE SISTEMAS CON MÚLTIPLES RESPUESTAS

Upload: others

Post on 04-Oct-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

3 - METODOLOGÍA DE LA SUPERFICIE DE RESPUESTA (RSM)

M.S Cámara – M.M. De Zan – L. Vera Candioti – H. Goicoechea

2016

DISEÑO EXPERIMENTAL Y OPTIMIZACIÓN DE SISTEMAS CON MÚLTIPLES RESPUESTAS

Conocer el funcionamiento de un sistema o proceso.

Encontrar las condiciones óptimas de funcionamiento.

Mejoras en costo, tiempo, eficiencia, productividad y /o calidad.

Conocimiento del sistema

Mejora de la calidad

Metodología de la superficie de respuesta (MSR)

Desarrollo teórico y primeras aplicaciones (década 1990)

o Box y Draper (1987) o Cornell (1991) o Montgomery y Myers (1996) o Araujo y Brereton (1996)

Aplicaciones en expansión (softwares comerciales)

o Procesos de fabricación industrial oQuímica oFarmacéutica oBiotecnologica

JMP-IN MINITAB STATISTICA STATGRAPHICS

DESIGN-EXPERT oAlimenticia oMetalúrgica oElectrónica

Originada por el trabajo de Box y Wilson (1951) Box, G. E. P., Wilson, K. G. (1951),“On the experimental attainment of

optimum conditions”, Journal of the Royal Statistical Society, B 13, 1-45

Metodología de la superficie de respuesta (MSR)

),( 21 xxfy

RESPUESTA

Analizar el comportamiento de una

x1 x2

Conjunto de técnicas matemáticas y estadísticas

MODELO Construir un

Datos experimentales

niveles

OPTIMIZAR DISEÑO DE

EXPERIMENTOS

Metodología de la superficie de respuesta (MSR)

Encontrar el

ÓPTIMO

Representación Gráfica del Modelo

),( 21 xxfy

Metodología de la superficie de respuesta (MSR)

Graficas de Contorno y Superficie de Respuesta P

rod

ucc

ión

de

alm

en

dra

s

Respuesta en el espacio

tridimensional para la

producción de almendras en función de los

fertilizantes utilizados

Gráficos de la MSR

Pro

du

cció

n d

e a

lme

nd

ras

Gráficas de Contorno y Superficie de Respuesta

Cada línea de contorno está formada por

todas las combinaciones de los factores que producen

una misma respuesta

Gráficos de la MSR

Design-Expert® Software

RendimientoDesign Points55.1

20.6

X1 = A: TemperaturaX2 = B: Tiempo

20.00 27.50 35.00 42.50 50.00

24.00

30.00

36.00

42.00

48.00

Rendimiento

A: Temperatura

B: T

iem

po

26.6

32.5

38.4 44.3

44.3

50.2

54.6

56.1

Gráfica de Contorno

Gráficos de la MSR

Gráfica de contornos

Superficie de Respuesta

Líneas de Isorespuesta

Óptimo de la Respuesta

Niveles óptimos de las variables

Gráficos de la MSR

Producción

Surfactante Factores Significativos

1 Temperatura 20- 60 ºC

2 Tiempo de incubación 24-48 hs

¡Optimizar el rendimiento!

Rangos

Experimentos exploratorios

Selección de factores

Buscando las mejores condiciones…

T (°C) Tpo (Hs) R (g/L)

20 24 20.6

24 24 26.1

28 24 32.0

32 24 36.3

36 24 39.2

40 24 42.0

44 24 42.9

48 24 43.8

52 24 42.5

56 24 41.2

Variaciones de temperatura

Condiciones óptimas de temperatura

T= 48° R= 43.8 g/L

Temperatura (ºC)

Ren

dim

ien

to

Grafica de respuesta univariada

Valor óptimo de temperatura

Sección transversal de la superficie de respuesta

ESTRATEGIA “OVAT”

Optimización univariada

T (°C) Tpo (Hs) R (g/L)

48 24 43.8

48 28 47.8

48 32 50.6

48 36 50.8

48 40 49.2

48 44 45.6

Variaciones de tiempo

R= 50.8 g/L

Condiciones óptimas

de tiempo a 48ºC

Tpo= 36 hs Tiempo (horas)

Re

nd

imie

nto

Grafica de respuesta univariada

Valor óptimo de tiempo

ESTRATEGIA “OVAT”

Sección transversal de la superficie de respuesta 16 experimentos sucesivos: varios días de trabajo

(se pueden hacer en simultáneo en bloques)

Optimización univariada

Variaciones simultáneas de tiempo y temperatura

T (°C) Tpo (Hs) R (g/L)

20 24 20.6

20 36 44.9

20 48 51.0

35 24 39.9

35 36 54.9

35 48 52.1

50 24 43.0

50 36 49.1

50 48 37.0

Predicción del óptimo por modelado:

Rendimiento = 56.2 g/L T= 34°, Tiempo= 40 hs

Re

nd

imie

nto

Valor óptimo de tiempo y temperatura

Grafica de superficie de respuesta

9 experimentos menor trabajo

Design-Expert® Software

RendimientoDesign Points55.1

20.6

X1 = A: TemperaturaX2 = B: Tiempo

20.00 27.50 35.00 42.50 50.00

24.00

30.00

36.00

42.00

48.00

Rendimiento

A: Temperatura

B: T

iem

po

26.6

32.5

38.4 44.3

44.3

50.2

54.6

56.1

mínimo

máximo

Design-Expert® Softw are

Area NAPRO

2.17954E+006

1.18672E+006

X1 = A: pH muestra

X2 = B: Stirring rate

Actual Factor

C: adición sal = 0.94

2.00 3.25 4.50 5.75 7.00

900.00

1000.00

1100.00

1200.00

1300.00Area NAPRO

1.25639E+006

1.25639E+006

1.5569E+006

1.5569E+006

1.85741E+006

1.85741E+006

2.15791E+006

2.45842E+006

1.62857E+006

1.62857E+006

1.72323E+006

1.72323E+006

1.41702E+006

1.41702E+006

Tiem

po

(ho

ras)

Grafica de contorno

Temperatura (ºC)

X 1 X 3

X 2

X 1 constante

X 1 X 2

X 3

X 2 constante X 3 constante

),....,( 1 kxxfy

Una misma RESPUESTA puede depender de más de dos factores

Técnicas de optimización

¿Cuál es el óptimo?

MSR y optimización

Design-Expert® Softw are

Area SUL

513107

333539

X1 = B: Stirring rate

X2 = C: adición sal

Actual Factor

A: pH muestra = 7.00

900.00 1000.00 1100.00 1200.00 1300.00

0.18

0.63

1.09

1.55

2.00Area SUL

320153

369177

418200

467223

516246

10.965

15.847

9.732

7.921

5.396

Design-Expert® Softw are

Area CBZ

Design Points

205584

153080

X1 = A: pH muestra

X2 = B: Stirring rate

Actual Factor

C: adición sal = 1.66

1.00 2.75 4.50 6.25 8.00

800.00

950.00

1100.00

1250.00

1400.00

187103

190356

193610

196863

20011680.61

60.20

45.89

30.94

15.53

Design-Expert® Softw are

Area PIR

239736

163579

X1 = A: pH muestra

X2 = C: adición sal

Actual Factor

B: Stirring rate = 1116.22

2.00 3.25 4.50 5.75 7.00

0.18

0.63

1.09

1.55

2.00Area PIR

168276

183461

198646

213831

229016160.09

120.74

89.61

59.75

30.84

El comportamiento óptimo de un SISTEMA puede depender de más

de una RESPUESTA.

Respuesta 1 Respuesta 3 Respuesta 2

Técnicas de optimización de respuestas múltiples

¿Cuál es el óptimo global?

Requerimientos y

pasos para la

aplicación

Creación de un Diseño de Experimentos Ajuste de un Modelo Utilización de una Técnica de Optimización

Explorar el modelo para obtener información sobre el óptimo

Requerimientos de la MSR

Diseño Modelo

No se le puede exigir al diseño más información de la que puede brindar

• Para construir un modelo se necesitan como mínimo la misma cantidad de puntos experimentales diferentes que coeficientes a estimar.

• Para evaluar la falta de ajuste se deben incluir repeticiones de un punto del diseño

22 121222110 xxxy

22 + pcentral

22 + pcentral + paxiales

curvaturaxxxy 121222110

2222

2111121222110 xxxxxy

? o ¿ 2222

2111 xx

Diseños y modelos matemáticos para la MSR

CONSTRUCCIÓN DE UN MODELO

Experimentos para optimizar la extracción de un alcaloide

pH (X1)

Temperatura (X2)

mg/g (y)

0 -1 43

-1 1 65

1 0 49

0 1 69

-1 -1 21

1 -1 43

1 1 62

-1 0 45

0 0 57

0 0 54

0 0 61

0 0 57

Lineal y= 52.2 + 3.8 x1

+ 14.8 x2

Lineal con Interacción y= 52.2 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

Cuadrático y= 56.9 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

- 9.2 (x1)2 - 0.2 (x2)2

Construcción del Modelo

Modelo SC gl MC F0 p (Ft >F0) R2aj

LINEAL 0.70

Regresión 1408 2 704.2 13.6 0.001 significativa

Error Residual 465.3 9 51.7

FAj 440.6 6 73.4 8.9 0.039 significativa

INTERACCION 0.77

Regresión 1565 3 521.5 13.5 0.002 significativa

Error Residual 309.1 8 38.6

FAj 284.3 5 56.87 6.8 0.070 en el límite

CUADRATICO 0.95

Regresión 1826 5 365.2 46.0 <0.001 significativa

Error Residual 47.9 6 7.9

FAj 22.8 3 761 0.91 0.526 no significativa

Error Puro 24.8 3 8.2

Elegir Modelo: mayor F0 de regresión menor F0 de Falta Ajuste mayor R2

aj

Evaluación del Modelo (ANOVA)

Pruebas de Hipótesis para los coeficientes del modelo

Modelo Cuadrático Completo

y = 56.9 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

- 9.2 (x1)2 - 0.2 (x2)2

¿Todos los términos son significativos? ¿Todos son importantes? ¿Todos aportan información?

Las Hipótesis que hay que probar son: 0 i 1 iH : 0 H : 0

i

0 0.05,k,n k 1

E

CMF F

CM

Significancia del Coeficiente:

i0 0.05,2,n k 1

E

ˆt t

CM

Evaluación del los Coeficientes

Modelo completo

Utilizar el modelo más simple que describa el comportamiento del

sistema

MODELO CUADRÁTICO

SC gl MC F0 p (Ft >F0)

Regresión 1826 5 365.2 46.0 <0.001

x1 88.2 1 88.2 11.1 0.016

x2 1320 1 1320 166 <0.001

x1 x2 156 1 156 19.7 0.004

(x1)2 228 1 228 28.8 0.002

(x2)2 0.17 1 0.17 0.02 0.889

Residual 47.9 6 7.9

LOF 22.8 3 761 0.91 0.526

Error Puro 24.8 3 8.2

Variable no significativa

Eliminar del modelo

Evaluación del los Coeficientes

Principio de

Parsimonia

Manual Eliminación Backward Modelo Completo Modelo Depurado

Adición Forward Modelo Reducido Modelo Depurado

Técnicas para depurar los Modelos

y = 56.9 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

- 9.2 (x1)2 - 0.2 (x2)2

CATEGORÍA DE LOS MODELOS

Modelo Completo Modelo Jerárquico Modelo Reducido y = 56.9 + 3.8 x1

+ 14.8 x2

- 6.2 x1 x2

- 9.2 (x1)2

y = 38.9 + 13.3 x1

- 0.3 x2

+ 0.1 x1 x2

- 9.2 (x1)2 - 1.2 (x2)2

y = 38.9 + 13.3 x1

- 9.2 (x1)2 - 1.2 (x2)2

y = 38.9 + 13.3 x1

- 0.3 x2

- 9.2 (x1)2 - 1.2 (x2)2

Un Modelo es Jerárquico cuando contiene todos los términos más simples que componen los términos de mayor orden que están en el modelo. Los modelos

jerárquicos tienen un comportamiento más estable que los no jerárquicos.

Se conserva el término de

primer orden

Categoría de los Modelos

00

k

i ii

y x

MODELO LINEAL o de PRIMER ORDEN

coeficiente del modelo que afecta al factor i ïx

0 término constante

Design-Expert® Software

T (A)1.51

0.77

X1 = B: pHX2 = C: Temp

Actual FactorsA: Apareante = 15.00D: Acetato = 60.00

3.000

3.250

3.500

3.750

4.000

25.00

28.75

32.50

36.25

40.00

1.090

1.123

1.155

1.188

1.220

R

esp

ue

sta

X2 X1

Para dos factores este modelo tiene 3 términos

Para k> 2 es un hiperplano

Modelos matemáticos para la MSR

00

k

i i ij i ji i j

y x x x

MODELO LINEAL CON INTERACCIÓN

coeficiente de interacción entre el factor y el factor ij ï jx x

Para dos factores este modelo tiene 4 términos

Design-Expert® Software

R (A)13.232

0.985

X1 = A: ApareanteX2 = D: Acetato

Actual FactorsB: pH = 3.500C: Temp = 32.50

12.00

16.50

21.00

25.50

30.00

20.00

52.50

85.00

117.5

150.0

0.0000

6.250

12.50

18.75

25.00

R

esp

ue

sta

X2 X1

Puede verse como X2 tiene distinto comportamiento

según X1

Modelos matemáticos para la MSR

2

00 1

k k

i i ii i ij i ji i i j

y x x x x

MODELO CUADRATICO o de SEGUNDO ORDEN

2 coeficiente que explica la curvatura del factor ii ix

Para dos factores este modelo tiene 6 términos

Design-Expert® Software

Dureza5.56

2.09

X1 = A: % ManitolX2 = B: %Camphor

-1.00

-0.50

0.00

0.50

1.00

-1.00 -0.50

0.00 0.50

1.00

2

2.925

3.85

4.775

5.7

D

ure

za

A: % Manitol

B: %Camphor

Modelos matemáticos para la MSR

MODELO CÚBICO o de TERCER ORDEN

Para dos factores este modelo tiene 10 términos

Design-Expert® Software

R382

1.33

X1 = A: AX2 = B: B

Actual FactorC: C = 0.00

-1.00

-0.50

0.00

0.50

1.00

-1.00

-0.50

0.00

0.50

1.00

-8

10.75

29.5

48.25

67

R

3

A: A B: B

1222212

21112

32222

31111

2222

2111211222110

xxxx

xxxxxxxxy

Modelos matemáticos para la MSR

1 Definir los objetivos de la optimización

2 Seleccionar los factores que resultan significativos

Plantear adecuadamente el PROBLEMA a resolver y seleccionar la RESPUESTA a evaluar

3 Establecer la Región de Operabilidad

Considerar las posibilidades instrumentales y la información sobre el sistema

4 Seleccionar un Entorno Experimental Definir la región del espacio de los factores en donde vamos a planear los experimentos

Pasos de la MSR

6 Elaborar un Modelo Matemático

Graficar la SUPERFICIE DE RESPUESTA y evaluar resultados

7 Localizar el Óptimo buscado para la Respuesta Utilizar herramientas gráficas y/o matemáticas para predecirlo.

8 Verificar experimentalmente Confirmar el valor de la respuesta utilizando los niveles óptimos de los factores

5 Construir un Diseño Experimental de Optimización

Recabar datos experimentales

Repetir los pasos 4 , 5 y 6 si fuera necesario

Pasos de la MSR

Si conocemos poco del sistema, el punto óptimo puede encontrarse fuera del entorno experimental inicial

Región de Operabilidad

Condiciones en donde el proceso o equipo puede ser

operado

Entorno Experimental

Limitado por los niveles seleccionados para los factores

X1

X2

X3

El Entorno Experimental debe moverse hacia la localización del óptimo

Región de operabilidad y entorno experimental

Diseño Experimental de Optimización

Modelo probable

Conocimiento previo del sistema

• Comportamiento esperado para la Respuesta • Localización probable del Óptimo

Primer orden Segundo orden

SI

NO

Determinación del Óptimo

Aproximación al Óptimo

Planificación de los experimentos

Diseño de Optimización de Primer Orden

Modelo de Primer Orden

Mover el Entorno Experimental en el sentido

del Óptimo

lineal

no lineal

Establecer Condiciones Óptimas

Aproximación al Óptimo

Experimentar

Evaluar curvatura

Localización del Óptimo

Diseño de Optimización de Segundo Orden

Modelo de Segundo Orden

Caracterizar la Superficie

Experimentar

La Metodología de Superficie de Respuesta puede ser una Técnica Secuencial

Aproximación al

óptimo con diseños

de primer orden

Objetivo: Aplicar experimentos que permitan moverse rápidamente a las proximidades del óptimo buscado para la respuesta.

Diseños Experimentales de Primer Orden

Técnica de

ESCALAMIENTO ASCENDENTE (o descendente)

Esta técnica opera “paso a paso” , programando el paso siguiente en función de los resultados del anterior

En cada paso se estudia una región relativamente pequeña.

Modelos de Primer Orden

APROXIMACIÓN AL ÓPTIMO: cuando no se sabe nada sobre el sistema a estudiar

SIMPLEX: Figura geométrica con k + 1 vértices (k: nº de factores)

Diseño SIMPLEX

factor 1

facto

r 2

factor 1

facto

r 2

factor 1

facto

r 2

FACTORIAL EN DOS NIVELES: se estudian todas las combinaciones de los factores en +1 y -1

factor 1

facto

r 2

Diseño para superficie de

respuesta de primer orden

Diseño SIMPLEX

Paso 1

Simplex Inicial: experimentos 1, 2 y 3

La peor respuesta es la del experimento 3 Buscar un opuesto

Diseño SIMPLEX en escalamiento

ascendente

Paso 2

Segundo Simplex : experimentos 1, 2 y 4

La peor respuesta es la del experimento 2

Método de Escalamiento Ascendente sin ajustar Modelo

DISEÑO SIMPLEX en ESCALAMIENTO ASCENDENTE

Buscar un opuesto

Paso 3

Tercer Simplex : experimentos 1, 4 y 5

La peor respuesta es la del experimento 1 Buscar un opuesto

Paso 4

Cuarto Simplex : experimentos 4, 5 y 6

Las peores respuestas son las 4 y 5 Buscar opuestos

Paso 5

Quinto Simplex : experimentos 5, 6 y 7

Sexto Simplex : experimentos 4, 6 y 8 La mejor respuesta es la 6

Seleccionar un Entorno Experimental para un Diseño de Segundo Orden que permita

localizar el Óptimo

Se recorre secuencialmente una trayectoria en sentido

de su máxima pendiente, es decir,

del mayor incremento o decremento de la

respuesta

ascenso

descenso

00

k

i ii

y x

Superficie ajustada con un Modelo de Primer Orden

Normal de la Superficie de

Respuesta ajustada

Método de la máxima pendiente

Design-Expert® Software

R155.1

20.6

X1 = A: AX2 = B: B

-1.000 -0.5000 0.0000 0.5000 1.000

-1.000

-0.5000

0.0000

0.5000

1.000

Respuesta

Factor 1

Fa

cto

r 2

54.04

55.58

Paso 1 Establecer el Punto Base, o Punto de Origen

Paso 2 Elaborar un Diseño

2k (-1, +1)

o Punto Central

(xi = xj =…..xk = 0) coincidente con el

Punto de Origen

o Réplicas en el Punto Central

Paso 3 Ajustar un modelo lineal, obtener la Superficie de Respuesta

y evaluar curvatura

j

i

Diseño Factorial en método de la

máxima pendiente

Paso 4 Se elige una de las variables como variable de apoyo y se

establece un tamaño de incremento o escalón para la misma.

1 jx

Paso 5 Calcular el

incremento para las otras variables

jiki

xx

jj

ii

;,....2,1

ˆ

ˆ

j

iix

ˆ

ˆ

Design-Expert® Software

R155.1

20.6

X1 = A: AX2 = B: B

-1.000 -0.5000 0.0000 0.5000 1.000

-1.000

-0.5000

0.0000

0.5000

1.000

Respuesta

Factor 1

Fa

cto

r 2

54.04

55.58

j

1 jx

i j

iix

ˆ

ˆ

kkjjii xxxy ˆ......ˆˆˆˆ0

Máxima Pendiente en el plano i x j

Design-Expert® Software

R155.1

20.6

X1 = A: AX2 = B: B

-1.000 -0.5000 0.0000 0.5000 1.000

-1.000

-0.5000

0.0000

0.5000

1.000

Respuesta

Factor 1

Fa

cto

r 2

54.04

55.58

j

iPendiente

ˆ

ˆ

Paso 6 Convertir cada incremento a valores naturales para obtener un punto experimental en el sentido de la máxima pendiente.

Paso 7 Continuar

experimentando en esta dirección hasta no observar más incrementos

Design-Expert® Software

R155.1

20.6

X1 = A: AX2 = B: B

-1.000 -0.5000 0.0000 0.5000 1.000

-1.000

-0.5000

0.0000

0.5000

1.000

Respuesta

Factor 1

Fa

cto

r 2

54.04

55.58

Paso 8 Crear un nuevo Diseño 2k con replicas en el punto central que debe coincidir con el último punto experimental de mejor respuesta.

Paso 9 Construir un

nuevo modelo de primer orden y evaluar curvatura

Paso 10 Experimentar en el

sentido de máximo ascenso del nuevo modelo hasta no obtener más incrementos.

Repetir Paso 8 y Paso 9 hasta encontrar curvatura significativa, o la respuesta óptima

Región del ÓPTIMO localizada

Optimización del rendimiento de una reacción de síntesis de un polímero

Primer entorno experimental: 30-40 minutos y 150-160ºC

Diseño factorial a dos nieles con cinco repeticiones del punto central

Variables Naturales Variables codificadas Respuesta

min ºC x1 X2 Rendimiento (%)

30 150 -1 -1 39.3

30 160 -1 1 40.0

40 150 1 -1 40.9

40 160 1 1 41.5

35 155 0 0 40.3

35 155 0 0 40.5

35 155 0 0 40.7

35 155 0 0 40.2

35 155 0 0 40.6

Punto de base u origen: 35 min a155 ºC

DISEÑO FACTORIAL en MÉTODO DE MÁXIMA PENDIENTE

Modelo Ajustado

1 2ˆ 40.44 0.775 0.325 y x x

Pruebas de Adecuación del Modelo Lineal

Modelo Significativo Falta de Ajuste No Significativa Interacción No Significativa Curvatura No Significativa

Trayectoria de Máximo Ascenso

o Pasa por el punto 40.44 o Tiene una Pendiente =0.325/0.775

j

iPendiente

ˆ

ˆ

Selección de un incremento base para una de las variables

1 1 5min x

Selección del incremento de la otra variable en función de la máxima pendiente en ascenso

2 1(0.325/0.775) 0.42 2º x x C

Incrementos Variables Naturales Variables codificadas Respuesta

min ºC x1 X2 Rendimiento (%)

Origen 35 155 0 0 40.5

O+Δ 40 157 1.00 0.42 49.5

O+2Δ 45 159 2.00 0.84 59.8

O+3Δ 50 161 3.00 1.26 70.4

O+4Δ 55 163 4.00 1.68 80.9

O+5Δ 60 165 5.00 2.10 75.1

Experimentos con pendiente en ascenso

Se crea un nuevo diseño alrededor del punto (55, 163)

Variables Naturales Variables codificadas Respuesta

min ºC x1 X2 Rendimiento (%)

50 158 -1 -1 76.5

50 168 -1 1 77.0

60 158 1 -1 78.0

60 168 1 1 79.5

55 163 0 0 81.2

55 163 0 0 80.5

55 163 0 0 80.7

55 163 0 0 80.9

55 163 0 0 80.6

Modelo Lineal

Pruebas de Adecuación del Modelo Lineal

Modelo No Significativo Falta de Ajuste Significativa Interacción No Significativa Curvatura Significativa

Modelo Cuadrático Pruebas de Adecuación del Modelo Cuadrático

Modelo Significativo Falta de Ajuste No Significativa Interacción No Significativa Curvatura Significativa

Proximidad del óptimo

Seleccionar entorno experimental para diseño de segundo orden

Diseños de

segundo orden

1 Proporcionar una distribución razonable de puntos de

datos en el Entorno Experimental

N min= 1 + 2k + k (k-1)/2

2 Generar datos que permitan el ajuste de un modelo

matemático de segundo orden

Estudiar cada factor en al menos tres niveles análisis de curvatura.

Tener una cantidad de puntos que permitan estimar todos los términos del modelo cuadrático.

Diseños experimentales de

segundo orden

k = 3

X1

X2

X3

X1x2 x1x3 x2x3

X1x2x3

X12 X22 X32

N min= 1 + 2k + k (k-1)/2 = 1 + 2.3 + 3 (3-1)/2 = 10

3 Posibilitar el estudio de la Idoneidad del Modelo y la

Falta de Ajuste.

Repeticiones del punto central o de otro punto (4-6).

N = N min + Co

4 Ser Eficiente para el cumplir con el objetivo propuesto

sin requerir demasiados puntos experimentales.

6 Posibilitar la realización de experimentos en Bloques:

5 Minimizar la Varianza de los Coeficientes de Regresión

del Modelo:

Ortogonalidad

Cuando es necesario bloquear el diseño, es importante mantener la ortogonalidad de los bloques.

El punto central debe distribuirse por igual entre los bloques.

A B A x B

1 1 1

-1 1 -1

1 -1 -1

-1 -1 1

A con B:

[1x1]+[(-1)x1]+[1x(-1)]+(-1)x(-1) = 0

0.437

0.437

Error Estándar del Modelo

7 Proporcionar un error de predicción estable en el

entorno experimental:

Rotabilidad

8 Permitir la creación secuencial a partir de diseños de

primer orden

9 Posibilitar la obtención de diseños aumentados

2k 3k

3k D-Optimal

Diseños

simétricos

Dos factores Tres factores

Punto central

• Se investigan todas las posibles combinaciones de los niveles de los factores

• Número de experimentos (N= 3k )

• El número de experimentos crece rápidamente con el número de factores

3 niveles por factor (-1, 0 , +1)

Diseño Factorial Completo a 3 niveles

Diseño cúbico, que responde al diseño factorial completo 2k

Punto central

Diseño estrella, a una distancia del centro.

•Compuesto por:

5 niveles por factor (-α, -1, 0, +1, +α)

• Número de experimentos (N = 2k +2k + C0)

Diseño Central Compuesto

Puede generarse a partir de un diseño factorial de primer orden anterior cuando se observa curvatura y quiere

estudiarse mejor esta región del espacio experimental

Diseño inicial Aumento del Diseño

curvatura

Factorial en dos niveles Estrella

Bloque 2 Bloque 1

2k + Co

2k+ Co

•Centrado en las caras

•Circunscripto

o Rotable

o Esférico

o Práctico

Los puntos estrella o puntos axiales pueden tomar distintas ubicaciones en el entorno experimental, a una

distancia α del centro del diseño

4factn

1

1

k

4 k

Entorno experimental esférico

Puntos axiales posibles experimentalmente

Cuasi-Rotables

5k

Diseño Central Compuesto centrado en las caras

α = 1.0 Se transforma en un diseño de tres niveles

El entorno experimental es más acotado

Es útil cuando en la práctica no se pueden modificar

fácilmente los niveles de los factores

Diseño Esférico Diseño Rotable Diseño Práctico

k Valor de alfa

2 1.414 1.414 1.189

3 1.732 1.682 1.316

4 2.000 2.000 1.414

5 2.236 2.378 1.495

Punto central

• Compuestos por la combinación de diseños factoriales a dos

niveles con diseños de bloques incompletos

• Número de experimentos (N = 2k (k−1) + c0 )

• Puede aplicarse para k ≥ 3

Tres factores

3 niveles por factor (-1, 0 , +1)

Diseño Box-Behnken

• El dominio experimental es muestreado de manera uniforme, los puntos experimentales son equidistantes entre si.

• Los factores varían en diferente número de niveles cada uno. Para un diseño de 3 factores el primero toma tres niveles, el segundo cinco y el

tercero siete

x2

• Número de experimentos (N= k2+k+Co)

0 0.5 -0.5 1.0 -1.0

0

1.0

-1.0

x1

Matriz de Doherlet

Central compuesto (CC) N = 2k +2k + C0

Factorial completo (FC) N = 3k

2

3

4

5

6

7

Box-Behnken (BB) N = 2k (k−1) + C0

más eficiente

Factores Coeficientes Puntos Experimentales(N) Eficiencia (E) (modelo cuadrático) (1 punto central)

6

10

15

21

28

36

9

15

25

43

77

143

9

27

81

243

729

2187

-

13

25

41

49

57

0.67

0.67

0.60

0.49

0.36

0.25

-

0.77

0.60

0.51

0.57

0.63

BB CC FC BB CC FC

0.67

0.37

0.18

0.08

0.04

0.02

La Eficiencia de un diseño está dada por el cociente entre el número de coeficientes estimados por el modelo y el numero

total de puntos experimentales

Eficiencia

Diseños

‘optimal’

Son Diseños NO Simétricos, logrados mediante algoritmos computacionales cuyo fin es

satisfacer condiciones establecidas por el operador, tales como:

Cantidad de puntos experimentales

Tipo de modelo a ajustar

Rangos de las variables

Regiones no posibles de ensayo

Diseños óptimos

1 Región Experimental Irregular.

2 Falta de Ajuste de Modelo Cuadrático.

3 Necesidad de reducir la cantidad de puntos

experimentales.

• Se dividen en distintos tipos, nombrados por las letras del alfabeto.

• El tipo de Diseño Óptimo se refiere a la propiedad o criterio que se pondera en el diseño.

Diseños óptimos

Es un diseño basado en el criterio de proporcionar

una buena estimación de los parámetros de

regresión para el modelo seleccionado.

11 Puntos Experimentales distintos

Se pierde Rotabilidad

Diseño D-optimal

Se crean ecuaciones para restringir el área donde el

sistema genera combinaciones no favorables

Región de alta presión

1.0 2.0 20.0

40.0

Flujo (mL/min)

% M

etO

H

Región favorable

Se seleccionan puntos experimentales con una

Distribución óptima desde el punto de vista estadístico.

Diseño D-optimal con restricciones

Puntos Seleccionados

Determinante de XTX máximo

Selección de puntos experimentales en dominio asimétrico

Buena estimación de coeficientes y error de

predicción más o menos estable.

Error estándar en un diseño central compuesto

Error estándar en un diseño central compuesto al que se quitaron dos puntos

por no poder operarse en esa región

Error estándar en un diseño central D-optimal con restricciones para evitar

esos dos puntos

ANEXO: Creando un D-Optimal con restricciones

Localización del

óptimo

Diseños Experimentales de Segundo Orden

Análisis canónico

Candidato al Óptimo

Modelo de Segundo Orden

Localización del Punto Estacionario

Análisis de cordillera

Buen ajuste y R2aj mayor a 70%

para PREDECIR

Es el punto del espacio de los factores en el cual el plano tangente a la superficie tiene pendiente igual a cero y es un

“candidato al óptimo”

Punto Estacionario

Punto de Respuesta Máxima

Punto de Respuesta Mínima

Punto Silla

Loma Valle Silla de montar

Cuando hay un punto silla la superficie sube o baja a partir del punto estacionario dependiendo de la dirección en la

que nos movemos

Punto Silla

0ˆ......ˆˆ21 kxyxyxy

2

00 1

k k

i i ii i ij i ji i i j

y x x x x

Paso 1 Ajustar un Modelo de Segundo Orden con niveles

codificados

Paso 2 Verificar el tipo de Superficie de Respuesta

obtenida Análisis gráfico Análisis canónico

Paso 3 Obtener el Punto Estacionario

Bxx' bx' 0ˆˆ y

En donde:

ˆ

ˆ

ˆ

b

x

1

2

k

1

2

k

x

x

x

β

β

β

kk

k

k

ˆsim

2ˆˆ

2ˆ...2ˆˆ

B 222

11211

Es el vector de los factores

Es el vector de los coeficientes de

regresión de primer orden

Es una matriz simétrica cuya diagonal principal está

formada por los coeficientes de los términos cuadráticos

puros

La derivada de la función respecto al vector x igualada a 0 es:

0Bx bx

2

y

bBx -1

02

1-

de donde puede calcularse el punto estacionario:

La respuesta predicha para el punto estacionario estará dada por:

0 o

1ˆy2

ox b

¿Qué tipo de punto estacionario es?

¿Es el óptimo que buscamos?

2 2 20 1 1 2 2 k k

ˆ ˆy y w w ..... w

0y Valor de la respuesta predicho por el modelo en el punto estacionario

iw Variables canónicas

i Autovalores de la matriz B

Forma Canónica del Modelo

Transformaciones de las variables codificadas

Análisis canónico

x1

x2 w2

w1

Punto estacionario

Origen del Diseño

Ecuación canónica: rotación y traslación de los ejes coordenados

Entorno Experimental

Cordillera de la Superficie

iPositivo para todas las i: Punto MÍNIMO VALLE

Negativo para toda i: Punto MÁXIMO LOMA

Ambos signos: Punto SILLA DE MONTAR

Formas clásicas

Punto Estacionario DENTRO del Entorno Experimental

Caracterización de la Superficie

Otras formas

Punto Estacionario FUERA del Entorno Experimental

iPositivo para todas las i: CRESTA DESCENDENTE

Negativo para toda i: CRESTA ASCENDENTE

Ambos signos: CORDILERA ESTACIONARIA

Caracterización de la Superficie

Design-Expert® Software

R155.1

20.6

X1 = A: AX2 = B: B

-0.50 0.13 0.75 1.38 2.00

-1.50

-1.13

-0.75

-0.38

0.00

R1

A: A

B: B

22.2

28.828.835.4

42

48.6

Design-Expert® Software

R155.1

20.6

X1 = A: AX2 = B: B

-0.50

0.13

0.75

1.38

2.00

-1.50

-1.13

-0.75

-0.38

0.00

0

14

28

42

56

R

1

A: A B: B

LOMA ASCENDENTE

¿Qué hacemos en este caso?

Seguimos experimentando en el sentido del óptimo, siempre que lo permitan las condiciones de operación del sistema.

Proponemos un óptimo alternativo, en donde la respuesta es favorable y las condiciones de operación son posibles

Design-Expert® Software

R110

3

X1 = A: AX2 = B: B

-1.00 -0.50 0.00 0.50 1.00

-1.50

-0.75

0.00

0.75

1.50

R1

A: AB

: B

2.42

2.42

3.94

3.94

5.45

5.45

6.97

6.97

8.48

8.48

Design-Expert® Software

R110

3

X1 = A: AX2 = B: B

-1.00

-0.50

0.00

0.50

1.00

-1.50

-0.75

0.00

0.75

1.50

0

2.5

5

7.5

10

R

1

A: A B: B

CORDILLERA ESTACIONARIA

¿Qué hacemos en este caso?

Podemos seleccionar el mejor punto desde el punto de vista operacional que de una respuesta satisfactoria.

En este caso habrá muchas soluciones posibles al problema y podemos decidir sobre la conveniencia del nivel de los factores

¿Qué hacemos cuando el punto estacionario no es el óptimo buscado?

Objetivo: MAXIMIZAR la Respuesta

Punto Estacionario

En este caso deberemos encontrar el mejor punto posible dentro del Entorno Experimental. Este punto se ubica en la cordillera de mayor

crecimiento de la superficie y se encuentra por el método conocido como “análisis de cordilleras”

LOCALIZACIÓN DEL ÓPTIMO- ANÁLISIS de CORDILLERA

Construir esferas (o círculos) concéntricas al centro del diseño

Objetivo: MAXIMIZAR la Respuesta

Centro del Diseño

Punto Óptimo en el Entorno Experimental

Puntos alternativos

Los softwares de optimización emplean ecuaciones matemáticas

para resolver este tipo de situaciones

Cordillera del sistema

El error de predicción de la respuesta es función del modelo postulado, el diseño y ubicación del punto

Está dado por el producto del Leverage en ese punto de la superficie

por el Error Experimental

expˆ VxLyV

El Intervalo de Confianza para la respuesta predicha puede

calcularse a partir de su desviación estándar

ySxtyIC ˆˆ)05.0(

Para estar seguros de haber encontrado un óptimo confiable para

nuestro sistema debemos tener en cuenta el error en la predicción

De una manera similar a cuando se obtiene la varianza en la

predicción en una curva de calibrado univariado

Error de predicción

Design-Expert® Software

StdErr of Design1.5

0.5

X1 = A: AX2 = B: B

Actual FactorC: C = 0.00

-1.00

-0.50

0.00

0.50

1.00

-1.00

-0.50

0.00

0.50

1.00

0.000

0.250

0.500

0.750

1.000

S

tdE

rr o

f D

esi

gn

A: A B: B

Leverage: función del diseño y del modelo ajustado

Design-Expert® SoftwareR1

Color points by value ofR1:

795.8

1

Run Number

Le

vera

ge

Leverage vs. Run

0.00

0.25

0.50

0.75

1.00

1 3 5 7 9 11 13 15 17

Design-Expert® SoftwareR1

Color points by value ofR1:

795.8

1

Run Number

Le

vera

ge

Leverage vs. Run

0.00

0.25

0.50

0.75

1.00

1 3 5 7 9 11 13 15 17

DCC

Modelo Lineal Modelo Cuadrático

puntos centrales

puntos axiales

Error de predicción

Diseños

De mezclas

En los casos estudiados hasta

ahora (deseños experimentales

para variables independientes),

cada variable podía tomar

cualquier valor dentro de su

rango, independientemente del

valor tomado or las otras

variables.

Euna mezcla tenemos la restricción

de que la suma de todos los

componentes sea 1 (o 100%). Es

decir no pueden ser variados

independientemente, ya que al

hacerlo se puede pasar el porcentaje

de 100.

1

1

0

0 S = 0

S = 1

S = 1

S = 2

S = 1

Como consecuancia, no es

posible aplicar a los

problemas de mezclas los

diseños vistos.

¿Cuando es necesario realizar diseños de mezclas?

Composición de azúcares (u otro nutriente) de un

medio de cultivo que exige que se cumpla cierto

valor de osmolaridad.

Mezcla de solventes en un proceso extractivo

(diferentes polaridades para diferentes compuestos

a extraer).

Composición de fases en cromatografía.

Diferentes ligandos de un comprimido

farmacéutico.

Constituyentes de un alimento.

Otros.

Cuando los factores analizados son componentes

de una mezcla, sus niveles no son

independientes entres si.

El espacio experimental es una figura que tiene

tantos vértices como componentes, en un espacio

cuya dimensionalidad es igual al número de

componentes menos uno.

La respuesta es una función de las proporciones

de los componentes.

• Tres componentes (3)

• Espacio experimental: triángulo

(cada vértice corresponde a un

componente puro)

• Dimensionalidad: 2

0 x1

1

0

x

2

1

X1+x2 = 1 • Dos componentes (2)

• Espacio experimental:

segmento de recta (cada extremo

corresponde a 100 % un

componente)

•Dimensionalidad: 1

1

0.5

0.33

0

• Cuatro componentes (4)

• Espacio experimental:

pirámide (cada vértice

corresponde a un

componente)

•Dimensionalidad: 3

Modelo clásico para un sistema lineal de 2

componentes:

y = b0 + b1 x1 + b2 x2

y = X b + e = ypred + e

=

(XTX)-1XT y = (XTX)-1XTX b

b = (XTX)-1XT y b = [b0 ; b1 ; b2 ]

ypred = X (XTX)-1XT y ypred = H y (H es conocida como matriz “hat” por sombrero)

Xb = X(XTX)-1XT y

Pero XTX es singular en un diseño de

mezclas

ya que x1+ x2 = 1

y = b0 + b1 x1 + b2 x2 + e

Si (x1+ x2= 1), podemos hacer:

ypred = b0 (x1+ x2)+ b1 x1 + b2 x2 (la suma no se altera)

ypred = (b0 + b1) x1 + (b0 + b2) x2

ypred = b1* x1 + b2 * x2

Si x1 = 1, x2 = 0, entonces y = b1*

Si x2 = 1, x1 = 0, entonces y = b2*

Con sólo dos experimentos se pueden calcular fácilmente los

coeficientes del “modelo lineal para dos componentes”

Reemplazando x12 = x1 (1- x2 ) y x2

2 = x2 (1- x1 ), se llega a :

ypred = b1* x1 + b2 * x2 + b12* x1 x2

Modelo cuadrático para dos componentes

De manera similar se puede llegar a:

ypred = b1* x1 + b2 * x2 + b3 * x3 + b12* x1 x2 + b13* x1 x3 +

+ b23* x2 x3

Modelo cuadrático para tres componentes

ypred = b1* x1 + b2* x2 + b3* x3 + b12* x1 x2 + b13* x1 x3 +

+ b23* x2 x3 + + b123* x1 x2 x3

Modelo cúbico especial para tres componentes

Modelo cuadrático cásico:

Yi = o + 1 X1 + 2 X2 + 12 X1 X2 + 11 X12 + 22 X2

2 + i

q

i

q

kjikjiijkjiijii xxxxxxy

1

Modelo de Scheffé:

Henry Scheffé (1907-1977)

Simplex Lattice Simplex Centroid

D-Optimal

Diseños utilizados

Ejemplo 1 Formulación del un comprimido

en que se busca la mejor mezcla de los tres

ligandos (90.8% del total): alfa-lactosa monohidratada

(X1), beta-lactosa anhidra (X2) y almidón de arroz

modificado (X3).

Respuestas: fuerza que hay que hacer para romper la

tableta (Y1), y la velocidad de disolución (Y2).

(R. Leardi / Analytica Chimica Acta 652 (2009) 161–172)

• Los coeficientes de los términos lineales

corresponden a la respuesta obtenida

con el componente puro.

Modelo obtenido para la primer respuesta:

• Los coeficientes de las interacciones dobles

indican el efecto sinérgico. En el ejemplo, si no

hubiera interacción, el valor debería ser el promedio de los

coeficientes para X1 y X2, es decir 72 [(31+113)/2]. Pero

es 120/4 (así se calcula el efecto en las interacciones

dobles, dividiendo por cuatro), es decir 30, o sea 42

unidades menos.b

• Los coeficientes de las interacciones triples se

calculan dividiendo por 27

• En la figura puede verse que X2 tiene el mayor efecto sobre Y1 y

éste es positivo.

• X1 tiene menor efecto, pero negativo (pasa de 70 a 31).

• X3 es el componente con menor efecto (pasa de 42 a 38).

• Observar que estos efectos no se corresponden con los

valores de los coeficientes!

Y1 = 39 (X2 = 0)

Y1 = 113

(X2 = 100%) Y1 = 70 (X1 = 0)

Y1 = 31

(X1 = 100%)

Y1 = 42 (X3 = 0)

Y1 = 38

(X3 = 100%)

Modelo obtenido para la segunda respuesta:

Mayor

respuesta para

la combinación

de ambos

factores

Ejemplo 2

Formulación de un comprimido

en el cual hay 20% de droga y el resto

corresponde a una mezcla de 3

excipientes:

1- Lactosa

2- Avicel PH 101 (una celulosa microcristalina)

3- Hidroximetilpropilcelulosa (HMPC)

Comprehensive Chemometrics. Vol 1, página 431

Se mide una propiedad:

Fuerza de rotura (kg) <1.30

Se quiere ajustar un modelo

cúbico especial

Ajuste de la primer respuesta Fuerza de rotura

La „interacción‟ BC se debe mantener para que el

modelo sea jerárquico

Gráfica de trazas: “Trace”

Es una especie de silueta de la superficie de respuesta.

Representa el efecto de cambiar cada componente en una línea imaginaria a partir de una mezcla referencia (el centroide)

Gráfica de trazas para el ejemplo 1

(Leardi)

Es un análisis similar al realizado anteriormente

Uso de restricciones

Ejemplo: es necesario

que los tres

componentes estén

siempre

A veces es necesario que nunca estén

en forma pura

¨Pseudocomponentes”

Ejemplo: Formulación de un

detergente midiendo dos

respuestas: viscosidad y turbidez

Restricciones:

• 3% ≤ A (agua) ≤ 8%

•2% ≤ B (alcohol) ≤ 4%

•2% ≤ C (urea) ≤ 4%

A+B+C=9%

Tutorial DExpert

Pseudocomponentes

Pseudocomponentes: diseño generado

Propiedades del diseño

Pseudocomponentes

Los vértices ya no son puros

Pseudocomponentes

Efluente de la

industria lechera

Efluente de la

industria

cervecera

Efluente de la

industria

azucarera

Optimization of the Bacillus thuringiensis var. kurstaki HD-1 d-endotoxins production by using experimental mixture design

and artificial neural networks. GA Moreira, GA Micheloud, AJ Beccaria, HC Goicoechea, Biochem. Eng. J., 2007, 35, 48-55.

Ejemplo usando efluentes industriales para un medio de cultivo

Modelos mixtos: mezcla-proceso

Mezcla-Mezcla (mezclas cruzadas)

Modelo mixto

Lineal x Lineal

Cuadrático x Cuadrático

y = f (x) x g (z)

y = (f1 x1 + f2 x2 + f3 x3) x (g1 z1 + g2 z2 + g3 z3)

y = (f1 x1 + f2 x2 + f3 x3) x g1 z1 + (f1 x1 + f2 x2 + f3 x3) x g2 z2 + (f1 x1

+ f2 x2 + f3 x3) x g3 z3

y = f1 x1 g1 z1 + f2 x2 g1 z1 + f3 x3 g1 z1 + f1 x1 g2 z2 + f2 x2 g2 z2 + f3

x3 g3 z3 + f1 x1 g3 z3 + f2 x2 g3 z3 + f3 x3 g3 z3

333332

3231

31

232322

2221

2113

1312

1211

11

zxbzxbzxb

zxbzxbzxbzxbzxbzxby

Modelo lineal mixto de mezclas cruzadas

para tres componentes

Ejemplo de uso en CE: optimización en la

separación de picos combinando dos variables de

proceso (pH y voltaje) y tres de mezclas (3

diferentes sales para los buffers)

Determinación de fluoroquinolonas por CE-DAD en

aguas

Se evaluó la separación de los 4 quinolonas fluoradas bajo diferentes soluciones

reguladoras compuestas por 3 naturalezas distintas de iones: fosfato, borato y

citrato, todas de sodio.

Enoxacina: ENO

Ciprofloxacina: CPF

Ofloxacina: OFN

Enrofloxacina: ENF

M.R. Alcaráz, L. vera-Candioti, MJ Culzoni, H.C. Goicoechea. Anal.

Bioanal. Chem. 406 (2014) 2571-2580.

Tipo de datos: CE-DAD

2 4

Se tiene como objetivo reducir tiempo de

análisis, pero asegurándose que no se toquen los

picos 2 y 4

Modelo mixto

Modelo mixto

Valor óptimo

(target): 2

Modelo mixto

Modelo mixto

Modelo mixto

Modelo mixto

Optimización de un medio de cultivo para la

producción de una proteína recombinante

C. Didier, M. Etcheverrigaray, R. Kratjie, H.C. Goicoechea, Chemom. Intell. Laborat. Syst. 86 (2007) 1

Modelo mixto

N sources C sources

Constrains

Modelo mixto

Optimización por

sectores

Modelo mixto

Commercial product

of high price

Developed product of

low price

Response Modelo F p Adj. R2 p-LOF

IVC QxQ 6.46 < 0.0001 0.722 0.307

qprot QxQ 8.39 < 0.0001 0.781 0.013

BA QxQ 11.04 < 0.0001 0.832 0.052

qlact QxQ 5.46 < 0.0001 0.679 0.233

qamo QxQ 2.85 0.0055 0.500 0.005

Modelo mixto

La MSR es una técnica sumamente

versátil que permite la utilización de

diferentes diseños experimentales y

herramientas estadísticas para resolver

problemas de optimización de sistemas.

Puede aplicarse a la optimización de

una única respuesta o a la optimización

simultanea de varias respuestas.

Conclusiones

El buen criterio del operador y el

correcto uso de la metodología son

fundamentales para arribar a conclusiones

correctas.

Una vez obtenidas las condiciones

óptimas de operación del sistema, según el

criterio establecido, las mismas deben

confirmarse experimentalmente.

Conclusiones

167