caso 202 : calibrado para fosfato y predicción inversasimfit.usal.es/casos/simfit/caso202.pdfsi la...

7
Caso 202: Calibrado para fosfato y predicción inversa 1 Caso 202 : Calibrado para fosfato y predicción inversa (Regresión lineal con pesos estadísticos de réplicas) (F.J. Burguillo, USAL) Caso práctico El ajuste del caso 201, puede que nos parezca poco ortodoxo, ya que se ha “supuesto” que el error era el mismo en todas las medidas de absorbancias (error constante o desviación estándar constante), haciéndose por tanto un ajuste de regresión lineal sin pesos estadísticos (en realidad se trata de una regresión lineal con pesos constantes, ya que es como si se hubiera ponderado con w i = 1/1 2 =1). Pero esta suposición podría no ser correcta, de manera que lo mejor sería obtener unos nuevos datos experimentales, pero esta vez haciendo 4 réplicas de cada concentración. Supongamos que los datos obtenidos han sido los siguientes: De nuevo se desean analizar estos datos con el fin de construir una recta de calibrado del tipo ley de Beer con un término constante “C” de corrección por línea base (absorbancia de los reactivos): que en términos matemáticos podríamos escribir como la ecuación de una recta: Teoría El modelo de regresión de una variable dependiente “y” frente a una variable independiente “x” es de la forma: donde θ es un vector de parámetros desconocidos e independientes (θ 1 , θ 2 , θ 3 , .... θ P ) y e es el error experimental. Como es sabido, dados “n” pares de observaciones (x 1 ,y 1 ), (x 2 ,y 2 ), (x 3 ,y 3 ),...... (x n ,y n ), el método general de los mínimos cuadrados consiste en calcular el valor de los parámetros θ que minimice la suma de los residuales al cuadrado. Pero, para que el ajuste tenga las propiedades estadísticas adecuadas, es necesario que los errores ε i sigan una distribución normal de media cero (medidas no sesgadas) y varianza constante (medidas con misma precisión). Si la varianza de los errores no es constante, hay que utilizar la estrategia de los mínimos cuadrados ponderados (regresión lineal con pesos estadísticos), que consiste en calcular el valor de los parámetros θ " que minimizan la suma de los residuales al cuadrado ponderados con sus pesos estadísticos: [Fosfato] / mM Absorbancia 0.0100 0.185 0.0100 0.192 0.0100 0.191 0.0100 0.185 0.0400 0.298 0.0400 0.302 0.0400 0.301 0.0400 0.317 0.0800 0.456 0.0800 0.458 0.0800 0.421 0.0800 0.429 0.120 0.583 0.120 0.578 0.120 0.569 0.120 0.607 0.160 0.763 0.160 0.750 0.160 0.737 0.160 0.736 0.200 0.835 0.200 0.892 0.200 0.857 0.200 0.943 C x m y = [ ] C Fosfato a Absorbanci = l e e q = ) , ( x f y ( 2 ) , ( - = q xi f y w WSSQ i i

Upload: others

Post on 11-Sep-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

Caso 202: Calibrado para fosfato y predicción inversa 1

Caso 202 : Calibrado para fosfato y predicción inversa (Regresión lineal con pesos estadísticos de réplicas) (F.J. Burguillo, USAL)

Caso práctico

El ajuste del caso 201, puede que nos parezca poco ortodoxo, ya que se ha “supuesto” que el error era el mismo en todas las medidas de absorbancias (error constante o desviación estándar constante), haciéndose por tanto un ajuste de regresión lineal sin pesos estadísticos (en realidad se trata de una regresión lineal con pesos constantes, ya que es como si se hubiera ponderado con wi = 1/12 =1). Pero esta suposición podría no ser correcta, de manera que lo mejor sería obtener unos nuevos datos experimentales, pero esta vez haciendo 4 réplicas de cada concentración. Supongamos que los datos obtenidos han sido los siguientes:

De nuevo se desean analizar estos datos con el fin de construir una recta de calibrado del tipo ley de Beer con un término constante “C” de corrección por línea base (absorbancia de los reactivos):

que en términos matemáticos podríamos escribir como la ecuación de una recta:

Teoría

El modelo de regresión de una variable dependiente “y” frente a una variable independiente “x” es de la forma:

donde θ es un vector de parámetros desconocidos e independientes (θ1 , θ2 , θ3 , .... θP ) y ε es el error experimental. Como es sabido, dados “n” pares de observaciones (x1,y1), (x2,y2), (x3,y3),...... (xn,yn), el método general de los mínimos cuadrados consiste en calcular el

valor de los parámetros θ que minimice la suma de los residuales al cuadrado. Pero, para que el ajuste tenga las propiedades estadísticas adecuadas, es necesario que los errores εi sigan una distribución normal de media cero (medidas no sesgadas) y varianza constante (medidas con misma precisión). Si la varianza de los errores no es constante, hay que utilizar la estrategia de los mínimos cuadrados ponderados (regresión lineal con pesos estadísticos), que consiste en calcular el valor de los parámetros “θ" que minimizan la suma de los residuales al cuadrado ponderados con sus pesos estadísticos:

[Fosfato] / mM Absorbancia 0.0100 0.185 0.0100 0.192 0.0100 0.191 0.0100 0.185 0.0400 0.298 0.0400 0.302 0.0400 0.301 0.0400 0.317 0.0800 0.456 0.0800 0.458 0.0800 0.421 0.0800 0.429 0.120 0.583 0.120 0.578 0.120 0.569 0.120 0.607 0.160 0.763 0.160 0.750 0.160 0.737 0.160 0.736 0.200 0.835 0.200 0.892 0.200 0.857 0.200 0.943

Cxmy +⋅=

[ ] CFosfatoaAbsorbanci +⋅⋅= lε

εθ += ),(xfy

( )2),(∑ −= θxifywWSSQ ii

2 Caso 202: Calibrado para fosfato y predicción inversa

donde los pesos wi se toman igual al inverso de la varianza:

y donde WSSQ significa “suma de residuales al cuadrado con pesos estadísticos” (weighted sum of squares).

En realidad no suele ser posible conocer la varianza exacta σσi2, por lo que tendremos que

contentarnos con una estima de la misma, que se denota como si2, de forma que los pesos

estadísticos vendrán dados por:

donde si es la llamada desviación estándar de cada punto, obtenida en este caso a partir de las 4 réplicas experimentales que se han medido en cada punto. Hablaríamos, por tanto, de una regresión lineal con pesos estadísticos, calculados en base a desviaciones estándar “si” obtenidas de réplicas.

Procedimiento paso a paso

1.- Crear primero un archivo con los datos

• Seleccionar en el menú principal la opción “Archivo” > “Nuevo archivo tipo ajuste de curvas” > “MAKFIL”, para acceder al siguiente cuadro de opciones que nos ofrece varias posibilidades para introducir los datos:

En este caso nos interesa seleccionar el “introducir las “x” en orden creciente” y que “las “s” en lugar de teclearlas las calcule el programa”. • A continuación aparece un cuadro de dialogo donde se escribirá el nombre del directorio y

del archivo donde se desean guardar los datos (por ejemplo: c:\curso\caso202.dat) • Después de pulsar “OK” deberá ir contestando a preguntas sencillas que va haciendo el

programa, incluida la del número de pares de datos que se desean introducir, finalmente se despliega una pantalla tipo hoja de cáculo donde se teclean los datos x,y solamente.

• Al finalizar de introducir los datos, se pulsa “Guardar” y aparece la siguiente pantalla de

opciones, donde se selecciona “Calcular valores de s”

21 iiw σ=

21 ii sw =

Caso 202: Calibrado para fosfato y predicción inversa 1

• Seguidamente el programa ofrece diferentes opciones para calcular las “s” de los puntos:

en este caso debemos elegir la opción de “desviación estándar de la muestra”, ya que se disponen de réplicas para determinar la “s” a partir de ellas.

• Finalmente, se vuelve al menú anterior, donde podemos inspeccionar los datos eligiendo

“mostrar tabla”. Aparecerá una tabla con los valores “x,y” tecleados y sus “s” ya calculadas.

2.- AJUSTE DE LOS DATOS A UNA RECTA

• Seleccionar en el menú principal la opción “Ajustes”, seguida de la opción “Lineal; múltiple lineal y módulos GLM” y finalmente “Ejecutar”. El programa nos ofrece, para empezar, la posibilidad de guardar los resultados del ajuste en un archivo, contestaremos de momento que “no”.

• A continuación se despliega un submenú con todas las opciones disponibles:

4 Caso 202: Calibrado para fosfato y predicción inversa

Empezaremos seleccionando “Nuevos datos” para importar nuestro archivo de datos (caso2.dat), a continuación iremos respondiendo al programa en la forma usual y al volver al menú de partida seleccionaremos ahora la opción “Regresión lineal simple (recta)”

• Automáticamente el programa hace el ajuste de regresión lineal por mínimos cuadrados y

muestra la siguiente tabla con los resultados:

En esta tabla aparece, junto con el valor del parámetro, el error estándar (desviación estándar) asociado a ese parámetro, así como los límites de confianza al 95 % para dicho parámetro (horquilla de confianza). La tabla muestra también, en la última columna de la derecha, la probabilidad p de que el parámetro sea redundante, es decir que sea tan próximo a cero que no esté justificada su inclusión en la ecuación, cuando p< 0.05 se considera que el parámetro es significativamente distinto de cero (esta prueba se realiza con el test “t” de Student cuyo fundamento se verá mas adelante). En este caso ninguno de los 2 parámetros es redundante. Finalmente la tabla incluye el coeficiente de correlación al cuadrado (R2) y el coeficiente de correlación (R) .

En conclusión, la ecuación de la recta, cuando la concentración de fosfato se expresa en mM, sería ahora:

donde, como era de esperar, los parámetros de ajuste han variado ligeramente respecto al ajuste sin pesos estadísticos (caso 201). Ahora las desviaciones estándar de los parámetros son 0.037 para la pendiente y de 0.0020 para la ordenada en el origen, apreciablemente inferiores a las obtenidas en el ajuste del caso 201. Ahora el coeficiente de correlación es de 0.9964, diferente al del caso 1, como es lógico, ya que se trata de diferentes datos experimentales. Asimismo, los límites de confianza de los parámetros han mejorado mucho respecto a los observados en el caso 201, como cabía esperar, ya que ahora disponemos de 24 puntos experimentales frente a 6 y, al calcular estos límites a partir de la “t” de Student, un mayor número de puntos trae consigo una disminución de las horquillas de confianza. En resumen, esta estrategia de haber realizado réplicas de cada determinación experimental, nos ha permitido usar pesos estadísticos y nos ha proporcionado una recta de ajuste con menores desviaciones estándar para los parámetros. No obstante, las diferencias no han sido muy llamativas al tratarse de pocos puntos y a que los mismos no se desvían mucho de la linealidad. Ya se apreciarán diferencias mas grandes en otros ejercicios.

• El programa ofrece a continuación diferentes opciones, marcaremos las tres primeras, ya que ahora si que estamos interesados en hacer predicción inversa (calibración), es decir predecir la concentración de fosfato en una muestra a partir de su medida de absorbancia:

[ ] 152.069.3 +⋅= FosfatoaAbsorbanci

Caso 202: Calibrado para fosfato y predicción inversa 1

• Seguidamente el programa muestra diferentes opciones para representar los datos,

elegiremos “Gráfica ejes originales”:

Apareciendo a continuación una gráfica en la que figuran los puntos experimentales, el ajuste de la recta a los puntos y las bandas de confianza al 95 %, bandas que en este caso son muy estrechas debido a la precisión de esta técnica espectrofotométrica:

6 Caso 202: Calibrado para fosfato y predicción inversa

• Si se desea, esta gráfica se puede editar pulsando “Editar”, con el fin de modificar las escalas

y rotular los ejes. Si queremos imprimir la gráfica se pica en el botón Windows (impresora bajo Windows) y aparece un menú en el que basta seleccionar “Imprimir gráfico actual” para obtener la copia impresa.

• A nosotros nos interesa ahora mas predecir la concentración de fosfato en dos muestras a las

que hemos medido su absorbancia (predicción inversa o calibración). Para ello, el programa nos pregunta primero desde donde queremos introducir los valores de “y”, desde el terminal o

• desde un archivo preparado al efecto. Ahora lo más sencillo es seleccionar desde “Teclado”: • Hecho esto se despliega una tabla para teclear nuestros valores, imaginemos 0.231 y 0.472:

• A continuación el programa calcula los valores de “x” y sus límites de confianza asociados:

Caso 202: Calibrado para fosfato y predicción inversa 1

Como puede apreciarse, las predicciones están acompañadas de sus horquillas de confianza, límites que calcula el programa en base a las expresiones correspondientes de propagación del error y las desviaciones estándar de los parámetros. Después de pulsar OK, podemos abandonar el programa pulsando seguidamente “No” > “Salir”.