tema 2: métodos de ajuste. 1. el ajuste por mínimos cuadrados ¿por qué se ajusta? dado un...

Tema 2: Métodos de ajuste

1. El ajuste por mínimos cuadrados

¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes (x e y), con frecuencia se pretende condensar y resumir los datos en un ‘modelo’ que depende de parámetros ajustables.

A veces, un modelo es simplemente una clase de funciones convenientes, como polinomios o gaussianas, y el ajuste da los coeficientes apropiados.

Otras veces, los parámetros vienen dados por una teoría subyacente, y se trata de comprobar si los datos siguen la teoría.

El procedimiento estándar es normalmente el mismo: se diseña una ‘figura de mérito’, que mide el acuerdo entre los datos y el modelo para una determinada elección de los parámetros. Los parámetros que dan un mínimo en la función de mérito son los parámetros óptimos de ajuste.

La obtención de los parámetros de ajuste no es suficiente. Un ajuste bien hecho debe tener tres resultados

1. Parámetros de ajuste.2. Error en la estimación de los parámetros3. Una medida estadística de la bondad del ajuste.

Consideremos que disponemos de un conjunto de N datos del tipo

Supongamos que queremos ajustarlos a un modelo con M parámetros ajustables

El modelo será de la forma:

donde x es la variable independiente.

¿Cuál es la ‘función de mérito’?

Consideremos los conocidos ‘mínimos cuadrados’:

Esta idea intuitiva se fundamenta en los estimadores de máxima similitud

En realidad, la función de mérito rigurosa es la Chi-cuadrado:

2. Ajuste lineal por mínimos cuadrados

2.1 Ajuste a una recta

Modelo:

Función de mérito:

Minimizamos la función de mérito:

Es decir, se trata de resolver un sistema de dos ecuaciones LINEALES con dos incógnitas, a y b

Tenemos el objetivo 1). Faltan el 2) y el 3).

2) Error en los parámetros SI SE CONOCEN los i

3) Bondad de ajuste

con

¿Y SI NO SE CONOCEN los i ?

La estimación de errores en los parámetros es más sutil

La bondad de ajuste NO es independiente de los valores de a y b

Nos falta un viejo amigo, el coeficiente de correlación lineal(también llamado chi-a-ojo)

r YA SUPONE QUE HAY BUENA CORRELACIÓN, y lo que hace es medir su fortaleza, no te dice la significación estadística de dicha correlación. Bajo ciertas condiciones (muchos datos, y distribuciones de x e y razonables), se puede estimar la probabilidad de que el valor de r se deba al azar:

2.2 Ajuste lineal generalizado

¡La palabra lineal en realidad se refiere a la dependencia del modelo con los parámetros del mismo! Si la dependencia es lineal, entonces existe una solución exacta para encontrar los parámetros de ajuste!!!

Ejemplos:

En el caso general, se tendrá un modelo con M parámetros, cada uno de ellos acompañando linealmente a una función

cualquiera.

La función de mérito es la misma de siempre:

Si se hace

se tiene un sistema de M ecuaciones lineales con M incógnitas (los M parámetros ak ), que se resuelve (analítica o numéricamente), pero cuya solución es EXACTA, es decir, encontramos el mínimo absoluto.

Ejemplo:

Entonces:

Solución:

En algunos softwares comerciales, a este procedimiento también se le llama regresión lineal múltiple, porque a cada función de x del modelo se le puede hacer corresponder una variable nueva.

Antes de pasar al ajuste no lineal, veamos algunos casos en los que no es necesario usarlo, porque en realidad se puede usar el lineal.

¡También hay que ser cuidadoso con el modelo, porque hay que definirlo bien!

2.2 Ajuste no lineal

En este caso, el modelo tiene una dependencia no lineal con los parámetros inevitable

La función de mérito es la misma de siempre, Chi-cuadrado.

PERO ahora no se puede encontrar de forma exacta el mínimo, sino que se procede iterativamente a partir de una ESTIMACIÓN INICIAL de los parámetros.

2.3 Método de Levenberg-Marquardt

Consiste en una estrategia inteligente para buscar el mínimo de Chi-cuadrado. Necesita calcular el gradiente y el hessiano de Chi-cuadrado con respecto a los parámetros, que dependen de las derivadas del modelo con respecto a los parámetros. Usa esa información para acercarse al mínimo.

No está garantizado que se encuentre el mínimo absoluto, puede haber una convergencia a un mínimo relativo. Ello depende de forma fundamental de la elección de parámetros iniciales.

La estrategia usual consiste en variar los parámetros iniciales, y probar a ver si se converge al mismo sitio. También se puede hacer ‘a ojo’, si se ve que el modelo ajusta razonablemente bien.

El software comercial bueno lo tiene implementado.

Ahora es más complicado medir los errores en los parámetros y la bondad del ajuste, aunque en el software comercial ambos datos están disponibles.

En concreto, para la bondad del ajuste, se suele usar el llamado coeficiente de determinación, que mide la fracción de la variabilidad de los datos que es explicada por el modelo. Cuanto más cercano sea este coeficiente a la unidad, mejor es el modelo.

Ejemplo: series de radiación solar normalizada

Modelo:

Otro ejemplo: desviación estándar de distribuciones correspondientes a energías de sólidos desordenados.Modelo:

2.4 Criterios de creación y selección de modelos

No hay ninguna regla mágica, sólo algunas directrices generales:

• Si hay una teoría subyacente, usar el modelo correspondiente, a no ser que se pretenda demostrar que la teoría no es válida.

• A igualdad de ajuste, optar siempre por el modelo más sencillo, es decir, con menor número de parámetros.

• Es muy importante la INTUICIÓN, que es otra manera de llamar al conocimiento del comportamiento de las funciones elementales (polinomios, exponenciales, logaritmos, leyes de potencia, funciones usuales de probabilidad, etc). Ello ayudará al diseño del modelo adecuado para los datos disponibles.

tema 2: métodos de ajuste. 1. el ajuste por mínimos cuadrados ¿por qué se ajusta? dado un...

Documents