tema 2: métodos de ajuste. 1. el ajuste por mínimos cuadrados ¿por qué se ajusta? dado un...

18
Tema 2: Métodos de ajuste

Upload: reyna-lascano

Post on 22-Jan-2016

221 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

Tema 2: Métodos de ajuste

Page 2: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

1. El ajuste por mínimos cuadrados

¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes (x e y), con frecuencia se pretende condensar y resumir los datos en un ‘modelo’ que depende de parámetros ajustables.

A veces, un modelo es simplemente una clase de funciones convenientes, como polinomios o gaussianas, y el ajuste da los coeficientes apropiados.

Otras veces, los parámetros vienen dados por una teoría subyacente, y se trata de comprobar si los datos siguen la teoría.

Page 3: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

El procedimiento estándar es normalmente el mismo: se diseña una ‘figura de mérito’, que mide el acuerdo entre los datos y el modelo para una determinada elección de los parámetros. Los parámetros que dan un mínimo en la función de mérito son los parámetros óptimos de ajuste.

La obtención de los parámetros de ajuste no es suficiente. Un ajuste bien hecho debe tener tres resultados

1. Parámetros de ajuste.2. Error en la estimación de los parámetros3. Una medida estadística de la bondad del ajuste.

Page 4: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

Consideremos que disponemos de un conjunto de N datos del tipo

Supongamos que queremos ajustarlos a un modelo con M parámetros ajustables

El modelo será de la forma:

donde x es la variable independiente.

Page 5: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

¿Cuál es la ‘función de mérito’?

Consideremos los conocidos ‘mínimos cuadrados’:

Esta idea intuitiva se fundamenta en los estimadores de máxima similitud

En realidad, la función de mérito rigurosa es la Chi-cuadrado:

Page 6: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

2. Ajuste lineal por mínimos cuadrados

2.1 Ajuste a una recta

Modelo:

Función de mérito:

Page 7: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

Minimizamos la función de mérito:

Es decir, se trata de resolver un sistema de dos ecuaciones LINEALES con dos incógnitas, a y b

Page 8: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

Tenemos el objetivo 1). Faltan el 2) y el 3).

2) Error en los parámetros SI SE CONOCEN los i

3) Bondad de ajuste

con

Page 9: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

¿Y SI NO SE CONOCEN los i ?

La estimación de errores en los parámetros es más sutil

La bondad de ajuste NO es independiente de los valores de a y b

Nos falta un viejo amigo, el coeficiente de correlación lineal(también llamado chi-a-ojo)

r YA SUPONE QUE HAY BUENA CORRELACIÓN, y lo que hace es medir su fortaleza, no te dice la significación estadística de dicha correlación. Bajo ciertas condiciones (muchos datos, y distribuciones de x e y razonables), se puede estimar la probabilidad de que el valor de r se deba al azar:

Page 10: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

2.2 Ajuste lineal generalizado

¡La palabra lineal en realidad se refiere a la dependencia del modelo con los parámetros del mismo! Si la dependencia es lineal, entonces existe una solución exacta para encontrar los parámetros de ajuste!!!

Ejemplos:

En el caso general, se tendrá un modelo con M parámetros, cada uno de ellos acompañando linealmente a una función

cualquiera.

Page 11: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

La función de mérito es la misma de siempre:

Si se hace

se tiene un sistema de M ecuaciones lineales con M incógnitas (los M parámetros ak ), que se resuelve (analítica o numéricamente), pero cuya solución es EXACTA, es decir, encontramos el mínimo absoluto.

Page 12: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

Ejemplo:

Entonces:

Solución:

Page 13: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

En algunos softwares comerciales, a este procedimiento también se le llama regresión lineal múltiple, porque a cada función de x del modelo se le puede hacer corresponder una variable nueva.

Antes de pasar al ajuste no lineal, veamos algunos casos en los que no es necesario usarlo, porque en realidad se puede usar el lineal.

¡También hay que ser cuidadoso con el modelo, porque hay que definirlo bien!

Page 14: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

2.2 Ajuste no lineal

En este caso, el modelo tiene una dependencia no lineal con los parámetros inevitable

La función de mérito es la misma de siempre, Chi-cuadrado.

PERO ahora no se puede encontrar de forma exacta el mínimo, sino que se procede iterativamente a partir de una ESTIMACIÓN INICIAL de los parámetros.

Page 15: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

2.3 Método de Levenberg-Marquardt

Consiste en una estrategia inteligente para buscar el mínimo de Chi-cuadrado. Necesita calcular el gradiente y el hessiano de Chi-cuadrado con respecto a los parámetros, que dependen de las derivadas del modelo con respecto a los parámetros. Usa esa información para acercarse al mínimo.

No está garantizado que se encuentre el mínimo absoluto, puede haber una convergencia a un mínimo relativo. Ello depende de forma fundamental de la elección de parámetros iniciales.

La estrategia usual consiste en variar los parámetros iniciales, y probar a ver si se converge al mismo sitio. También se puede hacer ‘a ojo’, si se ve que el modelo ajusta razonablemente bien.

El software comercial bueno lo tiene implementado.

Page 16: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

Ahora es más complicado medir los errores en los parámetros y la bondad del ajuste, aunque en el software comercial ambos datos están disponibles.

En concreto, para la bondad del ajuste, se suele usar el llamado coeficiente de determinación, que mide la fracción de la variabilidad de los datos que es explicada por el modelo. Cuanto más cercano sea este coeficiente a la unidad, mejor es el modelo.

Page 17: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

Ejemplo: series de radiación solar normalizada

Modelo:

Otro ejemplo: desviación estándar de distribuciones correspondientes a energías de sólidos desordenados.Modelo:

Page 18: Tema 2: Métodos de ajuste. 1. El ajuste por mínimos cuadrados ¿Por qué se ajusta? Dado un conjunto de observaciones de dos magnitudes ( x e y ), con frecuencia

2.4 Criterios de creación y selección de modelos

No hay ninguna regla mágica, sólo algunas directrices generales:

• Si hay una teoría subyacente, usar el modelo correspondiente, a no ser que se pretenda demostrar que la teoría no es válida.

• A igualdad de ajuste, optar siempre por el modelo más sencillo, es decir, con menor número de parámetros.

• Es muy importante la INTUICIÓN, que es otra manera de llamar al conocimiento del comportamiento de las funciones elementales (polinomios, exponenciales, logaritmos, leyes de potencia, funciones usuales de probabilidad, etc). Ello ayudará al diseño del modelo adecuado para los datos disponibles.