unidad v

70
UNIDAD V ANÁLISIS DE DATOS EXPERIMENTALES POR MÍNIMOS CUADRADOS

Upload: thor-de-asgard

Post on 30-Jun-2015

350 views

Category:

Education


0 download

DESCRIPTION

Que el estudiante, se capacite en el tratamiento estadístico de datos experimentales utilizando el método de mínimos cuadrados. Explicar qué es un diagrama de dispersión y cuál es la causa de la dispersión de los datos en dicho diagrama

TRANSCRIPT

Page 1: Unidad V

UNIDAD V

ANÁLISIS DE DATOS EXPERIMENTALES

POR MÍNIMOS CUADRADOS

Page 2: Unidad V

CONTENIDO

5.1 Ajuste de Curvas

5.2 Análisis de Regresión

5.2.1 Métodos de Mínimos Cuadrados

5.2.2 Regresión Lineal

5.2.3 Regresión Curvilínea

5.2.3.1 Función Potencial: YC = a Xb

5.2.3.2 Función Exponencial: YC = a bx

Page 3: Unidad V

5.1 AJUSTE DE CURVAS

Uno de los objetivos en el análisis de resultados es el llegar a establecer una relación cuantitativa entre dos o más variables y mediante esta relación poder efectuar predicciones.

Por lo general la relación consiste en una ecuación que expresa cómo la variable dependiente (cuyo valor se desea predecir) es afectada por una o más variables independientes.

Page 4: Unidad V

En esta unidad se ilustra la forma de establecer la posible relación de una variable dependiente con otra variable considerada independiente. El primer paso es disponer de una colección de datos obtenidos experimentalmente. Si se simbolizan por X y Y las variables independiente y dependiente respectivamente, y sus valores particulares por X1, Y1, X2, Y2, etc., en una tabla se dispondrían así.

El siguiente paso es representar los puntos (X1, Y1 ), (X2, Y2) . . . . , (XN, YN) en un sistema de coordenadas rectangulares. El sistema de puntos resultantes se llama diagrama de dispersión.

Page 5: Unidad V

Con el diagrama de dispersión es posible representar una curva que se aproxime a los datos, es decir, que siga la tendencia de los mismos. Tal curva se llama curva de aproximación.

En la figura 5.1 (a) , por ejemplo, se ve que los datos experimentales se aproximan bien a una línea recta y se dice que entre las variables existe una relación lineal. En b), existe una relación no lineal.

Page 6: Unidad V

Las curvas mostradas en la Fig. 5.1 se denominan curvas de aproximación y describen la tendencia de los puntos en el diagrama de dispersión. El problema general de hallar la ecuación de la curva de aproximación que se ajuste mejor al conjunto de datos con los que se obtuvo el diagrama de dispersión se denomina determinación de la CURVA DE AJUSTE.

Una curva de aproximación como la de la Fig. 5.1 (a) sugiere una ecuación lineal; (ecuación de la recta) Y = a + bX; mientras que la de la curva en la Fig. 5.1 (b) sugiere una ecuación cuadrática (parabólica) de la forma Y = a + bX + cX2

Page 7: Unidad V

La dispersión de los puntos se debe a los errores que afectan en el proceso de medición tanto a la variable dependiente como a la independiente. En ocasiones puede despreciarse el error en la variable independiente al compararse con el error (o variación aleatoria) de la variable dependiente. Esto dependerá de la situación particular de las causas de error sobre cada variable al realizar el experimento.

Page 8: Unidad V

Ejemplo:

Del análisis de un fenómeno se obtuvieron los siguientes resultados.

Page 9: Unidad V
Page 10: Unidad V
Page 11: Unidad V

5.2 ANÁLISIS DE REGRESIÓN

Uno de los propósitos principales de la curva de ajuste es estimar una de las variables a partir de la otra. El proceso de estimación se conoce como regresión. Si Y se va a estimar a partir de X por medio de alguna ecuación la llamamos ecuación de regresión de Y sobre X y a la curva correspondiente curva de regresión de Y sobre X.

A continuación se presentan algunos ejemplos de relaciones denominadas funciones o ecuaciones de predicción:

Page 12: Unidad V

Línea Recta:Yc = a + bX

Ecuación de segundo grado o cuadrática:Yc = a + bX + cX2

 Ecuación potencial:

Yc = KXn o Yc = aXb

 Ecuación exponencial:

Yc = A DX o Yc = a bX

Page 13: Unidad V

En estos ejemplos, Yc representa el valor estimado de la variable dependiente a partir del valor X, de la variable independiente.

Existen varios métodos para determinar la ecuación de regresión. El "método de mínimos cuadrados", que se describe mas adelante, se considera el mejor; por fundamentarse en el tratamiento estadístico de los datos experimentales.

Page 14: Unidad V

Como se mencionó anteriormente, los errores afectan tanto a la variable independiente como a la variable dependiente, sin embargo en muy diversos casos la variable independiente puede considerarse sin error (o de error despreciable) y considerar que la dispersión es debido únicamente a los errores en la variable dependiente. En este caso se considera que para un valor puntual de X (sin error) el valor experimental de Y se aparta del valor que predice la curva de regresión.

Page 15: Unidad V

5.2.1 MÉTODO DE MÍNIMOS CUADRADOS

Generalmente, más de una curva de un tipo dado parece ajustarse a un conjunto de datos. Para evitar el juicio individual en la construcción de rectas, parábolas u otras curvas de aproximación, es necesario obtener una definición de la "mejor curva de ajuste", mejor parábola de ajuste," etc.

Considérese la Fig. 5.2 en la cual los puntos de un conjunto de datos (hipotéticamente experimentales) se expresan por (X1 , Y1), (X2, Y2) . . . . . (Xn, Yn).

Page 16: Unidad V

Para un valor dado de x, por ejemplo X1 habrá una diferencia entre el valor de Y1 y el valor correspondiente de la curva C.

Esta diferencia se denota por D1 y se conoce como desviación, error, o residuo y puede ser positivo, negativo o cero. Análogamente, correspondiendo a los valores X2 , X3 . . . , XN obtenemos las desviaciones D2 , D3 , . . . , DN

Page 17: Unidad V

Una medida de la "bondad de ajuste" de la curva C al conjunto de datos la suministra la cantidad D1

2 + D22 + ….. + DN

2. Si la suma es pequeña el ajuste es bueno, si es grande, el ajuste es malo.

Definición:

De todas las curvas de aproximación correspondientes a un conjunto de puntos dados, la curva que tenga la propiedad de que D1

2 + D22 + ….. + DN

2 es mínimo, se conoce como la mejor curva de ajuste.

Page 18: Unidad V

Una curva con esta propiedad se dice que ajusta los datos por mínimos cuadrados y se llama "Curva de regresión de mínimos cuadrados" o simplemente "Curva de mínimos cuadrados“.

Una recta con esta propiedad se llama recta de mínimos cuadrados, una parábola con esta propiedad se llama parábola de mínimos cuadrados, etc.

Page 19: Unidad V

5.2.2 REGRESIÓN LINEAL

Se aplica el método de mínimos cuadrados para determinar la ecuación de regresión. Para una relación lineal en general Yc = a + bX ; Yc representa el valor teórico de Yi ó el valor estimado de Y que corresponde a un valor particular de X.

El criterio de mínimos cuadrados requiere la determinación de los valores de "a" y "b" tal que Z = Σ(Yi - Yc)2 sea un mínimo (es decir, que tienda a cero). En la ecuación de la relación lineal "a" y "b" se denominan coeficientes de regresión:"a" es la intercepción con el eje de las ordenadas Y "b" es la pendiente de la línea, que mejor se ajusta.

Page 20: Unidad V

Como se busca la recta que mejor se ajuste a los puntos experimentales, el intercepto “a” y la pendiente “b” adquieren el carácter de variables; ya que estos parámetros son los que diferencian a una recta de otra.

Sea:Z = Σ(Yi - Yc)2

Sustituyendo Yc = a + bX

Z = Σ(Yi - a - bX)2

Debe ser un mínimo de acuerdo a la definición de mejor curva de ajuste (en este caso, mejor recta de ajuste).

Page 21: Unidad V

Utilizando el cálculo diferencial con derivadas parciales actuando sobre sumatorias, se llega a establecer un sistema de dos ecuaciones, denominadas ecuaciones normales para la regresión lineal o ecuaciones normales para la recta de mínimos cuadrados.

Donde n es el número de pares ordenados (X, Y) o número de puntos o número de observaciones, a y b son incógnitas que representan, como ya se mencionó, respectivamente, el intercepto y la pendiente de la recta de mínimos cuadrados.

Page 22: Unidad V

Para resolver estas ecuaciones se requiere obtener ΣX, ΣY, ΣXY y ΣX2

Simultaneando las ecuaciones (1) y (2), de manera literal, estás se disponen de la siguiente manera:

Page 23: Unidad V

Ejemplo:Se quiere determinar la constante “K” (N/m) de un resorte, a partir de la ley de Hooke. Para el experimento se dispone de diferentes masas y por cada variación de masa, se mide la deformación del resorte.

El equipo con el cual, se harán las pruebas se muestra a continuación:

Page 24: Unidad V

La tabla de datos, generada a partir de la observación es:

Considere las siguientes observaciones:La ley de Hooke: Fs = K*x (N)Aceleración de la gravedad: g = 9.78 m/s2

Construya preliminarmente la tabla de datos que relacione la fuerza con la deformación:

Page 25: Unidad V

La tabla de datos, generada a partir de la observación es:

Construya el diagrama de dispersión, para la relación entre las variables de fuerza contra deformación del resorte. Con esto se verificará la tendencia de los datos experimentados.

Page 26: Unidad V

Grafico:Diagrama de Dispersión

Page 27: Unidad V

Grafico:Curva de Aproximación

Page 28: Unidad V

Al analizar la dispersión de los datos y trazando la tendencia de ellos, podemos observar que es una relación lineal. Por lo consiguiente aplicaremos el método de mínimos cuadrados.

Acomodando las ecuaciones de mínimos cuadrados a las variables que poseemos en el experimento:

Construya la tabla para satisfacer las relaciones anteriores:

Page 29: Unidad V

Llenando la tabla con los datos requeridos:

Page 30: Unidad V

Resolviendo las ecuaciones de solución:

•Resolviendo para “a”

•Resolviendo para “b”

Page 31: Unidad V

Finalmente, la ecuación de regresión queda así:

Se tomaran dos de los datos de la variable independiente y se realizara una interpolación con la ecuación calculada (a través del método de mínimos cuadrados).

Este procedimiento se realizara para determinar la “Curva de regresión de mínimos cuadrados”

Page 32: Unidad V

Grafico:Curva de Regresión de Mínimos Cuadrados

Page 33: Unidad V

5.2.3 Regresión Curvilínea

5.2.3.1 Función potencial o curva geométrica: Yc = aXb

Aplicando logaritmo a la función Yc = aXb, tenemos:  Log Yc = Log a + b Log X

 Tal como hemos dicho anteriormente, la expresión (Log Yi - Log Yc)2 es un mínimo; sustituyendo en esta expresión Log Yc por su valor, tenemos:

  (Log Yi - Log a - b Log X)2 (es un mínimo)

Page 34: Unidad V

Al derivar parcialmente con respecto a "a" y respecto a "b" e igualar a cero las derivadas, obtenemos las ecuaciones normales siguientes:  Log Y = n Log a + b Log X (1)  Log X Log Y = Log a Log X + b (Log X)2 (2)

Despejando para “a” y “b” tenemos que:

Page 35: Unidad V

Ejemplo:

Una muestra de un gas ideal se expande, según la tabla de datos extraídos del experimento; el proceso se da en condiciones de cuasiequilibrio, para el cual podemos decir que la relación entre las variables es: P = kVb

Page 36: Unidad V

Grafico

Page 37: Unidad V

Grafico

Page 38: Unidad V

Relacionando las ecuaciones para determinar las variables “a” y “b”

Aplicándola a nuestras variables

Plantear la tabla en relación con las ecuaciones:

Page 39: Unidad V

Tabla con los datos obtenidos:

Sustituir los datos calculados en las ecuaciones, para determinar las constantes “k” y “b”

Page 40: Unidad V

•Calculo para determinar la constante “k”:

•Calculo para determinar la constante “b”:

Page 41: Unidad V

La Ecuación de regresión se puede expresar como:

De acuerdo al planteamiento anterior, la relación entre las variables se puede escribir de la siguiente manera:

(Pa)

Page 42: Unidad V

Curva de regresión parabólica de mínimos cuadrados

Page 43: Unidad V

5.2.3 REGRESIÓN CURVILÍNEA

5.2.3.2 Caso Exponencial: Yc = A DX

La función exponencial se presenta en multitud de fenómenos de crecimiento animal, vegetal, económico, físicos, etc. En todos ellos la variable mas usada es el tiempo. En el crecimiento exponencial, cada valor de “Y” se obtiene multiplicando el valor anterior por una cantidad constante “D”

Page 44: Unidad V

Donde “A” es el valor inicial para x=0, además, “A” es el factor por el que se multiplica en cada unidad de la variable independiente. Si 0 < D < 1 se trata de un decrecimiento exponencial. La función exponencial sirve para describir cualquier proceso que evolucione de modo que el aumento (o disminución) en un pequeño intervalo, sea proporcional a lo que había al comienzo del mismo.

Al aplicar cálculo integral, se llega a una expresión del tipo Y = A DX , que es una relación exponencial ya que x está como exponente de una base D.

Page 45: Unidad V

Para encontrar la función que mejor se ajusta a los resultados obtenidos, haremos uso de los mínimos cuadrados.

Aplicando logaritmo a Yc = ADX tenemos:

Log Yc = Log A + X Log D

 Como en los casos anteriores, interesa minimizar la expresión:  

Z = (Log Yi - Log a - X Log b)2

 

Page 46: Unidad V

Al derivar parcialmente con respecto a “A" y “D" e igualar a cero las derivadas llegamos a las siguientes ecuaciones normales:  Log Yi = n Log A + Log D Xi (1) X Log Yi = Log A Xi + Log D Xi

2 (2)

En este caso, X representa a la variable independiente, y Y es la variable dependiente. Despejando para “A” y “D”:

Page 47: Unidad V

Ejemplo:Se lleva a verificación la ley de enfriamiento de Newton y se dispone el equipo como se muestra en la figura. Luego que el termómetro alcanza el equilibrio en el medio ambiente, se obtuvieron los siguientes datos:

Page 48: Unidad V

Fundamento Teórico:La ley de enfriamiento de Newton se escribe como:

Donde:dT/dt: representa la rapidez del enfriamientoT: es la temperatura instantánea del cuerpoK: es una constante que define el ritmo del enfriamiento To: es la temperatura del ambiente

Si el cuerpo se enfría a partir de la temperatura Tm hasta una To y la ley de enfriamiento de Newton es válida para explicar su enfriamiento, la ecuación:

Page 49: Unidad V

Cuantificando el fenómeno, se recogieron los siguientes valores experimentales; donde cada cinco minutos se leía el termómetro expuesto al medio (To = 32 oC)

Page 50: Unidad V

Grafico de dispersión

Page 51: Unidad V

Curva de aproximación

Page 52: Unidad V

Relacionando las ecuaciones para determinar las variables “A” y “D” :

Aplicándola a nuestras variables:

Plantear la tabla en relación con las ecuaciones:

Page 53: Unidad V

Tabla con los datos obtenidos:

Page 54: Unidad V

Sustituir los datos calculados en la tabla, para las ecuaciones de mínimos cuadrados:

Page 55: Unidad V

De acuerdo al planteamiento anterior, la relación entre las variables se puede escribir de la siguiente manera:

Realizando la mejor curva de ajuste, a partir de la ecuación de ajuste

Page 56: Unidad V

Curva de regresión exponencial de mínimos cuadrados

Page 57: Unidad V

Calculo del porcentaje de error para “D”:

Page 58: Unidad V

UNIDAD V

ANÁLISIS DE DATOS EXPERIMENTALES

POR MÍNIMOS CUADRADOS(Ejercicios adicionales)

Page 59: Unidad V

Ejercicio 13

Un grupo de alumnos investigaron sobre el movimiento parabólico de un balín, los valores que obtuvieron se muestran en la tabla siguiente:

a.Diagrama de dispersión y dibujar curva de aprox.

b.Ecuación de regresiónc. Encontrar el error en el exponente

Page 60: Unidad V

a. Diagrama de dispersión y dibujar la curva de aprox.

Page 61: Unidad V

a. Diagrama de dispersión y dibujar la curva de aprox.

Page 62: Unidad V

b. Determinar ecuación de regresión que relaciona las variables X e Y

Construcción de tabla:

Page 63: Unidad V

Llenar los campos:

Ecuaciones normales:

Page 64: Unidad V

Calculo de constante “a”

Page 65: Unidad V

Calculo de constante “b”

Ecuación de ajuste:

Page 66: Unidad V

Curva de ajuste:

Page 67: Unidad V

Ejercicio 16:Un grupo de alumnos investigo la relación que existe entre la variación de temperatura y el tiempo que tarde en enfriarse hasta la temperatura ambiente

a. Hacer diagrama de dispersiónb. Dibujar curva de aproximaciónc. Determinar la ecuación de regresión

Page 68: Unidad V

a. Diagrama de dispersión.

Page 69: Unidad V

Curva de aproximación y ecuación de regresión.

Page 70: Unidad V

Curva de ajuste: