tema2.1_problemas_regresion.pdf
TRANSCRIPT
-
Mnimos cuadrados 1
Universidad Politecnica de Cartagena
Dpto. Matematica Aplicada y Estadstica
Grado en Ingeniera de Edificacion
Estadstica Mnimos cuadrados
Problema 1
I.1 Un ingeniero estudia la relacion entre dos variables X e Y . Dispone de los valores
de Y para 15 valores de X, y sabe que la media y la varianza de los valores de X
valen x = 20, s2x = 4. Decide ajustar una recta de regresion y encuentra la ecuacion
siguiente:
y = 32 x
1. Cual es el signo de la correlacion entre X e Y ? Justifica tu respuesta.
2. Calcular la covarianza de X e Y.
3. Cuanto vale y?
Problema 2
I.2 Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la
corrosion. En un estudio se recocieron cinco especmenes de la aleacion a 7000 cada
uno durante un intervalo de tiempo distinto (x, en minutos). Despuees se midio
el potencial de pasivacion (y, en mV)- una medida de resistividad de la aleacion
cristalizada- para cada especimen. Los datos experimentales son los siguientes:
x 10 20 45 90 120
y -408 -400 -392 -379 -385
1. Suponiendo que la mejor forma de describir la relacion entre las variables es
lineal, ajustar una recta de regresion a los datos. Calcular r2 e interpretar el
resultado.
2. Cual es el potencial de pasivacion cuando el tiempo de recocido es de 30
minutos?
-
2 Mnimos cuadrados
Problema 3
I.1 En la direccion http://dataservice.eea.eu.int/dataservice/, se pueden encontrar los
datos de emision de CO2 por fuentes fosiles para los distintos paises europeos entre
los anos 1985 y 1997. Se indican a continuacion los datos de emision total de este
contaminante para Espana entre los anos 1990 y 1997.
Ano (X) 90 91 92 93 94 95 96 97
Emision total (Y ) 203.8 215.5 225.1 211.5 222.8 237.5 226.6 242.8
( Megatoneladas)
Se pueden utilizar las cantidades numericas siguientes:xi = 748;
x2i = 69980;
yi = 1785.6;
y2i = 399722;
xiyi = 167142
1. Realizar el ajuste lineal de la emision total en funcion del ano. Calcular el
valor de R2 y comentar la bondad del ajuste.
2. Segun nuestro modelo, se esta produciendo un aumento o un descenso de la
emision de CO2?
3. Segun nuestro modelo, cual sera la cantidad de CO2 emitida en 1998 por
Espana?
Problema 4
I.2. Los siguientes datos se refieren al crecimiento de una colonia de bacterias en un medio
de cultivo:
x 3 6 9 12 15 18
y 115000 147000 239000 356000 579000 864000
siendo x los das desde la inoculacion e y el numero de bacterias.
1. Representar y en funcion de x para verificar que es razonable ajustar una curva
exponencial.
2. Ajustar una curva exponencial a los datos.
3. Estimar, usando el modelo ajustado en el apartado anterior, el numero de
bacterias al termino de 20 das.
-
Mnimos cuadrados 3
Problema 6
I.2- La comision de comercio federal americana midio el numero de miligramos de tar (X)
y monoxido de carbono (C0) (Y ) por cigarrillo en las distintas marcas comerciales
disponibles. Se tomo una muestra de 12 marcas, obteniendo para cada una:
X 9 4 14 12 10 5 3 17 6 7 8 15
Y 6 6 14 12 12 7 4 18 8 8 13 13
a) Calcula el porcentaje de marcas con un nivel de C0 inferior a 8. Calcula los
cuartiles de la distribucion de X.
b) Ajusta una recta de regresion de Y sobre X y discute la bondad del ajuste.
(Ayuda:
x = 110;
y = 121;
xy = 1294
x2 = 1234;
y2 = 1411)
Problema 5
I.2.- En un estudio sobre la rapidez de combustion del grafito artificial en un flujo de aire
humedo, se llevo a cabo un experimento para investigar la difusividad del Oxgeno
a traves de una mezcla de vapor de agua. Para ello se prepararon muestras de
Nitrogeno y Oxgeno con una fraccion molar de agua de 0.017 a 9 temperaturas
distintas, midiendose la difusividad del Oxgeno en cada una, obteniendose:
Temperatura 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8
DifusividadO2 1.69 1.99 2.31 2.65 3.01 3.39 3.79 4.21 4.64
(a) Realice el diagrama de dispersion correspondiente. Es posible el ajuste de
un modelo de regresion lineal simple, que relacione la difusividad del O2 en
funcion de la temperatura? Como debe salir el coeficiente de correlacion?
(positivo, negativo, cerca de 0?).
(b) En caso afirmativo, obtener la correspondiente recta de regresion utilizando la
tecnica de los mnimos cuadrados.
(c) Hallar el coeficiente de determinacion r2 e interpretar su valor.
(d) Cual sera la prediccion sobre la difusividad del O2, para una temperatura de
3o a partir del modelo construido?.
-
4 Mnimos cuadrados
I.3.- Con el fin de determinar si existe relacion entre la cantidad de polmeros de latex
incluida durante el proceso de mezclado de cemento Portland y su resistencia adhe-
siva a tension, una empresa encargada de realizar certificaciones de obras toma una
muestra de tamano 10, obteniendo los siguientes resultados:
Polmeros latex (mgr/kg) 13.5 11.0 13.0 11.2 12.0 13.2 12.0 13.5 11.2 13.0
Resistencia (kgf/cm2) 17.5 16.6 17.2 16.6 17.0 17.3 16.9 17.3 16.8 17.1
(a) Calcular la media y varianza asociada a cada una de las variables.
(b) Calcular la covarianza existente entre ambas variables as como el coeficiente
de correlacion.
(c) Realizar un ajuste por mnimos cuadrados de la resistencia respeto a la cantidad
de polmeros anadida en la mezcla.
(d) Deducir, suponiendo que la relacion proporcionada por las rectas de regresion
es valida el valor estimado para la resistencia si la cantidad de polmero agre-
gado es de 11.5mgr/kg.
Problema 6
El rendimiento de una reaccion qumica depende de la concentracion del reactivo y de
la temperatura de la operacion.
Rendimiento Concentracion Temperatura
81 1.00 150
89 1.00 180
83 2.00 150
91 2.00 180
79 1.00 150
87 1.00 180
84 2.00 150
90 2.00 180
En el modelo de regresion del rendimiento sobre la temperatura y la concentracion,
-
Mnimos cuadrados 5
1. Cual es la matriz x de diseno?
2. Cuantas dimensiones tiene el espacio en el que podemos representar los datos?
3. Si la superficie ajustada tiene por ecuacion:
Rendimiento = 39.75 + 3 concentracion + 0.25 temperatura,
calcular los valores ajustados y los residuos.
Problema 7
Se tabulan los datos de un experimento obteniendo los resultados siguientes:
Y X1 X2 X3
3.81 1.00 2.50 15
8.92 1.00 1.80 18
8.33 2.00 1.50 15
9.61 2.00 1.83 18
Para cada uno de las formulas siguientes, dar la matriz de diseno asociada, determinar
el numero de dimensiones necesarias para representar los datos y especificar que tipo de
curva o superficie esta modelada por la formula:
1. Y = a0 + a1X1 + a2X2 + a3X3
2. Y = a0 + a1X2 + a3X3
3. Y = a0 + a1X1 + a2X21 + a3X3
4. Y = aX2 + b
5. Y = a0 + a1X1 + a2X21
6. Y = a1X1 + a3X3