guia de metodos cuantitativos

13
REGRESIÓN MÚLTIPLE. Muchos problemas de regresión involucran más de una variable regresiva, Tales modelos se denominan regresión múltiple. Como ejemplo, suponga que la vida útil de una herramienta de corte depende de la velocidad y del Angulo de corte. Un modelo de regresión múltiple que podría describir esta relación es y = b 0 + b 1 x 1 + b 2 x 2 + E Donde y representa la vida de la herramienta, x 1 la rapidez de corte y x 2 el ángulo de corte. Este es un modelo de regresión múltiple con dos regresores. El término lineal se emplea debido a que la ecuación anterior es la función lineal de los parámetros desconocidos b 0 , b 1 y b 2 . El parámetro b 0 define la ordenada al origen del plano. Alguna veces llamamos b1 y b2 coeficientes de regresión parciales, porque b1 mide el cambio esperado en y por un cambio unitario en x1 cuando x2 se mantiene constante, y b2 mide el cambio esperado en y por un cambio unitario en x2 cuando x1 se mantiene constante. En general, la variable dependiente o respuesta y puede relacionarse con k variables independientes. El modelo y = b 0 + b 1 x 1 + b 2 x 2 + ……. + b k x k + E Se denomina modelo de regresión múltiple con k variables independientes.

Upload: evervelasquez

Post on 14-Apr-2016

119 views

Category:

Documents


7 download

DESCRIPTION

Guia de metodos

TRANSCRIPT

Page 1: Guia de Metodos Cuantitativos

REGRESIÓN MÚLTIPLE. Muchos problemas de regresión involucran más de una variable regresiva, Tales modelos se denominan regresión múltiple. Como ejemplo, suponga que la vida útil de una herramienta de corte depende de la velocidad y del Angulo de corte. Un modelo de regresión múltiple que podría describir esta relación es y = b0 + b1 x1 + b2 x2 + E Donde y representa la vida de la herramienta, x1 la rapidez de corte y x2 el ángulo de corte. Este es un modelo de regresión múltiple con dos regresores. El término lineal se emplea debido a que la ecuación anterior es la función lineal de los parámetros desconocidos b0, b1 y b2. El parámetro b0 define la ordenada al origen del plano. Alguna veces llamamos b1 y b2 coeficientes de regresión parciales, porque b1 mide el cambio esperado en y por un cambio unitario en x1 cuando x2 se mantiene constante, y b2 mide el cambio esperado en y por un cambio unitario en x2 cuando x1 se mantiene constante. En general, la variable dependiente o respuesta y puede relacionarse con k variables independientes. El modelo y = b0 + b1 x1 + b2 x2 + ……. + bk xk + E Se denomina modelo de regresión múltiple con k variables independientes.

Page 2: Guia de Metodos Cuantitativos

TERMINOLOGÍA DE REGRESIÓN MÚLTIPLE. Variable de Respuesta (Y, ): El elemento de salida del proceso. Factor o Variable de Predicción (X): Variable incontrolada o controlada cuya influencia está siendo estudiada Espacio de Inferencia: Rango de operación de los factores estudiados. Adecuación: Valor pronosticado de la variable de respuesta, dada una combinación específica de configuraciones de los factores Residuales: La diferencia entre un valor adecuado (pronosticado) y un valor experimental real Multicolinearidad: Condición en la que dos o más variables predictoras (Variables X) se correlacionan entre sí R2: Medida de cuánta variación es explicada por medio de la ecuación de regresión. Es la suma de los cuadrados del modelo de regresión dividido entre la suma total de cuadrados. Su raíz cuadrada es el coeficiente de correlación “r" R2 Ajustado: Un valor ajustado que se usa para comparar los modelos con diferentes números de términos Estadística C-p de Mallows: Un parámetro de regresión usado para ayudar a determinar qué modelo de regresión múltiple debe elegirse (se desea baja; Pauta: desea C-p ≤ cantidad de términos en el modelo) VIF: Factor de inflación de la varianza. Calcula el grado de multicolinearidad Un VIF grande implica que al menos una variable es redundante VIF > 10: alto grado de multicolinearidad - (Ri2 > 9 ) VIF > 5: grado moderado de multicolinearidad (0.8 < Ri2 < 0.9) Pauta: Asegúrese de que VIF < 5 cuando sea posible y debe ser <10

Page 3: Guia de Metodos Cuantitativos

EJERCICIOS DE REGRESIÒN MULTIPLE 1.- Se piensa que la energía eléctrica que consume una planta química se relaciona con la temperatura ambiental promedio (X1), el número de días del mes (X2), la pureza promedio del producto (X3) y las toneladas del producto generadas (X4), se dispone de los datos históricos del año pasado, mismos que se presentan en la siguiente tabla.

Y X1 X2 X3 X4

240 25 24 91 100

236 31 21 90 95

290 45 24 88 110

274 60 25 87 88

301 65 25 91 94

316 72 26 94 99

300 80 25 87 97

296 84 25 86 96

267 75 24 88 110

276 60 25 91 105

288 50 25 90 100

261 38 23 89 98

A) Ajuste el modelo de regresión múltiple para estos datos B) Pruebe la significación del la regresión C) Calcule los residuos de éste modelo. Analice los residuos. D) Verifique la posibilidad de reducir el modelo y obtenga un pronóstico del

consumo de energía eléctrica para una temperatura promedio de 55, 22 días del mes, una pureza promedio del producto de 93 y 107 toneladas del producto generadas.

E) Determine selección hacia adelanta

Page 4: Guia de Metodos Cuantitativos

2.- Hald informa acerca de los datos relativos al desprendimiento de calor, en calorías por gramo de cemento (Y) para diversas cantidades de ingredientes (X1,X2,X2,X4) , los datos aparecen en la siguiente tabla.

Numero de observación

Y X1 X2 X3 X4

1 78.5 7 26 6 60

2 74.3 1 29 15 52

3 104.3 11 56 8 20

4 87.6 11 31 8 47

5 95.9 7 52 6 33

6 109.2 11 55 9 22

7 102.7 3 71 17 6

8 72.5 1 31 22 44

9 93.1 2 54 18 22

10 115.9 21 47 4 26

11 83.8 1 40 23 34

12 113.3 11 66 9 12

13 109.4 10 68 8 12

a) Ajuste un modelo de regresión múltiple de éstos datos. b) Pruebe la significación del modelo c) Construya los intervalos de confianza correspondientes al 95% d) Analice lo residuales, e) Determine selección hacia adelanta f) Pronostique una vez obtenidas las conclusiones de los puntos anteriores el

desprendimiento de calor por gramo de cemento si para los ingredientes x1, x2, x3, x4 son 5, 35,12 y 18 respectivamente.

Page 5: Guia de Metodos Cuantitativos

3.- Un embotellador de bebidas gaseosas analiza las rutas de servicio de las máquinas expendidotas en un sistema de distribución. Le interesa predecir el tiempo necesario para que el representante de ruta atienda las máquinas expendedoras en una tienda. Ésta actividad de servicio consiste en abastecer las máquinas con productos embotellados y algo de mantenimiento y limpieza. El Ingeniero Industrial responsable del estudio ha sugerido que las dos variables más importantes que afectan el tiempo de entrega (Y) son la cantidad de cajas de producto abastecido (X1) y la distancia caminada por el representante (X2). El ingeniero ha reunido 25 observaciones de tiempo de entrega que se muestran en la siguiente tabla.

Observación Tiempo de

entrega (min.) (Y) Cantidad de cajas

(X1) Distancia (pies)

X2

1 16.68 7 560

2 11.50 3 220

3 12.03 3 340

4 14.88 4 80

5 13.75 6 150

6 18.11 7 330

7 8.00 2 110

8 17.83 7 210

9 79.24 30 1460

10 21.50 5 605

11 40.33 16 688

12 21.00 10 215

13 13.50 4 255

14 19.75 6 462

15 24.00 9 448

16 29.00 10 776

17 15.35 6 200

18 19.00 7 132

19 9.50 3 36

20 35.10 17 740

21 17.90 10 140

22 52.32 26 810

23 18.75 9 450

24 19.83 8 635

25 10.75 4 150

a) Ajuste un modelo de regresión múltiple de éstos datos. b) Pruebe la significación del modelo c) Construya los intervalos de confianza correspondientes al 95% d) Analice lo residuales, e) Determine selección hacia adelante

Page 6: Guia de Metodos Cuantitativos

f) Pronostique una vez obtenidas las conclusiones de los puntos anteriores el tiempo de entrega para una cantidad de cajas de 15 y una distancia de 275 pies.

4.- En el área de desarrollo de una empresa se pretende obtener un nuevo polímetro de bajo peso molecular (Y1), de lograrse esto, se obtendría un polímetro que funcione como dispersante en la industria de la cerámica. De acuerdo a conocimientos técnicos que se tienen, se considera que los factores críticos son X1: persulfato de sodio (NaPS), X2: ácido hipofosforoso (H3PO2) y X3: isopropanol (IPA). Para encontrar las condiciones óptimas se realizó un experimento y se obtuvieron los siguientes datos (los valores de los factores están codificados). Además de Y1, se midió la viscosidad (Y2)

X1 X2 X3 Y1 Y2

0 0 0 8392 1075

-1 -1 0 9895 2325

1 -1 0 9204 1575

-1 1 0 7882 690

1 1 0 7105 420

-1 0 -1 8939 1188

1 0 -1 4548 930

0 0 0 8598 920

-1 0 1 9152 1275

1 0 1 8992 860

0 -1 -1 10504 5600

0 1 -1 7462 540

0 -1 1 9368 1225

0 1 1 7772 620

0 0 0 8440 1015

a) Ajuste el modelo de regresión múltiple para la variable Y1 b) Ajuste el modelo de regresión múltiple para la variable Y2 c) ¿El modelo explica la variación observada en Y1? Argumente con base en

significancia del modelo, residuales y coeficientes de determinación.

Page 7: Guia de Metodos Cuantitativos

5.- Suponga que el Gerente de ventas de una gran compañía distribuidora de partes para automóviles, desea calcular desde abril las ventas totales de la región. Según las ventas regionales, también pueden estimarse las ventas totales de la compañía. Sí, con base en la experiencia, se encuentra que los estimados de abril de las ventas anuales son razonablemente exactos, entonces en años futuros podría utilizarse el pronóstico de abril para revisar los planes de producción y mantener el inventario correcto en las tiendas al menudeo. Varios factores parecen estar relacionados con las ventas, incluyendo el número de tiendas al menudeo en la región que almacena las partes comercializadas por la compañía, el número de automóviles registrados en la zona hasta abril 1, y el ingreso personal total para el primer trimestre del año. Finalmente se seleccionaron cinco variables independientes como las más importantes (de acuerdo al gerente de ventas). Después se recopilaron datos para un año reciente. También se registraron las ventas anuales totales en ese año según cada región. Obsérvese en la tabla anexa que para la regresión 1 se tuvieron 1739 tiendas al menudeo que almacenan las partes de auto de la empresa, que hubo 9 270 000 automóviles registrados en la región hasta el 1 de abril y que las ventas para ese año fueron por $ 37 702 000 dólares.

Ventas anuales Y

Número de tiendas de menudeo

X1

N° de automóviles registrados (millones)

X2

Ingreso personal

(mmdd) X3

Antigüedad promedio

de los autos

(años) X4

N° de Supervisores

X5

37.702 1739 9.27 85.4 3.5 9.0

24.196 1221 5.86 60.7 5.0 5.0

32.055 1846 8.81 68.1 4.4 7.0

3.611 120 3.81 20.2 4.0 5.0

17.625 1096 10.31 33.8 3.5 7.0

45.919 2290 11.62 95.1 4.1 13.0

29.600 1687 8.96 69.3 4.1 15.0

8.114 241 6.28 16.3 5.9 11.0

20.116 649 7.77 34.9 5.5 16.0

12.994 1427 10.92 15.1 4.1 10.0

Page 8: Guia de Metodos Cuantitativos

6.- El señor Mike Wilde, es presidente del sindicato de profesores del distrito escolar de Ostego. Al prepararse para futuras negociaciones, al presidente le gustaría investigar la estructura de los sueldos de personal docente en el distrito. Considera que existen tres factores que afectan el pago laboral de un profesor: años de experiencia, una calificación de la efectividad en la enseñanza asignada por el director y si el profesor tiene o no grado de maestría. Una muestra aleatoria de 20 profesores dio como resultado los siguientes datos.

Sueldo (mdd) Y Años de

experiencia X1 Calificación de

director X2 Maestría X3

21.1 8 35 0

23.6 5 43 0

19.3 2 51 1

33.0 15 60 1

28.6 11 73 0

35.0 14 80 1

32.0 9 76 0

26.8 7 54 1

38.6 22 55 1

21.7 3 90 1

15.7 1 30 0

20.6 5 44 0

41.8 23 84 1

36.7 17 76 0

28.4 12 68 1

23.6 14 25 0

31.8 8 90 1

20.7 4 62 0

22.8 2 80 1

32.8 8 72 0

Maestría: 1 Sí 0 No Determine la ecuación de regresión, ¿Que sueldo estimaría usted para un profesor con cinco años de experiencia, una calificación de 60 dada por el director y sin maestría.

Page 9: Guia de Metodos Cuantitativos

7.- Un productor de comida para cerdos desea determinar que relación existe entre la edad de un cerdo cuando comienza a recibir un complemento alimenticio de reciente creación. El peso inicial del animal y el aumento de peso de un periodo de una semana con el complemento alimenticio. La siguiente información es el resultado de un estudio de ocho lechones.

Número de lechón Peso inicial (lbs) Edad inicial (semanas)

Aumento de peso

1 39 8 7

2 52 6 6

3 49 7 8

4 46 12 10

5 61 9 9

6 35 6 5

7 25 7 3

8 55 4 4

a) calcule la ecuación que mejor describa estas tres variables b) Cuánto podemos esperar que un cerdo aumente de peso en una semana

con el complemento alimenticio, si tiene nueve semanas de edad y pesa 48 libras.

8.- Walmart es una de las compañías más grandes y exitosas de Estados Unidos, con más de 2,400 tiendas en operación y ventas anuales por 82 mil millones de dólares. En el inicio la compañía daba una excelente tasa de rendimiento (ROE) a sus accionistas, pero su desempeño en este rubro ha decaído. Junto con el crecimiento rápido, la empresa se ha expandido más allá del concepto original de tienda y ahora incluye Sam’s Club que es una operación de margen muy bajo con fuerte rotación de inventario. Los siguientes datos muestran cifras para los anos fiscales que terminan en enero de la fecha mostrada, el inventario, el porcentaje de tiendas que eran Sam’s Club y ROE

Año Inventario miles de millones de dólares

Porcentaje Sam’s Club

ROE (%)

1985 1.2 1.5 36.7

1986 1.5 2.6 33.3

1987 2.2 4.8 35.2

1989 2.8 7.0 37.1

1990 3.6 7.7 37.1

1991 4.7 81 35.8

1992 6.2 8.6 32.6

1993 7.8 10.8 30.0

1994 9.8 12.2 28.5

1995 11.5 17.7 26.6

1996 14.4 17.7 24.9

Page 10: Guia de Metodos Cuantitativos

Desarrolle una ecuación de regresión múltiple para pronosticar ROE para Walmart con base en las dos variables dadas. Que consejo daría a los administradores de la empresa para aumentar ROE 9.- La reserva Federal de Estados Unidos realiza un estudio preliminar para determinar la relación entre ciertos indicadores económicos y el cambio porcentual anual en el producto interno bruto (PIB), dos de los indicadores examinados son el monto del déficit del gobierno federal (en miles de millones de dólares) y el promedio industrial Dow Jones (el valor medio del año). Los datos correspondientes a seis años son:

Y X1 X2

Cambio en el PIB Déficit federal Dow Jones

2.5 100 2,850

-1.0 400 2,100

4.0 120 3,300

1.0 200 2,400

1.5 180 2,550

3.0 80 2,700

¿Que porcentaje de cambio en el PIB se esperaría en un año en el cual el déficit federal fue de 240,000 millones de dólares y el promedio Dow Jones fue de 3,000? 10.- Un estudiante graduado que quiere comparar un auto Neptuno usado investigó los precios. Piensa que el año del modelo y el número de millas recorridas influyen en el precio de compra. Los datos siguientes corresponden a 10 autos con precio (Y) en miles de dólares, año (X1) y millas recorridas (X2) en miles. Encuentre la ecuación y pronostique cuanto pagaría si desea comprar un auto Neptuno 1991 con alrededor de 40,000 millas recorridas.

Y X1 X2

Precio en miles de dólares

Año Millas en miles

2.99 1987 55.6

6.02 1992 18.4

8.87 1993 21.3

3.92 1988 46.9

9.55 1994 11.8

9.05 1991 36.4

9.37 1992 28.2

4.20 1988 44.2

4.80 1989 34.9

5.74 1991 26.4

Page 11: Guia de Metodos Cuantitativos

11.- Una persona está pensando vender su casa. Con el fin de decidir el precio que pedirá por ella, ha reunido datos de 12 ventas recientes. Registró el precio de venta ( en miles de dólares) , el número de pies cuadrados de construcción (en ciento de pies cuadrados), el número de pisos, el número de baños y la antigüedad de la casa en años.

Precio de venta

Pies cuadrados

Pisos Baños Antigüedad

49.65 8.9 1 1 2

67.95 9.5 1 1 6

81.15 12.6 2 1.5 11

81.60 12.9 2 1.5 8

91.50 19.0 2 1.0 22

95.25 17.6 1 1.0 17

100.35 20.0 2 1.5 12

104.25 20.6 2 1.5 11

112.65 20.5 1 2.0 9

149.70 25.1 2 2.0 8

160.65 22.7 2 2.0 18

232.50 40.8 3 4.0 12

Si la casa de ésta persona tiene 1, 800 pies cuadrados (18 cientos de pies cuadrados), un piso, 1.5 baños y seis años de antigüedad, que precio de venta puede esperar 12.- Una industria acerera ha estado buscando los factores que influyen en la cantidad de acero (en millones de toneladas) que puede vender cada año. La administración sospecha que los siguientes son los factores principales: la tasa anual de inflación del país, el precio promedio por tonelada de acero importado que acota los precios (en dólares) y el número de automóviles ( en millones) que los fabricantes de autos de Estados Unidos planea producir ese año. Los datos son los siguientes:

Año

Y X1 X2 X3

Millones de toneladas vendidas

Tasa de Inflación

Cota de Importaciones

Número de automóviles

1993 4.2 3.1 3.10 6.2

1992 3.1 3.9 5.00 5.1

1991 4.0 7.5 2.20 5.7

1990 4.7 10.7 4.50 7.1

1989 4.3 15.5 4.35 6.5

1988 3.7 13.0 2.60 6.1

1987 3.5 11.0 3.05 5.9

Cuantas toneladas de acero esperará vender la compañía en un año en el que la tasa de inflación es de 7.1 los fabricantes de automóviles norteamericanos planean producir 6.0 millones de autos y la cota promedio del acero importado por tonelada de $3.50

Page 12: Guia de Metodos Cuantitativos

13.- El gerente de ventas distrital de un importante fabricante de automóviles está estudiando las ventas. Específicamente le gustaría determinar qué factores afectan el número de autos vendidos en una distribuidora. Para investigar, selecciona al azar 12 distribuidores. De ellos obtiene el número de vehículos vendidos el último mes, los minutos de publicidad radiofónica comprados en dicho periodo, el número de vendedores de tiempo completo empleados en la distribuidora, y si ésta se localiza en la ciudad o no. La información es la siguiente:

Autos vendidos en el último mes(Y)

Publicidad (X1)

Fuerza ventas (X2)

Ciudad (1:si, 2:no) (X3)

127 18 10 1

138 15 15 2

159 22 14 1

144 23 12 1

139 17 12 2

128 6 12 1

161 25 14 1

180 26 17 1

102 15 7 2

163 24 16 1

106 18 10 2

149 25 11 1

Page 13: Guia de Metodos Cuantitativos

14.- El señor Steve Douglas fue contratado como gerente en entrenamiento por una importante empresa financiera. Como primer proyecto, se le pidió que estudiara la utilidad bruta en la industria química. ¿Que factores afectan las utilidades en esa industria? Steve selecciona al azar una muestra de 16 compañías y obtiene datos respecto a la cantidad de empleados, el número de dividendos consecutivos pagados de acciones comunes, el valor total de inventario al inicio del presente año y la ganancia bruta de cada empresa. Sus descubrimientos son:

Compañía Ganancia bruta

(mmd) (Y) Número de empleados

(X1)

Dividendos consecutivos

(X2)

Inventario inicial (mmd)

(X3)

1 2800 140 12 1800

2 1300 65 21 320

3 1230 130 42 820

4 1600 115 80 76

5 4500 390 120 3600

6 5700 670 64 8400

7 3150 205 43 508

8 640 40 14 870

9 3400 480 88 5500

10 6700 810 98 9875

11 3700 120 44 6500

12 6440 590 110 9130

13 1280 440 38 1200

14 4160 280 24 890

15 3870 650 60 1200

16 980 150 24 1300

a) Determine la ecuación de regresión. La Master Chemical Company emplea 220 personas, ha pagado 64 dividendos consecutivos de acciones comunes y tiene un inventario valuado en $ 1 500,000 (dólares) al principio del año. ¿Cual es la ganancia bruta calculada?