mic sesión 11

29
MÉTODOS DE INVESTIGACIÓN CUANTITATIVA Sesión 11 MODELO DE REGRESIÓN LINEAL GENERAL (Ejercicios) FÁTIMA PONCE REGALADO 1

Upload: metodoscuantitativos

Post on 21-Jan-2017

42 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Mic sesión 11

MÉTODOS DE INVESTIGACIÓN CUANTITATIVA

Sesión 11

MODELO DE REGRESIÓN LINEAL GENERAL (Ejercicios)

FÁTIMA PONCE REGALADO 1

Page 2: Mic sesión 11

2

PUNTOS A TRATAR

FÁTIMA PONCE REGALADO

MODELO DE REGRESIÓN LINEAL GENERAL (Ejercicios).

Aplicación 1: Uso del excel.

Aplicación 2: Uso del excel y del Eviews.

Comparación de Modelos.

Page 3: Mic sesión 11

3FÁTIMA PONCE REGALADO

APLICACIÓN 1 (1/8)(Anderson et al, 15.5)

El dueño de la empresa Movie desea estimar el ingreso bruto semanal en función de los gastos de publicidad. En el archivo Movie.xlsx se presentan los datos históricos de 10 semanas.

Ingreso Semanal bruto (en miles de

$)Publicidad en TV (en miles de $)

Publicidad en Periódicos (en

Miles de $)

96 5 1.590 2 295 4 1.592 2.5 2.595 3 3.394 3.5 2.394 2.5 4.294 3 2.593 3 2.595 3.2 2.8

Page 4: Mic sesión 11

4FÁTIMA PONCE REGALADO

APLICACIÓN 1 (2/8)

a) MODELO BIVARIADO: Obtenga una ecuación de regresión estimada en la que el monto gastado en publicidad en TV sea la variable independiente. ¿Qué tan bueno es el modelo económica y estadísticamente (al 5%)?

b) MODELO MULTIVARIADO: Obtenga una ecuación de regresión estimada en la que el monto gastado en publicidad en TV y en periódicos sean las variables independientes. ¿Qué tan bueno es el modelo económica y estadísticamente (al 5%)?

c) COMPARE MODELOS: ¿Cual de los 2 modelos estimados es mejor?, por qué?

Page 5: Mic sesión 11

5FÁTIMA PONCE REGALADO

APLICACIÓN 1 (3/8)REGRESIÓN EN EXCEL

Para realizar regresión en EXCEL emplear comando DATOS / ANALISIS DE DATOS Escoger REGRESIÓN:

Page 6: Mic sesión 11

6FÁTIMA PONCE REGALADO

APLICACIÓN 1 (4/8)REGRESIÓN EN EXCEL

Rango de datos de la variable dependiente

Rango de datos de la(s) variable(s) independientes

Presenta cuadro con los errores estimados y valor de Yestimado.

Page 7: Mic sesión 11

7FÁTIMA PONCE REGALADO

APLICACIÓN 1 (5/8)

MODELOBIVARIADO

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.7869Coeficiente de determinación R^2 0.6191R^2 ajustado 0.5715Error típico 1.1463Observaciones 10

ANÁLISIS DE VARIANZA

 Grados de

libertadSuma de

cuadrados

Promedio de los

cuadrados FValor crítico

de FRegresión 1 17.0884 17.0884 13.0053 0.0069Residuos 8 10.5116 1.3140Total 9 27.6     

  Coeficientes Error típico Estadístico t Probabilidad

Intercepción 88.6605 1.4705 60.2919 6.3637E-12Publicidad en TV (en miles de $) 1.6213 0.4496 3.6063 0.00691881

Modelo es bueno estadísticamente, a nivel de t y F

Existe relación positiva entre publicidad en TV e ingresos brutos semanales.

Page 8: Mic sesión 11

8FÁTIMA PONCE REGALADO

APLICACIÓN 1 (6/8)

MODELOMÚLTIPLE

Resumen

Estadísticas de la regresiónCoeficiente de correlación múltiple 0.9482Coeficiente de determinación R^2 0.8990R^2 ajustado 0.8702Error típico 0.6310Observaciones 10

ANÁLISIS DE VARIANZA

 Grados de

libertadSuma de

cuadradosPromedio de los

cuadrados FValor

crítico de FRegresión 2 24.8129 12.4064 31.1591 0.0003Residuos 7 2.7871 0.3982Total 9 27.6      

  Coeficientes Error típico Estadístico t ProbabilidadIntercepción 82.9513 1.5282 54.2803 1.8883E-10Publicidad en TV (en miles de $) 2.3386 0.2963 7.8938 9.9259E-05

Publicidad en Periódicos (en miles de $) 1.3687 0.3107 4.4046 0.00313941

Este modelo es mejor que el bivariado pues tiene mayor R2 ajustado

Modelo es bueno económica (signos correctos de betas) y estadísticamente.

Page 9: Mic sesión 11

9FÁTIMA PONCE REGALADO

APLICACIÓN 1 (7/8)

d) INTERPRETACIÓN DEL β (pendiente): ¿Es el coeficiente correspondiente a los gastos de publicidad en TV de la ec. de regresión estimada del inciso a) igual al del inciso b)?. Interprete este coeficiente en cada caso.

e) USO DE LA ESTIMACIÓN: ¿Cuál es el ingreso semanal bruto en una semana en la que se gastan $3500 en publicidad en TV y $1800 en publicidad en periódicos?

f) PREDICCIÓN: ¿Cuál sería el ingreso bruto esperado por el empresario si se espera gastar la siguiente semana $ 3200 en publicidad en TV (3.2 miles) y $ 2100 en publicidad en periódicos (2.1 mil)?

Page 10: Mic sesión 11

10FÁTIMA PONCE REGALADO

APLICACIÓN 1 (8/8)d) INTERPRETACIÓN DEL β (pendiente): El coeficiente nos dice

el cambio marginal o neto en los ingresos semanales ante el cambio de $ 1000 en gastos de publicidad en TV, pero su valor es diferente en ambas ecs. de regresión estimada, en a) =1.6213 y en b) =2.3386.

e) USO DE LA ESTIMACIÓN: El ingreso semanal bruto en una semana en la que se gastan $3500 en publicidad en TV y $1800 en publicidad en periódicos es:

82.9513 + 2.3386 (3.5) + 1.3687 (1.8) = 93.6 miles $

f) PREDICCIÓN: El ingreso bruto esperado por el empresario si se espera gastar la siguiente semana $ 3200 en publicidad en TV (3.2 miles) y $ 2100 en publicidad en periódicos (2.1 mil) es:

82.9513 + 2.3386 (3.2) + 1.3687 (2.1) = 93.3 miles $

Page 11: Mic sesión 11

11FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) preg 13-20)

Rick está pensando en vender su casa. Con el fin de decidir el precio que pedirá por ella, ha reunido datos de 12 ventas recientes. Registró el precio de venta (en miles de $), el número de pies2 de construcción (en cientos de pies2), el número de pisos, el número de baños y la antigüedad de la casa (en años).

¿Cuál es el modelo?, ¿Cuál es la variable dependiente?.

Page 12: Mic sesión 11

12FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

a) Empleando los datos del archivo PRECIOCASA.XLS determine la mejor ecuación de regresión múltiple.

EN EXCEL emplear comando DATOS / ANALISIS DE DATOSEscoger REGRESIÓN:

Page 13: Mic sesión 11

13FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

Rango de datos de la variable dependiente

Rango de datos de las variables independientes

Presenta cuadro con los errores estimados y valor de Yestimado.

Page 14: Mic sesión 11

14FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

ResumenEstadísticas de la regresión

Coeficiente de correlación múltiple 0.9744Coeficiente de determinación R^2 0.9495R^2 ajustado 0.9207Error típico 13.9224Observaciones 12

ANÁLISIS DE VARIANZA

 Grados de

libertadSuma de

cuadrados

Promedio de los

cuadrados FValor crítico

de FRegresión 4 25528.84 6382.21 32.9262 0.0001Residuos 7 1356.83 193.83Total 11 26885.67     

Page 15: Mic sesión 11

15FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

  CoeficientesError típico

Estadístico t

Probabilidad Inferior 95%

Superior 95%

Intercepción 9.370 14.1581 0.662 0.529 -24.1089 42.8483pies2 (cientos) 4.856 1.6188 3.000 0.020 1.0286 8.6842pisos 2.601 10.4373 0.249 0.810 -22.0792 27.2814baños 8.557 17.0490 0.502 0.631 -31.7579 48.8710antigüedad (en años) -1.023 1.2650 -0.809 0.445 -4.0144 1.9679

Análisis de los residuales

Observación

Pronóstico Precio de Venta (en miles de $) Residuos

1 61.703 -12.0532 60.523 7.4273 77.341 3.8094 81.868 -0.2685 92.888 -1.3886 88.604 6.6467 112.255 -11.9058 116.192 -11.9429 119.431 -6.781

10 145.394 4.30611 133.739 26.91112 237.261 -4.761

Page 16: Mic sesión 11

16FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

b) Importe los datos del archivo: PRECIOCASA.XLS al Eviews (tendrá PRECIOCASA.WF1) y determine la ecuación de regresión de mejor ajuste para los datos.

c) ¿Cuál es el valor de R2 para esta ecuación?

d) Si la casa de Rick tiene 1,800 pies cuadrados (18 cientos de pies2), un piso, 1.5 baños y 6 años de antigüedad, ¿qué precio de venta puede esperar Rick?

En el EVIEWS: Ingresar al Eviews / Crear nuevo file y definir formato

FILE / NEW / WORKFILE …… Importar datos del excel: FILE / IMPORT / ….

Page 17: Mic sesión 11

17FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

En el EVIEWS: Análisis univariado: para ver si se presentan elementos

atípicos o algún quiebre en el comportamiento de los datos.

40

80

120

160

200

240

1 2 3 4 5 6 7 8 9 10 11 12

PRECIO

a) Para seleccionar una serie: Dar click a serie

seleccionada. Saldrá la hoja con los datos

de la serie

b) Para graficar la serie: View / Gráfico / línea.

Page 18: Mic sesión 11

18FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

En el EVIEWS:

Análisis Bivariado:a) Hallar el Diagrama de dispersión entre Precio y pies2

(gráfico SCATTER) ¿Qué relación tienen los datos?.

Para graficar la serie: Escoger View / Gráfico / Scatter… (ver sgte lámina)

b) ¿Qué valor tiene el coeficiente de correlación?. QUICK / GROUP STATISTICS/ CORRELATIONS/ ...

Escribir los nombres de las series…

Page 19: Mic sesión 11

19FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa1.- Seleccionar la variable independiente (pies2) y la variable dependiente

(precio)….. Open Group2.- Elegir VIEW/GRAPH/ SCATTER, y en Fit Lines elegir Regression Line…

Aceptar.

Page 20: Mic sesión 11

20FÁTIMA PONCE REGALADO

40

80

120

160

200

240

8 12 16 20 24 28 32 36 40 44

PIES2

PREC

IO

3.- El resultado sale:

Las variables precio-pies2 se relacionan de manera directa o positiva:

Si sube el tamaño (pies2) se eleva el precio.

Aplicación 2: Precio de la casa

Page 21: Mic sesión 11

21FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casab) Análisis de Regresión Múltiple:Precio= 1 + 2pies2 + 3pisos + 4banhos + 5antiguedad + En el Eviews, teniendo los datos muestrales, escoger:

Quick / Estimate Equation

Escribir la ecuación a estimar

precio c pies2 pisos banhos antiguedad

Método de estimación: MCO = LS

Muestra empleada

1 12

Page 22: Mic sesión 11

22FÁTIMA PONCE REGALADO

c) R

2 =0.

9495

E

l 94%

de

las

varia

cion

es d

el

PR

EC

IO s

on e

xplic

adas

por

PIE

S2,

PIS

OS

, B

AN

HO

S y

AN

TIG

UE

DA

D.

Test de significancia Conjunta: Fest > Ftabla ó prob(F)<0.05 Rechazar H0.

Test de significancia individual: Si |test|>|ttabla≈2| ó prob<0.05 PIES2 es variable estadístic. importante, otras no.

Dependent Variable: PRECIO Method: Least Squares Sample: 1 12 Included observations: 12

Variable Coefficient Std. Error t-Statistic Prob. C 9.369706 14.15811 0.661791 0.5293

PIES2 4.856395 1.618764 3.000065 0.0199 PISOS 2.601135 10.43730 0.249215 0.8103

BANHOS 8.556553 17.04900 0.501880 0.6311 ANTIGUEDAD -1.023282 1.264951 -0.808950 0.4452

R-squared 0.949533 Mean dependent var 110.6000

Adjusted R-squared 0.920695 S.D. dependent var 49.43836 S.E. of regression 13.92241 Akaike info criterion 8.399213 Sum squared resid 1356.834 Schwarz criterion 8.601258 Log likelihood -45.39528 Hannan-Quinn criter. 8.324409 F-statistic 32.92624 Durbin-Watson stat 1.829811 Prob(F-statistic) 0.000125

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

Ecuación de regresión empleando EVIEWS.

Page 23: Mic sesión 11

23FÁTIMA PONCE REGALADO

Aplicación 2: Precio de la casa(Ej. Levin y Rubin(2010) pg 13-20)

d) Si la casa de Rick tiene 1,800 pies cuadrados (18 cientos de pies2), 1 piso, 1.5 baños y 6 años de antigüedad, ¿qué precio de venta puede esperar Rick?

Regresión estimada: ^PRECIO = 9.37 + 4.86 PIES2 + 2.6 PISOS +

8.56 BANHOS – 1.02 ANTIGUEDAD

Precio esperado sería: ^ PRECIOesperado = 9.37 + 4.86*(18) + 2.6*(1) + 8.56*(1.5) – 1.02*(6)

^ PRECIOesperado = 106.17 miles de $

Page 24: Mic sesión 11

COMPARACIÓN ENTRE MODELOS

Page 25: Mic sesión 11

25FÁTIMA PONCE REGALADO

COMPARACIÓN ENTRE MODELOS (1/3)

Suponga que se quiere elegir el mejor modelo para una función de demanda (CONSUMO), si se tiene como variables independientes: INGRESO, PRECIO y PUBLICIDAD.

Los modelos propuestos son:

CONSUMO= β1 + 2 INGRESO +

CONSUMO= 1 + 2 INGRESO+ 3 PRECIO +

CONSUMO= 1 + 2INGRESO+ 3PRECIO+ 4PUBLICIDAD+

Si se estiman los 3 modelos: ¿Cuál es mejor?

Page 26: Mic sesión 11

26FÁTIMA PONCE REGALADO

COMPARACIÓN ENTRE MODELOS (2/3)

(Criterios a emplear)Para comparar entre modelos con diferentes variables independientes, cuando la variable dependiente es la misma se emplea: _ R2 Ajustado ó R2: Selecciona como mejor modelo aquel que

tiene mayor valor de R2 ajustado.

Criterio de Información de Akaike. Criterio Bayesiano de Schwarz. Criterio de Hannan Quinn.

Se elige el modelo que tenga menor valor

Page 27: Mic sesión 11

27FÁTIMA PONCE REGALADO

COMPARACIÓN ENTRE MODELOS (3/3)

Dependent Variable: CONSUMO Method: Least Squares Sample: 1964 2012 Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

C 724.8630 234.4719 3.091471 0.0033

INGRESO 1.792203 0.175116 10.23438 0.0000

R-squared 0.690265 Mean dependent var 3001.327 Adjusted R-squared 0.683675 S.D. dependent var 923.0798 S.E. of regression 519.1658 Akaike info criterion 15.38228 Sum squared resid 12668058 Schwarz criterion 15.45950 Log likelihood -374.8660 Hannan-Quinn criter. 15.41158 F-statistic 104.7426 Durbin-Watson stat -.- Prob(F-statistic) 0.000000

Dependent Variable: CONSUMO Method: Least Squares Sample: 1964 2012 Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

C 3406.640 737.1843 4.621151 0.0000

INGRESO 2.105837 0.175281 12.01410 0.0000 PRECIO -33.94242 8.955323 -3.790195 0.0004

R-squared 0.763975 Mean dependent var 3001.327 Adjusted R-squared 0.753713 S.D. dependent var 923.0798 S.E. of regression 458.1001 Akaike info criterion 15.15132 Sum squared resid 9653360. Schwarz criterion 15.26715 Log likelihood -368.2074 Hannan-Quinn criter. 15.19527 F-statistic 74.44712 Durbin-Watson stat -.- Prob(F-statistic) 0.000000

Dependent Variable: CONSUMO Method: Least Squares Sample: 1964 2012 Included observations: 49

Variable Coefficient Std. Error t-Statistic Prob.

C 3681.494 978.4742 3.762485 0.0005

INGRESO 2.009421 0.284628 7.059806 0.0000 PRECIO -36.99961 11.47379 -3.224708 0.0024

PUBLICIDAD 49.24304 113.9035 0.432322 0.6676

R-squared 0.764951 Mean dependent var 3001.327 Adjusted R-squared 0.749281 S.D. dependent var 923.0798 S.E. of regression 462.2032 Akaike info criterion 15.18799 Sum squared resid 9613432. Schwarz criterion 15.34243 Log likelihood -368.1059 Hannan-Quinn criter. 15.24659 F-statistic 48.81643 Durbin-Watson stat -.- Prob(F-statistic) 0.000000

PORTAFOLIO DE MODELOS

MODELO 1 MODELO 2 MODELO 3

R2 Ajustado 0.6837 0.7537 0.7492

Akaike 15.3828 15.1513 15.1880

Schwarz 15.4595 15.2672 15.3424

Hannan Quinn 15.4116 15.1953 15.2466

Page 28: Mic sesión 11

28FÁTIMA PONCE REGALADO

Análisis de los rendimientos de la Educación

¿Cuál modelo es mejor?.

Page 29: Mic sesión 11

29FÁTIMA PONCE REGALADO

Anderson, D., Sweeney, D. y Williams T. (2008). Estadística para Administración y Economía. [10ma. Ed.] México, Cengage Learning Editores S.A. de C.V., Cap 14 y 15.

Levin, R. y Rubin, D. (2010). Estadística para Administración y Economía. Séptima Edición Revisada. Pearson Educación, México. Prentice Hall. 2010. Cap. 12 y 13.

BIBLIOGRAFIA