analisis de regresión lineal con gretl

Upload: jgacias01

Post on 16-Jul-2015

469 views

Category:

Documents


1 download

TRANSCRIPT

AnalisisdeRegresi onconGretlAutores:M.VictoriaEstebanM.PazMoralSusanOrbeMartaReg ulezAinhoaZarragaMarianZubiaDepartamentodeEconomaAplicadaIIIEconometrayEstadsticaFacultaddeCienciasEconomicasyEmpresarialesUPV/EHUContenido1. GretlylaEconometra 11.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2. QueeslaEconometra?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2.1. ParaquesirvelaEconometra? . . . . . . . . . . . . . . . . . . . . . 41.3. Unestudioeconometrico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4. Losdatosysumanejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.4.1. Fuentesdedatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.4.2. Elsoftwareeconometrico . . . . . . . . . . . . . . . . . . . . . . . . . 91.5. Introducci onaGretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.5.1. An alisisdescriptivodeunavariable . . . . . . . . . . . . . . . . . . . . 141.5.2. Relacionesentrevariables . . . . . . . . . . . . . . . . . . . . . . . . . 192. ModelodeRegresi onLinealSimple 252.1. Introducci on.Unejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2. Elementosdelmodeloderegresionsimple . . . . . . . . . . . . . . . . . . . . 282.3. Hipotesisbasicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292.3.1. Resumen:modeloderegresionlinealsimpleconhip otesisbasicas . . . 332.4. EstimacionporMnimosCuadradosOrdinarios . . . . . . . . . . . . . . . . . 332.4.1. Elcriteriodeestimaci onmnimo-cuadratico . . . . . . . . . . . . . . . 362.4.2. PropiedadesdelosestimadoresMCO . . . . . . . . . . . . . . . . . . 362.4.3. Laestimaci onMCOenGretl . . . . . . . . . . . . . . . . . . . . . . . 372.4.4. Propiedadesdelarectamnimo-cuadratica . . . . . . . . . . . . . . . 402.4.5. Laprecisiondelaestimaci onylabondaddelajuste . . . . . . . . . . 422.5. Contrastesdehipotesiseintervalosdeconanza . . . . . . . . . . . . . . . . 452.5.1. Contrastesdehipotesissobre . . . . . . . . . . . . . . . . . . . . . . 45ii CONTENIDO2.5.2. Intervalosdeconanza. . . . . . . . . . . . . . . . . . . . . . . . . . . 472.6. Resumen.Presentaciondelosresultados . . . . . . . . . . . . . . . . . . . . . 493. ModelodeRegresi onLinealM ultiple 513.1. Introducci on.Unejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 523.2. EstimaciondeMnimosCuadradosOrdinariosutilizandoGretl . . . . . . . . 543.3. An alisisdelosresultadosmostrados . . . . . . . . . . . . . . . . . . . . . . . 553.3.1. Coecientesestimados . . . . . . . . . . . . . . . . . . . . . . . . . . . 583.3.2. Desviacionestpicaseintervalosdeconanza . . . . . . . . . . . . . . 613.3.3. Signicatividadindividualyconjunta . . . . . . . . . . . . . . . . . . 643.4. Bondaddeajusteyselecciondemodelos. . . . . . . . . . . . . . . . . . . . . 694. Contrastesderestriccioneslinealesypredicci on 774.1. Contrastesderestriccioneslineales . . . . . . . . . . . . . . . . . . . . . . . . 784.2. ContrastesutilizandoGretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . 804.3. Estimacionbajorestriccioneslineales. . . . . . . . . . . . . . . . . . . . . . . 874.4. Estadsticosequivalentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 894.5. Prediccion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 915. Erroresdeespecicaci onenlaelecci ondelosregresores 955.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 965.2. Efectosdeomisiondevariablesrelevantes . . . . . . . . . . . . . . . . . . . . 965.3. Efectosdeinclusiondevariablesirrelevantes. . . . . . . . . . . . . . . . . . . 1036. Multicolinealidad 1076.1. Multicolinealidadperfecta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1086.2. Multicolinealidaddegradoalto . . . . . . . . . . . . . . . . . . . . . . . . . . 1107. VariablesCualitativas 1177.1. Introducci on.Unejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1187.2. Modeloconunavariablecualitativa . . . . . . . . . . . . . . . . . . . . . . . 1187.2.1. Incorporaciondevariablescuantitativas. . . . . . . . . . . . . . . . . 1237.3. Modelocondosomasvariablescualitativas . . . . . . . . . . . . . . . . . . . 1277.3.1. Variascategoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1277.3.2. Variosconjuntosdevariablescticias . . . . . . . . . . . . . . . . . . 129Analisisderegresi onconGretl iii7.4. Contrastedecambioestructural . . . . . . . . . . . . . . . . . . . . . . . 1327.4.1. Cambioestructuralutilizandovariablescticias. . . . . . . . . . . . . 133ApendiceA 137A.1. Repasodeprobabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137A.1.1. Unavariablealeatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . 137A.1.2. Dosomasvariablesaleatorias . . . . . . . . . . . . . . . . . . . . . . . 141A.1.3. Algunasdistribucionesdeprobabilidad. . . . . . . . . . . . . . . . . . 144A.2. Repasodeinferenciaestadstica. . . . . . . . . . . . . . . . . . . . . . . . . . 145A.2.1. Estimacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147A.2.2. Contrastedehipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . . 150iv CONTENIDOFiguras1.1. Diagramadedispersionsupercie-preciodepisos . . . . . . . . . . . . . . . . 41.2. PantallainicialdeGretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.3. A nadirdatos:hojadecalculodeGretl . . . . . . . . . . . . . . . . . . . . . . 111.4. Findecargadedatosconhojadecalculo . . . . . . . . . . . . . . . . . . . . 121.5. Ficherocondatosdetresvariables . . . . . . . . . . . . . . . . . . . . . . . . 131.6. Cuadrodedescripci ondevariables . . . . . . . . . . . . . . . . . . . . . . . . 141.7. Ficherocondescripci ondevariables . . . . . . . . . . . . . . . . . . . . . . . 141.8. Histogramadefrecuenciasrelativas . . . . . . . . . . . . . . . . . . . . . . . . 151.9. Iconosdelasesi on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.10. Tiposdeasimetra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.11. Diagramadedispersionsupercie-precios(2) . . . . . . . . . . . . . . . . . . 201.12. Diagramasdedispersion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.1. Selecciondeuncherodemuestra . . . . . . . . . . . . . . . . . . . . . . . . 262.2. Diagramadedispersionprecio-superciedeviviendas . . . . . . . . . . . . . . 272.3. PreciopisosdeBilbaovesussuperciehabitable . . . . . . . . . . . . . . . . 302.4. ModeloYi= + 5 +ui, conS2X= 0 . . . . . . . . . . . . . . . . . . . . 312.5. Ejemplosderealizacionesdeu . . . . . . . . . . . . . . . . . . . . . . . . . . 322.6. EjemplosdedistribuciondeY. . . . . . . . . . . . . . . . . . . . . . . . . . . 322.7. Modeloderegresionsimple . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342.8. Funci onderegresionpoblacionalyfunci onderegresionmuestral . . . . . . . 352.9. Ventanadeespecicaciondelmodelolineal . . . . . . . . . . . . . . . . . . . 372.10. Ventanaderesultadosdeestimaci onMCO. . . . . . . . . . . . . . . . . . . . 382.11. Ventanadeiconos:recuperarresultadosestimaci on. . . . . . . . . . . . . . . 392.12. Gr acosderesultadosderegresionMCO . . . . . . . . . . . . . . . . . . . . . 39vi FIGURAS2.13. ResiduosMCO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402.14. Criteriodedecisiondelcontrastedesignicatividadindividual . . . . . . . . 463.1. Gr acoderesiduosporn umerodeobservaci on . . . . . . . . . . . . . . . . . 563.2. Gr acoderesiduoscontralavariableF2. . . . . . . . . . . . . . . . . . . . . 573.3. Gr acodelavariableestimadayobservadaporn umerodeobservaci on . . . 573.4. Gr acodelavariableestimadayobservadacontraF2 . . . . . . . . . . . . . 585.1. Gr acodelosresiduosdelModelo(5.2)porobservaci on . . . . . . . . . . . . 1005.2. Gr acodelosresiduosdelModelo(5.2)sobreF2 . . . . . . . . . . . . . . . . 1015.3. Gr acosdelosresiduosdelModelo(5.1)sobreobservaci onysobreF2 . . . . 1037.1. Cambioenordenada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1247.2. Cambioenordenadayenpendiente . . . . . . . . . . . . . . . . . . . . . . . 126A.3. Lafunci ondedensidadnormal yelhistograma . . . . . . . . . . . . . . . . . 138A.4. Ejemplosdedistribucionnormal . . . . . . . . . . . . . . . . . . . . . . . . . 139A.5. Simulaci on1:histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140A.6. Distribuci onnormalbivariante . . . . . . . . . . . . . . . . . . . . . . . . . . 141A.7. Funci ondedensidaddeladistribucionChi-cuadrado . . . . . . . . . . . . . . 144A.8. Funci ondedensidaddeladistribucionF-Snedecor . . . . . . . . . . . . . . . 145A.9. Funci ondedensidaddeladistribuciont-Student . . . . . . . . . . . . . . . . 146A.10.Sesgoyvarianzadeestimadores. . . . . . . . . . . . . . . . . . . . . . . . . . 149A.11.Ejemplosdedistribuciondeestimadores . . . . . . . . . . . . . . . . . . . . . 150A.12.Ejemplo1:ResultadoydistribuciondelestadsticobajoH0. . . . . . . . . . 153A.13.Ejemplo2:ResultadoydistribuciondelestadsticobajoH0. . . . . . . . . . 156A.14.Ejemplo3:ResultadoydistribuciondelestadsticobajoH0. . . . . . . . . . 158Tablas1.1. Datossobrepreciodeviviendaocupada . . . . . . . . . . . . . . . . . . . . . 31.2. Distribuci ondefrecuenciasdelpreciode50pisos . . . . . . . . . . . . . . . . 161.3. Estadsticosdescriptivosdelpreciode50pisos . . . . . . . . . . . . . . . . . 161.4. Estadsticosdescriptivosdelconjuntodedatos . . . . . . . . . . . . . . . . . 191.5. Matrizdecoecientesdecorrelacion . . . . . . . . . . . . . . . . . . . . . . . 222.1. Conjuntodedatosincluidosendata3.1Housepricesandsqft . . . . . . . . . 272.2. ResiduosdelaregresionMCO. . . . . . . . . . . . . . . . . . . . . . . . . . . 402.3. EstadsticosdescriptivosdevariablesdelaFRM . . . . . . . . . . . . . . . . 412.4. Matrizdecorrelaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.5. Estimaciondevarianzasycovarianzade y. . . . . . . . . . . . . . . . . . 442.6. Estimacionporintervalo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483.1. Modelo(3.1).Datosdecaractersticasdeviviendas . . . . . . . . . . . . . . . 543.2. Modelo(3.1).Estimaciondelamatrizdecovarianzasde. . . . . . . . . . . 623.3. Modelo(3.1):Estimacionporintervalodeloscoecientes. . . . . . . . . . . . 634.1. DatosparaelestudiodelaFunci ondeInversion . . . . . . . . . . . . . . . . 834.2. Datosenterminosreales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 845.1. Modelos(5.1)y(5.2)estimadosparaelpreciodelavivienda . . . . . . . . . 995.2. Modelosestimadosparaelpreciodelavivienda. . . . . . . . . . . . . . . . . 104Tema1Gretl ylaEconometraContenido1.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2. QueeslaEconometra? . . . . . . . . . . . . . . . . . . . . . . 21.2.1. ParaquesirvelaEconometra? . . . . . . . . . . . . . . . . . 41.3. Unestudioeconometrico . . . . . . . . . . . . . . . . . . . . . . 61.4. Losdatosysumanejo. . . . . . . . . . . . . . . . . . . . . . . . 71.4.1. Fuentesdedatos . . . . . . . . . . . . . . . . . . . . . . . . . 91.4.2. El softwareeconometrico . . . . . . . . . . . . . . . . . . . . . 91.5. Introducci onaGretl . . . . . . . . . . . . . . . . . . . . . . . . . 111.5.1. Analisisdescriptivodeunavariable . . . . . . . . . . . . . . . . 141.5.2. Relacionesentrevariables . . . . . . . . . . . . . . . . . . . . . 192 Tema1. Gretl ylaEconometra1.1. IntroduccionEstecursosedirigeaaquellaspersonasinteresadasenaprenderainterpretarinformacionestadsticasobrelarealidadecon omica. Laherramientabasicaesunmodeloeconometricoqueconjugalosesquemasteoricossobreel funcionamientodelaEconomaconlastecnicasestadsticasdeanalisisdedatos.Unmodelopuedetenerunaestructuramuycompleja,peroenestecursonoscentramosenel modelom assencillo, yquedanombrealaasignatura, elmodeloderegresi onlinealgeneral. Este modelo explica el comportamiento de una unicavariableecon omicaodeotra ndolem asgeneral.Por otro lado, este curso tiene un caracter totalmente aplicado, en el que los ejemplos practicossirven para introducir los conceptos estadstico-econometricos. As, una parte importante delcursosededicaaestudiarcasospracticos, enlosqueel estudianteaprenderaamanejarunsoftwareeconometricoyainterpretaradecuadamentelosresultadosobtenidos. El paqueteeconometricoautilizaresGretl; setratadesoftwaredelibreuso, f acil demanejar yquetieneaccesoalasbasesdedatosqueseestudianenmuchoslibrosdeintroducci onalanalisiseconometrico.Este primer tema se organiza de la siguiente forma: la seccion 2 presenta la disciplina que nosocupa en este curso, la Econometra. La secci on 3 describe un ejemplo de estudio econometri-co, destacandocu alessonloselementosqueintegranunmodeloeconometrico. Lasecci on4seocupadelosdatosecon omicos, suscaractersticas, lasprincipalesfuentesdeobtenciondedatosylosprogramasinform aticosquesirvenparaalmacenaryprocesarlosdatos. ElsoftwareGretlseintroduceenelapartado5,enelqueseincluyeelesquemadeunaprimerasesi onpracticadeusodeGretl.Losdos ultimosapartadossonunrepasoalosconceptosdeprobabilidadeinferenciaestadsticaqueseaplicaranposteriormente,yqueseacompa nadeunasesi ondepracticaenGretl.1.2. QueeslaEconometra?Enlatomadedecisionesdecaracterecon omicosuelesermuy util disponerdeinformacionenformade datoscuantitativos.Porejemplo,ala horadeelegir unosestudiosuniversitariospodemosguiarnospornuestraspreferenciaspersonales, perotambienporfactorescomolasexpectativasdesalarioenlaramaelegidaolafacilidadconlaqueesperamosconseguirunempleo.Sisetratadelacompra-ventadeunpiso,nosinteresaconocerlasituaci ondelmer-cadoinmobiliario.Paraellopodemosrecopilardatosdepreciosydealgunascaractersticasde los pisos que puedan inuir en el precio como, por ejemplo, su tama no o si es una viviendausadaquenecesitareforma.Supongamosqueenlasecci ondeanunciosdeunperi odicolocalaparecenlossiguientesdatossobre50pisosenventaenelcentrodeunaciudad: Preciodelpiso,enmilesdeeuros. Tama nodelpiso,enmetroscuadradoshabiles. Estadodelpiso:sinecesitareformaoestaparaentraravivir.Analisisderegresi onconGretl 3Indicador Tama no Precio Areformar Indicador Tama no Precio Areformar1 55 210,354 no 26 110 476,600 no2 59 309,520 no 27 110 456,769 no3 60 366,617 no 28 115 500,643 no4 60 299,304 si 29 125 619,000 no5 60 369,650 no 30 135 645,253 no6 65 273,460 si 31 135 625,000 no7 65 155,000 si 32 140 522,800 si8 70 228,384 no 33 150 390,660 no9 70 246,415 no 34 150 504,850 si10 70 255,000 si 35 150 715,204 no11 75 150,253 si 36 150 570,000 si12 77 352,800 no 37 160 751,265 no13 80 366,000 si 38 180 583,000 si14 80 298,000 si 39 180 738,000 no15 80 312,530 no 40 180 552,931 si16 83 240,400 no 41 190 691,200 no17 85 278,569 si 42 195 811,400 no18 91 390,658 no 43 200 691,000 si19 92 216,364 si 44 200 1110,000 no20 100 402,600 no 45 230 961,620 no21 100 272,300 si 46 230 661,000 no22 100 360,607 no 47 240 841,417 no23 100 570,000 no 48 240 588,992 si24 100 480,809 no 49 245 841,400 si25 100 186,314 si 50 250 1051,000 noTabla1.1:DatossobrepreciodeviviendaocupadaEstosdatosaparecenenlaTabla1.1.Enbaseaestainformacion,sinosofrecenunpisode100m2reformadoaunpreciode525000e,diramosqueelpisoparececaroyaquesupreciosuperaelpromediodepreciosdelospisosdeestascaractersticasincluidosenlamuestra:402, 6 + 360, 607 + 570 + 480, 8094= 453, 504milesdeeurosSinembargo, que podemos decir si se tratarade unpisode 90m2areformar? Odeunpisode 50m2reformado? Notenemos datos parareplicar el procedimientoanterior.Unecon ometrapodraayudar adar respuestaaestas cuestiones. Enel Gr aco1.1, querepresentaconjuntamenteel precioyel tama nodecadapiso, seveunpatr ono relaci onestableentretama nodeunpisoysuprecio. Estarelacionsepuedetrasladaraunmodelo util para responder a las preguntas que planteamos. Las tecnicas econometricas nos permitencuanticar, apartirdel modeloylosdatos, lainuenciaquetieneel tama nodel pisoosuestado en el precio del mismo. La respuesta podra ser, por ejemplo: Laestimaci ondelpreciomediodeunpisoareformarde90 m2esde297350euros, aunqueel preciopuedeoscilarentre152711y441989eurosaunniveldeconanzadel90 %.Adem as,sisetratadeunpisoreformado, laestimaci ondel preciomedioseincrementaenm as de100000euros, siendofactiblespreciosentre210521y556639euros.4 Tema1. Gretl ylaEconometra 100 200 300 400 500 600 700 800 900 1000 1100 1200 50100150200250precio (miles euros)Superficie (m2)Gr aco1.1:Diagramadedispersionsupercie-preciodepisosLa Econometra es una rama de la Economa que utiliza la estadstica para medir o cuanticarlas relaciones existentes entre variables econ omicas. Es una materia interdisciplinar que utilizala teora econ omica, la matem atica, la estadstica y los metodos computacionales. En palabrasdeRamanathan(2002):Enterminos sencillos, laeconometrase ocupade la aplicaci onde metodosestadsticosalaeconoma.Adiferenciadela estadstica econ omica, queesprin-cipalmentedatos estadsticos, laeconometrasedistinguepor la unicaci ondeteoraecon omica,instrumentosmatem aticosymetodologaestadstica.Entermi-nosm asgenerales,laeconometraseocupade(1)estimarrelacionesecon omicas,(2) confrontar la teora econ omica conlos datos y contrastar hip otesis relati-vasal comportamientoecon omico,y(3)predecirel comportamientodevariablesecon omicas.1.2.1. ParaquesirvelaEconometra?El objetivo de un estudio econometrico es comprender mejor un fen omeno econ omico y, comoresultado,poderrealizarprediccionesdelaevoluci onfuturadelfen omenodeinteres.Elins-trumento basico es el modelo, que ayuda a entender las relaciones entre variables econ omicasy sirve para evaluar los efectos de distintas medidas o polticas econ omicas. Algunos ejemplosenlosquelaEconometraesdeutilidadson: Unanalistadelmercadodeactivospuedeestarinteresadoenanalizarycuanticarlarelacion entre el precio de un activo y distintas caractersticas de la empresa que ofreceeseactivoascomodelestadogeneraldelaeconoma. Los directivos de Iberdrola pueden estar interesados en analizar los factores que afectanalademandadeelectricidad. El grupoEroski puedeestarinteresadoencuanticarel efectodedistintosnivelesdepublicidadsobresusventasysusbenecios.Analisisderegresi onconGretl 5 ElserviciodeestudiosdelMinisteriodeEconomaydelBancodeEspa naodelBancoCentralEuropeoquiereanalizarelimpactodelaspolticasmonetariasyscalessobreeldesempleo,lainacion,lasexportacioneseimportaciones,lostiposdeinteres,etc. Si un organismo quiere implementar polticas para corregir, por ejemplo, la discrimina-ci onsalarialporsexo,enprimerlugardebeconocercu alessonlosprincipalesfactoresdeterminantes del problema y, en segundo lugar, analizar las posibles medidas a tomar,estudiandocu alespuedenserlosefectosdedichasmedidas. Ungobiernoregional puedenecesitar previsiones sobrelaevoluci ondelapoblacionparaplanicarlanecesidaddeserviciossocialesylasnecesidadesdenanciacionqueconllevan.Tambiendebetenerinformacionprecisasobresucapacidaddenanciacion,porloqueleinteresadisponerdeprediccionesrelativasalarecaudaci onimpositiva. Si una persona quiere contratar un prestamo, le interesa conocer cu al va a ser la evolu-ci ondelostiposdeinteres.Enlos ultimosa noshemosasistidoaunamayordifusionyutilizaci ondelosmetodoseco-nometricosgracias, entreotrasrazones, alamayordisponibilidadycalidaddelosdatosyaldesarrollodelosmetodosdecomputacion.Adem as,laaplicaciondelaEconometranoserestringe al ambito estrictamente econ omico, sino que proporciona procedimientos de estudiodedatosquepuedenaplicarsealcampodelasCienciasSociales.Porejemplo,para: Analizarsielendurecimientodelaspenas,comolaintroducci ondelapenademuerte,tienecomoconsecuencialadisminuciondelatasadecriminalidad. Analizarlaefectividaddelasmedidasdeseguridadvial,comoelcarnetporpuntos,enlareducciondeln umerodemuertesenaccidentesdetr aco. Predecirlosresultadosdeunacompeticiondeportivacomo,porejemplo,eln umerodegolesquemarcar alaselecciondeInglaterraenunmundialdef utbol. Analizarcu al puedeserel efectosobrelosvotantesenlasproximaseleccionesdeunadeterminada medida, por ejemplo, prohibir fumar enlugares p ublicos, legalizar losmatrimoniosentrepersonasdelmismosexo,etc. Estudiarsi haydiferenciasenel votodependiendodesi setratadeeleccioneslocales,regionalesoeuropeas. Analizarsi lasmedidasrestrictivassobrelapublicidaddetabacoyalcohol reducenelconsumodeestosproductos.Los comienzos de la Econometra pueden situarse en la decada de los treinta del siglo pasado.Sucoincidenciaenel tiempoconlaGranDepresi onnoes casual: comoconsecuenciadeesta, los economistas de la epoca estaban interesados en poder predecir los ciclos econ omicosqueobservaban. Entreellos destacaKeynes, quedefendalaintervenciondel gobiernoenlaactividadecon omicaparamitigarestascrisis. As, losprimerosecon ometrasseocuparondedarrespuestaaproblemasmacroecon omicosconobjetodeasesoraralosgobiernosenlaimplantaciondepolticasecon omicas.6 Tema1. Gretl ylaEconometraEnuncomienzo, seaplicaronalos datos econ omicos metodos estadsticos queyahabansidoutilizados enciencias naturales. Sinembargo, estos metodos nopodanreproducirsemimeticamenteenelambitoecon omico, sinoquehabaqueadaptarlosodesarrollarnuevosmetodosdeacuerdoalascaractersticaspropiasqueposeenlasvariablessocioecon omicas.As, enlaeconometrasehandesarrolladodosgrandes areas: laeconometrate orica, cuyoobjetivo es desarrollar metodos de estudio y analisis de datos y determinar sus propiedades, yla econometra aplicada, que se ocupa de utilizar estos metodos para responder a los problemasdeinteresenlapractica.Enestecursoponemosmayor enfasisenlaparteaplicada.Setratade proporcionar al alumno las herramientas necesarias para que sea capaz de llevar a cabo unproyecto aplicado. Para ello, es indispensable dedicar tiempo al conocimiento de los metodoseinstrumentos basicos del analisis econometrico, yaquesonel requisitoprevioparaunabuenaaplicacionpractica.1.3. UnestudioeconometricoUnodenuestrosobjetivosespeccosesque, al nal del curso, el estudiantedebesercapazdeestructurarydesarrollaruntrabajodeinvestigacion.Hoyda,unapersonaquedispongadeunordenadorensucasapuedellevaracabounpeque noproyectoeconometrico.As,unestudioeconometricoconstadelassiguientesetapas, Heij, deBoer, Franses, Kloek&Dijk(2004): Formulaci on del problema. Se trata de determinar la cuesti on de interes. Debemos plan-tear de forma precisa las preguntas que nos interesa responder. Por ejemplo, si se tratadeconocerlasituaci ondel mercadoinmobiliarioenunaciudad, podemosplantearnoslasiguientepregunta: cual esel preciodelospisosenesaciudadyquefactoreslodeterminan? La teora econ omica puede ayudarnos a enfocar el problema, a determinarquevariablesestaninvolucradasycu alpuedeserlarelacionentreellas. Recolecci ondedatosestadsticosrelevantesparaelanalisis.Enelejemploanterior,esfacil recolectar datos sobreel preciodepisos, sutama noyotras caractersticas quepuedeninuirensuprecio(verTabla1.1).Losresultadosdelanalisisvanadependerengranmedidadelacalidaddelosdatos.Sinembargo,nosiempreessencilloobtenerlos datos relevantes para el analisis. Podemos encontrar problemas como la ausencia dealg undato, cambiosenladenici ondeunavariable, fallosenel metododerecogida,tenerunacantidadinsucientededatosonodisponerdeinformacionrelativaaunavariable. Formulaci on y estimaci on del modelo. De la union de las teoras y cuestiones planteadasenlaprimeraetapaconlosdatossellegaaunmodeloeconometrico.Porejemplo,podemosplantearque, enmedia, el preciodeunpiso, Y , dependedesutama no, X.Unposiblemodeloeconometricoquerecogeestateoraes:Y |X N( +X, 2)Es decir, el preciodelos pisos dadountama no, por ejemplo100m2, sedistribuyealrededor de sumedia+100seg ununanormal de varianza2. Al formular elAnalisisderegresi onconGretl 7modelo hemos elegido la forma funcional de la relacion entre las variables y la naturalezaestocasticadelavariabledeinteresoend ogena, Y . El objetivoesobtenerunmodelorelevantey utilparadarrespuestaanuestrosobjetivos.El siguientepasoes laestimaci ondelos parametros desconocidos deladistribucionyquesondeinteresparael analisis. Enel ejemplodel preciodelospisos, interesanlosparametrosdesumedia,y.Laestimaci onconsisteenutilizarlosdatosytodalainformacionrelevante paraaprender algosobre los par ametros desconocidos. Enlainterpretaciondelosresultadosdeestimaci onesimportantetenerencuentaquenoconocemosel valor de los parametros, por lo que unicamente vamos a hacer armacionesdel tipo con un 95 % de conanza, el aumento del impuesto sobre carburantes no afectaal consumodegasolina.Existenmuchosmetodosdeestimaci on. Laelecci onentreunouotrodependedelaspropiedades del modeloeconometricoseleccionado. Es decir, unamalaselecciondelmodelotambieninuyeenlavalidezdelas estimaciones. UncursointroductoriodeEconometra,comoeste,sesuelecentrarenelestudiodelmodeloderegresionlinealysuestimaci onmediantemnimoscuadradosordinarios,quesoninstrumentossencillosymuy utilesenlapractica. An alisis del modelo. Se trata de estudiar si el modelo elegido es adecuado para recoger elcomportamiento de los datos. Por ejemplo, si es correcto asumir que el tama no del pisoinuye en su precio, si la relacion lineal entre ambas variables es correcta, etc. Consisteenunaseriedecontrastes diagn osticos quevaloransi el modeloestacorrectamenteespecicado, es decir, si los supuestos realizados son v alidos. Si es necesario, se modicaelmodeloenbasealosresultadosobtenidosenloscontrastes. Aplicaci ondel modelo.Unavezobtenidounmodelocorrecto,seutilizapararesponderalascuestionesdeinteres.Dado que para la realizacion de un proyecto econometrico es necesario conocer donde obtenerlosdatosymanejarunsoftwareespeccodeanalisiseconometrico,vamosaextendernosunpocoenestosdospuntos.1.4. LosdatosysumanejoC omo se obtienen datos econ omicos? No proceden de experimentos controlados sino que loseconomistas, al igual queotrosinvestigadoresdel campodelasCienciasSociales, obtienenlos datos de la observaci on de la realidad. En un experimento controlado, como los realizadosenlaboratorios, el investigadortienecontrol sobrelascondicionesdel estudio. Porejemplo,para analizar el efecto de un fertilizante, podemos aplicar distintas dosis de fertilizante sobreunconjuntodesembrados, controlandotambienel gradodehumedadolaluzquerecibecadaplanta.Adem as,sepuederepetirelexperimento,manteniendolasmismascondicionesoalterandoalgunascomolasdosisoel gradodehumedad. Obviamente, aunquelascanti-dades elegidas seanexactamentelas mismas, noesperamos queel resultado, por ejemplo,el crecimientodelasplantas, seaidenticoentreexperimentosporquelassemillasutilizadas8 Tema1. Gretl ylaEconometrasondistintasoporquehaypeque noserroresdemedida. Estasdiferenciasnaturalesenlosresultadosdelosexperimentosseconocencomovariacionesmuestrales.LosdatosobtenidosdeexperimentoscontroladossontpicosdelasCienciasNaturalesyseconocencomodatos experimentales. Los datos quesonresultadodeunprocesoquetienelugarenlasociedad, yquenoescontrolableporunaovariaspersonas, seconocencomodatosnoexperimentales.Estacaractersticahasidounfactorimportanteeneldesarrollodelas tecnicas econometricas y debemos tenerlo en cuenta en la interpretaci on de los resultados.Clasicaci on de los datos economicos. Los datos econ omicos pueden ser de diferentes tipos,loquevaadeterminarel analisisquerealicemos. Unaprimeraclasicaci ondistingueentredatos cuantitativos, aquellos que toman valores numericos dentro de un rango de valores, comopreciootama nodeunpiso,ydatoscualitativos,queaparecencomocategorasoatributos,como por ejemplo el sexo, la profesion o el estado de un piso. Los seis primeros temas de estecursosecentranenelanalisisdedatoscuantitativos.Eltemasieteconsiderasituacionesenlasquealg unfactorexplicativoescualitativo.Unasegundaclasicaci ondistingueentredatosdeseriestemporalesydatosdesecci oncru-zada. Losprimerossereerenaobservacionesrecogidasensucesivosmomentosdetiempo,normalmenteregulares,comoa nos,trimestresomeses.EjemplosdedatostemporalessonelProductoInteriorBruto(PIB)delaContabilidadNacional trimestral, el n umeromensualdealiacionesalaSeguridadSocialoelvalordiariodelIBEX35.Lossegundossereerenavaloresquetomandiferentesagentesenunmomentodel tiempo, porejemplo, lapoblaciondesempleadaenela no2005encadaunodelospasesdelaUnionEuropea(UE),elsalariomedioencadasector industrial enel 2006oel gastorealizadoenlibros detextopor unconjuntodefamilias enseptiembrepasado. Tambienes posibletener unacombinaci ondedatos de secci on cruzada y series temporales, por ejemplo, las puntuaciones obtenidas por losestudiantesdeEconometraenloscursos2004-05,2005-06y2006-07.Cuandoseencuestaalosmismosindividuosalolargodel tiempo, comolatasadeparoyel crecimientodel PIBdesde1990hasta2006paralos25pasesdelaUE, seconocenconel nombrededatosdepanel o datoslongitudinales. En este curso nos centraremos en el analisis de datos de secci oncruzada.Lastecnicasqueutilicemostambiensepuedenaplicarenseriestemporales,aunqueenocasionessuestudioesmascomplejo.Unaterceraclasicaci onseestableceenfunci ondel nivel deagregacion. Seconocencomodatos microecon omicos omicrodatos los referidos al comportamientodeagentes econ omi-coscomoindividuos, familiasoempresas. UnejemploeslaEncuestadePoblacionActiva,elaboradaporel INEypublicadaenhttp://www.ine.es/prodyser/microepa.htm. Losdatosmacroecon omicos o macrodatosson los datos referidos a ciudades, regiones o naciones que sonresultantesdelaagregacionsobreagentesindividuales, comosonlosresultadosdelaCon-tabilidadNacional. Porejemplo, laContabilidadNacionalTrimestral deEspa na, elaboradatambienporelINEypublicadaenhttp://www.ine.es/inebmenu/mnucuentas.htm.Analisisderegresi onconGretl 91.4.1. FuentesdedatosEncontrar y recopilar datos no es siempre sencillo. En ocasiones es muy costoso coleccionar losdatos adecuados a la situaci on y manejarlos. Sin embargo, esta tarea se ha visto favorecida enlos ultimosa nosporlamejoraenlarecogidadedatosyelhechodequemuchosorganismospermitenacceder asus bases de datos enlaWorldWide Web. Algunos organismos quepublicandatosmacroecon omicosson: InstitutoVascodeEstadstica(EUSTAT):http://www.eustat.es. BancodeEspa na:http://www.bde.es Estadsticas.TambienpublicaelBoletnes-tadsticomensualyelBoletndecoyunturamensual. InstitutoNacional deEstadstica(INE): http://www.ine.es InebaseoBancotem-pus.Estandisponibles,porejemplo,losresultadosdelaencuestadepoblacionactiva,laContabilidadNacional oel boletnestadsticomensual. Adem as, enenlaces seencuentranotraspaginaswebdeserviciosestadsticos. EUROSTAT: Es laOcinaEstadsticadelaUnionEuropea, seencargadevericaryanalizarlosdatosnacionalesrecogidosporlosEstadosMiembros. El papel deEu-rostatesconsolidarlosdatosyasegurarsedequesoncomparablesutilizandouname-todologahomogenea. Lainformacionenterminosdetablasestadsticas, boletineses-tadsticoseinformativos, inclusoworkingpaperssepuedeencontrarenladireccion:http://europa.eu.int/comm/eurostat. Organizaci on para la Cooperaci on y Desarrollo Economico (OCDE): http://www.oecd.org,Statistical portal, statistics. Estan disponibles algunas series de las publicaciones MainEconomicIndicators(mensual)oComerciointernacional. FondoMonetarioInternacional (FMI): http://www.imf.org. ParaobtenerdatossobreunamplioconjuntodepasestambiensepuedeconsultarsupublicacionEstadsticasFinancierasInternacionales(mensualyanual).MuchosmanualesdeEconometraincluyenunabasededatosqueseanalizanenel textocomoilustracionalamateria.EnestecursoutilizaremosprincipalmentelosdatosincluidosenRamanathan(2002),queestanaccesiblescomoarchivosdemuestraenGretl.1.4.2. El softwareeconometricoEl desarrollo de los ordenadores ha permitido almacenar una gran cantidad de datos, a la vezquehafacilitadosumanejo. Existenenlaactualidadunamplioconjuntodepaquetesparael analisis econometrico que realizan complejas operaciones mediante unas instrucciones muysencillas.Silosdatosestandisponiblesenpapel,lashojasdecalculo,comoEXCEL,sonuninstrumentosencilloparaintroduciryprepararlosdatosy realizaroperacionessencillas.Sinembargo,engeneralesconvenienteutilizarprogramaseconometricosespeccos.AlgunosdelosmaspopularesenloscursosdeEconometrason:10 Tema1. Gretl ylaEconometra EViews,desarrolladoporQuantitativeMicroSoftware,contieneunaampliagamadetecnicasdeanalisiseconometrico.MuchosmanualesdeEconometracontienenunCDconejemplospracticosenEviews. Supaginawebconlainformaciondel programaeshttp: //www.eviews.com. SHAZAM, elaborado en la Universidad British of Columbia (Canada), incluye tecnicaspara estimar muchos tipos de modelos econometricos. M as informacion se puede obtenerenhttp: //shazam.econ.ubc.ca\,dondesepuedeejecutarelprogramaremotamente. Gretl, acronimo de GnuRegression,EconometricandTimeSeries(Biblioteca Gnu deRegresi on Econometra y Series Temporales), elaborado por Allin Cottrell (UniversidadWakeForest). Essoftwarelibre, muyf acil deutilizar. Tambiendaaccesoabasesdedatosmuyamplias,tantodeorganismosp ublicos,comoelBancodeEspa na,comodeejemplosrecogidosentextosdeEconometra. RATS, acronimodeRegressionAnalysisof TimeSeries. ContieneunaampliagamadetecnicasdeanalisiseconometricoconespecialdedicacionalAn alisisdeSeriesTem-porales.Suwebes:http: //www.estima.com R, software libre paracomputoestadsticoygr acos. Consiste enunlenguaje, unentornodeejecuci on, undebugger ylahabilidaddecorrer programas guardados enarchivos detiposcript. Sudise nofueinuenciadopor dos lenguajes existentes: SyScheme.Paginaweb:http: //www.r project.orgUnobjetivodeestecursoesqueel estudiantesefamiliariceconel usodeprogramaseco-nometricos. Por su sencillez y accesibilidad, en este curso introductorio se utiliza el programaGretlparaestudiarcasospracticos.Enlapaginahttp: //gretl.sourceforge.net/gretlespanol.htmlse encuentra toda la informacion en castellano relativa a la instalacion y manejo del programa.Elmanual,eningles,seencuentraenlacarpetaen/.Juntoconel programasepuedencargarlosdatosutilizadoscomoejemplosdeaplicacioneseconometricas en los siguientes libros de texto Davidson & Mackinnon (2004), Greene (2008),Gujarati (1997), Ramanathan(2002), Stock&Watson(2003), Verbeek(2004), Wooldridge(2003).Al instalarGretl autom aticamentesecarganlosdatosutilizadosenRamanathan(2002)yGreene(2008).Elrestosepuedendescargardelapagina:http: //gretl.sourceforge.net/gretldata.htmlenlaopci ontextbookdatasets.EstecursoseestructurasobrecasospracticospresentadosenRamanathan(2002)yenWooldridge(2003)yejerciciosaresolverconayudadeGretl. Launiondeteoraypracticapermitenal alumnounautoaprendizajetantodeloscontenidosbasicosdelcursodeAn alisisdeRegresi oncomodelautilizaci ondelsoftwareGretl.Analisisderegresi onconGretl 111.5. IntroduccionaGretlLaprimerasesi onconelprogramaGretlconsisteenunapracticaguiadaenlaqueseapren-der aacrearunchero,introducirlosdatosdelaTabla1.1y realizarunanalisisdescriptivo.Preparaci ondelchero.AlejecutarGretl,aparecelasiguienteventanaprincipal:Gr aco1.2:PantallainicialdeGretlComotodavanosehacargadoning unchero, variasopcionesdel men uprincipal, engrisclaro,noestandisponibles.LosdatosaanalizarnoestanincluidosenlabasedeGretl,porloquevamosalaopci onArchivo NuevoconjuntodedatosControl+N. Completamoslainformacionquevasolicitandoelprograma: n umerodeobservaciones,enlaTabla1.1seincluyen50pisos.PincharenAceptar. El tipo de datos que utilizamos. En este caso, marcamos desecci oncruzaday Adelante. Si el paso anterior se ha realizado correctamente, conrmamos la estructura del conjuntode datos pinchando en Aceptar. Al pinchar en Atr asse recupera solo la ventana de tipo dedatos, por lo que esta opci on no permite corregir un error en el n umero de observaciones. Enla ultimaventanamarcaremosSqueremosempezaraintroducirlosdatos. Enlasiguienteventanaescribimosel Nombredelaprimeravariable, porejemplom2.Nosepuedenutilizarlaletra n, acentosni m asde15caracteresparanombraralasvariables. Tras Aceptar, se abre una hoja de calculo, de modo que en la pantalla aparece:Gr aco1.3:A nadirdatos:hojadecalculodeGretl12 Tema1. Gretl ylaEconometraParaincluirlosdatosdelavariablem2, vamosalaceldacorrespondiente, porejemplolaprimera, y pinchamos sobre ella con la tecla izquierda del rat on; tras teclear la cifra, 55, damosalateclaEntrar.Siporerrornotecleamosalg undato,porejemplo,lasegundaobservaci onde 59 m2, nos situaremos en la la posterior, en este caso en el primer dato de 60 m2, y vamosa observaci on insertar obs. Se crea una nueva la en blanco por encima de la anterior. Paraguardarlasmodicacionesenlasesi ondetrabajohayquepincharenAplicar.Podemos a nadir mas variables conlaopci onVariable A nadir del men udelahojadecalculo.Porejemplo,creamosunanuevavariablequedenominamosReforma.Estavariablees cualitativa, por lo que asociamos a la situaci on a reformar = s el valor 0 y a la otra opci on,areformar=no elvalor1.Unavezquesehanincluidotodoslosdatos,vamosaAplicaryCerrarlahojadecalculo.Sinohabamosguardadolos ultimoscambiosrealizados,alcerrarlahojadecalculoapareceuncuadroquenospideconrmarloscambios.Lasseriescreadasdebenaparecerasenlapantalla:OJO!Gr aco1.4:FindecargadedatosconhojadecalculoEsrecomendableguardarlosdatosyaincorporadosenuncherodedatosGretl mediantelaopci ondel men uprincipal Archivo Guardardatos. Enel siguientecuadroa nadimoseldirectorio y el nombre del chero de datos, por ejemplo, pisos. Por defecto, grabar a los datosconlaextensi ongdt.Parausarestosdatosenunasesi onposterior,solohayquepinchardosvecessobreelchero.Confrecuencia, los datos estanalmacenados enotrahojade calculo, comoEXCEL. Porejemplo, enel cheroEXCELpisos.xls seencuentranlasvariablesm2ypreciodelaTabla1.1.A nadirlosdatosdeprecioalcherodeGretlesmuysencillo.Unavezabiertoelcheropisos.gdt,hayque: Utilizarlaopci ondelmen uprincipalArchivo A nadirdatos EXCEL. . . . DarelnombreyubicaciondelcheroEXCEL,pisos.xls. Darlaceldaapartirdelacualhayqueempezaraimportarlosdatos.Enestecasolavariable precioempieza en la celda B1, donde esta su nombre, e importaremos los datosdesdecolumna2, la1. Paraa nadirlasdosvariables, m2 yprecio, comenzaramosaimportardatosen columna1,la1.Finalmente,hayquepincharenAceptar.Analisisderegresi onconGretl 13Paracomprobarsi nohayerroresenlosdatosvamosa Datos seleccionartodos yluegoactivamoslahojadecalculomedianteDatos Editarvalores obienmostramoslosdatosenpantallaconDatos Mostrarvalores Todaslasvariables. Debeaparecerlasiguienteventana:OJO! * = LOS CAMBIOS NO SE HAN GUARDADOGr aco1.5:FicherocondatosdetresvariablesUnavezquelosdatossehancargadocorrectamente, losalmacenamosenel mismocheropisos.gdt pinchandoenArchivo Guardardatos.Unavezguardadaslasmodicaciones, enlapantalladeGretlapareceelnombredelcherosinelasterisco*.Notasexplicativas.Alcrearunchero,nosinteresaincluirnotasexplicativasdeltrabajoyarealizado. EnGretl esposiblea nadirestainformacionendosapartados, unogeneral yotroespeccodecadavariable. Esposiblea nadir unabrevedescripci ondecadavariableyqueaparezcacomoetiquetadescriptiva juntoconel nombredelavariable. Porejemplo,a nadiremoslanotainformativasobrelainterpretaci ondelavariableReforma:Valor0sielpisoestaparareformar,valor1siestareformadoMarcamosconelrat onlavariableyvamosaVariableeditaratributos.Elcuadrosiguienteenelapartadodescripci onescribimoseltextoypinchamosenAceptar(verGr aco1.6).Lasetiquetasdescriptivasson utilesparasaberlafuentededatosolasunidadesdemedida.Porejemplo,paralavariableprecioym2a nadiremoslassiguientesetiquetasdescriptivas:Variable Etiquetadescriptiva Nombreamostrarengr acosprecio Preciodepisosenmilesdeeuros Precio(mileseuros)m2 Tama nodepisosenmetroscuadrados Supercie(m2)Laopci onDatos Editarinformaci ondalugarauncuadroquepermitea nadirtextoinfor-mativo,porejemplo,Datosutilizadoseneltema1deAn alisisderegresionconGretlFinalmente, laopci onDatos Verdescripci onpermitevisualizarlainformaciondelaes-tructuradelconjuntodedatosjuntoconlasnotasexplicativasa nadidas.Sitodoelprocesoseharealizadocorrectamente,enpantalladebeaparecerelsiguientecuadro:14 Tema1. Gretl ylaEconometraGr aco1.6:Cuadrodedescripci ondevariablesLOS LTIMOS CAMBIOS SE HAN GUARDADOGr aco1.7:Ficherocondescripci ondevariables1.5.1. AnalisisdescriptivodeunavariableUna vez incorporados los datos, vamos a obtener una visi on general de los mismos. El objetivodel analisis descriptivoes resumir unconjuntode datos, extrayendolas caractersticas einformacionmasrelevanteparael estudio. Enprimerlugar, sintetizaremoslainformacionde cadaunade las variables yenunasegundaetapa, obtendremos unaprimeraideadelasrelacionesexistentesentrelasvariables.Paraelloseutilizangr acosyn umeros-resumenconocidoscomoestadsticosdescriptivos1. El analisisdescriptivodeuna unicavariablequeproporcionaGretlseencuentraenlaopci onvariabledelmen uprincipal;unresumendeesteanalisisseobtieneenelmen uauxiliarqueaparecealpincharconlatecladerechadelrat onsobrelavariable.El gr aco mas utilizado para resumir datos de secci on cruzada de una unica variable econ omi-caesel histograma, queaparececonlaopci ondel men uauxiliarGr acodefrecuencias.Se tratade undiagramade barras que enel eje horizontal oabscisarepresentalos va-1Esteapartadoesunresumendelosconceptosmnimosrelevantes. Explicacionesmasdetalladasseen-cuentranenmanualescomoPe na&Romo(1997).Analisisderegresi onconGretl 15lores delavariabledivididos enintervalos. Sobrecadaintervalosedibujaunabarra, cu-yasuperciereejael n umerodeobservaciones quepertenecenadichointervalo. Si, porejemplo, pinchamos con la tecla derecha del rat on sobre la variable precios y vamos aGr aco de frecuencias, aparece el cuadro de opciones del histograma enla que jamos: N umero de intervalos: Por defecto aparecen 7 intervalos, que es un n umero entero proxi-moaN,siendoNeln umerodeobservaciones,enestecaso50. Valormnimointervaloizquierdoy grosordelintervalo: todos los intervalos deben tenerla misma amplitud. Por defecto, se eligen de manera que el punto central o marca de clasedelosintervalosprimeroy ultimosean,respectivamente,losvaloresmnimoym aximoquetomalavariableenelconjuntodedatos. 0 0.05 0.1 0.15 0.2 0.25 0.3 020040060080010001200Frecuencia relativaprecioGr aco1.8:HistogramadefrecuenciasrelativasUsando las opciones estandar de Gretl obtenemos el Gr aco 1.8. Si pinchamos sobre el gr aco,sedespliegaunmen uauxiliarquepermitehacercambiosenel gr aco(editar)oguardarloendiversosformatos(portapapeles, postcript, etc). Laopci onguardarasesi oncomoiconoguardael gr acoalolargodelasesi ondeGretl. Esdecir, unavezcerradalaventanadelgr aco, serecuperapinchandoenel cuartosmbolodelabarradeherramientas situadaenparte inferior derechade laventanaprincipal (vistaiconos de sesi on) y, acontinuaci on,pinchandodosveceseneliconogr aco1.BARRA DE HERRAMIENTASGr aco1.9:Iconosdelasesi on16 Tema1. Gretl ylaEconometraParaverlatablaconladistribuciondefrecuenciasrepresentadaenel histograma, hayquemarcarlavariablecorrespondienteeiralaopci onVariable Distribuci ondefrecuencias.Porejemplo,latabladedistribuciondefrecuenciasdelavariableprecioes:Distribucion de frecuencias para precio, observaciones 1-50 n umerode cajas = 7, media = 489,858, desv.t p.=237,416intervalo punto medio frecuencia rel acum.< 230,23 150,25 6 12,00% 12,00% ****230,23 - 390,19 310,21 15 30,00% 42,00% **********390,19 - 550,15 470,17 9 18,00% 60,00% ******550,15 - 710,11 630,13 11 22,00% 82,00% *******710,11 - 870,06 790,08 6 12,00% 94,00% ****870,06 - 1030,0 950,04 1 2,00% 96,00%>= 1030,0 1110,0 2 4,00% 100,00% *Tabla1.2:Distribuci ondefrecuenciasdelpreciode50pisosEnlaprimeracolumnaaparecenlosintervalosenquesehandivididolosvaloresquetomalavariableprecioylasegundaincluyeel puntomedioomarcadeclasedel intervalo. Lacolumna frecuenciaes lo que se conoce como frecuenciaabsoluta de un intervalo, es decir,el n umerodepisosconprecioeneseintervalo. Por ejemplo, enlaTabla1.1hay15pisoscuyo precio se encuentra entre 230232ey 390190e. La columna, rel, contiene la frecuenciarelativadecadaintervalo, es decir, lafracci ondeobservaciones quehayencadatramo.Conestasfrecuenciassehaconstruidoelhistogramaanterior.Porejemplo,los15pisosconprecio en el intervalo [230,232; 390,190) constituyen el 30 % del total de los 50 pisos. Y, comotodoslosintervalossondeigual amplitud, laalturadelasegundabarradel histogramaeslafrecuenciarelativaasociadaentantoporuno, esdecir, 0,3. Si alafrecuenciarelativadeunintervaloselesumanlasfrecuenciasrelativasdelosanterioresseobtienelafrecuenciarelativaacumuladahastacadaintervalo, queapareceenlacolumnaacum. Porejemplo,enelconjuntodepisosqueestudiamos,un42 %deellostieneunprecioinferiora390190e.Ladescripci onnumericadeunavariableseencuentraenlaopci ondel mismomen uauxi-liarEstadsticosdescriptivos oenel men uprincipal, Variable Estadsticosprincipales. ElresultadoparalavariableprecioeslaTabla1.3:Estadsticos principales, usando las observaciones 1 - 50para la variable precio (50 observaciones v alidas)Media 489,86 Desviacion t pica 237,42Mediana 466,68 C.V. 0,48466M nimo 150,25 Asimetr a 0,68052M aximo 1110,0 Exc. de curtosis -0,19251Tabla1.3:Estadsticosdescriptivosdelpreciode50pisosEstaventanatieneunnuevomen u.Laopci on CopiarpermiteimportarlatablaauncheroMSWord,Latexosimplemente,comoapareceenpantalla(Textoplano).EstosestadsticosAnalisisderegresi onconGretl 17descriptivosreejanalgunascaractersticasdeladistribucionrecogidasenelhistograma.Lamedia y la mediana son medidas de posici on, la desviacion tpica y el coeciente de variaci onsonmedidasdedispersion, mientrasquelaasimetrayexcesodecurtosissonmedidasdeformadeladistribucion.Lasmedidas deposici ondanunaideadelasituaci onocentrodel conjuntodepuntos.Lamediaeselvalorpromedio.SidisponemosdeNdatosdeunavariablex1, x2, . . . , xN,lamedia,otambienmomentomuestraldeprimerorden,sedenecomo: x =x1 +x2 +. . . +xNN=1NN

i=1xiLamediaesunestadsticopocorobustofrentealapresenciadevaloresextremos: observa-cionesanomalasvanatenerunagraninuenciaenelvalorquetome.Porejemplo,sielpison umero50tuvieraunpreciomuyalto, porejemplo, 1350milesdeeurosenlugarde1051,entonceselpreciomedioaumentaraencasi6000euros,situandoseen495,84milesdeeuros.Engeneral, interesanestadsticos cuyovalor novare muchoante cambios enlos valoresdeunaspocasobservaciones, pormuygrandesqueseanesasvariaciones. Lamediana, quees el valor central deladistribucion, poseeestapropiedad. As, lamedianadel precio es466, 68milesdeeuros.Las medidas de posici on proporcionan un valor representativo del conjunto de datos que debecomplementarse con una medida del error asociado. Para valorar la representatividad de este unicovalor seutilizanlasmedidas dedispersi on, queinformandesi lasobservacionesestanpococoncentradas(omuydispersas)alrededordesucentro.Unamedidasencillaesladiferenciaentrelosvaloresmaximoymnimoquetomanlosdatosenlamuestra, loqueseconocecomorecorrido.Esdecir,Recorrido = M aximo - MnimoEnel ejemplo, tenemos que el recorridode los precios es 1110-150,25=959,75miles deeuros. Esta medida solo tiene en cuenta dos valores, los extremos. Otras medidas se elaborancontodoslosdatos,porejemplo,ladesviaciontpica,queeslarazcuadradapositivadelavarianza.Lavarianzadeunconjuntodedatossedenecomounpromediodeloscuadradosdelasdesviacionesdelosdatosalamedia.Gretlcalculalavarianza,S2oS2x,como:S2x=(x1 x)2+ (x2 x)2+. . . + (xN x)2N 1=1N 1N

i=1(xi x)2Portanto,ladesviaci ontpica,Sx,secalculaseg un:Sx= +_1N 1N

i=1(xi x)2Varianza y desviacion tpica son medidas de la dispersion de los datos alrededor de la media.Tieneel valormnimocerocuandotodoslosdatosdelavariabletomanel mismovalor. Laventajadeladesviaciontpicaesquetienelasmismasunidadesdemedidaquelavariableoriginal.Engeneral,cuantomasproximaaceroesteSx,m asconcentradosestaranlosdatos18 Tema1. Gretl ylaEconometraalrededor de lamediayestaser am as representativadel conjuntode observaciones. Sinembargo, al depender Sxde las unidades de medida, no es f acil comparar su representatividaden dos conjuntos de datos. Para solucionar este problema se utiliza el coeciente de variaci on,C.V.,queesunamedidaadimensionaldeladispersion,ysedenecomo:C.V. =Sx| x|si x = 0En el ejemplo de precios tenemos que C.V. = 0, 485 < 1, la dispersion de los datos es peque naenrelacionasunivel,porloque consideramosquelamedia sesbastanterepresentativadelconjuntodedatos.Mediaydesviaciontpicasonlosestadsticos-resumenm asconocidos.Seacompa nandelasmedidasdeforma, quereejanotrascaractersticasdel histograma. Laasimetradeunadistribucionsereereasilosdatossedistribuyendeformasimetricaalrededordelamediaono.Elcoecientedeasimetrasedenecomo:Coecientedeasimetra =1NN

i=1_xi xSx_3=1N

Ni=1(xi x)3S3xconSx=_(N 1)/N Sx=_i(xi x)2/N.Elcoecientedeasimetraescerocuandolos datos sedistribuyensimetricamentealrededor delamedia, es positivocuandolacoladerecha(asociadaavaloresporencimadelamedia)esm aslargaquelaizquierdasiendonegativaencasocontrario. Enel ejemplode los precios de los pisos, observamos que laasimetraespositiva, loquesecorrespondeconunamediamayorquelamediana, esdecir, x>Mediana(X). 0 0.05 0.1 0.15 0.2 0.25 0510152025Asimetra positiva 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2-2 -10123Asimetra negativa Gr aco1.10:TiposdeasimetraElcoecientedecurtosisesunamedidadelapuntamientodeladistribucionysedene:Curtosis =1NN

i=1_xi xSx_4=1N

Ni=1(xi x)4S4xEstecoecientemidelacantidaddeobservacionesqueseencuentranenlascolasenrelacionconlassituadasalrededordelamedia. El nivel dereferenciaestres, queesel valordelaAnalisisderegresi onconGretl 19curtosisdeladistribucionnormal.As,sedeneelexcesodecurtosiscomo:Exc.decurtosis =1N

Ni=1(xi x)4S4x3 (1.1)Unexcesodecurtosispositivoindicamayorpesodeobservacionesenlacolaymayorapun-tamientoqueladistribucionnormal, mientrasquesi esnegativoindicamenorn umerodeobservacionesenlacolaymenorapuntamiento.Cuandotenemos unconjuntode variables, Gretl permite recoger enuna unicatablalosestadsticosdescriptivosdetodaslasvariables.Elprocesoeselsiguiente:1. Seleccionarlasvariablesdeinterespinchandosimult aneamentelateclaizquierdadelrat onylateclaControl.2. Ir a Ver Estadsticosprincipales o utilizar Estadsticosdescriptivosen el men u auxi-liarqueaparecealpincharlatecladerechadelrat onsobrelasvariablesseleccionadas.As,conlosdatosdelaTabla1.1seobtienelasiguientetabladeestadsticosdescriptivos:Estadsticos principales, usando las observaciones 1 - 50Variable MEDIA MEDIANA MIN MAXm2 127,34 105,00 55,000 250,00Reforma 0,62000 1,0000 0,00000 1,0000precio 489,86 466,68 150,25 1110,0Variable D.T. C.V. ASIMETRIA EXC.CURTOSISm2 59,048 0,46370 0,67091 -0,77954Reforma 0,49031 0,79083 -0,49445 -1,7555precio 237,42 0,48466 0,68052 -0,19251Tabla1.4:EstadsticosdescriptivosdelconjuntodedatosdondeD.T. indicadesviaciontpica, MINesmnimoyMAXdenotael m aximo. Al inter-pretarestosresultados,hayquetenerencuentaquelavariableReformanoesunavariablecuantitativacontinua,sinounavariablecualitativadiscreta,quesolotomavalores1 o0.1.5.2. RelacionesentrevariablesCuandoel conjuntodedatoscontiene, porejemplo, dosvariablescuantitativasnosinteresaestudiarlarelacionoasociacionqueexisteentreellas. Engeneral, al analizardos(om as)variables, podemosestablecerunarelaciondecausalidadentreellas. Porejemplo, podemospensarqueel preciodeunpisopuedeserconsecuenciadel tama nodelavivienda, peronoal reves. Sellamavariableindependienteoexogena, x, alaquecausael efectoyvariabledependiente o endogena, y, a la que lo recibe. La relacion entre estas variables puede estudiarsecon gr acos o expresarse numericamente mediante, por ejemplo, el coeciente de correlacion.Todosestoselementosdel analisisdescriptivodeunconjuntodevariablesserealizaconelmen uquesedespliegaenlaopci onVerdeGretl.20 Tema1. Gretl ylaEconometraRepresentaci ongraca. Eldiagramadedispersionoscatterplot daunaprimeraideadelarelacionentredosvariables.Eselgr acoquerepresentacadapunto(xi, yi), i=1, . . . Nenel plano: la variable x aparece en el eje de abscisas y la variable yen el eje de ordenadas. Porejemplo,paraobtenerconGretlelGr aco1.11,preciosobresupercie,podemosseguirunodelossiguientespasos: Ver Gr acos Gr acoX-Y(scatter)yenelcuadroDenirel gr acomarcar:VariabledeejeX Elegir >m2VariablesdeejeYA nadir >precio Obienseleccionar lasvariablesprecioym2 pinchandosimult aneamentelateclaiz-quierdadelrat onylateclaControl eiralmen uauxiliar,Gr acodedosvariablesXY.Enelsiguientecuadro,seseleccionalavariabledelaabscisa,m2.Al pincharenAceptar apareceel Gr aco1.11que, ademasdelanubedepuntos, incluyeunarecta-sntesisdelarelacion, larectaderegresionmnimocuadr aticaqueveremosm asadelante. 100 200 300 400 500 600 700 800 900 1000 1100 1200 50100150200250Precio (miles euros)Superficie (m2)Precio con respecto a Superficie (con ajuste mco)Y = 44,9 + 3,49XGr aco1.11:Diagramadedispersionsupercie-precios(2)Alpincharsobreelgr acoapareceunmen uauxiliarquesirvepara: Exportar el gr aco a cheros en diferentes formatos en Guardar como Windows metale(EMF). . . ,PNG. . . ,postscript(EPS). . . ,PDF. . . . Copiar/exportarelgr acoaotroscherosconCopiaral portapapeles. Guardarelcheroenlasesi ondeGretlenGuardarlasesi oncomoicono. RealizarcambiosenelcheroconEditar.Enlapesta naPrincipal secontrolaelttulodelgr aco,eltama noytipodeletra,elcolordelaslneas/puntos,eldibujodelmarcocompleto, lasituaci ondetextoexplicativodelasvariablesrepresentadas(posici ondelaclave)olaeliminaciondelarecta-resumen.Laescalaylaexplicaci ondelosejessemodicaenEjeXyEjeY. Enlneas secontrolalarepresentaciondelosdatos, tipodelneaopunto,yeltextoexplicativodelasvariables.Etiquetaspermitea nadirtextoenelgr acoysalidaacheroincluyevariosformatosparaguardarelgr aco.Analisisderegresi onconGretl 21El gr aco de dispersion permite distinguir la posible relacion, lineal o no, que existe entre lasvariables. Sedicequehayunarelaci onlineal positiva entreambasvariablescuandoalaumentar x, aumenta en promedio el valor de y (gura b en el Gr aco 1.12). Diremos que hayunarelaci onlineal negativa entreambasvariablescuandoobservamosqueal aumentarx, disminuye en promedio el valor de y(gura c). En el ejemplo, se observa una clara relacionlinealpositivaentreprecioytama nodelpiso.-3-2-10123-1.6 -1.2 -0.8 -0.4 0.0 0.4 0.8 1.2 1.6-4-3-2-101234-1.6 -1.2 -0.8 -0.4 0.0 0.4 0.8 1.2 1.6-3-2-10123-1.6 -1.2 -0.8 -0.4 0.0 0.4 0.8 1.2 1.6-2-10123456-1.6 -1.2 -0.8 -0.4 0.0 0.4 0.8 1.2 1.6X1Y1X2Y2X3Y3X4Y4(a) Sin relacin lineal (b) Relacion lineal positiva(c) Relacin lineal negativa (d) Relacin no linealGr aco1.12:DiagramasdedispersionCovarianza y correlaci on. Lacovarianzaes unamedidadel gradode asociacionlinealentredosvariables. Si setienenNparesdedatosdedosvariables, (x1, y1) . . . (xN, yN), lacovarianzasedenotaporSxyysedene:Sxy= cov(x, y) =1NN

i=1(xi x)(yi y)siendo xe ylasmediasaritmeticasdelasvariables. Lacovarianzadependedelasunidadesde medidade las variables, loque nopermite comparar larelacionentre distintos paresde variables medidas enunidades diferentes. Enestos casos se utilizael coeciente decorrelaci onlinealentrexey,quesedene:rxy= corr(x, y) =SxySxSy=

Ni=1(xi x)(yi y)_

Ni=1(xi x)2_

Ni=1(yi y)222 Tema1. Gretl ylaEconometraEl coecientedecorrelacionlineal ylacovarianzatienenel mismosigno: sonpositivos siexisterelacionlineal directaopositiva(gurabenel Gr aco1.12), sonnegativossi existerelacionlineal inversaonegativa(gurac) ytomavalorcerosi xeysonindependientes(gura a) o cuando la relacion, si existe, es no lineal (gura d). Adem as, su valor no dependedel ordenenqueseconsiderenlasvariables, esdecir, Sxy=Syxyrxy=ryx. Adiferenciadelacovarianza,elcoecientedecorrelacionesunamedidaadimensionaldelarelacionquetomavaloresentre-1y1, 1 rxy 1: uncoecientedecorrelacionigual aunoenvalorabsolutoindicaquelasvariablesestanrelacionadaslinealmentedeformaexactaylosdatossesit uansobreunalnea.EnGretl, si semarcanlas variables queinteresanysevaaVer Matriz decorrelaci onseobtieneunatabla(matriz)conloscoecientesdecorrelacionparacadapardevariablesconsideradas.Elresultadoparalosdatosdeprecios,tama noyreformadelospisoses:Coeficientes de correlacion, usando las observaciones 1 - 50valor cr tico al 5% (a dos colas) = 0,2787 para n = 50m2 Reforma precio1,0000 0,0440 0,8690 m21,0000 0,2983 Reforma1,0000 precioTabla1.5:MatrizdecoecientesdecorrelacionPor ejemplo, el coeciente de correlacion entre el precio y el tama no de los pisos se encuentraenlaprimerala, columnatercera, (precio-m2). Esdecir, rprecio,m2=0, 869, loqueindicaque hay una fuerte relacion lineal positiva entre estas variables. Hay que tener en cuenta queeste coeciente se dene para variables cuantitativas, por lo que no lo aplicamos a la variableReforma.Analisisderegresi onconGretl 23BibliografaDavidson, D. yJ. Mackinnon(2004), EconometricTheoryandMethods, OxfordUniversityPress.Greene,W.(2008),EconometricAnalysis,6aedn.,Prentice-Hall.Gujarati,D.(1997),Econometrab asica,4aedn.,McGraw-Hill.Heij, C., de Boer, P., Frances, P., Kloek, T. y H. Van Dijk (2004), EconometricMethodswithApplicationsinBusinessandEconomics,OxfordUniversityPress.Pe na, D. y J. Romo (1997), Introducci on a la Estadstica para las Ciencias Sociales, McGraw-Hill.Ramanathan, R. (2002), Introductory Econometrics with Applications, 5aedn., South-Western.Stock,J.yM.Watson(2003),IntroductiontoEconometrics,Addison-Wesley.Verbeek,M.(2004), AGuidetoModernEconometrics,2aedn.,JohnWiley.Wooldridge, J. M. (2003), IntroductoryEconometrics. AModernApproach, 2aedn., South-Western.24 Tema1. Gretl ylaEconometraTema2ModelodeRegresi onLineal SimpleContenido2.1. Introducci on.Unejemplo . . . . . . . . . . . . . . . . . . . . . . 262.2. Elementosdel modeloderegresionsimple . . . . . . . . . . . . 282.3. Hipotesisbasicas. . . . . . . . . . . . . . . . . . . . . . . . . . . 292.3.1. Resumen:modeloderegresi onlinealsimpleconhip otesisbasicas 332.4. EstimacionporMnimosCuadradosOrdinarios . . . . . . . . . . 332.4.1. El criteriodeestimaci onmnimo-cuadratico . . . . . . . . . . . 362.4.2. PropiedadesdelosestimadoresMCO . . . . . . . . . . . . . . . 362.4.3. Laestimaci onMCOenGretl . . . . . . . . . . . . . . . . . . . 372.4.4. Propiedadesdelarectamnimo-cuadratica. . . . . . . . . . . . 402.4.5. Laprecisi ondelaestimaci onylabondaddel ajuste. . . . . . . 422.5. Contrastesdehipotesiseintervalosdeconanza. . . . . . . . . 452.5.1. Contrastesdehip otesissobre. . . . . . . . . . . . . . . . . . 452.5.2. Intervalosdeconanza . . . . . . . . . . . . . . . . . . . . . . 472.6. Resumen.Presentaciondelosresultados . . . . . . . . . . . . . 4926 Tema2. ModelodeRegresi onLineal Simple2.1. Introduccion.UnejemploSupongamosquenosinteresaconocerlarelacionquehayentreel preciodeunaviviendaydeterminadascaractersticasdelamisma. Empezaremosconsiderandoel casom assencillo,una unica caracterstica, la supercie. Se trata de cuanticar la inuencia que tiene el tama nodeunaviviendaenladeterminaciondesupreciodeventamedianteunmodeloderegresionlinealsimple.Enestecaptulovamos aespecicar, estimar yanalizar el modelode regresi onlinealsimple. Lateoranecesariaparaestenser ailustradamedianteel estudiosimult aneodelconjunto de datos data3-1disponible en Gretl dentro del conjunto de datos correspondiente aRamanathan. Este chero contiene el precio de venta y la supercie de 14 viviendas vendidasenelareadeSanDiego.Vamosacomenzarrealizandounanalisisgraco.1. AccedemosaesteconjuntodedatosenArchivo Abrirdatos Archivodemuestray en la carpeta de datos de Ramanathanseleccionamos data3-1Housepricesandsqft:Gr aco2.1:SelecciondeuncherodemuestraSeabreuncheroquecontienetresvariables,const,priceysqft.LaTabla2.1muestralosvaloresdisponiblesparacadavariable.2. EnDatos Leerinformaci onaparecelasiguientedescripci ondelconjuntodedatos:DATA3-1: Precio de venta y superficie h abil de viviendasunifamiliaresen la comunidad universitaria de San Diego en 1990.price = Precio de venta en miles de d olares (Rango 199.9 - 505)sqft = Pies cuadrados de area habitable (Rango 1065 - 3000)Analisisderegresi onconGretl 27i PiF2 i P F21 199,9 1065 8 365,0 18702 228,0 1254 9 295,0 19353 235,0 1300 10 290,0 19484 285,0 1577 11 385,0 22545 239,0 1600 12 505,0 26006 293,0 1750 13 425,0 28007 285,0 1800 14 415,0 3000Tabla2.1:Conjuntodedatosincluidosendata3.1Housepricesandsqft3. Seguidamente en Variable Editaratributoscambiamos los nombres a las variables (PyF2),ladescripci on(Preciodeventaenmilesded olaresyPiescuadradosh abiles)yelnombreamostrar(Precio,PySupercie,F2)4. Guardamosloscambiosenuncherollamadodatos-cap3.gdt conArchivo Guardardatos.5. Abrimosel diagramadedispersionentrelasdosvariables(verel Gr aco2.2). EnelobservamosunarelacionlinealpositivaentrePyF2. 150 200 250 300 350 400 450 500 550 1500200025003000Precio, PSuperficie, F2Precio, P con respecto a Superficie, F2 (con ajuste mnimo-cuadrtico)Y = 52,4 + 0,139XGr aco2.2:Diagramadedispersionprecio-superciedeviviendasUnmodelosencilloquerecogeunarelacionlineal causa-efectoentresupercieyprecioesPi= + F2i. Estoquieredecirqueel preciodeunaviviendadepende unicamentedesusuperciey,porlotanto,dosviviendasdeigualtama nodebentenerexactamenteelmismoprecio. Estahipotesis es pocorealistaporquediferencias enotras caractersticas, comolaorientaciondelacasaosuestadodeconservaci on,tambieninuyenensuprecio.Debemos,portanto, especicarunmodeloeconometricoquerecogeestacaracterstica: el modeloderegresionlinealsimple.28 Tema2. ModelodeRegresi onLineal Simple2.2. Elementosdel modeloderegresi onsimpleElmodelosimplerelacionadosvariablesdeformalineal,Yi= +Xi +uii = 1, . . . , N (2.1)donde:- Yes la variableaexplicar, variabledependienteoend ogena, es decir, la variablequeestamosinteresadosenexplicar.- Xeslavariableexplicativa,variableindependienteoex ogena.- Laordenadaylapendientedelmodelosonloscoecientesdelaregresi on.SidenimosKcomoel n umerodecoecientesdesconocidosaestimar, enel modeloderegresionsimpletenemosK= 2coecientesaestimar.- ueselterminodeerror,variablealeatoriaoperturbaci on.- El subndiceidenotaobservaci on. Engeneral, el subndiceiser aempleadocuandolamuestracontengadatosdesecci oncruzadayelsubndicet cuandotengamosobser-vaciones correspondientes a series temporales, aunque esto no es de especial relevancia.- Nesel tama nomuestral, n umerodeobservacionesdisponiblesdelasvariablesdeestudio (Y, X). Cuando tratemos con datos temporales Tdenotara el tama no muestral1.Elerroruiseintroduceporvariasrazones,entrelascualestenemos: Efectos impredecibles, originados por las caractersticas de la situaci on econ omica o delcontexto de analisis, y efectos no cuanticables derivados de las preferencias y los gustosdelosindividuosoentidadesecon omicas. Erroresdemedidaproducidosalahoradeobtenerdatossobre lasvariablesdeinteres. Erroresdeespecicacionocasionadosporlaomisiondealgunavariableexplicativaobien,porlasposiblesnolinealidadesenlarelacionentreXeY .Modelo para la relacionprecio-tama no del piso. Eneste casoplanteamos el siguientemodeloderegresionlineal:Pi= +F2i +uii = 1, . . . , N (2.2)donde- Pies la observaci on i de la variable dependiente (end ogena o a explicar) precio de ventaenmilesdedolares.1Eneste captuloylos siguientes, por simplicidad, noreservaremos laletramay usculaparavariablesaleatoriasXylasmin usculaspararealizaciones(x)sinoqueutilizaremosmay usculastantoparaunavariablealeatoriacomocomoparasurealizacion,esdecir,paralosdatos.Analisisderegresi onconGretl 29- F2ieslaobservaci onidelavariableindependiente(ex ogenaoexplicativa) areahabi-tableenpiescuadrados.- Losdoscoecientesaestimarsony, ysospechamosqueal menostienevalorpositivoyaqueamayorsuperciehabitabledelaviviendasupreciol ogicamenteseesperaraseamayor.- En este modelo el termino de error o perturbacion ui recogera caractersticas especcasde los pisos: lugar enel que se sit ua, orientacionde la casa, vistas, etc., es decir,caractersticas que diferencianel preciode los pisos que tienenlamismasuperciehabitable.Unprimerobjetivodelanalisiseconometricoesconocery,quesonlosparametrosdelarelacion entre Py F2. Del total de viviendas del area objeto de estudio, tenemos una muestracon datos de N= 14 pisos. Por tanto, el objetivo del estudio es inferir, a partir de la muestra,larelacionprecio-tama nodeunaviviendaenlapoblacion.Parallevaracaboestainferenciaesnecesariodeterminarlanaturalezaaleatoriadelasvariablesqueintervienenenelestudio.2.3. Hip otesisbasicasElmodelo(2.1)debecompletarseconlaespecicaciondelaspropiedadesestocasticasdelavariable de interes Y . A partir de las propiedades de Y , es posible conocer las propiedades delos distintos metodos de estimaci on, elegir el mejor estimador en el modelo, realizar contrastes,etc.Lascondicionesbajolascualesvamosatrabajarenunprincipiosedenominanhip ote-sis b asicas. Bajoestashipotesisestimaremosyanalizaremosel modelopara, nalmente,predecir Y . Enunasegundaetapa, podemos considerar otras situaciones, relajandoalgu-nasdeestashipotesis,analizandosilosprocedimientosdeestimaci onycontrasteanterioressiguen siendo validos. Las hipotesis basicas se reeren a los distintos elementos de la regresion.Sobrelaformafuncional1. Elmodeloeslinealenloscoecientes. Losmodelosaestimaralolargodel cursosonlineales enlos coecientes, Yi=+Xi+ui. Sinembargo, podemos permitir nolinealidadesenlasvariablesexplicativascomopuedeserlaespecicacion:Pi= + (F2i)2+uienlaquelasuperciehabitabledelospisosnoinuyedeformalinealsobreelprecio,sinodeformacuadr atica.Sobreloscoecientes2. Loscoecientesysemantienenconstantesalolargodelamuestra. Vamosacon-siderar que la inuencia de las variables explicativas es estable a lo largo de la muestra.Supongamosqueestamosinteresadosenanalizar,enterminosmedios,elpreciodelos30 Tema2. ModelodeRegresi onLineal Simplepisos de Bilbao (P) en funci on de la supercie habitable en metros cuadrados (F2). Enestecasointeresaraestimarlarectacentral representadaenelcaso1delGr aco2.3.Noobstante, supongamos que algunos de estos pisos estanlocalizados enel centrode Bilbao (representados enazul) yque otros estanlocalizados enla periferia (enrojo).Elcaso2delGr aco2.3muestraestahipoteticasituaci on:engeneral,paraunadeterminadasupercie, lospisosdel centrotienenmayorprecio. As, enel gr acoesposibledistinguirdosnubesdepuntos,cadaunaasociadaapisosdeunadeterminadazona. Si este fuera el caso, estaramos dispuestos a creer que existen (y debemos estimar)dos rectas centrales (laazul ylaroja) permitiendoque tantolaordenadacomolapendiente cambien a lo largo de la muestra, dependiendo de la zona en la que se localiceelpiso.Caso1:Sindiscriminarporlocalizaci on-6PF2E(Pi) = +F2iCaso2:Discriminandoporlocalizaci on-6 PF2E(Pi/C) = 1 +1F2iE(Pi) = +F2iE(Pi/P) = 2 +2F2iGr aco2.3:PreciopisosdeBilbaovesussuperciehabitableSobrelavariableend ogena3. Lavariableendogenaescuantitativa.Alolargodeestecursobasicovamosasuponerquelavariableaexplicarescuantitativa. Locontrario, unavariableend ogenacuali-tativa, requieremetodosdeestimaci onalternativosal metodoqueseanalizaenestecurso.Sobrelavariableexplicativa4. LavariableexplicativaXtienevarianzamuestralS2XnonulayademasN K= 2.Estashipotesissonnecesariasparapoderidenticarloscoecientes(ordenadaypen-diente). Enprimer lugar, si el n umerodecoecientes aestimar fueramayor queeln umerodeobservacionesdisponiblesenlamuestra,notenemossucienteinformacionparapoderllevaracabolaestimaci on. M asadelanteveremosqueestacondicionde-behacersemasestricta, N>2, si ademasdeestimarlosdosparametrosyquedeterminanelvalormediodeY ,nosinteresaestimarsuvariabilidad.Porotraparte, si lavariableexplicativatuvieravarianzamuestral nula(S2X=0), esdecir, si lavariableexplicativatomaseunvalorconstante, porejemplo, Xi=5 i, lapendienteylaordenadanopodranseridenticadas.EstosedebeaquelavariableXesunacombinacionlinealdelterminoconstante,X= 5 terminoconstante = 5 1 =Analisisderegresi onconGretl 315. Dehecho, tal ycomosepuedeobservar enel Gr aco2.4, unasituaci ondeestascaractersticasnopuedeexplicarlasvariacionesdelavariabledeinteresY .6-YiXiXi= 5Gr aco2.4:ModeloYi= + 5 +ui, conS2X= 05. LavariableexogenaXesja, noaleatoria. Lasobservacionesdel regresorX1, . . . XNsonvalores jos enmuestras repetidas, es decir, suponemos que trabajamos enuncontextodeexperimentocontrolado.EstacondicionimplicaquelavariableexplicativaXno podra estar medida con error. En el caso practico que estamos considerando, estosignicaquelosmetroscuadradoshabitablesestanmedidosconexactitud.Enmuchoscasos es un supuesto poco realista, pero lo utilizamos como punto de partida. El contextoenel quelavariableexplicativaXtienecar acter aleatorioseestudiaentextosm asavanzados,porejemplo,Wooldridge(2003)oAlonso,Fern andez&Gallastegui(2005).6. Elmodeloestabienespecicado. En general, esta hipotesis requiere que en el modelo nose incluyan variables irrelevantes ni que se omitan variables relevantes para explicar Y .Enelcontextodelmodeloderegresionsimple,estosignicaquelavariableexplicativaXesla unicavariablerelevanteparaexplicarypredecirlavariabledeinteresY .Sobrelaperturbaci onEl terminodeerrorrecogeaquelloselementosqueafectanalavariabledeinteresyquenoobservamos. Podemos hacer conjeturas sobre los valores que puede tomar, cu ales son m as pro-bables y cu ales menos. As, consideramos que ui es aleatorio y tiene las siguientes propiedades.7. Laperturbaciontienemediacero.Elerrorimpredecible,lapartealeatoriadelmodelo,tiene media cero. Esto implica que la parte sistematica del modelo (+Xi) puede serinterpretadacomoelcomportamientomedioaanalizar,esdecir,E(Yi) = +Xi.8. Laperturbaciontienevarianzaconstante. Suponemosquelavariabilidaddel errorsemantieneconstante,var(ui) = 2, i(vercaso1delGr aco2.5).Deestemodo,comopuede verse en la distribucion de la gura izquierda del Gr aco 2.6, dados unos valoresespeccosdelavariableexplicativa, el rangodeposiblesvaloresquepuedetomarlavariableendogenatienelamismaamplitudylaprobabilidaddeobservar elementosalejadosdelamedianodependedelvalorquetomelavariableexplicativaX.32 Tema2. ModelodeRegresi onLineal SimpleCaso1:varianzaconstante?6-uiXi0Caso2:varianzacrecienteconXi?6-uiXi0Gr aco2.5:EjemplosderealizacionesdeuEnel casocontrario, estaramos hablandode perturbaciones heteroced asticas, cuyadispersionpuedevariaralolargodelamuestra(vercaso2delGr aco2.5).Enelcasode los pisos, signicara, por ejemplo, que el rango de los precios de los pisos con menorsuperciees mas peque noqueel delos pisos conmayor superciehabitable(ver laguraderechaenelGr aco2.6).Enotraspalabras,lospisospeque nosyconlamismasupercietienenlospreciosbastanteparecidos. Sinembargo, amedidaqueaumentalasupercie, laholguracreceypodemosencontrarpisosgrandesdeigual tama noadiversosprecios;esdecir,var(ui)esunafunci oncrecienteenX.Varianzaconstante Varianzanoconstantef(u)YXX1X2Gr aco2.6:EjemplosdedistribuciondeY9. Laperturbacionnoestaautocorrelacionada. Porel momentovamosasuponerquelacorrelacionentredosobservacionesdistintascualesquieradelaperturbacionescero,corr(ui, uj)=rui,uj=0;i =j.Estoimplicaquelascovarianzasentredosperturba-cionestambienescero:cov(ui, uj) = 0, i = j.Analisisderegresi onconGretl 3310. Laperturbacionsigueunadistribucionnormal. Este ultimo supuesto, como veremosmasadelante, nosenecesitaparalaestimaci onni paralaobtenciondepropiedadesdel estimador2. Sinembargoesnecesarioparapoderrealizarcontrastedehipotesisocalcularintervalosdeconanza.2.3.1. Resumen:modeloderegresi onlineal simpleconhip otesisbasicasAbreviadamente,elmodeloconlashipotesisbasicasmencionadasseescribe:Yi= +Xi +ui, Xijayui NID(0, 2) iEsdecir,Yi NID( +Xi, 2),siendo,y2parametrosdesconocidos.Enparticular,nosinteresamosporlosparametrosdelamediaysuinterpretaci onenestemodeloes: = E(Yi|Xi= 0):valormediooesperadodelavariableend ogenacuandoelvalorquetomalavariableexogenaescero. =E(Yi)Xi=E(Yi)Xi: unaumentounitarioenlavariableexplicativaconllevaunaumentomediodeunidadesenlavariableend ogena.LapendientemideelefectodeunaumentomarginalenlavariableexplicativasobreE(Yi).As,volviendoanuestroejemplotenemosque: = E(Pi|F2i= 0)eselpreciomediodeventaenmilesdedolarescuandoelpisodisponedeuna supercie de cero pies habitables, que tambien puede ser considerado como precio mnimodepartida.Enestecaso,esperaramosuncoecientenulodadoquenotienesentidohablardeunpisosinsuperciehabilobienunpreciodepartidapositivo.Noobstante,aunqueenestecontextolaordenadanotieneenprincipiomuchosentido, nodebemosdeeliminarlaalaligeraenarasdeobtenerresultadosf acilesdeinterpretar.=E(Pi)F2iindicaque,cuandounpisoaumentasusuperciehabilenunpiecuadrado,supreciomedioaumentaenmiles$.2.4. EstimacionporMnimosCuadradosOrdinariosUnavezdescritoelambitoenelquenosvamosamover,vamosaobtenerunestimadorade-cuadodeloscoecientesdelmodeloderegresionsimple:elestimadordemnimoscuadradosordinarios. Enprimerlugar, obtendremosel estimadory, acontinuaci on, justicaremossuusoenbaseasuspropiedades. El modelosimple(2.1)nosindicaquecadaobservaci onYies unarealizaciondeunavariablequetienedos componentes: unoquedependedel valordelregresorXi,cuyovalorobservamos,yuncomponenteresidualquenoobservamos.EstosignicaquetenemosNigualdadesconunamismaestructura:2Estoesas porqueel metododeestimacionquesevaaderivaresel deMnimosCuadradosOrdinarios.Sinembargo, si seestimasepormaximaverosimilitudel supuestodenormalidadsobreladistribuciondeYsesnecesarioparalaobtenciondelestimador.34 Tema2. ModelodeRegresi onLineal SimpleY1= +X1 +u1...Yi= +Xi +ui...YN= +XN+uNEl Gr aco2.7representagr acamenteunaposiblemuestra. Lospuntos(Yi, Xi)sesit uanodistribuyenalrededordelarecta +Xi.Ladesviaciondecadapuntorespectoaestarectacentral vienedadaporelvalorquetomeelterminodeerrornoobservableui.Porejemplo,enelGr aco 2.7,la perturbaciones positiva parala primera observaci on, de modoque Y1seencuentraporencimadelarectacentral. Porotrolado, el punto(Y2, X2)seencuentrapordebajodelarectacentral,esdecir,u2tomaunvalornegativo.6-YiXi?6u16?u2(Y2,X2)(Y1,X1)E(Yi) = +Xi +E(ui). .=0Gr aco2.7:ModeloderegresionsimpleAs,larectacentralseraaquellarectaqueseobtienecuandoelvalordelaperturbacionescero.Teniendoencuentaquesuponemosquelaperturbaciontienemediacero,esdecir,quenotieneefectossistematicossobreY ,larectacentral recogeelcomportamientomediodelavariabledeinteres.Laestimaci ondeunmodeloderegresionpretendeobtenerunaaproxi-maci onaestarectacentralnoobservable.Enterminoseconometricos,queremoscalcularelcomportamientomediodelavariabledeinteres, + Xi, apartirdeobservacionesprove-nientes de una muestra (Y1, X1), (Y2, X2), . . . , (YN, XN). Gr acamente, la estimaci on consisteencalcularlapendienteylaordenadaquemejorseajustaalanubedepuntos.Antesdeprocederalaestimaci ondel modeloesprecisodeniralgunosnuevosconceptos.Larectacentral objetodeestimaci onsedenominaFunci ondeRegresi onPoblacional(FRP)ydependedeloscoecientespoblacionalesdesconocidosy.Setratadelapartesistematicaopredecibledel modeloycorrespondeal comportamientomediooesperadodelavariableaexplicar:E(Yi) = E( +Xi +ui) = +Xi +E(ui). .=0= +XiAnalisisderegresi onconGretl 35Laperturbaci ondel modelorecoge todoaquelloque nohasidoexplicadopor lapartesistematicadelmodeloyseobtienecomoladiferenciaentrelavariableaexplicarylarectaderegresionpoblacional:ui= Yi XiElresultadonalobtenidoapartirdelainformacionqueofreceunamuestradadasedenecomo la Funci ondeRegresi onMuestral (FRM). Se obtiene una vez que los coecientesdelaregresionhayansidoestimados( , )ytambienseconocecomomodeloestimado:Yi= E(Yi) = +XiEl residuo mide el error cometido al estimar la variable end ogena yse dene como ladiferenciaentrelavariableaexplicarylarectaderegresionmuestral: ui= YiYi=Yi Xi= +Xi +ui Xi(2.3)= ( ) + ( )Xi +uiEste error proviene de dos fuentes: la primera, por el hecho de no poder obtener los valores dela perturbacion (ui) y la segunda se debe a que la estimaci on de los coecientes desconocidos(, )introduceunerroradicional. Esimportante, portanto, diferenciarynoconfundirelresiduoconlaperturbacion.-6 YiXi(Y1, X1)Y1X1E(Yi) = +Xi?6u1?6 +X1Yi= +Xi +X1=Y1?6 u1Gr aco2.8:Funci onderegresionpoblacionalyfunci onderegresionmuestralEn el Gr aco 2.8 la funci on de regresion poblacional est a trazada en color negro as como loscoecientespoblacionales, laordenada()ylapendiente(). Podemosverqueel valorYiseobtienecomolasumadel valorquetomalapartesistematica + Xi(situadasobrelaFRP)ydelvalorquetomalaperturbacionui,estoes,Yi= +Xi +ui.Lafunci onderegresionmuestral ylos coecientes estimados ( y) estanrepresentadosencolorrojo. LadiferenciaentrelaFRPylaFRMsedebealoserroresquesecometenenlaestimaci ondeloscoecientesdelaregresion( =, =). BasandonosenlaFRMpodemos obtener el valor del punto Yi como la suma del valor estimado de la parte sistematicaYi= + Xi(situado sobre la FRM) y del valor que toma el residuo ui, esto es, Yi=Yi+ ui.36 Tema2. ModelodeRegresi onLineal Simple2.4.1. El criteriodeestimaci onmnimo-cuadraticoDados el modelo y una muestra, debemos decidir como obtener la funci on de regresion mues-tral, esdecir, comocalcularlasestimaciones yapartirdelosdatos. Unmetodomuyutilizado por su sencillez y buenas propiedades es el metodo de mnimos cuadrados ordinarios.El estimadordeMnimosCuadradosOrdinarios, oMCO, delosparametrosyseobtienedeminimizarlasumadelosresiduosalcuadrado:mn ,N

i=1 u2i= mn ,N

i=1(YiYi)2= mn ,N

i=1(Yi Xi)2(2.4)Lasexpresionesdelestimadordeyseobtienendelascondicionesdeprimerorden,paralocualigualamoslasprimerasderivadasacero:

Ni=1 u2i = 2

Ni=1(Yi Xi) = 0

Ni=1 u2i= 2

Ni=1(Yi Xi)Xi= 0As, obtenemosunsistemadeecuaciones, llamadasecuacionesnormales, quevienendadaspor:N

i=1(Yi Xi). . ui= 0 (2.5)N

i=1(Yi Xi)Xi. . uiXi= 0 (2.6)Las expresiones de los estimadores MCO para los coecientes poblacionales y se obtienenderesolverlasecuacionespara y: =

Ni=1(XiX)(YiY )

Ni=1(XiX)2=SXYS2X(2.7) =Y X (2.8)2.4.2. PropiedadesdelosestimadoresMCONecesitamossabercu alessonlaspropiedadesquejusticanel usodelosestimadoresMCOenel modeloderegresionsimplebajolashipotesisbasicas. Losestimadores y sonli-nealesenlaperturbacion, esdecir, puedenexpresarsecomounacombinaci onlineal delasperturbacionesu1, . . . , uN. Ensegundolugar, losestimadoresMCOsonvariablesaleatoriascuyadistribucionestacentradaalrededordelvalorpoblacional,estoesE( ) = E() = Analisisderegresi onconGretl 37y,portanto,sonestimadoresinsesgados.Yencuantoalaprecision,elTeoremadeGauss-MarkovpruebaquelosestimadoresMCOtienenmnimavarianzadentrodelconjuntodelosestimadoreslineales(enu)einsesgados.Lasvarianzasycovarianzaparalosestimadoressonlassiguientes:var( ) = 2_

Ni=1X2iN

Ni=1(XiX)2_=2_1N+X2N S2X_(2.9)var() = 2_1

Ni=1(XiX)2_=2N1S2X(2.10)cov( , ) = 2_X

Ni=1(XiX)2_= 2NXS2X(2.11)Ambas varianzas dependendeladispersiondelaperturbacionvar(ui) =2, del tama nomuestralydeladispersiondelregresorX.Enamboscasos,cuantomayorseaNolavaria-bilidaddeX,S2x,menoreslavarianzadelosestimadoresMCO.Encuantoalacovarianzaser anonulaanoserquelamediaaritmeticadelavariableexplicativaseacero.2.4.3. Laestimaci onMCOenGretlComoejemplo, calcularemoslasestimacionesMCOdel modeloparael preciodelavi-vienda,Pi= +F2i +ui,conlamuestradelcherodatos-cap3.gdt.UnaformasencilladeobtenerlaFRMmnimo-cuadraticaesrealizarel diagramadedispersionenel cual larectade regresion aparece en la parte superior izquierda. En el ejemplo que nos ocupa tenemos que = 52, 4y= 0, 139,comosepuedeverenelGr aco2.2.Vamosavercomopodemosobtenerunatabladeresultadosdetallados.Unaveziniciadalasesi ondeGretlyabiertoelcherodatos-cap3.gdt,vamosaModelo Mnimoscuadradosordinarios...Aparecelaventanadondeseespecicalapartesistematicadelmodelo:Gr aco2.9:Ventanadeespecicaciondelmodelolineal38 Tema2. ModelodeRegresi onLineal Simple Escogemos la variable dependiente, el precio de venta: en el cuadro izquierdo pinchamossobrePyluegoElegir >. Elegimoslavariableindependiente,eltama no:enelcuadroizquierdopinchamossobreF2yluegoA nadir >.LaventanadeespecicacionapareceenelGr aco2.9.TraspincharenAceptar aparecelaventanaderesultadosdel modelo(verel Gr aco2.10).MEN DEL MODELOGr aco2.10:Ventanaderesultadosdeestimaci onMCOEnesta ventanaaparecen los resultados basicos para elan alisis delmodelo y que se explicandetalladamentealolargodel curso. Laprimeracolumnamuestralasvariablesexplicativasquesehanincluidoenel modelo, laconstante(const)ylasuperciequeposeelavivienda(F2). En la segunda columna tenemos los coecientes estimados por MCO correspondientes acada una de las variables. Como ya vimos, la estimaci on de la ordenada es igual a = 52,35milesdedolaresylaestimaci ondelapendientees =0, 138750miles$porpiecuadrado.Aslafunci onderegresionmuestrales:Pi= 52, 3509 + 0,138750F2i(2.12)Esdecir,cuandolasuperciedelaviviendaaumentaenunpie cuadrado,elpreciomediodeventaestimadoaumentaen 1000=138, 750dolares. Observarqueestainterpretaci oncorrespondealaestimaci ondelcoeciente,noalparametropoblacional.Estaventanaderesultadosdel modelotieneunmen uconsieteopciones, Archivo, Editar,Contrastes,Guardar,Gr acos,An alisisyLatex,quesirvenparamostrarotrotipoderesul-tadosdeestimaci onoguardarlos.Veamosalgunasdeestasutilidades.Guardarresultados. Sienelmen uderesultadosdelmodelovamosaArchivo Guardarasesi oncomoicono, el modeloquedaguardadodentrodelacarpetaUSER. As, podemosrecuperarlo siempre que queramos; basta con pinchar sobre el bot on iconosdesesi on, cuartopor la izquierda de la barra de herramientas (ver el Gr aco 2.11), y en la ventana que aparece,pinchar dos veces sobre el icono llamado Modelo 1. Si posteriormente estim aramos otro modeloyloguardaramoscomoicono,GretllodenominaraModelo2.Algunosgracosdeinteres. Laopci onGr acosdelaventanaderesultadosdelmodeloincluyedistintasrepresentacionesgr acastantodelavariableend ogenadeinteres,comodeAnalisisderegresi onconGretl 39ICONO DEL MODELO ESTIMADOVista de iconosGr aco2.11:Ventanadeiconos:recuperarresultadosestimaci onsu ajuste y de los errores de su ajuste. Veamos algunos de los m as utilizados en regresion condatosdesecci oncruzada. EnGr acos Gr acodevariableestimadayobservada contraF2 obtenemos elgr acodedispersiondelasobservacionesrealesPifrentealavariableexplicativaF2ijunto con la funci on de regresion muestral (2.12). El resultado es la gura izquierda delGr aco2.12. 150 200 250 300 350 400 450 500 550 1500200025003000Precio, PSuperficie, F2Precio, P observada y estimadaactualestimada-60-40-20 0 20 40 60 80 100 1500200025003000residuoSuperficie, F2Residuos de la regresin (= P observada - estimada)Gr aco2.12:Gr acosderesultadosderegresionMCO Si seleccionamos Gr acos Gr acoderesiduos contraF2, se representan los erroresde ajuste uisobre la variable explicativa F2i, es decir, el diagrama de dispersion de lospares de puntos (F21, u1), . . . , (F214, u14), como aparece en la gura derecha del Gr aco2.12.Podemosapreciarquelosresiduossedistribuyenalrededordelvalorcero( u = 0)yquelavariacionconrespectoaestamediacreceamedidaqueaumentael tama nodelospisos. Este ultimoresultadopodraindicarquelahipotesisbasicadevarianzaconstantequizasnoseaaceptable.Variablesasociadasalaregresi on. ParaverlosvaloresquetomanlosajustesYiylosresiduos ui,debemosseleccionarAn alisis Mostrarvariableobservada,estimada,residuos.El resultadoqueobtenemos es latabla2.2. Podemos guardar cualquieradeestos valoresseleccionandolaopci onGuardardelmen udelmodelo,talcomomuestraelGr aco2.13.40 Tema2. ModelodeRegresi onLineal SimpleRango de estimacion del modelo: 1--14Desviacion t pica de los residuos = 39,023Observaciones P estimada residuos Observaciones P estimada residuos1 199,9 200,1 0,2 8 365,0 311,8 53,22 228,0 226,3 1,7 9 295,0 320,8 25,83 235,0 232,7 2,3 10 290,0 322,6 32,64 285,0 271,2 13,8 11 385,0 365,1 19,95 239,0 274,4 35,5 12 505,0 413,1 91,96 293,0 295,2 2,2 13 425,0 440,9 15,97 285,0 302,1 17,1 14 415,0 468,6 53,6Tabla2.2:ResiduosdelaregresionMCO.ParaalmacenarPihayqueelegir Guardar Valores estimados. Saleunaventanillaenlaque, pordefecto, el valorajustadooestimadodelavariableend ogenasellamayhat1 yenladescripci onaparecevalores estimados medianteel modelo1. Dadoquenuestravariabledependienteesel preciodeventaP, cambiamosdenombrealavariableylarenombramoscomophat1. Si repetimos los pasos anteriores peroescogemos Guardar Residuos, enlaventanillacorrespondientesenombraalosresiduoscomouhat1yladescripci onesresiduosdel modelo1. Unavezguardadasestasdosseries, lasencontramosenlaventanaprincipaljuntoalavariableindependientePylavariableexplicativaF2.Gr aco2.13:ResiduosMCO2.4.4. Propiedadesdelarectamnimo-cuadraticaVamos a realizar un peque no analisis de las variables que intervienen en la regresion mnimo-cuadr atica,conobjetodeestudiarlassimilitudesyrelacionesquepuedenexistirentreellas.Finalmente, generalizaremos estos resultados, comprobando que estas propiedades se cumplenencualquierregresionlinealmnimo-cuadratica.Comenzaremosobteniendolos estadsticosdescriptivosdelregresorF2,la variable end ogenaP, su ajustePy su residuo u en Ver Estadsticos principalesde la ventana inicial de Gretl:Analisisderegresi onconGretl 41Estadsticos principales, usando las observaciones 1 - 14Variable Media Mediana M nimo M aximoP 317, 493 291, 500 199, 900 505, 000F2 1910, 93 1835, 00 1065, 00 3000, 00phat1 317, 493 306, 958 200, 120 468, 602uhat1 0, 000000 1, 1919 53, 601 91, 8983Variable Desv. T p. C.V. Asimetr a Exc. de curtosisprecio 88, 4982 0, 278741 0, 653457 0, 529833F2 577, 757 0, 302344 0, 485258 0, 672125phat1 80, 1640 0, 252491 0, 485258 0, 672125uhat1 37, 4921 6, 15597e+15 1, 02687 0, 817927Tabla2.3:EstadsticosdescriptivosdevariablesdelaFRMAnalizandoestatabla-resumendelosdatoscomprobamosque:i) Lamediadelosresiduos(uhat1)escero, u = 0.ii) LasmediasdelavariabledependientePiylaestimada(phat1)coinciden,P=P.iii) Los coecientes de asimetra y curtosis de la variable dependiente ajustada Pi coincidenconlasdelavariableindependienteF2i.Acontinuacion,vamosaanalizarlasrelacioneslinealesexistentesentreestasvariables.Me-dianteVer Matrizdecorrelaci onobtenemoslasiguientematrizdecorrelaciones:Coeficientes de correlacion, usando las observaciones 1 - 14valor cr tico al 5\% (a dos colas) = 0,5324 para n = 14P F2 uhat1 phat11, 0000 0, 9058 0, 4236 0, 9058 P1, 0000 0, 0000 1, 0000 F21, 0000 0, 0000 uhat11, 0000 phat1Tabla2.4:MatrizdecorrelacionesPodemosverque:iv) Los valores ajustados Piy el regresor F2iestan perfectamente correlacionados,rPF2= 1.v) LacorrelacionentrelosvaloresobservadosPiconlosvaloresajustados Piylava-riableexplicativaF2ieslamisma,rP P= rPF2.vi) Losresiduos uiylavariableexplicativaF2iestanincorrelacionados,r uF2= 0.vii) Losresiduos uiylavariableajustada Piestanincorrelacionados,r uP= 0.Justicaci on de estos resultados: La propiedad i) se deriva de la primera ecuacion normal(2.5),quenosindicaquelasumadelosresiduoshadesercero,porloque u = 0.Notarquelaprimeraecuacionnormalexistesolosielmodelotieneterminoindependienteynoenotrocaso. Por lo tanto, los resultados que se obtienen derivados de ella solo se cumplen en el caso42 Tema2. ModelodeRegresi onLineal Simplede que el termino independiente exista. De u = 0 y comoY=Y+ u, se obtiene la propiedadii).Laspropiedadesiii), iv)yv)sedebenaquelosvaloresde PseobtienendeuncambiodeorigenyescaladelavariableF2, P= +F2.Estarelacionimplicaquesusdistribucionesdefrecuenciastienenlasmismaslasmedidasdeforma,estanperfectamentecorrelacionadasentresytienenlamismacorrelacionlinealfrenteatercerasvariables.Lapropiedadvi)sederivadelasecuacionesnormales(2.5), queindicaque u=0, y(2.6),queimplicaquelosresiduossonortogonalesalavariableexplicativaX,

iXi ui= 0.Comoconsecuencia,lacovarianzamuestralentreresiduoyvariableexplicativaescero:SX u=1NN

i=1(XiX)( ui u) =1NN

i=1Xi uiX u = 0y, por tanto, la correlacion entre ambas variables es: r uX= S uX/S uSX= 0. Esto nos vienea decir que en la parte del modelo que queda sin explicar, el residuo u, ya no queda nada quela variable exogena Xpueda explicar o aportar en terminos lineales. Finalmente, bas andonosen que r uX= 0 y que el ajusteYes una transformaci on lineal de X, se demuestra la propiedadvii),r uY= 0.DeestacondicionydadoqueYi=Yi + ui,sederivauna ultimapropiedad:viii)Lavarianza muestralde Ypuededescomponerse endosterminos:la varianza explicadaporXylavarianzaresidual,esdecir,S2Y= S2Y+S2 u2.4.5. Laprecisiondelaestimaci onylabondaddel ajusteUna vez realizada las estimaciones de los coecientes del modelo, la siguiente etapa del analisisconsisteenelanalisisyevaluaciondelosresultados.Porejemplo,1. Obtenerunamedidadelaprecisionenlaestimaci ondey.2. Evaluarlacalidaddel ajustealosdatos, esdecir, si lafunci onderegresionmuestral,Yi= +Xi,resumebienelcomportamientoobservadodelavariableend ogena.3. Evaluarsielmodelopropuestoescorrectoosihayalg unerrorenlaespecicaciondelmodelo,enlashipotesisplanteadas.Este apartado desarrolla los puntos 1 y 2. La respuesta al punto 3 es m as compleja, de modoqueelsiguienteapartadointroducealgunosaspectosdelaevaluaciondelmodelo.Laprecisiondelaestimaci onEnelapartado7deltema1vimosqueladesviaciontpicade ladistribucionmuestraldelosestimadoreseraunbuenindicadordelaprecision.Sinembargo,habitualmenteladesviaciontpicadelosestimadorestienealg unelementodesconocido. Estosucedeenestecaso, comopuede comprobarse en la expresi on de las varianzas (2.9) y (2.10), que dependen de la varianzaAnalisisderegresi onconGretl 43delaperturbacionvar(ui)=2. Podemosobtenerunaestimaci ondeladesviaciontpicasustituyendo el parametro poblacional por unestimador insesgado, . El resultado seconocecomoerrorestpicosdeloscoecientesdelaregresi on,esdecir,Errortpico( ) = des( ) = N1 +X2N S2XErrortpico() = des() = N1SXUnestimadorinsesgadodelavarianza2es: 2=1N 2N

i=1 u2i=1N 2N

i=1(YiYi)2donde

i u2ies lasumade cuadrados residual, (oSCR), yN 2sonlos grados delibertad que tenemos tras estimar y . Su raz cuadrada se conoce como errortpico delosperturbacionesoerrortpicodelaregresion.Portanto,laprecisiondelasestimacionesde los coecientes aumenta con el n umero de observaciones Ny la dispersion del regresor SXydisminuyecuandocreceelerrortpico .Deformasimilar,seconstruyeelsiguienteestimadorinsesgadodelamatrizdelasvarianzasylacovarianzadelosestimadoresMCO:V_ _=_ var( ) cov( , ) cov( , ) var()_= 2_____1N+X2

i(XiX)2_X

i(XiX)21

i(XiX)2____Errorestpicosdeestimaci onyestimaci ondelasvarianzasenGretl. En los resultadosdeestimaci ondelcasopracticoaparecenlossiguientesvaloresrelacionadosconlaprecision:Modelo 1: estimaciones MCO utilizando las 14 observaciones 1-14Variable dependiente: PVARIABLE COEFICIENTE DESV.TIP. ESTAD T VALOR Pconst 52,3509 37,2855 1,404 0,18565F2 0,138750 0,0187329 7,407 2, 179, porloquetmpertenecealaregi oncrticay,enconsecuencia,rechazamosH0aunniveldesignicaci ondel5 %.PodemosconcluirquelavariableF2essignicativaorelevanteparadeterminarel preciomediodelavivienda. Enel temasiguiente, veremoscomolacolumnaVALORPdelatabladeresultadosdeGretlinformasobrelaconclusi ondelcontraste.Otroscontrastessobre. Comohayevidenciaestadsticadequeesdistintodeceroy,porlotanto, lavariableexplicativaXessignicativa, nospuedeinteresarsaberquevalorpuedetomar.Vamosageneralizarelprocedimi