cedeac-3_1.pdf

Upload: gianina

Post on 02-Mar-2018

223 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/26/2019 CEDEAC-3_1.pdf

    1/101

    E E

    Centro de Estudiossobre Desarrollo EconmicoFacultad de EconomaUniversidad de los Andes

    2006

    3

    APUNTES DE CLASE CEDE ISSN1909-4442

    OCTUBRE DE

    INTRODUCCINA LA ECONOMETRA

    Ramn Antonio Rosales lvarezJorge Alexander Bonilla Londoo

  • 7/26/2019 CEDEAC-3_1.pdf

    2/101

    CEDE

    E E

    APUNTES DE CLASE

    2006

    3

    ISSN1909-4442

    INTRODUCCINA LA ECONOMETRA

    Ramn Antonio Rosales lvarezJorge Alexander Bonilla Londoo

    OCTUBRE DE

  • 7/26/2019 CEDEAC-3_1.pdf

    3/101

  • 7/26/2019 CEDEAC-3_1.pdf

    4/101

    INTRODUCCIN A LA ECONOMETRA*

    RAMN ANTONIO ROSALES LVAREZ**

    JORGE ALEXANDER BONILLA LONDOO

    ***

    Resumen

    La econometra es una de las importantes aplicaciones de estadstica matemtica, y una herramienta fundamental en investigacin econmica, el diseo y anlisis de poltica. El presendocumento desarrolla para aquellos que inician el estudio de

    economa, los elementos tericos bsicos sobre la modelacieconomtrica. Se aborda el modelo clsico de regresin lineal y ssupuestos, y la manera de efectuar hiptesis. Este documento considera un desarrollo preliminar para la posterior iniciacin temas ms avanzados de econometra.

    Palabras claves: anlisis de correlacin, mnimos cuadradordinarios, modelo economtrico, pruebas de hiptesis.

    Clasificacin JEL: C01, C10 y C20.

  • 7/26/2019 CEDEAC-3_1.pdf

    5/101

    INTRODUCTION TO ECONOMETRICS

    Abstract

    Econometrics is one of the most important applications tomathematical statistics and a fundamental tool in the economic resand in the design and analysis of economic policy. The pdocument develops the basic theory concepts of the economodeling for those that begin the study of economics. The specificassumptions, estimation, hypothesis testing and predictions fo

    classical regression model are the principal topics presented in thisThe concepts, the tools and their applications developed indocument are relevant for tackling many practical problems in toworld and for the introduction in advanced econometric courses.

    Key words: correlation analysis, least squares estimation, econommodel, hypothesis tests.

    JEL classification: C01, C10 y C20

  • 7/26/2019 CEDEAC-3_1.pdf

    6/101

    TABLA DE CONTENIDO1.LAMODELACINYLAECONOMETRA ......................................................................

    1.1. Mtodos Cuantitativos de la Economa. .......... ........... .......... ........... .......... .......... ...1.2. Definiciones de la Econometra....... ........... .......... ........... ........... .......... ........... .......1.3. Objetivo de la Econometra...................................................................................1.4. El Procedimiento Economtrico........... .......... ........... .......... ........... .......... ........... ...1.5. El Modelo .......... ........... ........... .......... ........... ........... .......... ........... ........... ........... ....1.6. El Modelo Econmico ........... .......... ........... .......... ........... .......... ........... .......... ........

    1.7. El Modelo Economtrico .......... ........... .......... ........... .......... ........... .......... ........... ....1.8. Elementos que componen el Modelo .............. .......... ........... .......... ........... .......... ....1.9. Clasificacin de las Variables................................................................................1.10. Clasificacin de las Ecuaciones............................................................................1.11. Clasificacin de los Modelos..................................................................................

    2.ORGANIZACINDEDATOSYESTADSTICADESCRIPTIVA ...................................2.1. Objetivos de la Estadstica...... ........... .......... ........... ........... .......... ........... .......... ...........

    2.2. Divisiones de la Estadstica..........................................................................................

    2.4. Poblacin y Muestra .....................................................................................................

    2.5. Parmetros Poblacionales y Estadsticos Muestrales ........... ........... .......... ........... ........

    2.6. Medidas de Tendencia Central y de Dispersin ........... .......... ........... ........... .......... .......

    2.7. Mtodos y Diagnsticos Grficos. .......... .......... .......... .......... ........... .......... .......... ..........

    2.8 Ejercicios de computador ..............................................................................................

    3.ANALISISDECORRELACION .........................................................................................3.1. Diagrama de Dispersin................................................................................................

    3.2. Coeficiente de Correlacin Lineal.................................................................................

    3.3. Pruebas de Hiptesis ....................................................................................................

    3.4. Ejercicios de computador .............................................................................................

    4.REGRESIONSIMPLELINEALYNOLINEAL.................................................................4.1. Objetivo del anlisis de regresin ................................................................................4.2. Funcin de regresin muestral y poblacional ...............................................................

    4.3. Supuestos del modelo de regresin................................................................................

    4.4. Mtodo de estimacin de mnimos cuadrados ordinarios.............................................

    4.5. Varianzas y errores estndar de los estimadores .......... ........... .......... .......... .......... .......

    4.6. Intervalos de confianza.................................................................................................

    4.7. Pruebas de hiptesis .....................................................................................................

    4.8. Prediccin.....................................................................................................................

    4.9. El Coeficiente de Determinacin..................................................................................

    4.10. Modelos de regresin simple no lineal en las variables .......... .......... ........... .......... .....4.11. Ejercicios de Computador ...........................................................................................

    5.REGRESIONMULTIPLELINEALYNOLINEAL ...........................................................5.1. Expresin del modelo en forma matricial......................................................................

    5.2. Supuestos del modelo....................................................................................................

    5.3. Mtodo de estimacin de mnimos cuadrados ordinarios.............................................

    5.4. Matriz de varianzas y covarianzas de los estimadores .......... ........... .......... .......... .........

  • 7/26/2019 CEDEAC-3_1.pdf

    7/101

    6.2. Heteroscedasticidad........................................................................................................

    6.3. Autocorrelacin ............................................................................................................

    6.4. Error de especificacin..................................................................................................

    6.5. No Normalidad de los errores .......................................................................................

    6.6. Ejercicios de computador. ............................................................................................

    7.INTRODUCCINAVARIABLESCUALITATIVAS .......................................................7.1. Regresin con variables independientes cualitativas ...................................................

    7.2. Regresin con variable dependiente cualitativa ......... ........... ........... .......... ........... ........

  • 7/26/2019 CEDEAC-3_1.pdf

    8/101

    INTRODUCCIN

    El curso de Econometra hace parte del rea de mtodos cuantitativos eny se constituye en una herramienta importante en la investigacin eco

    diseo y anlisis de poltica. El contenido y el desarrollo del curso s

    introductorio y su inters es la aplicacin de los conceptos tericos. El c

    proporcionarle al estudiante las bases iniciales para el manejo de los

    modelos economtricos, los elementos necesarios para el manejo de la inanlisis de resultados e interpretacin de las salidas del computador, y fa

    en sus aplicaciones, tales como la investigacin y la evaluacin de m

    poltica.

    El documento se encuentra dividido en siete secciones. La primera p

    definicin de la econometra, sus objetivos, el concepto del mo

    caracterizacin. La segunda trata de la organizacin de datos y la

    descriptiva. La seccin tres aborda los aspectos bsicos del a

    correlacin. La seccin cuatro presenta el modelo formal de regre

    simple. La quinta seccin muestra el modelo de regresin lineal mltiple

    seccin presenta la teora relacionada con el incumplimiento de los supmodelo. La seccin siete efecta una introduccin al anlisis tran

    regresin con variables independientes cualitativas y de variable d

    cualitativa. Al final del documento se incluye un anexo que de

    procedimiento general de manipulacin de datos en el paquete ec

    Eviews 4.1.

    1. LA MODELACIN Y LA ECONOMETRA

    1 1 Mtodos Cuantitativos de la Economa

  • 7/26/2019 CEDEAC-3_1.pdf

    9/101

    La investigacin economtrica se inici con el anlisis estadstico de la

    por Cournout (1838) y Marshall (1890). Posteriormente Tinbergen en 19

    aporte a la econometra mediante el estudio del anlisis de los ciclos ec

    Sin embargo, en el periodo de 1943-1950 la econometra comienza su

    con los trabajos de la Comisin Cowles. La hiptesis bsica es:

    econmicos se generan por sistemas de relaciones que son, e

    estocsticos, dinmicos y simultneos".

    La econometra hoy en da es una herramienta muy importante para e

    comportamiento de los fenmenos econmicos. Su desarrollo ha sido

    debido a la dinmica que han mostrado los adelantos en el anlisis m

    en mtodos estadsticos y de computacin.

    1.2. Definiciones de la Econometra

    Dado que en la econometra se asocian la Teora Econmica, las Matem

    Estadstica, diferentes definiciones han sido planteadas por los autores,

    se tratan de relacionar estas tres reas del conocimiento.

    G. Tintner: la econometra consiste en la aplicacin de la teora

    matemtica y de los mtodos estadsticos a los datos econmicos para

    resultados numricos y verificar los teoremas.

    W.C. Hood y T.C. Koopmans: la econometra es una rama de la econo

    la teora econmica y los mtodos estadsticos se fusionan en el an

    datos numricos e institucionales.

  • 7/26/2019 CEDEAC-3_1.pdf

    10/101

    Estas tres definiciones nos indican que la econometra es cuantitativa

    en estrecho contacto con la realidad.

    R. Frisch: la econometra a pesar de nutrirse de la Teora Econm

    Matemticas y de la Teora Estadstica, no es ni "Estadstica Econ

    "Teora Econmica", ni "Economa Matemtica".

    O. Lange: la econometra es la ciencia que trata de la determinacin, po

    estadsticos, de leyes cuantitativas concretas que rigen la vida econ

    combina la Teora Econmica con la Estadstica Econmica y trata d

    mtodos matemticos y de inferencia, una expresin concreta a

    generales establecidas por la teora.

    1.3. Objetivo de la Econometra

    El objetivo de la econometra es expresar la teora econmica e

    matemticos, verificar dicha teora por mtodos estadsticos, medir el

    una variable sobre otra, predecir los sucesos futuros, o proveer recomede la poltica econmica.

    1.4. El Procedimiento Economtrico

    El anlisis economtrico involucra las siguientes etapas principales:

    1. Especificacin del modelo: consiste en usar la teora, leyes

    particulares econmicas, para investigar las relaciones entre

    agentes de la economa.

  • 7/26/2019 CEDEAC-3_1.pdf

    11/101

    verificacin tiene un papel muy importante dado que examina si la

    cuantificada puede utilizarse adecuadamente con base en

    econmica.

    4. Prediccin: el modelo obtenido puede ser utilizado para la pred

    desarrollo de muchas aplicaciones. Pueden surgir nuevos

    tericos, y generarse implicaciones de poltica econmica a pa

    conclusiones del modelo.

    1.5. El Modelo

    Un modelo es una representacin simplificada de la realidad. Los inves

    los profesionales de diversas reas del conocimiento trabajan

    esquemas, los cuales les permiten estudiar el comportamiento de un fen

    inters.

    A. Rosenblueth se refiri a los modelos cientficos de la siguiente m

    construccin de modelos para los fenmenos naturales es una de

    esenciales de la labor cientfica. Mas an, se puede decir que toda la

    es sino la elaboracin de un modelo de la naturaleza. La intencin de el resultado de la investigacin cientfica, es obtener conocimiento y el

    alguna parte del Universo".

    1.6. El Modelo Econmico

    Se denomina modelo econmico a cualquier conjunto de supuestos queuna economa o parte de una economa. En este sentido, la teora econm

    entenderse como la formulacin y anlisis de modelos cuantitat

    esquematizacin requiere un planteamiento particular de las interrelacione

  • 7/26/2019 CEDEAC-3_1.pdf

    12/101

    2. Que la representacin sea simplificada, y

    3. Que se haga en forma matemtica.

    Al definir un modelo econmico como un conjunto de relaciones m

    (usualmente ecuaciones) que expresan una teora econmica, no

    necesariamente la especificacin concreta del tipo de funcin que re

    variables involucradas. Un ejemplo de un modelo econmico es:

    ( )kXXXfY ,,, 21 K= (1)

    donde Y = cantidad producida; Xi= cantidad del i-esimo insumo, i=1,2,,k

    Aunque esta ecuacin, denominada funcin de produccin, no pre

    estructura muy particular del arreglo de las variables X sobre Y, expres

    general la relacin entre el producto y los insumos, y que son las

    utilizadas de factores las que determinan la magnitud producida, y no lo co

    Para establecer una forma concreta de la especificacin de un modeprecisar el tipo de relacin que existe entre las variables econmicas. Un

    ello es una representacin lineal:

    kkXXXY ++++= L22110 (2)

    Est relacin puede ser correcta. Sin embargo, cuando no se conoce si e

    es determinante en forma lineal sobre Y, puede ocurrir error de esp

    Tambin se debe resaltar que este modelo hace nfasis en un nmero re

  • 7/26/2019 CEDEAC-3_1.pdf

    13/101

    1.7. El Modelo Economtrico

    El modelo economtrico es el modelo econmico que contiene las espec

    necesarias para su validacin emprica. Es usual concebir el modelo ec

    como un modelo conformado por una parte determinstica y una parte

    trmino de error. El modelo economtrico para el ejemplo expuesto en

    (2) tomara la forma:

    +++++= kkXXXY L22110 (3)

    donde kkXXX ++++ L22110 es la parte determinstica y es el

    error o componente estocstico.

    Los modelos economtricos por considerar un trmino aleatorio en su

    hacen parte de los modelos probabilsticos. Una diferencia fundamenta

    modelos econmicos y los modelos economtricos, es que los primeros s

    validos, dado que han sido establecidos por la teora econmica y solo p

    expresin general de ella. Por otro lado, los modelos economtricos

    estado de las cosas o de una situacin especfica y aunque tiene sus b

    teora econmica sus resultados pueden cambiar de un estudio a otro.

    Los modelos economtricos se prueban a travs del uso sistem

    informacin estadstica. Un modelo economtrico permite la inferencia epartir de los datos recopilados, por lo cual ste debe incorporar los

    aleatorios que se suponen intervienen en la determinacin de las obs

    Estas ltimas pueden constituyen una muestra si la aleatoriedad de lo

  • 7/26/2019 CEDEAC-3_1.pdf

    14/101

  • 7/26/2019 CEDEAC-3_1.pdf

    15/101

    d) Forma funcional: un investigador puede postular que la relacin

    variables de un modelo es de tipo lineal; no obstante, otro investiga

    formular una especificacin funcional distinta, por ejemplo cuadrtic

    otra fuente de error en la elaboracin del modelo, pues no se puede

    certeza sobre su forma funcional an cuando la teora seale algunas

    para corregirlo.

    De acuerdo con lo anterior un procedimiento sugerido para llevar

    formulacin de un modelo economtrico es el siguiente: 1) Delimitar el fe

    estudio; 2) Tener claridad sobre el objetivo del modelo; 3) Seleccionar la

    relevantes; 4) Establecer las relaciones entre las variables, y 5) Con

    objetivo planteado, estructurar una especificacin y estimar el modeloinformacin y base de datos de las variables.

    1.8. Elementos que componen el Modelo

    Los elementos que componen el modelo son: las variables, las ecuac

    parmetros.

    Una variable es una caracterstica de una poblacin que puede tomar

    valores. Solo son de inters aquellos valores de la variable que tienen un

    econmico. Por ejemplo las variables: precio, produccin, ingreso, y c

    insumo utilizado tienen regin econmicamente factible en los nmepositivos.

    Una ecuacin es una igualdad conformada por una expresin matem

  • 7/26/2019 CEDEAC-3_1.pdf

    16/101

    miden el efecto de las fluctuaciones de estas variables sobre la variable de

    Los parmetros cumplen un papel muy importante en el modelo, ya que s

    el investigador formula pruebas de hiptesis. Al observar la ecuac

    coeficiente que no acompaa ninguna variable independiente se le co

    constante paramtrica o intercepto; en algunos casos su magnitud

    interpretacin econmica.

    1.9. Clasificacin de las Variables

    Desde el punto de vista econmico las variables se pueden clasificar com

    endgenas y exgenas. Las variables endgenas son aquellas cuyos

    determinan o calculan dentro del modelo. En contraste, las variables ex

    caracterizan por que sus valores estn determinados fuera del modelo.

    Tambin existen otras clasificaciones de las variables; desde el e

    inferencia estadstica: variables aleatorias discretas y continuas, y de acue

    rol en expresin matemtica: variables dependientes e independientes, e

    explicativas. Otro grupo de variables lo constituyen las variables predeter

    este pertenecen las variables exgenas con o sin rezago (o retardo) y las rezagadas. Una denominacin adicional son las variables espera

    expectativas, las cuales son gran utilidad en la formulacin de modelos din

    1.10. Clasificacin de las Ecuaciones

    Bajo la perspectiva econmica las ecuaciones se pueden clasificar de l

    forma:

  • 7/26/2019 CEDEAC-3_1.pdf

    17/101

    hacen a los modelos. Ejemplos de ecuaciones de comportamie

    demanda, la oferta, la inversin, el consumo, el ahorro, etc.

    b) Ecuaciones tecnolgicas: El ejemplo tpico de una ecuacin tecno

    funcin de produccin, la cual refleja el estado de la tecnologa de

    de un pas.

    c) Ecuaciones institucionales: Reflejan un mandato o voluntad del go

    los estamentos que toman las decisiones en un pas. Ejemplo de

    institucionales son: oferta monetaria, impuestos, subsidios, etc.

    d) Ecuaciones de definicin: Son ecuaciones o identidades mate

    econmicas vlidas por definicin. Generalmente son relaciones conmayora de los ejemplos de este tipo de ecuaciones se encuent

    cuentas macroeconmicas. Una ecuacin de definicin es activo

    capital, o la ecuacin de identidad macroeconmica del Producto Nac

    para una economa con tres sectores.

    e) Ecuaciones de equilibrio: Estas garantizan que el modelo tenga

    Ejemplos de estas ecuaciones son: oferta igual a demanda, o aho

    inversin.

    1.11. Clasificacin de los Modelos

    Segn la cobertura econmica o subdisciplina, los modelos p

    microeconmicos o macroeconmicos. De acuerdo con el nmero d

    independientes, los modelos se dividen en simples y mltiples. Si se c

  • 7/26/2019 CEDEAC-3_1.pdf

    18/101

    2. ORGANIZACIN DE DATOS Y ESTADSTICA DESCRIPTIVA

    2.1. Objetivos de la Estadstica

    La estadstica es el lenguaje universal de la ciencia, tanto en sus ramas f

    sociales. La estadstica es un instrumento formal que utilizado de maneracon precisin, permite describir resultados y adoptar decisiones respec

    estos evidencian empricamente. La estadstica en su aplicacin sigue

    cientfico y se define como la ciencia de recolectar, clasificar, describir e

    datos numricos, es el lenguaje universal de la ciencia y el estudio de los

    aleatorios. Dentro de sus objetivos fundamentales se encuentra la estimaco ms caractersticas desconocidas de una poblacin, la realizacin de in

    pruebas de hiptesis.

    Se considera fundador de la estadstica a Godofredo Achenwall, econom

    (1719-1772), quien siendo profesor de la universidad de Leipzig, escrib

    descubrimiento de una nueva ciencia que llam estadstica (palabra d

    Staat que significa gobierno) y que defini como el conocimiento prof

    situacin respectiva y comparativa de cada estado. Desde su a

    estadstica se ha enriquecido continuamente con los aportes de m

    filsofos y cientficos.

    La teora general de la estadstica es aplicable a cualquier campo cientf

    se toman observaciones. El estudio y aplicacin de los mtodos estad

    necesarios en todos los campos del saber sean estos de nivel tcnico o

  • 7/26/2019 CEDEAC-3_1.pdf

    19/101

    2.2. Divisiones de la Estadstica

    La estadstica puede dividirse ampliamente en dos reas: estadstica d

    deductiva y estadstica inferencial o inductiva. La estadstica descriptiva

    en la que la mayora de la personas piensan cuando escuchan

    "estadstica". Esta es el rea de la estadstica dedicada a la r

    presentacin, y descripcin de datos numricos, cuyas conclusionesmismos no van ms all de la informacin que estos proporcionan. Por o

    inferencia estadstica es el mtodo y conjunto de tcnicas que se u

    obtener conclusiones ms all de los lmites del conocimiento aportado po

    en otras palabras, busca obtener la informacin que describe y carac

    poblacin a partir de los datos de una muestra.

    2.3. Tipos de Variables

    En estadstica cuando se recopila informacin, los datos se registran por

    observacin o medicin de una variable aleatoria que proviene de la rea

    un experimento. La variable se llama aleatoria, debido a la existencia

    resultados posibles del experimento y que no hay certeza total de que a

    uno de los resultados se obtenga siempre con una probabilidad del 10

    tanto, el hecho que una variable tome un valor particular es considerado

    aleatorio.

    An, cuando las observaciones resultantes no siempre son numricas

    experimentos, estas pueden cuantificarse asignndoles nmeros que

    representen una categorizacin. Por esta razn, el inters se centra ge

  • 7/26/2019 CEDEAC-3_1.pdf

    20/101

    infinito) y pueden arreglarse en una secuencia que corresponde uno a u

    enteros positivos; mientras las segundas toman valores dentro de un i

    recta de los nmeros reales. Si se tienen dos variables aleatorias, por

    nmero de hijos por familia y el consumo de energa elctrica; la p

    encuentra dentro del grupo de variables aleatorias discretas, y la segunda

    conjunto de variables aleatorias continuas.

    2.4. Poblacin y Muestra

    El concepto de poblacin y muestra es muy importante en la inferencia

    por lo que es conveniente presentar su definicin:

    Poblacin: Es la coleccin completa de individuos, objetos o mtienen una caracterstica en comn. La poblacin debe

    cuidadosamente en cada estudio cientfico de acuerdo con e

    objetivo de la investigacin.

    Muestra: Es un subconjunto de la poblacin; es decir, ella se c

    algunos de los individuos, objetos o medidas de una poblacin.

    es obtenida con el propsito de investigar, a partir del conocimie

    caractersticas particulares, las propiedades de toda la poblacin.

    primordial la seleccin de una muestra representativa de la po

    necesario formalmente enfatizar en la aleatoriedad de la muestr

    sobre la manera de seleccionar los elementos de la pob

    conformarn la muestra. La palabra aleatoriedad para este caso

    garantizar que cada elemento de la poblacin tenga la misma prob

    ser elegido Se considera que una muestra es ms eficien

  • 7/26/2019 CEDEAC-3_1.pdf

    21/101

    Bogot. Para este caso, la poblacin corresponde a todos los hogares de

    mientras que la muestra estar constituida por aquellos hogares que p

    seleccionados de manera aleatoria, como un grupo representativo de tod

    habitan en Bogot.

    2.5. Parmetros Poblacionales y Estadsticos Muestrales

    El trmino parmetro es utilizado para referirse a una caracterstica descla poblacin, que desea estimarse o evaluarse a travs de una prueba de

    que describe total o parcialmente su funcin de probabilidad o funcin d

    de probabilidad. Por otro lado, el estadstico es una medida numr

    caracterstica poblacional obtenida a partir de una muestra. Cabe ano

    estadsticos son fundamentales en la realizacin de inferencias. El valor la varianza son ejemplos de tales medidas.

    2.6. Medidas de Tendencia Central y de Dispersin

    Las medidas de tendencia central se encuentran dentro de las medidas

    que se emplean comnmente para describir conjuntos de datos. La tendede un conjunto de datos es la disposicin de stos para agruparse, ya se

    del centro o de ciertos valores numricos. A este grupo de medidas pe

    media, la mediana y la moda.

    Existen otro tipo de medidas numricas denominadas medidas de dispeobjetivo es explorar la variabilidad de los datos, es decir qu tan dispers

    observaciones en un conjunto de datos. Dentro de estas medidas se enc

    varianza, la desviacin estndar, el recorrido o rango, entre otras.

  • 7/26/2019 CEDEAC-3_1.pdf

    22/101

    luego, segn el inters del investigador presentarlos agrupados, en form

    o intervalos. Es importante tener en cuenta que las fuentes de informacin

    secundaria pueden almacenar sus datos sin agrupar o como datos a

    Con base en lo anterior, es relevante conocer el procedimiento de clc

    medidas numricas para ambos casos. Las expresiones algebraicas que

    la forma de obtener las medidas de tendencia central y de dispersin se m

    la Tabla No. 1.

    Con los datos agrupados de una variable aleatoria es posible construir h

    de frecuencias, los cuales pueden ser comparados con las representacion

    de distribuciones de probabilidad ya conocidas de variables aleatorias. En

    de los casos, estos histogramas se comparan con la distribucin normal,

    inspeccin es posible identificar sesgos o apuntamientos en la distribucin

  • 7/26/2019 CEDEAC-3_1.pdf

    23/101

    TABLA No. 1. MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN

    Medida Numrica Datos sin agrupar Datos agrupados

    Media=

    =

    n

    i

    i

    nx

    x1

    =

    =

    k

    i

    ii

    nxf

    x1

    , donde=

    =

    k

    i

    n

    Donde fi es la frecuencia absolutaclase i, para todo i = 1,2,,k claintervalos.

    Mediana

    Valor central de ladistribucin (el 50% de losdatos se encuentran porencima de este valor).

    )( mfjcLMediana +=

    DondeL es el lmite inferior de ladonde se encuentra la mediana, fmfrecuencia de esa clase, ces la londe ese intervalo y j es el nmeobservaciones en esta clase nece

    para completar un total de n/2.

    ModaValor ms frecuente

    Casos: Punto medio de la clase

    frecuencia ms alta. El promedio de los p

    medios de las consecutivas con frecueiguales ms altas.

    Puntos medios de las clasconsecutivas con frecueiguales ms altas.

    Medida Numrica Datos sin agrupar Datos agrupados

    Varianza)()( 12

    1

    2

    =

    nxxsn

    i

    i

    1

    2

    1

    1

    2

    2

    =

    ==

    n

    n

    x

    x

    s

    n

    i

    in

    i

    i

    1

    2

    12

    12

    =

    =

    =

    n

    n

    xf

    xf

    s

    k

    i

    ii

    i

    k

    i

    i

    Desviacin Estndar)1()( 2

    1

    2 == =

    nxxssn

    i

    i

    2

    n 1

    12

    12

    ==

    ==

    n

    n

    xf

    xf

    ss

    k

    i

    i

    i

    k

    i

    i

  • 7/26/2019 CEDEAC-3_1.pdf

    24/101

    2.8 Ejercicios de computador

    Considrese el siguiente conjunto de datos hipotticos de un estudio de

    TABLA No. 2. DATOS HIPOTTICOS EN EL ESTUDIO DE DEMANDA DEL B

    No. deObs.

    DX PX PZ PW I

    1 37 7 5 7 62 38 6 7 5 8

    3 18 10 3 13 34 50 4 9 4 185 22 9 3 11 3

    6 55 2 12 3 217 42 8 5 8 28 29 8 5 9 199 63 2 18 3 2010 13 12 2 15 611 60 3 9 5 12

    12 62 3 10 5 513 36 6 5 6 26

    Donde:DX: es la demanda del bien XPX: es el precio del bien XPZ: es el precio del bien Z

    PW: es el precio del bien WI: es el ingresoESTADSTICAS DESCRIPTIVAS

    MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSION Y NORMALIDA

    DX PX PZ PW Mean 40.38462 6.153846 7.153846 7.230769 11Median 38.00000 6.000000 5.000000 6.000000 8.Maximum 63.00000 12.00000 18.00000 15.00000 26Minimum 13.00000 2.000000 2.000000 3.000000 2.Std. Dev. 16.89940 3.210560 4.431820 3.811252 8.Sum 525.0000 80.00000 93.00000 94.00000 14Observations 13 13 13 13

  • 7/26/2019 CEDEAC-3_1.pdf

    25/101

    3. ANALISIS DE CORRELACION

    3.1. Diagrama de Dispersin

    Una primera aproximacin con el fin de detectar algn tipo de relacin

    variables (X y Y), consiste en ubicar los pares de valores de en un plano

    hasta conformar la nube de puntos. Un diagrama de dispersin es la rep

    grfica de todos los pares de valores en sistema de ejes de coordenadas.

    El diagrama de dispersin no es un mtodo estadstico como tal, ms b

    dentro de los llamados mtodos de "inspeccin preliminar", sin embar

    manera simple de visualizar si existe alguna posible relacin entre las v

    diagrama de dispersin puede presentar diferentes formas, tales como

    presentan en las figuras siguientes:

  • 7/26/2019 CEDEAC-3_1.pdf

    26/101

    la figura b) seala una relacin lineal de tipo inversa. Las figura c) y d

    posibles relaciones cuadrticas entre las variables, exhibiendo un m

    mnimo para la primera y segunda de estas figuras, respectivamente. L

    mostrara una tendencia de tipo cbico entre las variables. La figura f) es

    en el cul no puede identificarse por inspeccin algn tipo de relaci

    variables, pues aparentemente ella no existe.

    3.2. Coeficiente de Correlacin Lineal

    Si bien es cierto que el diagrama de dispersin permite visualizar la exis

    de una posible relacin lineal entre las variables, el investigador debe so

    conclusiones en trminos de alguna medida estadstica. El coeficiente de

    lineal es un estadstico que mide el tipo de relacin (signo) y la fuerza (m

    coeficiente) de asociacin lineal entre dos variables. Usualmente el coe

    correlacin lineal, representado por la letra r, bajo las condiciones de u

    aleatorio ideal se considera una buena representacin del coeficiente de

    poblacional (). La frmula para calcular r es la siguiente:

    ( )

    YX

    XYSS

    YXCovr

    ,^

    =

    ( )( )

    ( ) ( )

    =

    22yyxx

    yyxxr

    ii

    ii

    XY

    ( )( )

    ( ) ( )

    ( )

    ( )[ ] [

    =

    =

    2222

    2

    2

    2 yxnx

    yxnyx

    n

    yy

    n

    xx

    nyxyx

    r

    ii

    ii

    i

    i

    i

    i

    ii

    ii

    XY

  • 7/26/2019 CEDEAC-3_1.pdf

    27/101

    covarianza, la cual mide la asociacin lineal absoluta entre las va

    denominador es siempre positivo dado que en l se encuentran

    cuadrados.

    Si r tiende a 1 como seria el caso de la figura a) estara indicando una re

    positiva o directa entre las variables. Si r tiende a -1, existira una rel

    negativa o inversa entre las variables. Cuando r es exactamente igual

    relacin lineal es perfecta, siendo posible ajustar todos los puntos a travlnea recta con pendiente positiva (ver figura g) o negativa (ver

    respectivamente. Si r es cero no hay relacin lineal entre las variables

    horizontal une todos los pares de valores localizados en el diagrama de

    (ver figura i).

    La ventaja principal del coeficiente de correlacin lineal es su fcil

    interpretacin. Sin embargo, cuando las variables presentan algn tipo de lineal, r no puede medir esta clase de asociacin. As mimo, dado que

    dependencia lineal solo entre pares de variables, no proporciona informa

    la asociacin simultnea de ms de dos variables.

  • 7/26/2019 CEDEAC-3_1.pdf

    28/101

    1. r es de naturaleza simtrica. Esto indica que el coeficiente de

    entre X y Y es igual al coeficiente de correlacin entre Y y X.

    2. r es independiente del origen y la escala. Si se define X*i= aXi+ c

    + d, donde a>0, b>0, y c y d son constantes, entonces r en

    (variables transformadas) es igual al r entre X y Y (variables origina

    3. Si X y Y son variables estadsticamente independientes, el coecorrelacin lineal entre X y Y es cero. No obstante, si r es ce

    implica necesariamente que X y Y sean estadsticamente independ

    Una de las condiciones para que el coeficiente de correlacin se pueda

    que las variables sean continuas y con distribucin normal. En caso de qse cumpla como es el caso de variables discretas se debe buscar o

    estadstica para evaluar la dependencia entre las variables. Una alternativ

    son las tablas de contingencia.

    3.3. Pruebas de Hiptesis

    La formalidad estadstica sugiere realizar pruebas de hiptesis sobre los

    poblacionales basndose en los estadsticos encontrados. Por ejemplo, a

    el coeficiente de correlacin lineal estimado entre dos variables sea d

    cero, esto no es suficiente para afirmar que el parmetro poblaciona

    realidad distinto de cero, pues requiere recordarse que las inferencias s

    con base en informacin muestral y existe un margen de error cuando se

    tipo de procedimiento. A continuacin se presenta el esquema de

    hiptesis para el coeficiente de correlacin lineal cuando el investiga

  • 7/26/2019 CEDEAC-3_1.pdf

    29/101

    Paso 1: Planteamiento de la hiptesis:

    Ho: 0

    Ha: 0

    Paso 2: Nivel de significancia. Representa el nivel de error mxim

    para realizar la prueba. Este es establecido o defin

    investigador y se denota con la letra . Los valores de s

    con los cuales se trabajan pueden cambiar de una disciplina

    otra. Bajo situaciones donde los experimentos tienen una al

    control, usualmente se trabaja con niveles del 1% y 5%,

    significativo y significativo, respectivamente). En las investig

    las ciencias sociales, donde existe un limitado grado de co

    las variables, pueden encontrarse significancias estadsticas

    en algunas ocasiones hasta un 20%.

    Paso 3: El estadstico de prueba. Es una medida estadstica calcul

    de informacin muestral o experimental para llevar a caboPara el caso de correlacin lineal simple, el estadstico de

    define como:

    222

    1

    2

    = nC t

    r

    nrt ,.~

    donde r es el coeficiente de correlacin lineal muestral, n es

    de la muestra, n-2 los grados de libertad de la prueba y

  • 7/26/2019 CEDEAC-3_1.pdf

    30/101

    Paso 4: Regiones de decisin. Dado que la hiptesis alterna

    smbolo , se trabaja con los dos lados de la distribucin

    de rechazo estar repartida en los extremos de la f

    probabilidad, con un valor de 2 a cada lado. Los valo

    lmites derecho e izquierdo que limitan las regiones de

    determinan mediante el uso de la tabla t con sus respecti

    de libertad. Estos valores de t se denominan estad

    contraste. La figura j muestra la regin de rechazo

    aceptacin (AHo) de la hiptesis nula de esta prueba:

    Paso 5: Criterio de decisin y conclusin del investigador. Se debel estadstico calculado o de prueba Ct contra el

    tabulado 22 nt , . El criterio de decisin esta basado en

    calculado es mayor que el t de tablas positivo, cae en la

    rechazo del lado derecho de la distribucin y la decisin q

    tomar es rechazar la hiptesis nula ( 0 ); 2) si el t ca

    menor que el t de tablas negativo, el t calculado cae en la

    rechazo del lado izquierdo y la decisin igualmente es r

    hi t i l ( 0 ) 3) i l t l l d t

  • 7/26/2019 CEDEAC-3_1.pdf

    31/101

    los resultados de la prueba, y plantea las recome

    pertinentes.

    La significancia estadstica del coeficiente de correlacin en la prueba de h

    afecta por el tamao de la muestra (n) o mejor an por los grados d

    lgicamente a mayor tamao de la muestra el valor de r tiene mayor confi

    se encuentra un valor de r relativamente bajo y n es grande, es posible qu

    significativo al comparar el estadstico de prueba con el de contraste o

    alternativamente se puede encontrar un r alto pero no significativo estaddebido a que n es muy pequeo y por consiguiente el nmero de grados

    es bajo.

    3.4. Ejercicios de computador

    Usando los mismos datos del ejemplo hipottico de demanda plante

    captulo anterior, a continuacin se presenta el diagrama de dispersin,

    de covarianzas y de correlacin de las variables:

    DIAGRAMAS DE DISPERSIN

  • 7/26/2019 CEDEAC-3_1.pdf

    32/101

    MATRIZ DE COVARIANZAS

    VARIABLE DX PX PZ PW DX 263.6213 -47.98225 60.01775 -53.78107 47PX -47.98225 9.514793 -11.63905 10.73373 -12PZ 60.01775 -11.63905 18.13018 -12.65089 16PW -53.78107 10.73373 -12.65089 13.40828 -16

    I 47.89941 -12.99408 16.69822 -16.18343 63

    MATRIZ DE CORRELACION

    VARIABLE DX PX PZ PW DX 1.000000 -0.958056 0.868137 -0.904592 0.PX -0.958056 1.000000 -0.886170 0.950308 -0.PZ 0.868137 -0.886170 1.000000 -0.811397 0.PW -0.904592 0.950308 -0.811397 1.000000 -0.

    I 0.371175 -0.530011 0.493410 -0.556062 1.

    4. REGRESION SIMPLE LINEAL Y NO LINEAL

    4.1. Objetivo del anlisis de regresinEl objetivo fundamental del anlisis de regresin es el estudio de la depe

    una variable, llamada explicada, de una o ms variables llamadas exp

    anlisis de regresin se apoya en el concepto matemtico de funcin, en

    tiene una variable dependiente (variable explicada) y un conjunto d

    independientes (variables explicativas) con el fin de estimar los coeparmetros de dicha funcin y efectuar predicciones (encontrar el valor e

    la variable dependiente cuando se construyen escenarios reflejados en

    que toman las variables independientes).

  • 7/26/2019 CEDEAC-3_1.pdf

    33/101

    1. Especificacin: corresponde a la etapa en que el investigador defi

    funcional del modelo que desea utilizar para explicar la variable d

    siguiendo los lineamientos de la teora econmica.

    2. Estimacin: durante esta se calculan los valores numricos de los c

    o parmetros del modelo; para ello es necesario apoyarse en los m

    estimacin y la aplicacin de rutinas de computador usandoestadsticos (Eviews).

    3. Verificacin: consiste en corroborar la validez terica y estadstica

    es decir, evaluar si los signos obtenidos para los coeficientes esti

    los esperados y si el modelo cuenta con propiedades estadsticas (buen ajuste, alta relevancia y dependencia).

    4. Prediccin: muchas veces los modelos elaborados por los econ

    tienen solo como objeto mostrar la relacin entre variables y la m

    dicha relacin entre estas a travs de una forma funcional, sino qlos modelos tienen implicaciones en trminos de prediccin. En e

    puede encontrarse el efecto esperado sobre la variable depend

    diversos valores de las variables independientes fuera del rango m

    este procedimiento la inferencia estadstica juega un papel importa

    4.2. Funcin de regresin muestral y poblacional

    La lnea de regresin XXYE / es la unin de los p

  • 7/26/2019 CEDEAC-3_1.pdf

    34/101

    grfica de la lnea de regresin poblacional cuando el gasto en consumo d

    se desea explicar por el ingreso.

    Por otro lado, cuando la lnea de regresin es construida con los datos

    recibe el nombre de funcin de regresin muestral. Como todo proced

    inferencia estadstica, lo que se pretende es que la muestra sea

    representacin de la poblacin. En este sentido, la funcin de regresi

    constituye una representacin de la funcin de regresin poblacional. A

    en la prctica, las muestras de variables aleatorias son usadas para in

    las caractersticas de la poblacin.

    La siguiente grfica presenta un ejemplo de dos lneas de regresin mu

    el gasto en consumo semanal de un hogar versus el ingreso.

  • 7/26/2019 CEDEAC-3_1.pdf

    35/101

    4.3. Supuestos del modelo de regresin

    Los supuestos del modelo junto con los mtodos de estimacin carac

    resultados obtenidos de la regresin (coeficientes, pruebas de hiptesis

    de confianza, prediccin, etc.). En particular, los supuestos ms impo

    modelo recaen sobre el trmino del error. Teniendo en cuenta que la

    regresin poblacional puede expresarse tambin de la forma iY 1

    modelo de regresin lineal cuenta con los siguientes supuestos:

    Supuesto 1: El modelo de regresin es lineal en los parmetros:

    iii uXY ++= 21

    Supuesto 2: Los valores de X son fijos en muestreos repetitivos. Tc

    esto consiste en que X se supone no estocstica.

    Supuesto 3: El valor medio de la perturbacin iu es igual a cero.

  • 7/26/2019 CEDEAC-3_1.pdf

    36/101

    Por lo tanto los factores que no estn incluidos en el modelo

    consiguiente, estn incorporados en iu , no afectan sistemticamente el

    media de Y.

    Supuesto 4: Homoscedasticidad o varianza constante de iu . Dado el v

    la varianza de iu es constante para todas las observaciones. Es

    varianzas condicionales de iu son idnticas.

    2

    2

    2

    ]/[

    ]/[]/[

    ]/][[]/[

    =

    =

    =

    ii

    iiii

    iiiii

    XuVar

    XuEXuVar

    XuEuEXuVar

    La anterior ecuacin, establece que la varianza de iu para cada iX

    nmero positivo constante igual a 2 . Ntese que el supuesto 4 impl

    varianzas condicionales de iY tambin son homoscedsticas.

    2]/[ =ii XYVar .

    En contraste, si la varianza condicional de la poblacin Y varia co

    situacin se conoce como Heteroscedasticidad, lo cual puede escribirse2]/[ iii XuVar =

    Obsrvese el subndice sobre 2 en esta expresin indica que la var

    poblacin Yahora no es constante.

    Supuesto 5: No auto correlacin entre las perturbaciones. Dados d

  • 7/26/2019 CEDEAC-3_1.pdf

    37/101

  • 7/26/2019 CEDEAC-3_1.pdf

    38/101

    Cuando el modelo de regresin cumple con los anteriores supuestos se

    como modelo de regresin clsico y tiene las siguientes propie

    estimadores son MELI (mejores estimadores lineales insesgados). Si se

    supuesto de normalidad de los errores, los estimadores son ME

    estimadores insesgados) y por lo tanto seguirn distribucin normal. C

    intervalos de confianza, las predicciones y las pruebas de hiptesis tien

    estadstica.

    4.4. Mtodo de estimacin de mnimos cuadrados ordinarios

    El objetivo principal de la etapa de estimacin es encontrar los valo

    parmetros muestrales. El mtodo de estimacin ms popular recibe el

    mnimos cuadrados ordinarios (MCO). El criterio de este mtodo c

    proporcionar estimadores de los parmetros que minimicen la sum

    cuadrados de los errores. Operativamente el proceso es construir u

    objetivo en trminos de la suma de los cuadrados de los errores y

    optimizacin (condiciones de primer orden - C.P.O., y condiciones d

    orden - C.S.O.) obtener las frmulas de clculo de los estimadores.

    Debido a que la funcin de regresin poblacional no se puede

    directamente, los estimadores de mnimos cuadrados ordinarios se

    partir de la funcin de regresin muestral (FRM). La FRM es:

    iii eXY +21

    iii eYY +

  • 7/26/2019 CEDEAC-3_1.pdf

    39/101

    De acuerdo con el principio de mnimos cuadrados ordinarios:

    221

    2

    iii XYe minmin

    Derivando la anterior expresin con respecto a 1 y 2 e igualan

    respectivamente, y resolviendo las ecuaciones normales, se encu

    estimadores de los parmetros de la regresin:

    ( )( )

    ( )( )

    ( )XVar

    YXCov

    XXn

    YXYXn

    ii

    iiii

    =

    =

    ,

    222

    XY 21

    4.5. Varianzas y errores estndar de los estimadores

    As como existen medidas de dispersin para las variables tambin la

    los estimadores, por lo tanto, es necesario siempre presentar una

    precisin de los estimadores de los parmetros del modelo. Esta me

    error estndar e indica la confiabilidad de las estimaciones (si son pequ

    ver que los parmetros muestrales van a ser muy parecidos a los pobl

    La principal utilidad de los errores estndar de los estimadores es la co

    de intervalos de confianza y la prueba de hiptesis. A continuacin se

    forma de calcular la varianza y error estndar de cada estimador del

    regresin lineal simple:

    22

    1 X

    Vari ( )

    ( )

    = 2

    1 Xse i

  • 7/26/2019 CEDEAC-3_1.pdf

    40/101

    4.6. Intervalos de confianza

    En estadstica es comn efectuar inferencias basadas en estimacionesy en intervalos. Estas ltimas son menos riesgosas debido a que se e

    dentro de un rango con cierto margen de confiabilidad. En particula

    construirse intervalos de confianza para los parmetros del modelo de

    as como para las predicciones.

    Un intervalo de confianza para el parmetro 2 puede presentarse com

    =+ 1Pr 2222222 setset

    donde es el nivel de significancia estadstica y ( )2se es el error estn

    1100 es el nivel porcentual de confianza del intervalo. Una versin

    de esta expresin es: 222 set . De la misma forma para 1 :

    ]

    11211121 Pr setset

    121 set

    Si por ejemploes 0.05, la interpretacin del intervalo de confianza p

    dado un nivel de confianza del 95% (en 95 de cada 100 casos) en el la

    el intervalo

    ( ) ( )222222,

    setset + contendr el verdadero valor

    4.7. Pruebas de hiptesis

  • 7/26/2019 CEDEAC-3_1.pdf

    41/101

    Prueba de relevancia: la prueba de relevancia consiste e

    estadsticamente qu tan significativo es un parmetro del modelo

    manera puede identificarse si la variable independiente X aporta

    importante al modelo de regresin. Siguiendo la estructura presen

    captulo 2, para cada estimador i , i= 1, 2:

    Paso 1: Planteamiento de la hiptesis.

    Ho: 0i

    Ha: 0i

    Paso 2: Nivel de significancia :

    Paso 3: El estadstico de prueba. Para la prueba de relevancia en e

    regresin, el estadstico de prueba se define como:

    22 ni

    iC tset

    ,.~

    Paso 4: Regiones de decisin: La siguiente grfica muestra la r

    rechazo y aceptacin de la hiptesis nula.

  • 7/26/2019 CEDEAC-3_1.pdf

    42/101

    Paso 5: Criterio de decisin y conclusin del investigador: Si Ct

    rechaza la hiptesis nula. Si la prueba de hiptesis es rea

    1 y se rechaza Ho se concluye que el intercepto del

    significativo al nivel . Si la prueba se efecta para 2 y

    Ho se concluye que iX es estadsticamente relevante al

    significancia. Por otro lado, cuando no sea posible r

    hiptesis nula, se puede decir que no existe evidencia para afirmar que iX sea relevante al nivel de significanc

    Prueba de dependencia: esta prueba se lleva a cabo para evaluar si en

    de regresin las variables independientes explican estadsticamen

    conjunto la variable dependiente. Se desea que en un modelo de regreuna alta dependencia ocasionada por las variables explicativas. Esta

    hiptesis como cualquier otra debe seguir una estructura similar a la

    en el captulo 2. La hiptesis nula de esta prueba hace referenci

    existencia de dependencia en el modelo (para el caso de regresin sim

    solo hay una variable independiente se desea probar si 02

    = ). L

    alternativa argumenta lo contrario, sealando que al menos uno de los c

    que acompaan las variables independientes es distinto de cero (en

    simple esto es equivalente a 02 ).

    El estadstico de prueba para el caso de un modelo de regresin linea21

    22 nnC FtF ,.~ , donde FC es el estadstico calculado, que

    distribucin Fcon un grado de libertad en el numerador y n-2 grados de

    el denominador; y t es el estadstico t calculado en la prueba de relev

  • 7/26/2019 CEDEAC-3_1.pdf

    43/101

    4.8. Prediccin

    Una aplicacin del modelo de regresin es la prediccin o el pronvariable dependiente, de acuerdo con valores dados de las

    independientes. Hay dos tipos de predicciones: la prediccin media y la

    individual. A continuacin se presentan estos dos casos:

    Prediccin media: es la prediccin del valor medio condicioncorrespondiente a un determinado valor de X, denotado como X

    representa un punto sobre la lnea de regresin poblacional.

    Si se desea predecir 0XYE / , la estimacin puntual de la prediccin

    0210 XY + y la varianza de 0Y : ( ) ( )

    ( )

    +=

    2

    2

    0201

    XX

    XX

    nYVari

    .

    Prediccin individual: es la prediccin de un valor individual de Y, corre

    a un determinado valor de X. Si se desea predecir 0Y/ 0X , de igual fo

    la prediccin media, la estimacin puntual es 0210 XY + , sin e

    manera de calcular la varianza de 0Y es:

    ( ) ( )

    ( )

    ++=

    2

    202

    01

    1XX

    XX

    nYVar

    i

    4.9. El Coeficiente de Determinacin

  • 7/26/2019 CEDEAC-3_1.pdf

    44/101

    respecto a que tan bien la lnea de regresin muestral se ajusta a los d

    el caso de un modelo de regresin lineal simple se denota como 2r y

    22rr = , donde res el coeficiente de correlacin lineal entre las var

    X. Debido a que el 2r bajo los supuestos de modelo de regresin

    encuentra entre 0 y 1, la manera de interpretarlo es en

    argumentndose que dicho valor refleja la magnitud porcentual de la v

    la variable Yexplicada por la variable X.

    4.10. Modelos de regresin simple no lineal en las variables

    En algunos casos el investigador requiere estimar otro tipo de modelos

    las variables independientes no sean lineales, como por ejemplo

    transformadas en trminos logartmicos, cuadrticos, raz cuadrada, cLas razones para estimar estos nuevos modelos pueden ser: m

    resultados en trminos de bondad de ajuste, obtener elasticidades di

    de la regresin, o en algunos casos porque la teora econmica lo s

    ejemplo del modelo no lineal es el conocido como Cobb-Douglas, c

    funcional es la siguiente:iu

    ii eAXY2

    =

    Para estimar el modelo se efecta una linealizacin del mode

    transformndolo en logaritmos. De esta manera:

    iii uXLogLogAYLog ++= 2

    Puede notarse que las variables dependiente e independiente se

    transformadas en logaritmos y el trmino AL es el intercepto de la

  • 7/26/2019 CEDEAC-3_1.pdf

    45/101

    Sea iYLogYT= , ALog=1 y ii XLogXT = , luego el modelo a estim

    forma: iii uXTYT ++= 21 , y los coeficientes del modelo transforma

    ser obtenidos por el mtodo de mnimos cuadrados ordinarios u

    ecuaciones para los estimadores 1 y 2 presentadas en el numeral 4.4

    Tericamente un modelo Cobb-Douglas es una funcin con elasticidad

    a lo largo de todo su dominio, siendo diferente de una funcin linea

    elasticidad depende especialmente de la observacin iX . En este

    modelo Cobb-Douglas permite obtener directamente las elastic

    coeficiente 2 representa la elasticidad de Yrespecto a X, y se interpre

    aumento (cuando el valor de la elasticidad es mayor que cero) o d

    (cuando el valor de la elasticidad es menor que cero) porcentual en la ocasionada por el incremento en un 1% de la variable X.

    4.11. Ejercicios de Computador

    Continuando con el ejemplo de datos hipotticos de demanda present

    captulos anteriores, las siguientes salidas de computador muestran los

    del modelo de regresin lineal simple de demanda y el modelo no lin

    variables (doblemente logartmico) con las respectivas matrices d

    covarianza de los coeficientes:

  • 7/26/2019 CEDEAC-3_1.pdf

    46/101

    MODELO DE REGRESION LINEAL SIMPLE

    Dependent Variable: DXMethod: Least SquaresDate: 10/03/06 Time: 16:38Sample: 1 13Included observations: 13

    Variable Coefficient Std. Error t-Statistic Prob.

    C 71.41791 3.130854 22.81100 0.000PX -5.042910 0.454825 -11.08759 0.000

    R-squared 0.917870 Mean dependent var 40.3846Adjusted R-squared 0.910404 S.D. dependent var 16.8994S.E. of regression 5.058427 Akaike info criterion 6.22062Sum squared resid 281.4646 Schwarz criterion 6.30754

    Log likelihood -38.43407 F-statistic 122.934Durbin-Watson stat 2.267643 Prob(F-statistic) 0.00000

    Los resultados del modelo lineal muestran que la variable precio cue

    signo esperado y es relevante al 1%, 5% y 10% de significancia. El valo

    0.918, es decir, el 92% de la variacin de la demanda del bien X esta

    por la variable precio. Adicionalmente se observa la existencia de de

    conjunta en el modelo al 1%, 5% y 10% de significancia (Fc=12

    coeficiente de la variable PX es interpretado como un efecto marginal, p

    un incremento en una unidad del precio de X disminuye en promedio su

    en 5.04 unidades, manteniendo todos los dems factores constantes.

    MATRIZ DE VARIANZA COVARIANZA DE LOS COEFICIENTESDEL MODELO DE REGRESIN SIMPLE

  • 7/26/2019 CEDEAC-3_1.pdf

    47/101

    MODELO DE REGRESION SIMPLE NO LINEAL EN LAS VARIABLES(DOBLEMENTE LOGARITMICO)

    Dependent Variable: LOG(DX)Method: Least SquaresDate: 10/03/06 Time: 16:48Sample: 1 13Included observations: 13

    Variable Coefficient Std. Error t-Statistic Prob.

    C 4.799536 0.208899 22.97538 0.000LOG(PX) -0.722024 0.118417 -6.097307 0.000

    R-squared 0.771676 Mean dependent var 3.59748Adjusted R-squared 0.750919 S.D. dependent var 0.49910S.E. of regression 0.249094 Akaike info criterion 0.19866Sum squared resid 0.682526 Schwarz criterion 0.28558

    Log likelihood 0.708676 F-statistic 37.1771Durbin-Watson stat 2.124425 Prob(F-statistic) 0.00007

    Los resultados del modelo doblemente logartmico indican que

    logaritmo del precio es significativa (al 1%, 5% y 10%) y exhibe el signo

    R2es 0.772, por lo tanto, el 77% de la variacin del logaritmo de la de

    bien X es explicada por el logaritmo de su precio. Adicionalme

    dependencia conjunta en el modelo (1%, 5% y 10% de signific

    coeficiente de la variable LOG(PX) es interpretado como una elasticid

    tanto, un incremento en un 1% del precio de X disminuye en pr

    demanda en 0.72%, manteniendo todos los dems factores constantes.

    MATRIZ DE VARIANZA COVARIANZA DE LOS COEFICIENTESDEL MODELO NO LINEAL EN LAS VARIABLES

    (DOBLEMENTE LOGARITMICO)

  • 7/26/2019 CEDEAC-3_1.pdf

    48/101

    5. REGRESION MULTIPLE LINEAL Y NO LINEAL

    5.1. Expresin del modelo en forma matricial

    En regresin mltiple se supone que las variaciones de Yi que se

    explicar son debidas a K variables independientes, es decir X1, X2

    como en la realidad no pueden presentarse relaciones determin

    completo se considera la inclusin del trmino de perturbacin .

    Resulta conveniente analizar el modelo clsico de regresin lineal

    enfoque matricial. Supngase un modelo lineal de la forma:

    +kkxxxY L33221

    Si se tienen n observaciones independientes nyyy ,,, K21 de Y, podem

    iy como:

    ikikiii xxxy +L33221

    Donde jix es el valor de la j-sima variable independiente para

    observacin, ni ,,3,2,1 K= . Ahora defnanse las siguientes matrices, con

    =

    ny

    y

    y

    M

    2

    1

    Y ,

    =

    nknn

    k

    k

    xxx

    xxx

    xxx

    L

    MM

    L

    L

    21

    22221

    11211

    X ,

    =

    k

    M

    2

    1

    ,

    =

    n

    M

    2

    1

    P l t t l i t f i d l

  • 7/26/2019 CEDEAC-3_1.pdf

    49/101

    5.2. Supuestos del modelo

    Los supuestos del modelo son los siguientes:

    1. XY += (Linealidad en los parmetros).

    2. Xes de tamao kn x con rango k.

    3. XXYX == )/(0)( EE

    4. jiCovE ji == ,0)()'( 2 I .

    5. X es no estocstica.

    6. ( ) )I,0(.~X 2N

    5.3. Mtodo de estimacin de mnimos cuadrados ordinarios

    Se desea obtener un estimador

    de un vector de parmetros descono

    minimiza la suma del cuadrado de los errores S, donde:

    )XY(')XY('2

    === S

    Al minimizar Scon respecto a

    se encuentra el estimador de mnimos

    ordinarios de regresin mltiple:

    ( ) ( )Y'XX'X 1

    =MCO

    5.4. Matriz de varianzas y covarianzas de los estimadores

    La matriz de varianza-covarianza de los estimadores es releva

    determinacin de los errores estndar de los coeficientes y en la eje

  • 7/26/2019 CEDEAC-3_1.pdf

    50/101

    1. Suma de cuadrados de los errores. Puede ser calc

    YX''YY' =SCE .

    2. Varianza del modelo. Dado que en la mayora de los casos la v

    desconocida, se utiliza la informacin de la muestra para o

    estimador de la misma: )()()(2 knSCEkn ==

    YX''YY' .

    Usando la informacin anterior, la matriz de varianza covarianz

    coeficientes se puede calcular con la siguiente frmula:

    12 XX'

    = )(.covvar Matriz

    5.5. Pruebas de hiptesis

    Para efectuar pruebas de hiptesis es necesario obtener el error estnd

    uno de los estimadores. Esta medida de dispersin corresponde a la ra

    de cada uno de los elementos de la diagonal principal de la matriz de

    covarianza. A continuacin se presentan los aspectos ms importa

    efectuar las pruebas de relevancia y dependencia en un modelo de

    mltiple:

    Pruebas de relevancia: En estas pruebas se utilizan los t estadsticos

    de los estimadores con su respectivo p-valor. A continuacin se presen

    de obtenerlos:

    1. t estadsticos. Los valores de t son calculados efectuando

    bt di h b bilid d i l l d l t d ti

  • 7/26/2019 CEDEAC-3_1.pdf

    51/101

    obtener dicha probabilidad es necesario el valor del estadstico

    el nmero de grados de libertad )( kn y el nmero de colas de

    (en este caso dos colas dado que es una prueba de significancia

    Prueba de dependencia: Como se mencion en el captulo anterior el

    utilizado para realizar la prueba es el F.

    1. F estadstico. Mide la dependencia conjunta en el modelo resvariables explicativas. Puede ser obtenido en la forma matr

    siguiente manera: [ ][ )1)(())(( = kknF YX''YY'YnYX'' 2

    2. p valor. Arroja el nivel mnimo de significancia para rechazar l

    nula. En el procedimiento se requiere el valor obtenido de F, loslibertad del numerador )1( k y grados de libertad del denominad

    5.6. Coeficiente de determinacin ajustado ( )2R

    El trmino ajustado se refiere a que es corregido por los correspondiende libertad. El 2R mide la bondad de ajuste del modelo de regresin

    de explicacin de la variable dependiente por las variables independi

    como lo hace el 2R convencional, sin embargo el 2R tiene la partic

    que permite comparar modelos de regresin mltiple en los que s

    variables adicionales. No obstante, se debe considerar que la comparvalidez cuando en cada modelo la variable dependiente y el tamao de

    sean iguales. La forma de calcular el 2R se presenta a continuacin:

    n 1

    5 7 Inter alos de confian a

  • 7/26/2019 CEDEAC-3_1.pdf

    52/101

    5.7. Intervalos de confianza.

    Un intervalo de confianza para el parmetro Kkk ,,2,1, K= , tiene la

    ] 122 kkkkk setset Pr

    kk set

    2

    donde es el nivel de significancia estadstica y kse es el error estn

    El kse se obtiene mediante la frmula: ( ) ( )1

    '

    = kkk XXse . Puede neste intervalo de confianza corresponde a una expresin matemtica

    presentada en el caso de regresin simple.

    5.8. Modelos de regresin mltiple no lineal en las variables

    En este numeral, se extender el caso de la funcin tipo Cob

    desarrollado en el numeral 4.10 al caso de regresin mltiple no lin

    variables. Considrense ms variables independientes Xs que pueden

    variable Y, por lo tanto, el modelo Cobb-Douglas toma la forma:

    ik uikiii eXXAXY

    K32 32

    Luego transformando el modelo en logaritmos:

    iikkiii uXLogXLogXLogALogYLog +++++= L

    3322

    Sea iYLogYT= , ALog=1 , 22 ii XLogXT = ,..., ikik XLogXT = , entonces

    a estimar es:

    Bajo el esquema matricial los coeficientes del modelo transformado p

  • 7/26/2019 CEDEAC-3_1.pdf

    53/101

    Bajo el esquema matricial los coeficientes del modelo transformado p

    obtenidos a travs del mtodo de mnimos cuadrados ordinarios usando

    de clculo presentada en el numeral 5.3. El coeficiente kk ,

    representa la elasticidad de Yrespecto a Xky tiene la misma interpretac

    el caso del modelo de regresin simple doblemente logartmico d

    anterior. Por lo tanto, se tendrn 1k elasticidades en regresin

    estimarse una funcin tipo Cobb-Douglas. Por otro lado, cabe de

    ejercicios de estimacin diferentes al modelo Cobb-Douglas no permitdirectamente elasticidades constantes. Por ello es necesario tener en

    forma que toman las variables en el modelo transformado antes d

    interpretaciones de los coeficientes.

    5.9. Ejercicios de Computador.

    Ejemplo 1.

    Usando la misma base de datos hipotticos de demanda de captulos a

    continuacin se presentan los resultados de las estimaciones del

    regresin mltiple lineal y no lineal en las variables, las matrices d

    covarianza de los coeficientes, as como la comparacin entre l

    observados y predichos de la demanda y sus residuos:

    REGRESIN LINEAL MLTIPLE

  • 7/26/2019 CEDEAC-3_1.pdf

    54/101

    REGRESIN LINEAL MLTIPLE

    Dependent Variable: DX

    Method: Least SquaresDate: 10/04/06 Time: 10:31Sample: 1 13Included observations: 13

    Variable Coefficient Std. Error t-Statistic Prob.

    C 72.73351 10.83288 6.714142 0.000

    PX -4.588739 1.778623 -2.579939 0.032PW -0.386460 1.214240 -0.318273 0.758PZ 0.471929 0.688867 0.685080 0.512I -0.409388 0.201019 -2.036558 0.076

    R-squared 0.947105 Mean dependent var 40.3846Adjusted R-squared 0.920657 S.D. dependent var 16.8994S.E. of regression 4.760208 Akaike info criterion 6.24218

    Sum squared resid 181.2767 Schwarz criterion 6.45947Log likelihood -35.57419 F-statistic 35.8104Durbin-Watson stat 1.436480 Prob(F-statistic) 0.00003

    Los resultados del modelo lineal muestran que la variable precio cue

    signo esperado y es relevante al 5% y 10% de significancia. El valor

    0.947, es decir, el 95% de la variacin de la demanda del bien X estapor las variables independientes. Adicionalmente se observa la ex

    dependencia conjunta en el modelo al 1%, 5% y 10% de significancia (F

    El coeficiente de la variable PX es interpretado como un efecto marg

    tanto, un incremento en una unidad del precio de X disminuye en pr

    demanda en 4.59 unidades, manteniendo todos los dems factores cons

    Vale la pena aclarar que la variable ingreso an cuando es relevante

    significancia, el signo de su coeficiente no es consistente con la teora

    l i d bi l

  • 7/26/2019 CEDEAC-3_1.pdf

    55/101

    MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES DEL MODREGRESIN LINEAL MULTIPLE

    COEFICIENTE C PX PW PZ C 117.3513 -11.56233 1.349073 -6.616478 -0

    PX -11.56233 3.163501 -1.826424 0.777287 -0PW 1.349073 -1.826424 1.474379 -0.192430 0

    PZ -6.616478 0.777287 -0.192430 0.474538 -0I -0.600013 -0.022642 0.052888 -0.014848 0

    VALORES OBSERVADOS Y ESTIMADOS DE LA DEMANDA Y LOS RESIDUOS A MODELO DE REGRESIN LINEAL MLTIPLE

    obs Actual Fitted Residual Residual Plot1 37.0000 37.8104 -0.81044 | . *| . |2 38.0000 43.2972 -5.29718 | *. | . |3 18.0000 22.0098 -4.00977 | .* | . |4 50.0000 49.7111 0.28890 | . * . |5 22.0000 27.3714 -5.37143 | *. | . |

    6 55.0000 59.4627 -4.46267 | * | . |7 42.0000 34.4728 7.52721 | . | . *8 29.0000 27.1267 1.87326 | . | * . |9 63.0000 62.7036 0.29637 | . * . |10 13.0000 10.3593 2.64072 | . | * . |11 60.0000 56.3697 3.63029 | . | *. |12 62.0000 59.7074 2.29265 | . | * . |13 36.0000 34.5979 1.40211 | . | * . |

    MODELO DE REGRESION MULTIPLE NO LINEAL EN LAS VARIABLES

  • 7/26/2019 CEDEAC-3_1.pdf

    56/101

    (DOBLEMENTE LOGARITMICO)

    Dependent Variable: LOG(DX)Method: Least SquaresDate: 10/04/06 Time: 10:39Sample: 1 13Included observations: 13

    Variable Coefficient Std. Error t-Statistic Prob.

    C 3.042978 1.646616 1.848020 0.101LOG(PX) 0.115482 0.301528 0.382991 0.711LOG(PW) -0.336166 0.436617 -0.769933 0.463LOG(PZ) 0.671764 0.400484 1.677382 0.132LOG(I) -0.103431 0.084847 -1.219025 0.257

    R-squared 0.902417 Mean dependent var 3.59748Adjusted R-squared 0.853626 S.D. dependent var 0.49910S.E. of regression 0.190953 Akaike info criterion -0.18986Sum squared resid 0.291703 Schwarz criterion 0.02742Log likelihood 6.234096 F-statistic 18.4954Durbin-Watson stat 1.510399 Prob(F-statistic) 0.00041

    Los resultados del modelo doblemente logaritmo no son satisfactorios

    ninguna de las variables incorporadas como regresores son sig

    Asimismo, las variable LOG(PX) y LOG(I) no presentan los signos

    limitando la validez terica del modelo.

    MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES DEL MODOBLEMMENTE LOGARTMICO

    COEFICIENTE C LOG(PX) LOG(PW) LOG(PZ) LOC 2.711343 -0.229656 -0.565544 -0.638982 -0.0

    LOG(PX) -0.229656 0.090919 -0.022785 0.064962 0.0LOG(PW) -0.565544 -0.022785 0.190634 0.121451 0.0LOG(PZ) -0.638982 0.064962 0.121451 0.160387 0.0

    VALORES OBSERVADOS Y ESTIMADOS DEL LOGARITMO DE LA DEMA

  • 7/26/2019 CEDEAC-3_1.pdf

    57/101

    Y LOS RESIDUOS A PARTIR DEL MODELO DE REGRESINDOBLEMENTE LOGARTMICO

    obs Actual Fitted Residual Residual Plot1 3.61092 3.50939 0.10153 | . | * . |2 3.63759 3.80097 -0.16339 | .* | . |3 2.89037 3.07102 -0.18064 | .* | . |4 3.91202 3.91411 -0.00209 | . * . |5 3.09104 3.11501 -0.02396 | . *| . |6 4.00733 4.10808 -0.10075 | . * | . |7 3.73767 3.59355 0.14412 | . | * . |8 3.36730 3.32110 0.04619 | . | * . |9 4.14313 4.38551 -0.24237 | * . | . |10 2.56495 2.69990 -0.13495 | . * | . |11 4.09434 3.84781 0.24653 | . | . *12 4.12713 4.00914 0.11799 | . | * . |13 3.58352 3.39174 0.19178 | . | * |

    Ejemplo 2.

    Ahora considere la siguiente informacin de una firma sobre los

    produccin y la cantidad producida de un bien para estimar una funcin

    cbica:

    TABLA No. 3. COSTOS SEGN EL NIVEL DE PRODUCCIN

    Obs. Q CT1 0 52 1 143 2 234 3 285 4 336 5 367 6 418 7 459 8 48

    10 9 5011 10 5512 11 6113 12 6614 13 72

  • 7/26/2019 CEDEAC-3_1.pdf

    58/101

    Donde:

    CT: Costo total de produccinQ: Nivel de producto

    ESTADISTICAS DESCRIPTIVAS

    Q Q2 Q3 CTMean 10 136.6667 2100 66.19048Median 10 100 1000 55Maximum 20 400 8000 169Minimum 0 0 0 5Std. Dev. 6.204837 128.5365 2488.431 43.49899Observations 21 21 21 21

    MODELO DE REGRESION MULTIPLE NO LINEAL ENLAS VARIABLES (FUNCIN CUBICA)

    Dependent Variable: CTMethod: Least SquaresDate: 27/09/06 Time: 21:48Sample: 1 21Included observations: 21

    Variable Coefficient Std. Error t-Statistic ProC 4.586862 0.962089 4.767605 0.00020Q 10.450570 0.427013 24.473660 0.00000Q2 -0.974658 0.050336 -19.363000 0.00000Q3 0.043001 0.001653 26.020450 0.00000R-squared 0.999236 Mean dependent var 66.1904Adjusted R-squared 0.999101 S.D. dependent var 43.4989S.E. of regression 1.304364 Akaike info criterion 3.53895Sum squared resid 28.92322 Schwarz criterion 3.73790Log likelihood -33.15899 F-statistic 7408,61

    Durbin-Watson stat 0.882959 Prob(F-statistic)

    MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES

    6. INCUMPLIMIENTO DE LOS SUPUESTOS DEL MODELO

  • 7/26/2019 CEDEAC-3_1.pdf

    59/101

    El cumplimiento de los supuestos del modelo clsico de regresin ga

    los k obtenidos a travs del mtodo de mnimos cuadrados ordinario

    mejores estimadores linePales insesgados. Cuando tales supu

    violados, se empiezan a generar problemas en los resultados de la

    haciendo que los parmetros obtenidos no cumplan con alguna

    propiedades deseables de un estimador (eficiencia y consistencia). A cose describen de manera general los conceptos de multico

    heteroscedaticidad autocorrelacin, y no normalidad, la forma de det

    problemas en el modelo estimado y las posibles soluciones a la viola

    supuestos de mnimos cuadrados ordinarios relacionados con estos con

    6.1. Multicolinealidad

    La multicolinealidad tiene que ver con la relacin lineal entre algn c

    variables independientes en un modelo de regresin. Supngase e

    modelo con cuatro variables independientes:

    Cualquier relacin lineal entre las variables independientes de este m

    ejemplo X2 con X3, o X2 con X5 y X4 puede generar prob

    multicolinealidad. Por lo general, existen dos tipos de multicolinealidad:

    1. Multicolinealidad Perfecta: Para entender el concepto de multic

    perfecta es necesario expresar las variables independientes del

    trminos de una combinacin lineal cuya suma algebraica sea ig

  • 7/26/2019 CEDEAC-3_1.pdf

    60/101

    Los valores de pueden ser positivos o negativos y form

    combinaciones. Cuando la suma algebraica para todas las obsde la muestra de esta combinacin lineal es cero se dice

    multicolinealidad perfecta. De este caso se excepta que simult

    los valores de sean cero, pues esta es una solucin trivial de la

    En otras palabras, la multicolinealidad perfecta se presenta c

    combinacin lineal de uno o ms vectores de variables explicativade manera perfecta uno o ms vectores idnticos a cualqui

    variables explicativas en la base de datos.

    2. Multicolinealidad Alta: Esta se presenta cuando la colinealidad

    entre variables independientes es muy fuerte aunque no perfecta

    La multicolinealidad se presenta debido a la tendencia definida de cierta

    a lo largo de la muestra o a travs del tiempo. Tendencias o pa

    comportamiento similares de las variables independientes en un

    regresin sustentan la multicolinealidad. La multicolinealidad se puede

    en datos provenientes de series de tiempo. Por ejemplo, es comn en

    regresar variables que tienen que ver con la representacin de ciclos ec

    Por ello, antes de efectuar la regresin es til elaborar diagramas de

    entre las variables independientes con el objetivo de analizar el comp

    tendencial de estas.

    El problema de multicolinealidad es un problema ocasionado

    observaciones en los datos recopilados de la muestra. La pre

  • 7/26/2019 CEDEAC-3_1.pdf

    61/101

    Si existe multicolinealidad perfecta entre las variables independien

    modelo de regresin, ( XX' )-1

    no existe. Cuando esto ocurre no es posi

    . En presencia de alta multicolinealidad se genera una ampliacin

    estndar de

    , por lo que el valor de los estadsticos "t" para cada

    parmetros del modelo sern mucho menores que en aus

    multicolinealidad, aumentndose la probabilidad de cometer error dedecir, que acepte Hono siendo verdadera. Por consiguiente, el mode

    validez para realizar pruebas de relevancia.

    6.1.1. Deteccin de Multicolinealidad

    La deteccin de multicolinealidad en un modelo puede hacerse por m

    visualizacin de contradicciones en los estadsticos que juzgan la b

    ajuste (R2), dependencia (Fc) y los estadsticos que permiten evaluar la

    de las variables en el modelo (tc). Otro mtodo de deteccin es la est

    XX' ; si el valor obtenido de XX' es muy cercano a cero, puede con

    es muy probable la existencia de multicolinealidad alta.

    No obstante, se encuentran otras pruebas mucho ms formales e

    estadsticos. Una de ellas es estimar coeficientes de correlacin entre

    variables independientes y formular pruebas de hiptesis sobre los coef

    correlacin estimados para comprobar la significancia de la relacin

    trminos estadsticos. Por ejemplo, una vez calculado el coeficiente de

    lineal entre X2 y X3, puede proponerse la siguiente prueba de hip

    Ho: 032 ,X X (Si existe relacin lineal entre X2 y X3)

  • 7/26/2019 CEDEAC-3_1.pdf

    62/101

    El estadstico de prueba es:

    22232

    32

    1

    2

    = n

    XX

    XXC t

    r

    nrt ,

    ,

    ,.~

    Donde es el valor que se desea probar del coeficiente de correla

    poblacional. No obstante en la mayora de los casos este se asume c

    cual solo se desea verificar si hay o no correlacin entre las variables ex

    Si 22 nC tt , a un nivel de significancia determinado, se re

    confirmando la existencia de relacin lineal entre X2 y X3, es decir el

    regresin mostrar multicolinealidad.

    El otro mtodo formal consiste en la estimacin de regresiones aux

    ayudan a evaluar la relacin lineal existente entre un conjunto de

    independientes. Para ello, se ejecuta una regresin entre las

    independientes del modelo, por ejemplo X2 versus (X3, X4, X4, X5)

    analizan los estadsticos resultantes de esta. Si hay relacin lineal e

    variables, el R2, el Fc y el tc que acompaa a cada variable independ

    regresin auxiliar sern altos. Las pruebas de hiptesis sobre re

    dependencia estadstica en la regresin auxiliar determinan si ex

    multicolinealidad. Es importante tener en cuenta que deben estimarseposibles regresiones auxiliares resultantes de las combinaciones

    variables independientes o regresores del modelo original. El m

    6.1.2. Correccin de Multicolinealidad

  • 7/26/2019 CEDEAC-3_1.pdf

    63/101

    La correccin de multicolinealidad en un modelo puede ejecutarse medimtodos:

    1. Eliminacin de Variables: Esta tcnica propone la eliminacin de

    variables independientes relacionadas linealmente. El problema

    esta tcnica es que se pueden eliminar variables import

    tericamente explican la variable dependiente, presentndose po

    sesgo de especificacin por omisin de variables.

    2. Utilizacin de Informacin a priori: La informacin a priori co

    proviene de estudios anteriores que pueden brindar algn indic

    valor de algn parmetro correspondiente a una de las

    independientes incluida en la ecuacin de regresin. Operativ

    valor a prioridel parmetro es reemplazado en el modelo origina

    proceder a estimar el modelo resultante.

    3. Transformacin de Variables: Esta tcnica plantea una transfo

    las variables del modelo original. El ms conocido es la transfo

    primeras diferencias. Al trabajar con un modelo que inc

    organizados en series de tiempo se presenta la posibilidad de co

    ecuacin de primeras diferencias, asumiendo que con un rezag

    una de las variables del modelo es posible eliminar la relacinpuede existir entre las variables independientes. El modelo ori

    periodo t:

    Luego la ecuacin en diferencias es:

  • 7/26/2019 CEDEAC-3_1.pdf

    64/101

    Donde t* = t - t-1. Debe tenerse en cuenta que al estimar

    modelo, la interpretacin de los coeficientes estimados no es la

    en el modelo original, debido a que estos ahora representan

    diferencias de las variables entre los periodos t y t-1.

    4. Aumentar el tamao de la muestra: Este mtodo consiste en

    muestra o conjunto de datos utilizados para estimar el modelo. E

    solucin plausible dado que el problema de multicolinealidad es o

    fundamentalmente por las observaciones en la muestra. C

    incrementa el nmero de observaciones se piensa que es

    reproducir el componente de colinealidad entre los regre

    embargo, en muchos casos no es posible adquirir ms info

    observaciones de las variables debido a restricciones fsicas,

    econmicas.

    Finalmente, se recomienda que el investigador una vez utilice algun

    mtodos verifique si el problema de multicolinealidad fue corregido.

    6.2. Heteroscedasticidad

    El problema de heteroscedasticidad se presenta cuando es violado el s

    varianza constante de los errores de la funcin de regr

    heteroscedasticidad tiene que ver con la relacin entre una o ms de la

    La presencia de heteroscedasticidad es muy comn en regresiones e

    ti d d t d t t l P j l d l

  • 7/26/2019 CEDEAC-3_1.pdf

    65/101

    partir de datos de corte transversal. Por ejemplo, cuando se recole

    provenientes de estratos, de regiones, por tamao de la familia o pempresa. En general, puede presentarse en estudios que incluyen g

    comportamientos marcados a lo largo de toda la muestra; por ejemplo

    ingreso monetario del hogar segn el estrato, pues se puede pen

    varianza del ingreso monetario del grupo de alta riqueza es ms alta

    grupo de escasos recursos.

    El problema de heteroscedasticidad repercute directamente sobre la est

    los parmetros de la regresin. Los estimadores seguirn siendo ins

    consistentes pero no eficientes. La heteroscedasticidad causa la subes

    sobre estimacin de la varianza del modelo de regresin, por lo tanto e

    error estndar de los parmetros, el valor de los estadsticos t y los in

    confianza cambian con respecto a los resultados que deberan ob

    ausencia de heteroscedasticidad. En este sentido, la pres

    heteroscedasticidad en el modelo de regresin hace que las pruebas d

    no tengan validez estadstica o que las inferencias sean errneas.

    6.2.1. Deteccin de la heteroscedasticidad

    A continuacin se presentan los mtodos para detectar la exis

    heteroscedaticidad:

    1. Anlisis de residuales: Este mtodo permite evaluar grficamen

    heteroscedasticidad causada por una variable independiente en

    dispersin entre Yt estimado y et2. Si estas grficas muest

    tendencia especfica puede afirmarse que existe heteroscedasti

  • 7/26/2019 CEDEAC-3_1.pdf

    66/101

    tendencia especfica, puede afirmarse que existe heteroscedasti

    modelo de regresin.No obstante esta metodologa es indicativabasada en una prueba estadstica.

    2. Anlisis de regresin: Es la utilizacin de una o ms regresiones

    El procedimiento es similar al planteado para detectar multicoline

    la salvedad de que ahora la regresin no se estima entre la

    independientes, sino entre el cuadrado del trmino de error y el c

    regresores del modelo original. Dentro de este mtodo se enc

    pruebas de Park, White, Glejser, Breusch-Pagan-Godfrey, y

    Quandt. A continuacin se presenta el procedimiento general pa

    la prueba de White:

    Si se tiene el siguiente modelo original:

    Una vez estimado el modelo por el mtodo de mnimos

    ordinarios (MCO), el investigador debe calcular el cuadrado de l

    22 ttt YY , y luego estimar por MCO el siguiente modelo:

    tttttttt XXXXXX ++++++= 2152

    242

    13221102

    La prueba de hiptesis relacionada con el modelo anterior es:

    El estadstico de prueba es 252 .~nR . En este caso el nmero de

  • 7/26/2019 CEDEAC-3_1.pdf

    67/101

    libertad es cinco, que corresponde al nmero de variables explica

    regresin de White. Asimismo, para modelos con ms variables elos grados de libertad sern equivalentes al nmero de regres

    modelo auxiliar. Si 2.2

    lgnR > a un nivel de significancia , l

    nula es rechazada, por lo tanto, existe heteroscedasticidad en

    original.

    Es importante sealar que la prueba de White desarrollada

    exclusivamente a la prueba de trminos cruzados debido a que

    en la regresin auxiliar el trmino de interaccin de las

    independientes del modelo original: ttXX 215 . Cuando este com

    es agregado la prueba recibe el nombre de prueba de White si

    cruzados. Este cambio tiene un efecto directo sobre los grados

    de la prueba.

    6.2.2. Correccin de heteroscedasticidad

    Las medidas correctivas principalmente incluyen dos enfoques: cua

    conocida y cuando 2 es desconocida.

    1. Cuando se conoce 2 . En este caso se utiliza el mtodo d

    cuadrados ponderados (M.C.P) para realizar una transformac

    variables del modelo. Considere el modelo original el cua

    heteroscedasticidad y 2 es conocida:

    Este mtodo supone la siguiente transformacin:

    XY ++=

  • 7/26/2019 CEDEAC-3_1.pdf

    68/101

    ttt XY ++= 21

    Donde 2 es la desviacin estndar del modelo. Se supone

    transformacin permite que el modelo quede libre de heterosce

    No obstante, para asegurarse de esto puede efectuarse cualqu

    pruebas de deteccin presentadas anteriormente.

    2. Cuando no se conoce 2 : Por lo regular es muy difcil tener co

    previo de 2 . Para utilizar el mtodo de mnimos cuadrados p

    debe recurrirse a supuestos ad hoc, con cierto grado de razonabi

    2 para proceder a la transformacin de la regresin origi

    manera, que el nuevo modelo cumpla con el sup

    homocedasticidad. Considrese el siguiente modelo:

    El investigador presume que la varianza de los errores tiene l

    forma:

    222tt XUE =

    Esta expresin es planteada cuando se cree que la varianza de

    es proporcional al cuadrado de la variable explicativa. Bajo este s

    modelo transformado puede presentarse como sigue:

    y que el modelo transformado ahora es tericamente homoceds

  • 7/26/2019 CEDEAC-3_1.pdf

    69/101

    y que el modelo transformado ahora es tericamente homoceds

    ( ) ( ) ( ) ( ) ( ) 22222222 11 ==== ttttttt XXUEXXUEvE .

    El mtodo indica que las observaciones de la muestra deben divi

    raz cuadrada de la estructura generadora de la heteroscedasticid

    para este ejemplo es equivalente a dividir por tX . Luego el proindica que el modelo transformado requiere estimarse por MCO.

    razn por la cual el mtodo se denomina mnimos cuadrados p

    dado que se ponderan las observaciones originales por un

    conveniente verificar empricamente si luego de estimar

    transformado el problema de heteroscedasticidad fue corregido.

    6.3. Autocorrelacin

    El problema de autocorrelacin se presenta en una regresin cuando

    de las diferentes observaciones estn relacionados en el tiempo. Esto

    el efecto de los errores en el tiempo no es instantneo sino por el c

    persistente en el tiempo. La autocorrelacin es ms comn en series

    en el tiempo que en informacin proveniente de encuestas en un

    (seccin cruzada). La autocorrelacin puede estar relacionada con

    econmicos; generalmente sta se presenta en un modelo con

    macroeconmicas donde en el tiempo ocurre un evidente comp

    tendencial.

    generada en casos donde se usa una forma funcional incorrecta del m

    hace que los datos se ajusten a una forma funcional que no es la ms a

  • 7/26/2019 CEDEAC-3_1.pdf

    70/101

    q j q

    Se argumenta, que la manipulacin de informacin puede llegar a gener

    autocorrelacin. Un caso tpico se presenta en la cuentas naciona

    muchos datos son obtenidos a partir de otros, aplicando tcnicas de in

    o extrapolacin. Por ejemplo, cuando se convierten datos diarios a s

    Finalmente, modelos especiales como los de rezagos distribuid

    autoregresivos pueden originar autocorrelacin.

    Entre las consecuencias de la autocorrelacin se tiene la sobrees

    subestimacin de los estadsticos t que juzgan la significancia de la

    independientes en el modelo. Aunque los estimadores siguen siendo ins

    consistentes son ineficientes.En este sentido se afecta la validez est

    las pruebas de hiptesis.

    6.3.1. Deteccin de la autocorrelacin

    Los mtodos ms comunes para detectar autocorrelacin son:

    1. Anlisis de residuales: este mtodo plantea la construccin de

    de dispersin para los errores en funcin de tiempo o en fun

    perodo inmediatamente anterior. El primer paso es estimar

    original por MCO. Luego los errores estimados de la reggraficados en un eje de coordenadas para identificar si exi

    tendencia de los mismos en el tiempo, o de estos con su primer

  • 7/26/2019 CEDEAC-3_1.pdf

    71/101

    auxiliar es el trmino de error t y los regresores sus respectiv

    hasta el orden deseado por el investigador. Adicionalmente so

  • 7/26/2019 CEDEAC-3_1.pdf

    72/101

    hasta el orden deseado por el investigador. Adicionalmente so

    los regresores usados en el modelo original. La hiptesis nula coa que todos los coeficientes de autocorrelacin de orden (los c

    que acompaan a los residuos rezagados en la regresin au

    iguales a cero, mientras la hiptesis alterna es que al menos uno

    distinto de cero. El estadstico de prueba es ( ) 22 .~ sRsn , don

    nmero de errores rezagados en la regresin auxiliar. Paautocorrelacin de orden uno, que es la prctica ms comn, s s

    uno. La hiptesis nula es rechazada cuando ( ) 22 sRsn > a

    significancia ; en este caso se concluye que hay autocorrelaci

    6.3.2. Correccin de la autocorrelacin

    La correccin del problema de autocorrelacin incluye diferentes t

    persiguen principalmente la transformacin de las variables del mod

    objetivo de eliminar el patrn tendencial que siguen los errores. Se

    tipos de metodologas de correccin de la autocorrelacin:

    1. Cuando se conoce el coeficiente de autocorrelacin: la tran

    recomendada sugiere rezagar un perodo las variables del

    estimar una ecuacin de primeras diferencias. Para esto el mod

    debe ser transformado hasta tomar la forma:

    Esta ecuacin es estimada y se propone cualquiera de las t

    2. Cuando no se conoce el coeficiente de autocorrelacin: En la

  • 7/26/2019 CEDEAC-3_1.pdf

    73/101

    los casos a nivel emprico el coeficiente de autocorrelacin no Debido a esto el coeficiente de autocorrelacin debe ser

    partiendo de la suposicin de un valor inicial del mismo.

    Una de estos mtodos es el procedimiento Cochrane O

    consiste en la estimacin de modelos con sucesivas transforma

    un mtodo iterativo representado en un algoritmo que evala

    proceso la tendencia que sigue el estimado de regresiones

    Cuando la diferencia de entre un modelo estimado actual y su

    es 0.01 se afirma que el coeficiente ha convergido y por cons

    tendencia de crecimiento de este se ha eliminado.

    Por otro lado existe el mtodo de correccin a travs del Durbin

    Mediante esta tcnica, aunque no se conoce , este es posible

    partir del estadstico d de la regresin del modelo original

    obtenido el valor de las variables son transfo