econometria i (profesora: sonia sotoca lÓpez)

Upload: diana

Post on 08-Oct-2015

137 views

Category:

Documents


0 download

DESCRIPTION

Material de ECONOMETRIA ICURSO 2009/2010PROFESORA: SONIA SOTOCA LÓPEZe-mail: [email protected]. 91 394 23 03/ 23 04Despacho: Pabellón Central (Decanato, Primera Planta, Despacho 3)Horario de tutorías: Martes y Jueves de 12.30 a 14 horasMaterial disponible en: www.ucm.es/info/ecocuan/ectr1

TRANSCRIPT

  • 1

    Material de

    ECONOMETRIA I

    CURSO 2009/2010

    PROFESORA: SONIA SOTOCA LPEZ

    e-mail: [email protected]

    Tfno. 91 394 23 03/ 23 04

    Despacho: Pabelln Central (Decanato, Primera Planta, Despacho 3)

    Horario de tutoras: Martes y Jueves de 12.30 a 14 horas

    Material disponible en: www.ucm.es/info/ecocuan/ectr1

  • 2

    INTRODUCCION

    - Econometra: este vocablo procede del griego y significa medida de la economa

    - Esta definicin no caracteriza completamente el contenido de la materia, pero pone de manifiesto su carcter necesariamente

    cuantitativo.

    - A lo largo del tiempo, la Econometra ha ido ampliando su contenido debido fundamentalmente a 4 aspectos:

    o El desarrollo de la Teora Econmica o Los avances en la Teora Estadstica o El desarrollo de la Informtica y la creciente disponibilidad y

    fcil acceso a grandes bases de datos (tanto a nivel macro

    como micro).

    - Por tanto, el continuo avance de esta disciplina hace que no haya una definicin generalmente aceptada.

    - Intriligator (1978) define Econometra como aquella rama de la Economa que se ocupa de medir desde el punto de vista emprico

    cualquier relacin entre variables econmicas.

    - De acuerdo con esta definicin, los dos ingredientes bsicos de la Econometra son: 1) La Teora Econmica y 2) Los datos.

    - La caracterstica fundamental de esta disciplina es que debe saber conjugar perfectamente ambos ingredientes. En otras palabras, un

    econmetra no puede defender la medicin sin teora, pero

    tampoco la teora sin datos.

    - Saber conjugar perfectamente teora, datos y tcnicas estadsticas es lo ms difcil, pero tambin lo ms atractivo de la Econometra.

    Alguien dijo que la Econometra sera ms fcil sin datos. - En definitiva, la Econometra debe complementar a la Teora

    Econmica, para validar determinadas relaciones que postula

    usando datos. En este sentido, el econmetra no puede prescindir

    de la Teora, ni el terico de lo que dicen los datos.

    Relaciones entre la Teora Econmica y la Econometra

    (1) La Econometra necesita primero de la Teora Econmica para que le proporcione un marco conceptual concreto. Por ejemplo, la

    teora de Keynes proporciona un marco en el que se relacionan

    dos variables econmicas: Consumo ( C ) y Renta (Y ), en donde,

    adems se postula que el C es una funcin de la Y : ( )C f Y y no

    a la inversa. En ocasiones, el econmetra puede partir no de una

    teora, sino del sentido comn o de la intuicin de que exista una

    relacin entre un conjunto de variables. Por ejemplo, puede

  • 3

    preguntarse si un tipo de inters a corto plazo depende de su

    propia historia pasada o no.

    (2) La teora econmica tambin necesita de la econometra para poder validar, contrastar, determinadas hiptesis postuladas por el

    terico. En el ejemplo de la funcin de consumo Keynesiana, se

    postula una funcin lineal entre C e Y : C a bY , donde a es el

    consumo autnomo y b la propensin marginal a consumir.

    Adems, se supone que 0 1b . Usando datos, el econmetra

    puede contrastar si esta restriccin se cumple o no.

    (3) La teora econmica necesita de la econometra para poder seguir desarrollndose. Es decir, la evidencia emprica obtenida con los

    datos puede ayudar a reformular teoras ya existentes o incluso,

    sugerir nuevas. En el ejemplo anterior, se puede contrastar si la

    relacin entre C e Y es lineal o no. Adems, se puede contrastar

    si la relacin entre C e Y es esttica. Es decir, el C en un instante

    puede depender de la Y en ese momento, pero tambin del C e Y

    pasados.

    Pasos en un Estudio Economtrico:

    (1) Para que la teora econmica pueda utilizarse en un estudio economtrico necesita de una elaboracin matemtica que de lugar

    a un modelo y en concreto, a un modelo economtrico. Un modelo

    economtrico no es un modelo geomtrico ni un modelo

    matemtico. En un modelo geomtrico se representan mediante

    grficos o diagramas relaciones entre variables econmicas

    (IS/LM, Oferta/Demanda). En un modelo matemtico se

    representan mediante ecuaciones matemticas relaciones entre

    variables. Por ejemplo, ( )C f Y

    Las principales diferencias entre un modelo matemtico y uno

    economtrico son:

    a) La forma funcional ha de estar perfectamente definida. Por

    ejemplo, C a bY , es una funcin lineal caracterizada por a y b ,

    que son los parmetros de la misma. La idea es medir o estimar

    numricamente a y b , dada una muestra de C e Y .

    b) El carcter estocstico. Un modelo economtrico es estocstico

    porque aparecen en el mismo variables aleatorias. La excepcin son

    relaciones puramente deterministas como las identidades contables.

    En nuestro ejemplo, C a bY , donde es la perturbacin

    aleatoria, ya que no nos creemos que haya una relacin exacta entre

  • 4

    C e Y . La interpretacin de es la influencia combinada sobre el

    C de variables distintas a la Y . En concreto, en la funcin de

    consumo, puede recoger factores como las expectativas de los

    agentes, factores estacionales, tipos de inters. En esta funcin

    asumimos que el factor determinante del C es la Y , pero esto es

    slo una aproximacin. En general, recoger todos los fallos del modelo. Las hiptesis que hagamos sobre estas variables aleatorias son fundamentales para decidir qu tcnica economtrica usar.

    c) El tamao. El modelo debe ser pequeo, escueto. Esto quiere

    decir que tiene que tener pocos parmetros que le caracterizen.

    Muchas veces, el tamao est condicionado por la informacin

    estadstica disponible. En nuestro ejemplo, hay dos parmetros que

    caracterizan la funcin de consumo Keynesiana ( a yb ).

    (2) Una vez que se ha especificado el modelo economtrico, se trata de buscar los datos apropiados. Es decir, se necesitan datos de cada

    una de las variables que entran en el modelo. En nuestro ejemplo,

    podramos usar distintos tipos de datos.

    Datos de series temporales: miden una variable en perodos de

    tiempo sucesivos. La frecuencia puede ser el ao, el mes, el

    trimestre, la semana, el da e incluso podemos trabajar con datos

    intrahorarios (Bolsa). Disponer de datos temporales hace que

    podamos poner un subndice t (tiempo) a las variables:

    t t tC a bY

    Fuentes fundamentales de datos temporales son la Contabilidad

    Nacional, la EPA (Encuesta de Poblacin Activa), el INE (Instituto

    Nacional de Estadstica), Eurostat, Datos de Bolsa o el Banco de

    Espaa. Normalmente, son gratuitos.

    Datos de seccin cruzada: miden una variable en un momento

    determinado del tiempo para distintas entidades. Estas entidades

    pueden ser individuos, familias, pases, empresas, Comunidades

    Autnomas, sectores empresariales, etc. Por ejemplo, podemos

    tener una funcin de consumo familiar: i i iC a bY , donde el

    subndice i hace referencia a la familia.

    Estos datos fundamentalmente se obtienen a partir de entrevistas o

    encuestas hechas a las entidades correspondientes. Las dos fuentes

  • 5

    ms importantes de este tipo de datos son: la EPF (Encuesta de

    Presupuestos Familiares) y la CB (Central de Balances).

    Datos de panel: surgen al cruzar una seccin cruzada con una serie

    temporal. En nuestro ejemplo, tendramos el dato de consumo de

    una familia a lo largo de una serie de aos. Un panel supone

    disponer de mucha ms informacin que en una seccin cruzada, ya

    que tenemos distintas observaciones de una misma variable

    (consumo) para una misma unidad (familia). Esto es difcil

    conseguir en una ciencia no experimental como es la Economa.

    En un panel se pueden analizar o contrastar hiptesis que no es

    posible con una seccin cruzada. Por ejemplo, contrastar si ha

    habido diferencias en el comportamiento del consumo de las

    familias despus de un cambio de poltica econmica (impuestos)

    en un momento determinado del tiempo.

    Tanto las secciones cruzadas como los paneles no suele ser

    informacin gratuita.

    (3) Una vez que se ha especificado el modelo y que se dispone de los datos adecuados de todas las variables, se pasa a la etapa de

    estimacin del mismo. Consiste en medir empricamente los

    parmetros que caracterizan el modelo y aqu entra la estadstica,

    sobre todo la inferencia estadstica (que usa la informacin

    muestral disponible para inferir caractersticas de toda una

    poblacin).

    (4) Una vez que el modelo ha sido estimado usando las tcnicas economtricas adecuadas, llegamos al paso de la verificacin o

    validacin del modelo. Se establecen criterios (grficos y

    estadsticos) para rechazar o aceptar el modelo. Aqu comienza un

    proceso iterativo en la modelizacin, ya que si no aceptamos un

    modelo, no lo usamos, sino que reformulamos el modelo terico, o

    bien, tratamos de una forma ms adecuada los datos. A veces, es

    fcil teorizar sobre relaciones entre variables que estn definidas de

    forma precisa, pero otra cosa es obtener datos seguros de estas

    variables. Por ejemplo, es difcil siempre obtener datos razonables

    de los beneficios de una empresa, de un tipo de inters o del stock

    de capital de una economa. En algunos casos, no existe

    contrapartida observable para una variable terica.

  • 6

    Usos de un modelo economtrico estimado: Pueden ser varios:

    (1) Anlisis estructural. Se usa el modelo estimado para medir la relacin entre variables econmicas. Algunos ejemplos, son la

    medicin de la propensin marginal a consumir de un pas, de la

    elasticidad demanda-precio de un bien, de la elasticidad de la

    produccin-input de una empresa, de la curva de Phillips (inflacin

    y paro), de la relacin entre ventas y publicidad de un producto en

    una empresa, de la relacin entre el rendimiento y riesgo de un

    activo financiero, de la relacin entre el salario y el nivel de

    educacin de un individuo, etc.

    (2) Prediccin. Es el uso ms frecuente de un modelo economtrico. Se usa para predecir el valor futuro de una variable de inters. Las

    predicciones se usan para tomar decisiones. Por ejemplo, todo el

    mundo predice Inflacin, PIB o Consumo. Fuera de la economa,

    todos los das se hacen previsiones meteorolgicas.

    (3) Evaluacin de polticas econmicas. Se usa para simular el valor futuro de una variable bajo distintos supuestos de evolucin de otras.

    En nuestro ejemplo, sera predecir el patrn de evolucin de

    consumo bajo distintos escenarios de evolucin de la renta. Si una

    autoridad controla algunas variables, como la cantidad de dinero,

    puede evaluar el efecto sobre la tasa de inflacin ante distintos

    escenarios de crecimiento monetario.

    Clasificacin de variables en un modelo economtrico

    La principal clasificacin es la de:

    Variable Endgena: es aquella explicada por otras variables. Es denotada

    por y .

    Variables Exgenas: explican a la endgena pero no pueden estar influidas

    por ella. Puede haber k variables explicativas y son denotadas por

    1 2, ,..., kx x x .

    Hay que tener en cuenta que esta distincin vara dependiendo del modelo

    economtrico en particular y su objetivo. As, una exgena en un modelo

    puede pasar a ser la endgena de otro. Ej. ( )C f Y y ( )Y f M ,

    donde M es cantidad de dinero.

    Variables continuas: pueden tomar valores en todos los puntos de la recta

    real ( C e Y ).

    Variables discretas: slo toman valores en algunos puntos de la recta real.

  • 7

    Un ejemplo son las variables ficticias o dummies que toman valor uno o

    cero. La idea es que hay caractersticas que no se pueden medir (en euros,

    en kilos, etc), pero que pueden ser factores relevantes a la hora de explicar

    a otra variable. Por ejemplo, en la funcin de consumo familiar, adems de

    la renta, el hecho de que la familia viva en el campo o en la ciudad puede

    ser relevante para explicar diferencias en el consumo. Para ello, se

    construye una variable ficticia que toma uno para las familias que viven en

    la ciudad y cero para las que viven en el campo ( iD ) y se introduce como

    una exgena ms en el modelo.

  • 8

    TEMA 1. EL MODELO DE REGRESIN LINEAL SIMPLE Y

    GENERAL

    El objetivo es especificar, estimar y contrastar relaciones entre variables

    econmicas usando datos.

    Para ello, es necesario hacer una serie de hiptesis simplificatorias

    (1) Hiptesis de linealidad en los parmetros. Establece la linealidad en los parmetros en la relacin entre la variable endgena y las

    exgenas. Es decir, en la funcin de consumo tendremos.

    1 2t t tC Y

    donde 1 y 2 son los parmetros de esta relacin. No hay que confundir

    esta hiptesis de linealidad con la linealidad entre las variables. Por

    ejemplo, en las relaciones entre y y x que se dan a continuacin, slo la

    primera es formalmente lineal. Sin embargo, cumplen la hiptesis de

    linealidad en los parmetros las tres:

    1 2y x

    1 2

    xy e

    1 2 lny x

    En determinadas relaciones econmicas no se cumple la hiptesis de

    linealidad en los coeficientes. Un ejemplo sencillo es la funcin de

    produccin de tipo Cobb-Douglas, donde Y representa el output de la

    empresa, L es trabajo y K es el stock de capital:

    Y AK L

    Los parmetros desconocidos de esta funcin son A (parmetro de

    eficiencia), (elasticidad del output con respecto al capital) y

    (elasticidad del output con respecto al trabajo). Una simple transformacin

    logartmica en los datos, hace que esta relacin cumpla la linealidad en los

    parmetros. Es decir:

    ln ln ln lnY A K L

  • 9

    Ejemplos de relaciones entre variables econmicas no lineales en los

    parmetros hay muchos, por ejemplo, en una funcin de Consumo no lineal

    como:

    cC a bY

    donde a, b y c son los parmetros que caracterizan esta relacin. En este

    caso, habra que estimar estos tres parmetros dada una muestra de C y Y.

    Contrastar una relacin lineal entre C y Y, equivale a contrastar si el

    parmetro c es unitario o no.

    (2) Hiptesis de especificacin correcta. Esta hiptesis supone que las k variables explicativas del modelo son aquellas variables

    relevantes que explican el comportamiento de la endgena. Y que

    estn todas. No existe ninguna variable ix que no explique nada de

    la y . Es decir, el modelo est bien planteado o especificado.

    Esta hiptesis supone aceptar en la prctica dos cosas no siempre

    ciertas:

    (a) Aceptar que siempre hay una teora detrs que me permite saber cales son las variables relevantes en cada modelo.

    (b) Aceptar que sobre estas variables dispongo siempre de informacin muestral adecuada.

    El incumplimiento de esta hiptesis se da en muchos casos. Ejemplo: Si

    uno quiere estimar con datos de seccin cruzada una funcin de consumo

    keynesiana, adems de la renta familiar, existen otras muchas variables que

    explican el comportamiento del consumo de una familia. Por ejemplo, el

    nmero de hijos, la edad del cabeza de familia, si la mujer trabaja o no, si

    se vive en el campo o en la ciudad, etc. Sin embargo, nunca ser posible

    incluir todas y cada una de las variables que determinan el consumo de una

    familia.

    (3) Hiptesis de grados de libertad positivos. Los grados de libertad de un modelo se definen como la diferencia entre el nmero de datos

    ( n ) y el nmero de variables explicativas ( k ). Es decir, 0gl n k .

    Esta hiptesis supone que, como mnimo, es necesario disponer de

    tantos datos como parmetros a estimar. No obstante, es preferible

    siempre disponer de ms datos que parmetros a estimar. En el ejemplo

    de la funcin de consumo keynesiana hay que estimar dos parmetros (a

    y b). Con un nico dato, no sera posible estimar de forma nica ambos

  • 10

    parmetros. Con dos datos, sera posible obtener una nica estimacin

    de a y b, pero para que la estimacin sea estable, es mejor tener una

    nube de datos y pocos parmetros a estimar.

    (4) Hiptesis de parmetros constantes. Esta hiptesis supone que los parmetros

    1 2, ,..., k son constantes en el tiempo.

    Si trabajamos con n datos en la funcin de consumo keynesiana,

    suponer que la propensin marginal a consumir es constante en el

    tiempo, implica que se obtiene una estimacin que ha de interpretarse

    como la propensin marginal a consumir media en ese perodo de

    tamao n. Si el perodo muestral con el que se trabaja es muy amplio y

    heterogneo (por ejemplo, incluye perodos de crisis y de auge), es ms

    difcil mantener esta hiptesis que si la muestra es homognea.

    (5) Hiptesis de independencia lineal entre las variables explicativas. Esta hiptesis implica que cada variable explicativa

    contiene informacin adicional sobre la endgena que no est

    contenida en otras. Si hubiera informacin repetida, habra variables

    explicativas dependientes linealmente de otras. Formalmente, se

    puede resumir la informacin muestral sobre las k variables

    explicativas (regresores) en una matriz, denotada por X , de tamao

    n k con la siguiente estructura:

    11 1

    1

    k

    n nk

    x x

    x x

    donde cada columna recoge los datos asociados a cada variable x . El

    hecho de que cada columna sea linealmente independiente de las otras

    implica que el rango de la matriz X es completo, es decir, igual a k . Si

    alguna variable x es linealmente dependiente de otra, decimos que

    existe un problema de multicolinealidad exacta.

    (6) Hiptesis de regresores no estocsticos. Esta hiptesis implica que los datos de las variables explicativas son fijos en muestras

    repetidas. Es decir, el valor de las variables explicativas es constante

    en la funcin de distribucin de la endgena.

    Existen tres situaciones en Econometra donde no es posible

    mantener esta hiptesis:

  • 11

    (6.1) Modelos de ecuaciones simultneas. Por ejemplo, un modelo de

    demanda y de oferta de un bien que se intercambia en un mercado

    competitivo en equilibrio, se puede escribir:

    1

    d

    t t tq a bp

    2

    o

    t t tp c dq

    , 1,2, ,d ot tq q t n

    donde se observa una relacin bidireccional entre el precio (tp ) y la

    cantidad intercambiada ( dtq o

    o

    tq ), de forma que el precio es una

    exgena en la ecuacin de demanda y pasa a ser la endgena en la

    ecuacin de oferta y por tanto, esto hace que sea un regresor estocstico.

    (6.2) Modelos dinmicos en los que aparecen como regresores sucesivos

    retardos de la variable endgena. Por ejemplo, si en la relacin entre

    consumo y renta se supone un modelo dinmico como:

    1 2 1 3t t t tC C Y

    donde el propio modelo indica que el consumo retardado es un regresor

    estocstico al depender un error aleatorio, 1t . Es decir:

    1 1 2 2 3 1 1t t t tC C Y

    (6.3) Modelos con errores de medida en las variables explicativas. Bajo

    la hiptesis de renta permanente de Friedman, el consumo slo depende

    del componente permanente de la renta ( PtY ):

    P

    t t tC bY P T

    t t tY Y Y

    donde el componente transitorio ( TtY ) o las desviaciones aleatorias

    alrededor de la renta media de un agente no es observable. Por tanto, la

    renta permanente ( PtY ) es un regresor estocstico, ya que P T

    t t tY Y Y .

    De hecho, estos 3 incumplimientos dan lugar a 3 temas de econometra .

    (7) Hiptesis referentes a las perturbaciones aleatorias del modelo. El trmino de error t satisface las siguientes hiptesis:

  • 12

    (7.1) Esperanza nula en todo instante de tiempo: ( ) 0, 1,2,tE t n . Ya

    que t es tratado como la suma de muchos efectos individuales sobre la

    endgena, donde el signo de cada uno es desconocido, no existe ninguna

    razn para esperar cualquier valor distinto de cero. Supongamos que

    ( )tE , entonces el modelo 1 2 t tx es el mismo que

    1 2( ) ( )t tx , donde el nuevo trmino de error:*

    t t , es tal

    que la *( ) 0tE .

    Una situacin en la que se incumple esta hiptesis, es cuando a su vez,

    se incumple otra, como es omitir en el modelo una variable relevante. Si

    la verdadera funcin de consumo es

    t t t tC a bY ci

    donde ti es un tipo de inters y se trabaja con un modelo que omite esta

    variable:

    t t tC a bY

    donde t es el trmino de error de esta ecuacin y adems, se sabe que

    t t tci . Es fcil comprobar que ( ) 0t tE ci , aunque t tenga

    esperanza nula. Se usan las hiptesis de parmetros constantes y

    regresores no estocsticos.

    (7.2) Varianza constante (Homocedasticidad). Supone que al cumplirse

    (7.1), la 2 2var( ) ( ) , 1,2, ,t tE t n . Si la variabilidad (o dispersin

    alrededor de la media) de las perturbaciones cambia con el tiempo

    hablamos de heterocedasticidad.

    Es muy frecuente la heterocedasticidad en modelos donde se usan datos

    de seccin cruzada. Si tenemos la funcin de consumo familiar utilizada

    hasta ahora, es fcil comprender que aquellas familias con mayor nivel

    de renta tengan mayor variabilidad en su consumo (adems de satisfacer

    necesidades bsicas, pueden consumir otras cosas). Puesto que el error

    del modelo est relacionado con el consumo, lo que ocurrir es que a

    mayor renta, mayor varianza en el consumo y por tanto, mayor varianza

    en el error.

    (7.3) Ausencia de autocorrelacin en todo instante de tiempo. Implica

    que la cov( ) ( ) 0, , 1,2, ,t s t sE t s n t s . Si hay autocorrelacin, el

    error en un momento del tiempo ayudara a predecir el error en un

  • 13

    momento posterior y los errores tendran inercia. Si no hay

    autocorrelacin, la historia pasada no ayuda a predecir el

    comportamiento futuro y los errores son completamente aleatorios e

    imprevisibles.

    Es muy frecuente el incumplimiento de esta hiptesis en modelos

    donde se usan datos de series temporales.

    Estas restricciones se imponen para exigir un buen comportamiento a las variables t , aunque tambin hay razones

    tcnicas que nos obligan a hacer estas hiptesis. Puesto que tenemos n

    variables aleatorias 1, 2( , )n , su caracterizacin exige hablar, al

    menos, de sus dos primeros momentos (media y varianza):

    Media: Sera un vector de n medias, ( )E .

    E1

    .

    n

    =1

    .

    n

    Matriz de varianzas y covarianzas: Sera una matriz que recoge las

    varianzas de cada variable en la diagonal principal y las covarianzas

    entre una perturbacin y otra diferente fuera de la diagonal. Es

    simtrica, definida positiva y de tamao n n .

    2

    1 1 2 1 1 1 2 1

    22 1 2 2 2 1 2 2

    21 2 1 2

    var( ) cov( ) . cov( ) ( ) ( ) . ( )

    cov( ) var( ) . cov( ) ( ) ( ) . ( )var( )

    . . . . . . . .

    cov( ) cov( ) . var( ) ( ) ( ) . ( )

    n n

    n n

    n n n n n n

    E E E

    E E E

    E E E

    Los elementos diferentes de dicha matriz son ( 1)

    2

    n n . No obstante, si la

    muestra disponible es de tamao n , ya no tenemos grados de libertad

    para caracterizar el trmino de error, ya que habra que estimar n

    medias y ( 1)

    2

    n n varianzas y covarianzas distintas. Las hiptesis (7)

    hacen que el vector de medias sea nulo y la matriz de var-cov una

    matriz diagonal, en donde slo habra que estimar la varianza constante 2 , ya que por ausencia de autocorrelacin todas las covarianzas son

    cero.

  • 14

    NOTACIN MATRICIAL DEL MODELO LINEAL GENERAL

    La informacin asociada a la variable endgena se almacena en un

    vector columna Y de tamao 1n :

    Y = 1

    .

    n

    y

    y

    La informacin asociada a las variables explicativas se recoge en una

    matriz llamada X de tamao n k :

    X = 11 1

    1

    .

    . . .

    .

    k

    n nk

    x x

    x x

    Las perturbaciones en un vector de tamao 1n y los parmetros en

    un vector de tamao 1k :

    = 1

    .

    n

    ; = 1

    .

    k

    El modelo lineal general (MLG) escrito en forma matricial o compacta

    es:

    1

    .

    n

    y

    y

    =11 1

    1

    .

    . . .

    .

    k

    n nk

    x x

    x x

    1

    .

    k

    +1

    .

    n

    o bien, Y =X + . Este es un sistema de n ecuaciones que se

    corresponde con la forma compacta de escribir el MLG.

    Las hiptesis sobre las pertubaciones en notacin matricial son:

    E( ) = 0 ; var ( ) = E( T ) = 2 I, donde I es la matriz identidad

  • 15

    METODOS DE ESTIMACIN DEL MODELO LINEAL SIMPLE

    Y GENERAL

    Estimacin del modelo lineal simple:

    Supongamos que queremos estimar los parmetros de la funcin de

    consumo keynesiana (modelo de regresin lineal simple):

    t t tC a bY

    donde a es el consumo autnomo y b la propensin marginal a

    consumir. Para ello, se dispone de una muestra de n datos de consumo y

    renta que se puede representar en el plano tC e tY . Cada punto

    representa el par de valores de Consumo y Renta observados en ese

    perodo (ao) concreto. Esto se denomina NUBE DE PUNTOS real,

    donde habr tantos puntos como datos utilizados.

    Grfico: Nube de puntos real y recta de ajuste

    500

    1000

    1500

    2000

    2500

    500 1000 1500 2000 2500 3000

    RENTA

    CO

    NS

    UM

    O

    Si suponemos un modelo lineal entre ambas variables, dada la nube de

    puntos, una estimacin del modelo viene dada por una recta llamada

    RECTA DE AJUSTE definida por:

    ta bY

    donde a representa una estimacin del consumo autnomo y b una

    estimacin de la propensin marginal a consumir. Para cada valor de tY ,

    la recta de ajuste genera un valor de consumo que denotamos por tC ,

    que no tiene por qu coincidir con el consumo real tC . Si dado un valor

    de la tY , el modelo predice un valor de consumo tal que

    t tC C , en ese

    instante de tiempo el modelo ajusta perfectamente. Si dado un valor de

  • 16

    la tY , el modelo genera un valor del consumo tal que

    t tC C , el modelo

    infraestima el verdadero valor del consumo en ese ao y comete un

    error. Este error es medible y se denomina RESIDUO, es decir

    t t tC C . El residuo puede ser nulo, positivo o negativo, si el modelo

    acierta, infraestima o sobrestima el verdadero valor de consumo. En

    general, en todos los puntos de la nube real por encima de la recta de

    ajuste, el verdadero valor de consumo est por encima de lo que predice

    la recta; en los puntos sobre la recta de ajuste el modelo no se equivoca

    y en los puntos de la nube real por debajo de la recta, el verdadero valor

    de consumo est por debajo de lo que ajusta el modelo (la recta).

    El objetivo ahora es conseguir una estimacin de a y b de manera que se

    cumpla algn criterio de optimalidad. Por ejemplo, un criterio sera

    minimizar la suma de los residuos cometidos en toda la muestra:

    1 1

    min minn n

    t t t

    t t

    C a bY

    Este no es un buen criterio, ya que los errores individuales que comete

    el modelo pueden ser muy grandes, pero al tener signo los errores

    grandes y positivos se pueden compensar con los grandes y negativos.

    La solucin obvia es eliminar en este criterio el signo de los residuos,

    tomando por ejemplo el valor absoluto:

    1

    minn

    t

    t

    En este caso, el problema es la dificultad analtica de obtener una

    solucin para a y b . No obstante, otra forma de eliminar el signo de

    una variable es elevarla al cuadrado. El criterio de optimalidad sera

    obterner una expresin de a y b que minimize la suma de los cuadrados

    de los residuos:

    2 2

    1 1

    min min ( )n n

    t t t

    t t

    C a bY

    que tiene las ventajas de (1) eliminar la compensacin de errores por el

    signo, (2) penalizar ms los errores grandes que los pequeos y (3)

    llevar a una solucin analtica sencilla. Este criterio de estimacin es el

    ms conocido en Econometra y se denomina MCO (Mnimos

    Cuadrados Ordinarios).

  • 17

    Ejemplo: Obtener la expresin MCO para a y b en la funcin de

    Consumo Keynesiana:

    2 2

    1 1

    min min ( )n n

    t t t

    t t

    C a bY

    Solucin: Condiciones de primer orden:

    2

    1

    1

    2 ( ) 0

    n

    t nt

    t t

    t

    C a bYa

    2

    1

    1

    2 ( ) 0

    n

    t nt

    t t t

    t

    C a bY Yb

    Este es un sistema de dos ecuaciones con dos incgnitas. De la primera

    condicin, se obtiene que:

    1 1

    0n n

    t t

    t t

    C na b Y a C bY

    donde C e Y representan las medias muestrales de Consumo y Renta,

    respectivamente. Usando la segunda condicin de primer orden y la

    solucin para a , se obtiene:

    2 2

    1 1 1 1 1 1

    0 ( ) 0n n n n n n

    t t t t t t t t

    t t t t t t

    C Y a Y b Y C Y C bY Y b Y

    y operando:

    2

    1 1 1 1

    ( )n n n n

    t t t t t

    t t t t

    b Y Y Y C Y C Y

    1 1

    2 2 2

    1 1

    ( )( )

    ( )

    n n

    t t t t

    t t

    n n

    t t

    t t

    C Y nCY C C Y Y

    b

    Y nY Y Y

    Las dos frmulas en los recuadros son los estimadores MCO para los

    parmetros a y b. Para una muestra concreta de Consumo y Renta, el

  • 18

    estimador proporciona una estimacin concreta del consumo autnomo

    y de la propensin marginal a consumir.

    Ejercicio para el estudiante: Comprobar que la solucin obtenida es un

    mnimo. Es decir, mostrar que el hessiano es definido positivo:

    2 2 2 2

    2

    2 2 2 2

    2

    ( )

    ( )

    t t

    t t

    a a bH

    b a b

    Estimacin del modelo lineal general (MLG):

    Dada la formulacin matricial del MLG, Y =X + , el objetivo es,

    de nuevo, obtener la expresin analtica del estimador MCO de . Para

    ello, se define el vector de residuos de tamao 1n que una vez

    conseguida una estimacin del vector , se calcular como:

    Y X

    La funcin objetivo sigue siendo minimizar la suma de cuadrados de los

    residuos con respecto a los k parmetros del modelo que puede

    escribirse como:

    2

    1

    min min min( ) ( )n

    T T

    t

    t

    Y X Y X

    Operando:

    min( )( ) min( 2 )T T T T T T T T TY X Y X Y Y X Y X X

    Condiciones de primer orden:

    2 2 0

    TT TX Y X X

    donde se han tenido en cuenta los siguientes resultados sobre derivadas

    matriciales:

    Tz w

    wz

    ; 2

    Tz AzAz

    z

  • 19

    siendo z y w dos vectores de tamao compatible y A una matriz

    cuadrada. La solucin analtica a las condiciones de primer orden es:

    T TX X X Y

    Este es un sistema de k ecuaciones con k incgnitas (1 2

    , ,..., k ),

    llamado sistema de ecuaciones normales. El estimador que satisface

    este sistema se llama estimador por MCO. La forma ms sencilla de

    resolver este sistema es premultiplicar el mismo por la inversa de la

    matriz TX X de tamao ( k k ), teniendo que:

    1 ( )T TX X X Y

    Ejercicio para el estudiante: Comprobar que la solucin obtenida es un

    mnimo.

    Propiedades estadsticas del estimador MCO de :

    Linealidad: El estimador MCO de es lineal. La linealidad consiste en

    poder escribir el estimador como una combinacin lineal fija de los

    valores de la variable endgena.

    Prueba: Denotando por 1( )T TW X X X , el estimador MCO de se

    puede escribir como WY , donde por la hiptesis de regresores fijos

    sabemos que cada estimador se puede escribir como una combinacin

    lineal fija de los valores de la variable endgena Y .

    Insesgadez: El estimador MCO de es insesgado. Es decir, la media

    de la distribucin muestral de coincide con el verdadero . Si la ( )E , las estimaciones que conseguimos con el estimador no son

    iguales al verdadero vector de parmetros ni siquiera en media. A la

    diferencia ( )E se le denomina sesgo. La insesgadez es una

    propiedad deseable, pero no a toda costa. Por ejemplo, podemos tener

    dos estimadores alternativos de , uno insesgado y otro sesgado. Si los

    valores que toma el estimador sesgado oscilan menos alrededor de

    que el insesgado, el primero tendra menos varianza que el segundo. Es

    decir, a veces un pequeo sesgo compensa por la menor varianza.

  • 20

    Prueba: La expresin del estimador MCO de , 1 ( )T TX X X Y , se

    puede escribir como 1 ( )T TX X X , sin ms que sustituir el valor

    de Y por el modelo Y X . Por tanto:

    1 1 1( ) [ ( ) ] ( ) [( ) ] ( ) ( )T T T T T TE E X X X E E X X X X X X E

    donde se han usado las hiptesis de (1) parmetros constantes, (2)

    regresores fijos e independientes linealmente y (3) esperanza nula del

    trmino de error .

    Eficiencia: El estimador MCO de es eficiente. Es decir, tiene

    varianza mnima dentro de la familia de estimadores lineales e

    insesgados de . Esto es lo que demuestra el Teorema de Gauss-

    Markov. Pero antes, hay que derivar la expresin de la matriz de

    varianzas-covarianzas del estimador MCO de .

    1 1 var( ) [( )( ) ] [( ) ( ) ]T T T T TE E X X X X X X

    Sabiendo que por hiptesis los regresores son fijos:

    1 1var( ) ( ) ( ) ( )T T T TX X X E X X X

    y, finalmente, aplicando las hiptesis de que las pertubaciones tienen

    esperanza nula, varianza constante y ausencia de autocorrelacin:

    2 1var( ) ( )TX X

    Esta es la expresin de la mnima varianza de un estimador lineal e

    insesgado de (ver Apndice 1).

    Estimador MCO de la varianza residual 2

    Dada una muestra de Y y X , con la expresin del estimador MCO,

    es posible calcular una estimacin puntual de los parmetros, pero no es

    posible calcular una medida de la incertidumbre asociada a dicha

    estimacin (varianza), porque 2 es constante pero desconocido.

    Un estimador intuitivo de la varianza de las perturbaciones consiste

    en dividir la suma de cuadrados de los residuos MCO por n. No

    obstante, para que dicho estimador sea insesgado, hay que ponderar la

    suma de cuadrados de los residuos por los grados de libertad. Es decir:

  • 21

    2

    2 1

    n

    Tt

    t

    n k n k

    Este estimador es insesgado, es decir, la 2 2( )E , ya que la 2 ( ) ( )TE n k .

    Prueba: El vector de residuos MCO se puede escribir como:

    1 1 ( ) [ ( ) ]T T T TY Y Y X Y X X X X Y I X X X X Y MY

    donde la matriz M de tamao ( )n n es la llamada matriz de proyeccin

    que tiene propiedades importantes: (1) es simtrica, (2) idempotente ,(3)

    no tiene inversa y (4) es ortogonal a la matriz X , es decir, 0MX .

    Ejercicio para el estudiante: Probar estas cuatro propiedades de la matriz

    M .

    A partir de la relacin anterior y de las propiedades de la matriz M , se

    obtiene: ( )MY M X M . Por tanto, siempre que se desee la

    suma de cuadrados de los residuos se puede escribir como una forma

    cuadrtica:

    T T M

    Finalmente, la esperanza de esa suma es igual a:

    2 2

    ( ) ( ) [ ( )] [ ( )]

    [ ( )] [ ( )] [ ] [ ]

    T T T T

    T T

    E E M E tr M E tr M

    tr E M tr ME tr M tr M

    y la traza de la matriz M :

    1 1 1( ) [ ( ) ] [ ( ) ] [( ) ]T T T T T Ttr M tr I X X X X n tr X X X X n tr X X X X n k

    ya que la matriz M es cuadrada y de dimensin n y 1( )TX X de tamao

    ( )k k . De hecho, la prueba de que esta matriz no tiene inversa es

    inmediata, ya que el rango de una matriz idempotente coincide con su

    traza.

    Una vez obtenido un estimador insesgado de la varianza residual, dada

    cualquier muestra de Y y X en el MLG, los pasos en la estimacin

    MCO son:

  • 22

    (1) 1 ( )T TX X X Y

    (2) 2

    T

    n k

    (3) 2 1 var( ) ( )TX X

    Ejercicio para el estudiante: Probar que el estimador de la varianza del

    MCO es insesgado. Es decir, la [var( )] var( )E .

    Ejercicio numrico 1: Dada la siguiente muestra temporal de las

    variables ty y tx :

    ty 8.04 6.95 7.58 8.81 8.33 9.96 7.24 4.26 10.84 4.82 5.68

    tx 10 8 13 9 11 14 6 4 12 7 5

    Obtener la estimacin MCO de los parmetros del modelo

    1 2t t ty x , as como una estimacin insesgada de la varianza

    residual y de la matriz de varianzas-covarianzas del estimador de 1 y

    2 .

    Solucin: El clculo de la expresin 1 ( )T TX X X Y para esta muestra

    es:

    2

    11 99

    99 1001

    tT

    t t

    n xX X

    x x

    82.51

    797.60

    tT

    t t

    yX Y

    y x

    1

    1

    2

    11 99 82.51 1001 99 82.51 31 99 1001 797.60 99 11 797.60 0.51210

    El modelo estimado se escribe 3 0.5t ty x . La estimacin de la varianza

    residual por MCO exige calcular la suma de cuadrados de residuos:

    1 1 1 11 11 11 8.04 8 0.04;...; 5.68 5.5 0.18y y y y

    112

    112 2 1

    1

    14

    14; 1.5511 2

    t

    tt

    t

    SRn k

  • 23

    Por ltimo, la estimacin de la matriz de varianzas y covarianzas del

    estimador MCO de 1 y 2 es:

    1 1 22 1

    1 2 2

    var( ) cov( ) 1001 99 1.27 0.131.55 var( ) ( ) 99 11 0.13 0.0141210cov( ) var( )

    TX X

    Propiedades algebraicas del criterio de estimacin MCO

    Hay que distinguir las propiedades algebraicas del criterio MCO

    dependiendo de si el modelo incorpora o no un trmino constante. El

    sistema de ecuaciones normales para un modelo con trmino constante

    tiene la siguiente estructura:

    T TX X X Y

    o bien:

    112 1 1

    12 22 2 22 2 12 22 2 22

    1 2 2 1 2

    1 1 . 1 1 . 1 1 . 1

    . 1 . .

    . . . . . . . . . . . . ..

    . 1 . .

    k

    n k n

    k k nk n nk k k nk nk

    x x y

    x x x x x x x x y

    x x x x x x x x y

    donde la primera columna de la matriz X es determinista y vale siempre

    uno (es el llamado trmino constante del modelo). Operando en el

    sistema anterior, se obtiene:

    12 3

    2

    2 2 3 2 22

    2

    .

    . . . . ..

    . . .

    t t tk t

    t t t t tk t t

    tk tk tk

    n x x x y

    x x x x x x y

    x x y

    La primera ecuacin del sistema de ecuaciones normales de un modelo

    con trmino constante es:

    1 2 2 ...t tk k tn x x y

    o bien, en trminos matriciales:

  • 24

    T Ti X i Y

    donde Ti es un vector fila unitario de tamao n ; 1 1 . 1Ti . A partir

    de esta primera ecuacin que cumple el criterio MCO es fcil derivar

    algunas propiedades algebraicas:

    Propiedad 1. En el MLG con trmino constante estimado por MCO, la

    media muestral de los residuos es nula, es decir, 0 .

    Prueba: A partir de la primera ecuacin normal de un modelo con

    constante:

    ( ) 0 ( ) 0 0 0T T T T T ti X i Y i Y X i Y Y i

    Propiedad 2. En el MLG con trmino constante estimado por MCO, la

    media muestral de la variable endgena coincide con la media muestral

    de la variable ajustada por el modelo, es decir: Y Y .

    Prueba: A partir de la primera ecuacin normal de un modelo con

    constante:

    T T T T

    t ti X i Y i Y i Y y y

    Propiedad 3. En el MLG con o sin trmino constante estimado por

    MCO, los residuos son ortogonales a las variables explicativas, es decir:

    0TX . En trminos escalares, 1

    0, 1,2,...,n

    ti t

    t

    x i k

    .

    Prueba: A partir del sistema de ecuaciones normales MCO:

    ( ) 0 0T T T TX X X Y X Y X X

    Propiedad 4. En el MLG con o sin trmino constante estimado por

    MCO, los residuos son ortogonales a la variable endgena ajustada, es

    decir: 0TY . En trminos escalares, 1

    0n

    t t

    t

    y

    .

    Prueba: A partir de la misma condicin de ortogonalidad:

    0 ( ) 0 0T T T TY X X

  • 25

    teniendo en cuenta la propiedad 3 de ortogonalidad entre los residuos y

    los regresores.

    Propiedad 5. En el MLG con o sin trmino constante estimado por

    MCO, la suma de cuadrados de la variable endgena real es igual a la

    suma de cuadrados de la variable ajustada ms la suma de cuadrados de

    residuos, es decir: T T TY Y Y Y . O bien, escrita en trminos escalares,

    2 2 2

    1 1 1

    n n n

    t t t

    t t t

    y y

    .

    Prueba: La suma de cuadrados de residuos MCO se puede escribir

    como: ( ) ( ) 2T T T T T T TY X Y X Y Y X Y X X

    Sustituyendo en el ltimo sumando la expresin analtica del estimador

    MCO de :

    1 2 ( )T T T T T T T T T T TY Y X Y X X X X X Y Y Y X Y

    Finalmente: T T T T TY Y X X X Y

    Ejercicio para el estudiante: Probar de una manera diferente esta

    propiedad haciendo uso de la propiedad 4.

    Propiedad 6. En el MLG con trmino constante estimado por MCO, la

    propiedad 5 se cumple cuando las variables se expresan en desviaciones

    con respecto a sus medias, es decir:

    ( ) ( ) ( ) ( ) ( ) ( )T T TY iY Y iY Y iY Y iY i i

    donde i es una columna unitaria de tamao n.

    Prueba: Aplicando las propiedades algebraicas 1 y 2, la expresin

    anterior en trminos escalares queda reducida a:

    2 2 2( ) ( )t t ty y y y

    y operando 2 2 2 2 2t t ty ny y ny , que se corresponde con la propiedad 5.

  • 26

    A la suma de cuadrados de los valores de la endgena alrededor de

    su media se le llama ST (Suma Total); a la suma de cuadrados de la

    variable ajustada en desviaciones SE (Suma Explicada) y a la suma de

    cuadrados de residuos se le denomina SR (Suma Residual). Por tanto,

    esta ltima propiedad se expresa como ST SE SR . La interpretacin

    de esta igualdad es una descomposicin de varianzas. Es decir,

    dividiendo por n , indica que de toda la variabilidad que hay que

    explicar de la endgena (ST), hay una parte captada por el modelo (SE)

    y otra parte que no puede ser explicada (SR). Si el modelo ajusta

    perfectamente la SR=0 y la ST=SE. Si el modelo no explica nada, la

    0SE y la ST SR .

    Ejercicio para el estudiante: Comprobar que se cumplen estas 6

    propiedades con los datos del ejercicio numrico 1.

    Medidas de bondad de ajuste en la regresin

    La SR puede ser una medida de bondad de ajuste. No obstante, no es

    buena medida, ya que los residuos tienen escala y esta suma cambia ante

    un simple de escala en los datos de la endgena.

    Adems, la SR como mnimo es nula, pero su valor mximo no est

    acotado. Si queremos una medida adimensional y acotada, se puede

    definir un ratio de sumas. La medida de ajuste ms conocida es el

    llamado coeficiente de determinacin o 2R del modelo definido como:

    2 1SE SR

    RST ST

    en donde se ha usado la propiedad de que la ST SR SE , por lo que la

    expresin dada se corresponde con una medida de bondad slo vlida si

    el modelo tiene trmino constante.

    El valor del 2R (multiplicado por 100) se interpreta como el porcentaje

    de la varianza de la endgena que queda explicada por el modelo.

    Adems, est acotado entre cero y uno. Si el 2 0R , el ajuste es nulo, ya

    que la 0SE . Si el 2 1R , el ajuste es perfecto, ya que la SE ST , o

    bien, la 0SR . Ajustes intermedios daran lugar a un 2 0.5R .

    Ejercicio para el estudiante: Probar que en un modelo como t ty ,

    el 2 0R .

  • 27

    El 2R es muy fcil de calcular y muy usado, pero hay que tener en

    cuenta que tiene problemas.

    Problemas del 2R . En primer lugar, puede ser engaoso mirar slo el 2R sin mirar los datos. Muchas veces, el 2R es muy alto en relaciones

    espreas. El ejemplo ms famoso en la literatura economtrica es la

    relacin entre el N de nacimientos en un ao en los EEUU y el N de

    cigueas en ese mismo ao y estados. La estimacin del modelo que

    explica el N de nacimientos en funcin del N de cigueas proporciona

    un 2R muy elevado y esto sabemos que es espreo. La razn es que en

    ese ao la correlacin muestral entre ambas variables fue muy alta y

    aunque no hay ninguna relacin causal entre ambas, el coeficiente de

    determinacin es bueno, pero engaoso.

    En relaciones donde tiene sentido relacionar determinadas variables

    (Consumo y Renta), el coeficiente de determinacin puede ser

    excesivamente alto si en el perodo muestral considerado ambas

    variables evolucionan de forma muy parecida o presentan una tendencia

    comn.

    Otro problema distinto del 2R convencional es que nunca empeora

    cuando en el modelo introducimos variables explicativas adicionales. Es

    decir, aunque una nueva variable no sea muy relevante, su

    incorporacin hace que, en el peor de los casos, el 2R no cambie, o bien,

    con un poco de suerte, aumente. Introducir un nuevo regresor en el

    modelo tiene dos efectos: (1) disminuyen los grados de libertad y ste es

    negativo y (2) disminuye la suma residual y ste es positivo. Si el peso

    del efecto negativo es mayor que la mejora en el ajuste, no compensar

    introducir esta nueva variable y a la inversa.

    La solucin a ste ltimo problema es utilizar el llamado 2R ajustado o

    corregido de grados de libertad ( 2R ) que se calcula como:

    2 211 (1 )n

    R Rn k

    En esta formulacin del 2R se tienen en cuenta dos efectos: (1) Si

    aumenta el nmero de regresores en el modelo, disminuyen los grados

    de libertad y esto se penaliza, es decir: 21n

    k n k Rn k

    y (2)

    Esos nuevos regresores pueden mejorar el modelo en trminos de ajuste,

    es decir: 2 2k SR R R . Si el efecto de penalizacin es menor

  • 28

    que el efecto de mejora en el ajuste, el 2R aumentar e indicar que

    compensa la introduccin de esas nuevas variables y a la inversa.

    Como ejemplo, supongamos que se han estimado dos funciones de

    consumo alternativas:

    2 ; 0.80t t tC a bY R

    2 ; 0.87t t t tC a bY ci R

    donde ti es un Tipo de inters. Ambos modelos estn anidados ya que se

    quiere explicar el Consumo en funcin de la Renta (en el primero) o

    bien, introducir un nuevo regresor (Tipo de inters) en el modelo ms

    sencillo. El hecho de que el 2R sea mayor en el modelo ms complicado

    indica que el Tipo de inters es una variable que compensa introducir

    (en trminos de ajuste) a pesar de que los grados de libertad hayan

    disminuido.

    Derivacin del 2R : Se obtiene a partir del 2R convencional

    2 /1 1/

    SR SR nR

    ST ST n

    donde dividiendo por n la Suma Residual y la Suma Total, esta medida

    se puede interpretar como un ratio de varianzas. Implantando la

    restriccin de que los estimadores de las varianzas residual y de la

    variable endgena sean insesgados, se obtiene el 2R corregido de los

    grados de libertad:

    2 2/ 11 1 (1 )/ 1

    SR n k nR R

    ST n n k

    Ejercicio para el estudiante: Calcular el 2R convencional y el corregido

    usando los datos del ejercicio numrico 1. Interpretar este coeficiente.

    Prctica con los datos de Anscombe y Eviews.

    En un conocido trabajo publicado por F.J. Anscombe en 1973 (Graphs in Statistical Analysis, The American Statistician, 27, pp.17-21), se ilustran algunos aspectos bsicos del anlisis de regresin lineal usando

    los datos simulados que figuran en la tabla siguiente (tambin en

    www.ucm.es/info/ecocuan/ectr1):

  • 29

    t 1ty 2ty 3ty 4ty 1tx 2tx

    1 8.04 9.14 7.46 6.58 10.00 8.00

    2 6.95 8.14 6.77 5.76 8.00 8.00

    3 7.58 8.74 12.74 7.71 13.00 8.00

    4 8.81 8.77 7.11 8.84 9.00 8.00

    5 8.33 9.26 7.81 8.47 11.00 8.00

    6 9.96 8.10 8.84 7.04 14.00 8.00

    7 7.24 6.13 6.08 5.25 6.00 8.00

    8 4.26 3.10 5.39 12.50 4.00 19.00

    9 10.84 9.13 8.15 5.56 12.00 8.00

    10 4.82 7.26 6.42 7.91 7.00 8.00

    11 5.68 4.74 5.73 6.89 5.00 8.00

    Dada esta informacin se pide:

    (1) Estimar por MCO las cuatro regresiones con trmino constante que se indican a continuacin:

    (a) 1 11 12 1 1t t ty x

    (b) 2 21 22 1 2t t ty x

    (c) 3 31 32 1 3t t ty x

    (d) 4 41 42 2 4t t ty x

    Usando Eviews, los resultados son:

    Modelo (a)

    Dependent Variable: Y1 Method: Least Squares Date: 11/06/03 Time: 17:03 Sample: 1 11 Included observations: 11

    Variable Coefficient Std. Error t-Statistic Prob.

    C 3.000091 1.124747 2.667348 0.0257 X1 0.500091 0.117906 4.241455 0.0022

    R-squared 0.666542 Mean dependent var 7.500909 Adjusted R-squared 0.629492 S.D. dependent var 2.031568 S.E. of regression 1.236603 Akaike info criterion 3.425579 Sum squared resid 13.76269 Schwarz criterion 3.497924 Log likelihood -16.84069 F-statistic 17.98994 Durbin-Watson stat 3.212290 Prob(F-statistic) 0.002170

  • 30

    Modelo (b)

    Dependent Variable: Y2 Method: Least Squares Date: 11/06/03 Time: 17:22 Sample: 1 11 Included observations: 11

    Variable Coefficient Std. Error t-Statistic Prob.

    C 3.000909 1.125302 2.666758 0.0258 X1 0.500000 0.117964 4.238590 0.0022

    R-squared 0.666242 Mean dependent var 7.500909 Adjusted R-squared 0.629158 S.D. dependent var 2.031657 S.E. of regression 1.237214 Akaike info criterion 3.426567 Sum squared resid 13.77629 Schwarz criterion 3.498912 Log likelihood -16.84612 F-statistic 17.96565 Durbin-Watson stat 2.187570 Prob(F-statistic) 0.002179

    Modelo (c)

    Dependent Variable: Y3 Method: Least Squares Date: 11/06/03 Time: 17:26 Sample: 1 11 Included observations: 11

    Variable Coefficient Std. Error t-Statistic Prob.

    C 3.002455 1.124481 2.670080 0.0256 X1 0.499727 0.117878 4.239372 0.0022

    R-squared 0.666324 Mean dependent var 7.500000 Adjusted R-squared 0.629249 S.D. dependent var 2.030424 S.E. of regression 1.236311 Akaike info criterion 3.425107 Sum squared resid 13.75619 Schwarz criterion 3.497452 Log likelihood -16.83809 F-statistic 17.97228 Durbin-Watson stat 2.143578 Prob(F-statistic) 0.002176

    Modelo (d)

    Dependent Variable: Y4 Method: Least Squares Date: 11/06/03 Time: 17:26 Sample: 1 11 Included observations: 11

    Variable Coefficient Std. Error t-Statistic Prob.

    C 3.001727 1.123921 2.670763 0.0256 X2 0.499909 0.117819 4.243028 0.0022

    R-squared 0.666707 Mean dependent var 7.500909 Adjusted R-squared 0.629675 S.D. dependent var 2.030579 S.E. of regression 1.235695 Akaike info criterion 3.424111 Sum squared resid 13.74249 Schwarz criterion 3.496455 Log likelihood -16.83261 F-statistic 18.00329 Durbin-Watson stat 1.662223 Prob(F-statistic) 0.002165

  • 31

    Obsrvese que en los cuatro modelos coinciden todos los resultados

    MCO: (1) La estimacin puntual de la constante y la pendiente, (2) la

    media y la desviacin tpica muestral de la variable dependiente, (3) el

    coeficiente de determinacin convencional y corregido, (4) la suma de

    cuadrados de residuos (5) la desviacin tpica residual y (6) las

    desviaciones tpicas de los parmetros estimados por MCO.

    A la vista de estos resultados, los cuatro modelos ajustan igual.

    Aproximadamente el 66.7% de las fluctuaciones de la endgena vienen

    explicadas por la variabilidad de la exgena. Sin embargo, los datos

    utilizados no son los mismos. Muchas veces, la representacin grfica

    de los datos nos ayuda a entender los resultados numricos de una

    simple estimacin lineal.

    (2) Represente grficamente la nube de puntos real junto con la recta ajustada en cada uno de los cuatro modelos

    considerados:

    4

    6

    8

    10

    12

    2 4 6 8 10 12 14 16

    X1

    Y1

    2

    4

    6

    8

    10

    2 4 6 8 10 12 14 16

    X1

    Y2

    4

    6

    8

    10

    12

    14

    2 4 6 8 10 12 14 16

    X1

    Y3

    4

    6

    8

    10

    12

    14

    5 10 15 20

    X2

    Y4

  • 32

    En el modelo (a) la relacin entre las variables es ms o menos

    lineal, luego la hiptesis de linealidad en los parmetros hace que el

    ajuste sea razonable.

    En el modelo (b) la relacin entre las variables es claramente no

    lineal y el ajuste podra mejorar claramente especificando el modelo de

    otras formas, como por ejemplo:

    2

    1 2 3t t t ty x x

    1 2 lnt t ty x

    En el modelo (c) todos los puntos de la nube real, exceptuando uno,

    se ajustan casi perfectamente en una recta que no es la estimada porque

    ese valor atpico (el tercer par de valores) hace que la recta de ajuste

    cambie de pendiente y el ajuste sea peor. En este caso, se aprende que la

    presencia de una o ms observaciones atpicas pueden alterar todos los

    resultados de la estimacin. Por tanto, el tratamiento de atpicos antes de

    estimar una relacin puede ser crucial.

    En el modelo (d) tenemos otro problema diferente en los datos. Los

    datos de la variable explicativa 2tx son todos igual a 8, exceptuando el

    octavo valor, que es igual a 19. De hecho, ste es el dato que hace que la

    recta de ajuste est anclada donde est. Si eliminramos el par de

    valores de la endgena y de la exgena para el instante t=8, no sera

    posible estimar por MCO el modelo, ya que seran perfectamente

    colineales la constante y la variable explicativa (la primera vale uno en

    toda la muestra y la segunda vale 8).

    Ejercicios para el estudiante usando EViews: (1) Con los datos

    usados en el modelo (b) reestime usando las especificaciones

    alternativas que se proponen. Compare los resultados. (2) Cmo

    cambian los resultados de la estimacin del modelo (c) si se elimina el

    tercer par de valores observados sobre 3ty y 1tx ?. (3) Qu propiedad

    tiene la matriz TX X si se elimina el octavo par de valores de 4ty y 2tx

    en la regresin (d)?

    ESTIMACIN DEL MLG POR MXIMA VEROSIMILITUD

    Es otro mtodo de estimacin del vector de parmetros en el

    MLG. Este criterio proporciona un valor de los parmetros que

    maximizan la probabilidad (o verosimilitud) de que con ese valor se

    generen las mismas observaciones de la variable Y que las observadas.

  • 33

    Es decir, maximiza la verosimilitud de que el modelo estimado

    proporcione los mismos datos de Y que los observados en la realidad.

    Es un criterio de estimacin que tiene propiedades tericas ms

    fuertes que el MCO. A cambio, requiere de una hiptesis adicional: la

    hiptesis de normalidad de las perturbaciones del modelo. De hecho,

    esta hiptesis se puede justificar por diversos motivos:

    (a) Sabemos que t representa la influencia combinada de un

    gran nmero de variables explicativas que no se incluyen

    explcitamente en la matriz X . Adems, se espera que la

    influencia de estas variables sea pequea y en el mejor de

    los casos, aleatoria. Gracias al Teorema Central del Lmite,

    se puede demostrar que si existe un nmero grande de

    variables aleatorias independientes e idnticamente

    distribuidas, la suma de todas ellas seguir una normal.

    (b) Una variante del Teorema Central del Lmite afirma que aunque el nmero de variables no sea muy grande o no

    sean estrictamente independientes, su suma puede seguir

    teniendo una distribucin normal.

    (c) Con el supuesto de normalidad, se pueden obtener fcilmente las distribuciones que siguen los estimadores

    MCO, puesto que una funcin lineal de una variable

    normal hereda la normalidad. Recordar que ( )MCO f .

    Esto es crucial para poder hacer inferencia estadstica

    acerca de .

    (d) La distribucin normal es una distribucin sencilla, caracterizada slo por dos parmetros (media y varianza).

    Sus propiedades tericas han sido ampliamente estudiadas.

    Derivacin de la funcin de verosimilitud del modelo:

    Si ( , )N , es decir, una normal multivariante con media y matriz

    de varianzas , la funcin de densidad es:

    1/ 2/ 2 11( ) (2 ) exp ( ) ( )2

    n Tf

    Dadas las hiptesis habituales sobre , sabemos que 0 y 2I y la

    funcin de densidad anterior es ms simple:

  • 34

    / 2 2 / 2

    2

    1( ) (2 ) exp

    2

    n n Tf

    Puesto que Y es una funcin de , conocemos la funcin de distribucin

    de Y , aplicando el resultado de que:

    ( ) ( )f Y fY

    donde el ltimo trmino es el valor absoluto del determinante del

    Jacobiano de la transformacin.

    Ejercicio para el estudiante: Comprobar que en el modelo Y X , el

    determinante del Jacobiano de la transformacin es uno y por tanto,

    ( ) ( )f Y f .

    Por tanto:

    / 2 2 / 2 2

    2

    1( ) ( ) (2 ) exp ( ) ( ) ( , )

    2

    n n Tf Y f Y X Y X L

    siendo la funcin de verosimilitud cuando depende de los parmetros

    y 2 , dada una muestra de Y y X . Esta es la funcin de densidad

    conjunta de Y y X , dados los valores de los parmetros y 2 .

    Obtener la expresin de los estimadores por mxima verosimilitud de

    y 2 , supone maximizar la funcin de verosimilitud, 2( , )L . Para que

    sea ms fcil y puesto que no cambia el ptimo se maximiza el

    logaritmo neperiano de la funcin de verosimilitud:

    2 2

    2

    1max ln ( , ) ln 2 ln ( ) ( )

    2 2 2

    Tn nL Y X Y X

    Condiciones de primer orden:

    2

    1

    2

    ln ( , ) 1 ( 2 2 ) 0 ( )2

    T T T T

    MV

    LX Y X X X X X Y

    2

    2

    2 2 4

    ln ( , ) ( ) ( ) 10

    2 2

    T T

    MV

    L n Y X Y X

    n

    Por tanto, el estimador MV de coincide con el MCO, pero no es as

    para el estimador de la varianza de las perturbaciones, 2 . En concreto,

  • 35

    sabemos que el estimador MV de la varianza de las perturbaciones no es

    insesgado, ya que para que lo sea es necesario ponderar la suma de

    cuadrados de residuos por los grados de libertad, n k .

    Ejercicio para el estudiante: Encontrar la expresin y el signo del sesgo

    del estimador MV de la varianza de las perturbaciones, es decir 2 2 2 ( ) ( )MV MVE sesgo .

    Ejercicio para el estudiante: Comprobar que estamos en un mximo. La

    matriz hessiana de segundas derivadas particularizada en el punto en el

    que se cumplen las condiciones de primer orden es definida negativa y

    tiene la expresin:

    2

    4

    0

    02

    TX X

    Hn

    Propiedades estadsticas del estimador MV: La cota de Cramer Rao

    proporciona la mnima varianza que puede alcanzar cualquier estimador

    insesgado de un vector de parmetros. Dicha cota viene dada por la

    inversa de la matriz de informacin ( I ), donde sta viene definida por la

    esperanza del hessiano cambiada de signo. Es decir:

    2

    2

    ln ( )LI E

    , siendo

    2

    Tomando las derivadas segundas a las condiciones de primer orden, se

    tiene que:

    2 2

    2 2

    ln ( , ) TL X X

    2 2

    2 4

    ln ( , ) [ ]

    ( )( )

    TL X X Y

    2 2

    2 2 4 6

    ln ( , ) [ ] [ ]

    ( )( ) 2

    TL n Y X Y X

    y formando el hessiano:

  • 36

    2 4

    4 6

    [ ]

    [ ] [ ]

    2

    T T

    T

    X X X X Y

    Hn Y X Y X

    La esperanza de los trminos del hessiano es igual a:

    2 2

    T TX X X XE

    4 4

    [ ]0

    T TX X Y XE E

    2

    4 6 4 6 4 6 4

    [ ] [ ] [ ]

    2 2 2 2

    T Tn Y X Y X n E n n nE

    Puesto que la matriz de informacin es diagonal por bloques, su inversa

    tambin y tiene la expresin:

    2 1

    14

    ( ) 0

    20

    TX X

    I

    n

    Esta matriz indica que la cota inferior para la varianza de un estimador

    insesgado de es 2 1( )TX X y la cota inferior para la varianza de un

    estimador insesgado de 2 es la expresin 42

    n

    .

    En el caso MCO y MV, el estimador de tiene una matriz de varianzas

    que alcanza la cota exactamente, luego es eficiente.

    En el caso MCO, el estimador de 2 tiene una varianza igual a 42

    n k

    (ver Apndice 2), que supera a la Cota de Cramer Rao. En este caso, no

    podemos hablar de eficiencia.

    En el caso MV, el estimador de 2 tiene una varianza igual a 42 ( )n k

    n n

    (ver Apndice 2), que es inferior a la Cota de Cramer Rao. No obstante,

    en este caso el estimador MV es sesgado. Lo que s es cierto es que no

    existe un estimador insesgado de 2 que alcance la cota.

  • 37

    Apndice 1: Teorema de Gauss-Markov.

    Este teorema demuestra que el estimador MCO de es el que tiene

    mnima varianza dentro de la familia de estimadores lineales e

    insesgados.

    La varianza del estimador MCO de tiene la expresin 2 1var( ) ( )TX X . La expresin del estimador MCO de es WY

    donde 1( )T TW X X X . Denotando por * CY , donde C W , tendr

    todos los estimadores de distintos al MCO y lineales. Para que

    adems, * sea insesgado, se tendr que cumplir que *( )E . Por

    tanto, la *( ) [ ( )]E E C X CX y habr que imponer que kCX I .

    La varianza del estimador de llamado * es:

    * * * 2 var( ) [( )( ) ] ( )T T T TE E C C CC

    Aunque todava no son comparables ambas matrices de varianzas y

    covarianzas, es posible siempre descomponer una matriz fija como la C

    en la suma de otras dos: C W D , donde 0D y postmultiplicando por

    la matriz X esa identidad, tenemos que CX WX DX . Como kCX I ,

    por insesgadez y kWX I , por definicin, es obvio que 0DX . Por

    tanto:

    * 2 2 2 2 2 2var( ) ( )( )T T T T T TCC W D W D WW DD DW WD

    teniendo en cuenta que 1( )T TWW X X y 0T TDW WD , se obtiene :

    * 2 1 2 * 2 var( ) ( ) var( ) var( )T T TX X DD DD

    y la matriz 2 TDD es definida positiva por construccin.

    Apndice 2. Distribuciones de los estimadores MCO y MV de y de 2 .

    A partir de la hiptesis de normalidad de las perturbaciones es fcil

    obtener las distribuciones de los estimadores MCO y MV.

  • 38

    Distribucin del estimador de por MCO y MV: En ambos

    criterios la frmula del estimador coincide y al poder escribir el

    estimador como una funcin lineal de las perturbaciones, 1 ( )T TX X X , la normalidad se hereda. Por tanto:

    2 1 [ , ( ) ]TN X X

    Distribucin del estimador de 2 por MCO y MV: Para obtener esta

    distribucin es necesario el uso de un resultado estadstico preliminar:

    Resultado: La distribucin de la forma cuadrtica 22

    T

    q

    Q

    si se

    cumplen las siguientes condiciones:

    (1) El vector 2(0, )N I

    (2) La matriz Q es idempotente y su ( )tra Q q .

    A partir de este resultado podemos derivar inmediatamente la

    distribucin del estimador de 2 por MCO:

    2

    2 2 2

    2 2

    T T

    MCO MCO n k

    M n k

    n k n k

    ya que la ( )tra M n k . Es habitual escribir esta distribucin como:

    2

    2 2MCO n k

    n k

    Los dos primeros momentos de esta distribucin son:

    2 2

    2 2 2( ) ( )MCO n kE E n kn k n k

    4 4 4

    2 2

    2 2

    2var( ) var( ) 2( )

    ( ) ( )MCO n k n k

    n k n k n k

    Ejercicio para el estudiante: Derivar la distribucin y los momentos

    (esperanza y varianza) del estimador MV de 2 .