cedeac-3_1.pdf

7/26/2019 CEDEAC-3_1.pdf

1/101

E E

Centro de Estudiossobre Desarrollo EconmicoFacultad de EconomaUniversidad de los Andes

2006

3

APUNTES DE CLASE CEDE ISSN1909-4442

OCTUBRE DE

INTRODUCCINA LA ECONOMETRA

Ramn Antonio Rosales lvarezJorge Alexander Bonilla Londoo

7/26/2019 CEDEAC-3_1.pdf

2/101

CEDE

E E

APUNTES DE CLASE

2006

3

ISSN1909-4442

INTRODUCCINA LA ECONOMETRA

Ramn Antonio Rosales lvarezJorge Alexander Bonilla Londoo

OCTUBRE DE

7/26/2019 CEDEAC-3_1.pdf

3/101

7/26/2019 CEDEAC-3_1.pdf

4/101

INTRODUCCIN A LA ECONOMETRA*

RAMN ANTONIO ROSALES LVAREZ**

JORGE ALEXANDER BONILLA LONDOO

***

Resumen

La econometra es una de las importantes aplicaciones de estadstica matemtica, y una herramienta fundamental en investigacin econmica, el diseo y anlisis de poltica. El presendocumento desarrolla para aquellos que inician el estudio de

economa, los elementos tericos bsicos sobre la modelacieconomtrica. Se aborda el modelo clsico de regresin lineal y ssupuestos, y la manera de efectuar hiptesis. Este documento considera un desarrollo preliminar para la posterior iniciacin temas ms avanzados de econometra.

Palabras claves: anlisis de correlacin, mnimos cuadradordinarios, modelo economtrico, pruebas de hiptesis.

Clasificacin JEL: C01, C10 y C20.

7/26/2019 CEDEAC-3_1.pdf

5/101

INTRODUCTION TO ECONOMETRICS

Abstract

Econometrics is one of the most important applications tomathematical statistics and a fundamental tool in the economic resand in the design and analysis of economic policy. The pdocument develops the basic theory concepts of the economodeling for those that begin the study of economics. The specificassumptions, estimation, hypothesis testing and predictions fo

classical regression model are the principal topics presented in thisThe concepts, the tools and their applications developed indocument are relevant for tackling many practical problems in toworld and for the introduction in advanced econometric courses.

Key words: correlation analysis, least squares estimation, econommodel, hypothesis tests.

JEL classification: C01, C10 y C20

7/26/2019 CEDEAC-3_1.pdf

6/101

TABLA DE CONTENIDO1.LAMODELACINYLAECONOMETRA ......................................................................

1.1. Mtodos Cuantitativos de la Economa. .......... ........... .......... ........... .......... .......... ...1.2. Definiciones de la Econometra....... ........... .......... ........... ........... .......... ........... .......1.3. Objetivo de la Econometra...................................................................................1.4. El Procedimiento Economtrico........... .......... ........... .......... ........... .......... ........... ...1.5. El Modelo .......... ........... ........... .......... ........... ........... .......... ........... ........... ........... ....1.6. El Modelo Econmico ........... .......... ........... .......... ........... .......... ........... .......... ........

1.7. El Modelo Economtrico .......... ........... .......... ........... .......... ........... .......... ........... ....1.8. Elementos que componen el Modelo .............. .......... ........... .......... ........... .......... ....1.9. Clasificacin de las Variables................................................................................1.10. Clasificacin de las Ecuaciones............................................................................1.11. Clasificacin de los Modelos..................................................................................

2.ORGANIZACINDEDATOSYESTADSTICADESCRIPTIVA ...................................2.1. Objetivos de la Estadstica...... ........... .......... ........... ........... .......... ........... .......... ...........

2.2. Divisiones de la Estadstica..........................................................................................

2.4. Poblacin y Muestra .....................................................................................................

2.5. Parmetros Poblacionales y Estadsticos Muestrales ........... ........... .......... ........... ........

2.6. Medidas de Tendencia Central y de Dispersin ........... .......... ........... ........... .......... .......

2.7. Mtodos y Diagnsticos Grficos. .......... .......... .......... .......... ........... .......... .......... ..........

2.8 Ejercicios de computador ..............................................................................................

3.ANALISISDECORRELACION .........................................................................................3.1. Diagrama de Dispersin................................................................................................

3.2. Coeficiente de Correlacin Lineal.................................................................................

3.3. Pruebas de Hiptesis ....................................................................................................

3.4. Ejercicios de computador .............................................................................................

4.REGRESIONSIMPLELINEALYNOLINEAL.................................................................4.1. Objetivo del anlisis de regresin ................................................................................4.2. Funcin de regresin muestral y poblacional ...............................................................

4.3. Supuestos del modelo de regresin................................................................................

4.4. Mtodo de estimacin de mnimos cuadrados ordinarios.............................................

4.5. Varianzas y errores estndar de los estimadores .......... ........... .......... .......... .......... .......

4.6. Intervalos de confianza.................................................................................................

4.7. Pruebas de hiptesis .....................................................................................................

4.8. Prediccin.....................................................................................................................

4.9. El Coeficiente de Determinacin..................................................................................

4.10. Modelos de regresin simple no lineal en las variables .......... .......... ........... .......... .....4.11. Ejercicios de Computador ...........................................................................................

5.REGRESIONMULTIPLELINEALYNOLINEAL ...........................................................5.1. Expresin del modelo en forma matricial......................................................................

5.2. Supuestos del modelo....................................................................................................

5.3. Mtodo de estimacin de mnimos cuadrados ordinarios.............................................

5.4. Matriz de varianzas y covarianzas de los estimadores .......... ........... .......... .......... .........

7/26/2019 CEDEAC-3_1.pdf

7/101

6.2. Heteroscedasticidad........................................................................................................

6.3. Autocorrelacin ............................................................................................................

6.4. Error de especificacin..................................................................................................

6.5. No Normalidad de los errores .......................................................................................

6.6. Ejercicios de computador. ............................................................................................

7.INTRODUCCINAVARIABLESCUALITATIVAS .......................................................7.1. Regresin con variables independientes cualitativas ...................................................

7.2. Regresin con variable dependiente cualitativa ......... ........... ........... .......... ........... ........

7/26/2019 CEDEAC-3_1.pdf

8/101

INTRODUCCIN

El curso de Econometra hace parte del rea de mtodos cuantitativos eny se constituye en una herramienta importante en la investigacin eco

diseo y anlisis de poltica. El contenido y el desarrollo del curso s

introductorio y su inters es la aplicacin de los conceptos tericos. El c

proporcionarle al estudiante las bases iniciales para el manejo de los

modelos economtricos, los elementos necesarios para el manejo de la inanlisis de resultados e interpretacin de las salidas del computador, y fa

en sus aplicaciones, tales como la investigacin y la evaluacin de m

poltica.

El documento se encuentra dividido en siete secciones. La primera p

definicin de la econometra, sus objetivos, el concepto del mo

caracterizacin. La segunda trata de la organizacin de datos y la

descriptiva. La seccin tres aborda los aspectos bsicos del a

correlacin. La seccin cuatro presenta el modelo formal de regre

simple. La quinta seccin muestra el modelo de regresin lineal mltiple

seccin presenta la teora relacionada con el incumplimiento de los supmodelo. La seccin siete efecta una introduccin al anlisis tran

regresin con variables independientes cualitativas y de variable d

cualitativa. Al final del documento se incluye un anexo que de

procedimiento general de manipulacin de datos en el paquete ec

Eviews 4.1.

1. LA MODELACIN Y LA ECONOMETRA

1 1 Mtodos Cuantitativos de la Economa

7/26/2019 CEDEAC-3_1.pdf

9/101

La investigacin economtrica se inici con el anlisis estadstico de la

por Cournout (1838) y Marshall (1890). Posteriormente Tinbergen en 19

aporte a la econometra mediante el estudio del anlisis de los ciclos ec

Sin embargo, en el periodo de 1943-1950 la econometra comienza su

con los trabajos de la Comisin Cowles. La hiptesis bsica es:

econmicos se generan por sistemas de relaciones que son, e

estocsticos, dinmicos y simultneos".

La econometra hoy en da es una herramienta muy importante para e

comportamiento de los fenmenos econmicos. Su desarrollo ha sido

debido a la dinmica que han mostrado los adelantos en el anlisis m

en mtodos estadsticos y de computacin.

1.2. Definiciones de la Econometra

Dado que en la econometra se asocian la Teora Econmica, las Matem

Estadstica, diferentes definiciones han sido planteadas por los autores,

se tratan de relacionar estas tres reas del conocimiento.

G. Tintner: la econometra consiste en la aplicacin de la teora

matemtica y de los mtodos estadsticos a los datos econmicos para

resultados numricos y verificar los teoremas.

W.C. Hood y T.C. Koopmans: la econometra es una rama de la econo

la teora econmica y los mtodos estadsticos se fusionan en el an

datos numricos e institucionales.

7/26/2019 CEDEAC-3_1.pdf

10/101

Estas tres definiciones nos indican que la econometra es cuantitativa

en estrecho contacto con la realidad.

R. Frisch: la econometra a pesar de nutrirse de la Teora Econm

Matemticas y de la Teora Estadstica, no es ni "Estadstica Econ

"Teora Econmica", ni "Economa Matemtica".

O. Lange: la econometra es la ciencia que trata de la determinacin, po

estadsticos, de leyes cuantitativas concretas que rigen la vida econ

combina la Teora Econmica con la Estadstica Econmica y trata d

mtodos matemticos y de inferencia, una expresin concreta a

generales establecidas por la teora.

1.3. Objetivo de la Econometra

El objetivo de la econometra es expresar la teora econmica e

matemticos, verificar dicha teora por mtodos estadsticos, medir el

una variable sobre otra, predecir los sucesos futuros, o proveer recomede la poltica econmica.

1.4. El Procedimiento Economtrico

El anlisis economtrico involucra las siguientes etapas principales:

1. Especificacin del modelo: consiste en usar la teora, leyes

particulares econmicas, para investigar las relaciones entre

agentes de la economa.

7/26/2019 CEDEAC-3_1.pdf

11/101

verificacin tiene un papel muy importante dado que examina si la

cuantificada puede utilizarse adecuadamente con base en

econmica.

4. Prediccin: el modelo obtenido puede ser utilizado para la pred

desarrollo de muchas aplicaciones. Pueden surgir nuevos

tericos, y generarse implicaciones de poltica econmica a pa

conclusiones del modelo.

1.5. El Modelo

Un modelo es una representacin simplificada de la realidad. Los inves

los profesionales de diversas reas del conocimiento trabajan

esquemas, los cuales les permiten estudiar el comportamiento de un fen

inters.

A. Rosenblueth se refiri a los modelos cientficos de la siguiente m

construccin de modelos para los fenmenos naturales es una de

esenciales de la labor cientfica. Mas an, se puede decir que toda la

es sino la elaboracin de un modelo de la naturaleza. La intencin de el resultado de la investigacin cientfica, es obtener conocimiento y el

alguna parte del Universo".

1.6. El Modelo Econmico

Se denomina modelo econmico a cualquier conjunto de supuestos queuna economa o parte de una economa. En este sentido, la teora econm

entenderse como la formulacin y anlisis de modelos cuantitat

esquematizacin requiere un planteamiento particular de las interrelacione

7/26/2019 CEDEAC-3_1.pdf

12/101

2. Que la representacin sea simplificada, y

3. Que se haga en forma matemtica.

Al definir un modelo econmico como un conjunto de relaciones m

(usualmente ecuaciones) que expresan una teora econmica, no

necesariamente la especificacin concreta del tipo de funcin que re

variables involucradas. Un ejemplo de un modelo econmico es:

( )kXXXfY ,,, 21 K= (1)

donde Y = cantidad producida; Xi= cantidad del i-esimo insumo, i=1,2,,k

Aunque esta ecuacin, denominada funcin de produccin, no pre

estructura muy particular del arreglo de las variables X sobre Y, expres

general la relacin entre el producto y los insumos, y que son las

utilizadas de factores las que determinan la magnitud producida, y no lo co

Para establecer una forma concreta de la especificacin de un modeprecisar el tipo de relacin que existe entre las variables econmicas. Un

ello es una representacin lineal:

kkXXXY ++++= L22110 (2)

Est relacin puede ser correcta. Sin embargo, cuando no se conoce si e

es determinante en forma lineal sobre Y, puede ocurrir error de esp

Tambin se debe resaltar que este modelo hace nfasis en un nmero re

7/26/2019 CEDEAC-3_1.pdf

13/101

1.7. El Modelo Economtrico

El modelo economtrico es el modelo econmico que contiene las espec

necesarias para su validacin emprica. Es usual concebir el modelo ec

como un modelo conformado por una parte determinstica y una parte

trmino de error. El modelo economtrico para el ejemplo expuesto en

(2) tomara la forma:

+++++= kkXXXY L22110 (3)

donde kkXXX ++++ L22110 es la parte determinstica y es el

error o componente estocstico.

Los modelos economtricos por considerar un trmino aleatorio en su

hacen parte de los modelos probabilsticos. Una diferencia fundamenta

modelos econmicos y los modelos economtricos, es que los primeros s

validos, dado que han sido establecidos por la teora econmica y solo p

expresin general de ella. Por otro lado, los modelos economtricos

estado de las cosas o de una situacin especfica y aunque tiene sus b

teora econmica sus resultados pueden cambiar de un estudio a otro.

Los modelos economtricos se prueban a travs del uso sistem

informacin estadstica. Un modelo economtrico permite la inferencia epartir de los datos recopilados, por lo cual ste debe incorporar los

aleatorios que se suponen intervienen en la determinacin de las obs

Estas ltimas pueden constituyen una muestra si la aleatoriedad de lo

7/26/2019 CEDEAC-3_1.pdf

14/101

7/26/2019 CEDEAC-3_1.pdf

15/101

d) Forma funcional: un investigador puede postular que la relacin

variables de un modelo es de tipo lineal; no obstante, otro investiga

formular una especificacin funcional distinta, por ejemplo cuadrtic

otra fuente de error en la elaboracin del modelo, pues no se puede

certeza sobre su forma funcional an cuando la teora seale algunas

para corregirlo.

De acuerdo con lo anterior un procedimiento sugerido para llevar

formulacin de un modelo economtrico es el siguiente: 1) Delimitar el fe

estudio; 2) Tener claridad sobre el objetivo del modelo; 3) Seleccionar la

relevantes; 4) Establecer las relaciones entre las variables, y 5) Con

objetivo planteado, estructurar una especificacin y estimar el modeloinformacin y base de datos de las variables.

1.8. Elementos que componen el Modelo

Los elementos que componen el modelo son: las variables, las ecuac

parmetros.

Una variable es una caracterstica de una poblacin que puede tomar

valores. Solo son de inters aquellos valores de la variable que tienen un

econmico. Por ejemplo las variables: precio, produccin, ingreso, y c

insumo utilizado tienen regin econmicamente factible en los nmepositivos.

Una ecuacin es una igualdad conformada por una expresin matem

7/26/2019 CEDEAC-3_1.pdf

16/101

miden el efecto de las fluctuaciones de estas variables sobre la variable de

Los parmetros cumplen un papel muy importante en el modelo, ya que s

el investigador formula pruebas de hiptesis. Al observar la ecuac

coeficiente que no acompaa ninguna variable independiente se le co

constante paramtrica o intercepto; en algunos casos su magnitud

interpretacin econmica.

1.9. Clasificacin de las Variables

Desde el punto de vista econmico las variables se pueden clasificar com

endgenas y exgenas. Las variables endgenas son aquellas cuyos

determinan o calculan dentro del modelo. En contraste, las variables ex

caracterizan por que sus valores estn determinados fuera del modelo.

Tambin existen otras clasificaciones de las variables; desde el e

inferencia estadstica: variables aleatorias discretas y continuas, y de acue

rol en expresin matemtica: variables dependientes e independientes, e

explicativas. Otro grupo de variables lo constituyen las variables predeter

este pertenecen las variables exgenas con o sin rezago (o retardo) y las rezagadas. Una denominacin adicional son las variables espera

expectativas, las cuales son gran utilidad en la formulacin de modelos din

1.10. Clasificacin de las Ecuaciones

Bajo la perspectiva econmica las ecuaciones se pueden clasificar de l

forma:

7/26/2019 CEDEAC-3_1.pdf

17/101

hacen a los modelos. Ejemplos de ecuaciones de comportamie

demanda, la oferta, la inversin, el consumo, el ahorro, etc.

b) Ecuaciones tecnolgicas: El ejemplo tpico de una ecuacin tecno

funcin de produccin, la cual refleja el estado de la tecnologa de

de un pas.

c) Ecuaciones institucionales: Reflejan un mandato o voluntad del go

los estamentos que toman las decisiones en un pas. Ejemplo de

institucionales son: oferta monetaria, impuestos, subsidios, etc.

d) Ecuaciones de definicin: Son ecuaciones o identidades mate

econmicas vlidas por definicin. Generalmente son relaciones conmayora de los ejemplos de este tipo de ecuaciones se encuent

cuentas macroeconmicas. Una ecuacin de definicin es activo

capital, o la ecuacin de identidad macroeconmica del Producto Nac

para una economa con tres sectores.

e) Ecuaciones de equilibrio: Estas garantizan que el modelo tenga

Ejemplos de estas ecuaciones son: oferta igual a demanda, o aho

inversin.

1.11. Clasificacin de los Modelos

Segn la cobertura econmica o subdisciplina, los modelos p

microeconmicos o macroeconmicos. De acuerdo con el nmero d

independientes, los modelos se dividen en simples y mltiples. Si se c

7/26/2019 CEDEAC-3_1.pdf

18/101

2. ORGANIZACIN DE DATOS Y ESTADSTICA DESCRIPTIVA

2.1. Objetivos de la Estadstica

La estadstica es el lenguaje universal de la ciencia, tanto en sus ramas f

sociales. La estadstica es un instrumento formal que utilizado de maneracon precisin, permite describir resultados y adoptar decisiones respec

estos evidencian empricamente. La estadstica en su aplicacin sigue

cientfico y se define como la ciencia de recolectar, clasificar, describir e

datos numricos, es el lenguaje universal de la ciencia y el estudio de los

aleatorios. Dentro de sus objetivos fundamentales se encuentra la estimaco ms caractersticas desconocidas de una poblacin, la realizacin de in

pruebas de hiptesis.

Se considera fundador de la estadstica a Godofredo Achenwall, econom

(1719-1772), quien siendo profesor de la universidad de Leipzig, escrib

descubrimiento de una nueva ciencia que llam estadstica (palabra d

Staat que significa gobierno) y que defini como el conocimiento prof

situacin respectiva y comparativa de cada estado. Desde su a

estadstica se ha enriquecido continuamente con los aportes de m

filsofos y cientficos.

La teora general de la estadstica es aplicable a cualquier campo cientf

se toman observaciones. El estudio y aplicacin de los mtodos estad

necesarios en todos los campos del saber sean estos de nivel tcnico o

7/26/2019 CEDEAC-3_1.pdf

19/101

2.2. Divisiones de la Estadstica

La estadstica puede dividirse ampliamente en dos reas: estadstica d

deductiva y estadstica inferencial o inductiva. La estadstica descriptiva

en la que la mayora de la personas piensan cuando escuchan

"estadstica". Esta es el rea de la estadstica dedicada a la r

presentacin, y descripcin de datos numricos, cuyas conclusionesmismos no van ms all de la informacin que estos proporcionan. Por o

inferencia estadstica es el mtodo y conjunto de tcnicas que se u

obtener conclusiones ms all de los lmites del conocimiento aportado po

en otras palabras, busca obtener la informacin que describe y carac

poblacin a partir de los datos de una muestra.

2.3. Tipos de Variables

En estadstica cuando se recopila informacin, los datos se registran por

observacin o medicin de una variable aleatoria que proviene de la rea

un experimento. La variable se llama aleatoria, debido a la existencia

resultados posibles del experimento y que no hay certeza total de que a

uno de los resultados se obtenga siempre con una probabilidad del 10

tanto, el hecho que una variable tome un valor particular es considerado

aleatorio.

An, cuando las observaciones resultantes no siempre son numricas

experimentos, estas pueden cuantificarse asignndoles nmeros que

representen una categorizacin. Por esta razn, el inters se centra ge

7/26/2019 CEDEAC-3_1.pdf

20/101

infinito) y pueden arreglarse en una secuencia que corresponde uno a u

enteros positivos; mientras las segundas toman valores dentro de un i

recta de los nmeros reales. Si se tienen dos variables aleatorias, por

nmero de hijos por familia y el consumo de energa elctrica; la p

encuentra dentro del grupo de variables aleatorias discretas, y la segunda

conjunto de variables aleatorias continuas.

2.4. Poblacin y Muestra

El concepto de poblacin y muestra es muy importante en la inferencia

por lo que es conveniente presentar su definicin:

Poblacin: Es la coleccin completa de individuos, objetos o mtienen una caracterstica en comn. La poblacin debe

cuidadosamente en cada estudio cientfico de acuerdo con e

objetivo de la investigacin.

Muestra: Es un subconjunto de la poblacin; es decir, ella se c

algunos de los individuos, objetos o medidas de una poblacin.

es obtenida con el propsito de investigar, a partir del conocimie

caractersticas particulares, las propiedades de toda la poblacin.

primordial la seleccin de una muestra representativa de la po

necesario formalmente enfatizar en la aleatoriedad de la muestr

sobre la manera de seleccionar los elementos de la pob

conformarn la muestra. La palabra aleatoriedad para este caso

garantizar que cada elemento de la poblacin tenga la misma prob

ser elegido Se considera que una muestra es ms eficien

7/26/2019 CEDEAC-3_1.pdf

21/101

Bogot. Para este caso, la poblacin corresponde a todos los hogares de

mientras que la muestra estar constituida por aquellos hogares que p

seleccionados de manera aleatoria, como un grupo representativo de tod

habitan en Bogot.

2.5. Parmetros Poblacionales y Estadsticos Muestrales

El trmino parmetro es utilizado para referirse a una caracterstica descla poblacin, que desea estimarse o evaluarse a travs de una prueba de

que describe total o parcialmente su funcin de probabilidad o funcin d

de probabilidad. Por otro lado, el estadstico es una medida numr

caracterstica poblacional obtenida a partir de una muestra. Cabe ano

estadsticos son fundamentales en la realizacin de inferencias. El valor la varianza son ejemplos de tales medidas.

2.6. Medidas de Tendencia Central y de Dispersin

Las medidas de tendencia central se encuentran dentro de las medidas

que se emplean comnmente para describir conjuntos de datos. La tendede un conjunto de datos es la disposicin de stos para agruparse, ya se

del centro o de ciertos valores numricos. A este grupo de medidas pe

media, la mediana y la moda.

Existen otro tipo de medidas numricas denominadas medidas de dispeobjetivo es explorar la variabilidad de los datos, es decir qu tan dispers

observaciones en un conjunto de datos. Dentro de estas medidas se enc

varianza, la desviacin estndar, el recorrido o rango, entre otras.

7/26/2019 CEDEAC-3_1.pdf

22/101

luego, segn el inters del investigador presentarlos agrupados, en form

o intervalos. Es importante tener en cuenta que las fuentes de informacin

secundaria pueden almacenar sus datos sin agrupar o como datos a

Con base en lo anterior, es relevante conocer el procedimiento de clc

medidas numricas para ambos casos. Las expresiones algebraicas que

la forma de obtener las medidas de tendencia central y de dispersin se m

la Tabla No. 1.

Con los datos agrupados de una variable aleatoria es posible construir h

de frecuencias, los cuales pueden ser comparados con las representacion

de distribuciones de probabilidad ya conocidas de variables aleatorias. En

de los casos, estos histogramas se comparan con la distribucin normal,

inspeccin es posible identificar sesgos o apuntamientos en la distribucin

7/26/2019 CEDEAC-3_1.pdf

23/101

TABLA No. 1. MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN

Medida Numrica Datos sin agrupar Datos agrupados

Media=

=

n

i

i

nx

x1

=

=

k

i

ii

nxf

x1

, donde=

=

k

i

n

Donde fi es la frecuencia absolutaclase i, para todo i = 1,2,,k claintervalos.

Mediana

Valor central de ladistribucin (el 50% de losdatos se encuentran porencima de este valor).

)( mfjcLMediana +=

DondeL es el lmite inferior de ladonde se encuentra la mediana, fmfrecuencia de esa clase, ces la londe ese intervalo y j es el nmeobservaciones en esta clase nece

para completar un total de n/2.

ModaValor ms frecuente

Casos: Punto medio de la clase

frecuencia ms alta. El promedio de los p

medios de las consecutivas con frecueiguales ms altas.

Puntos medios de las clasconsecutivas con frecueiguales ms altas.

Medida Numrica Datos sin agrupar Datos agrupados

Varianza)()( 12

1

2

=

nxxsn

i

i

1

2

1

1

2

2

=

==

n

n

x

x

s

n

i

in

i

i

1

2

12

12

=

=

=

n

n

xf

xf

s

k

i

ii

i

k

i

i

Desviacin Estndar)1()( 2

1

2 == =

nxxssn

i

i

2

n 1

12

12

==

==

n

n

xf

xf

ss

k

i

i

i

k

i

i

7/26/2019 CEDEAC-3_1.pdf

24/101

2.8 Ejercicios de computador

Considrese el siguiente conjunto de datos hipotticos de un estudio de

TABLA No. 2. DATOS HIPOTTICOS EN EL ESTUDIO DE DEMANDA DEL B

No. deObs.

DX PX PZ PW I

1 37 7 5 7 62 38 6 7 5 8

3 18 10 3 13 34 50 4 9 4 185 22 9 3 11 3

6 55 2 12 3 217 42 8 5 8 28 29 8 5 9 199 63 2 18 3 2010 13 12 2 15 611 60 3 9 5 12

12 62 3 10 5 513 36 6 5 6 26

Donde:DX: es la demanda del bien XPX: es el precio del bien XPZ: es el precio del bien Z

PW: es el precio del bien WI: es el ingresoESTADSTICAS DESCRIPTIVAS

MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSION Y NORMALIDA

DX PX PZ PW Mean 40.38462 6.153846 7.153846 7.230769 11Median 38.00000 6.000000 5.000000 6.000000 8.Maximum 63.00000 12.00000 18.00000 15.00000 26Minimum 13.00000 2.000000 2.000000 3.000000 2.Std. Dev. 16.89940 3.210560 4.431820 3.811252 8.Sum 525.0000 80.00000 93.00000 94.00000 14Observations 13 13 13 13

7/26/2019 CEDEAC-3_1.pdf

25/101

3. ANALISIS DE CORRELACION

3.1. Diagrama de Dispersin

Una primera aproximacin con el fin de detectar algn tipo de relacin

variables (X y Y), consiste en ubicar los pares de valores de en un plano

hasta conformar la nube de puntos. Un diagrama de dispersin es la rep

grfica de todos los pares de valores en sistema de ejes de coordenadas.

El diagrama de dispersin no es un mtodo estadstico como tal, ms b

dentro de los llamados mtodos de "inspeccin preliminar", sin embar

manera simple de visualizar si existe alguna posible relacin entre las v

diagrama de dispersin puede presentar diferentes formas, tales como

presentan en las figuras siguientes:

7/26/2019 CEDEAC-3_1.pdf

26/101

la figura b) seala una relacin lineal de tipo inversa. Las figura c) y d

posibles relaciones cuadrticas entre las variables, exhibiendo un m

mnimo para la primera y segunda de estas figuras, respectivamente. L

mostrara una tendencia de tipo cbico entre las variables. La figura f) es

en el cul no puede identificarse por inspeccin algn tipo de relaci

variables, pues aparentemente ella no existe.

3.2. Coeficiente de Correlacin Lineal

Si bien es cierto que el diagrama de dispersin permite visualizar la exis

de una posible relacin lineal entre las variables, el investigador debe so

conclusiones en trminos de alguna medida estadstica. El coeficiente de

lineal es un estadstico que mide el tipo de relacin (signo) y la fuerza (m

coeficiente) de asociacin lineal entre dos variables. Usualmente el coe

correlacin lineal, representado por la letra r, bajo las condiciones de u

aleatorio ideal se considera una buena representacin del coeficiente de

poblacional (). La frmula para calcular r es la siguiente:

( )

YX

XYSS

YXCovr

,^

=

( )( )

( ) ( )

=

22yyxx

yyxxr

ii

ii

XY

( )( )

( ) ( )

( )

( )[ ] [

=

=

2222

2

2

2 yxnx

yxnyx

n

yy

n

xx

nyxyx

r

ii

ii

i

i

i

i

ii

ii

XY

7/26/2019 CEDEAC-3_1.pdf

27/101

covarianza, la cual mide la asociacin lineal absoluta entre las va

denominador es siempre positivo dado que en l se encuentran

cuadrados.

Si r tiende a 1 como seria el caso de la figura a) estara indicando una re

positiva o directa entre las variables. Si r tiende a -1, existira una rel

negativa o inversa entre las variables. Cuando r es exactamente igual

relacin lineal es perfecta, siendo posible ajustar todos los puntos a travlnea recta con pendiente positiva (ver figura g) o negativa (ver

respectivamente. Si r es cero no hay relacin lineal entre las variables

horizontal une todos los pares de valores localizados en el diagrama de

(ver figura i).

La ventaja principal del coeficiente de correlacin lineal es su fcil

interpretacin. Sin embargo, cuando las variables presentan algn tipo de lineal, r no puede medir esta clase de asociacin. As mimo, dado que

dependencia lineal solo entre pares de variables, no proporciona informa

la asociacin simultnea de ms de dos variables.

7/26/2019 CEDEAC-3_1.pdf

28/101

1. r es de naturaleza simtrica. Esto indica que el coeficiente de

entre X y Y es igual al coeficiente de correlacin entre Y y X.

2. r es independiente del origen y la escala. Si se define X*i= aXi+ c

+ d, donde a>0, b>0, y c y d son constantes, entonces r en

(variables transformadas) es igual al r entre X y Y (variables origina

3. Si X y Y son variables estadsticamente independientes, el coecorrelacin lineal entre X y Y es cero. No obstante, si r es ce

implica necesariamente que X y Y sean estadsticamente independ

Una de las condiciones para que el coeficiente de correlacin se pueda

que las variables sean continuas y con distribucin normal. En caso de qse cumpla como es el caso de variables discretas se debe buscar o

estadstica para evaluar la dependencia entre las variables. Una alternativ

son las tablas de contingencia.

3.3. Pruebas de Hiptesis

La formalidad estadstica sugiere realizar pruebas de hiptesis sobre los

poblacionales basndose en los estadsticos encontrados. Por ejemplo, a

el coeficiente de correlacin lineal estimado entre dos variables sea d

cero, esto no es suficiente para afirmar que el parmetro poblaciona

realidad distinto de cero, pues requiere recordarse que las inferencias s

con base en informacin muestral y existe un margen de error cuando se

tipo de procedimiento. A continuacin se presenta el esquema de

hiptesis para el coeficiente de correlacin lineal cuando el investiga

7/26/2019 CEDEAC-3_1.pdf

29/101

Paso 1: Planteamiento de la hiptesis:

Ho: 0

Ha: 0

Paso 2: Nivel de significancia. Representa el nivel de error mxim

para realizar la prueba. Este es establecido o defin

investigador y se denota con la letra . Los valores de s

con los cuales se trabajan pueden cambiar de una disciplina

otra. Bajo situaciones donde los experimentos tienen una al

control, usualmente se trabaja con niveles del 1% y 5%,

significativo y significativo, respectivamente). En las investig

las ciencias sociales, donde existe un limitado grado de co

las variables, pueden encontrarse significancias estadsticas

en algunas ocasiones hasta un 20%.

Paso 3: El estadstico de prueba. Es una medida estadstica calcul

de informacin muestral o experimental para llevar a caboPara el caso de correlacin lineal simple, el estadstico de

define como:

222

1

2

= nC t

r

nrt ,.~

donde r es el coeficiente de correlacin lineal muestral, n es

de la muestra, n-2 los grados de libertad de la prueba y

7/26/2019 CEDEAC-3_1.pdf

30/101

Paso 4: Regiones de decisin. Dado que la hiptesis alterna

smbolo , se trabaja con los dos lados de la distribucin

de rechazo estar repartida en los extremos de la f

probabilidad, con un valor de 2 a cada lado. Los valo

lmites derecho e izquierdo que limitan las regiones de

determinan mediante el uso de la tabla t con sus respecti

de libertad. Estos valores de t se denominan estad

contraste. La figura j muestra la regin de rechazo

aceptacin (AHo) de la hiptesis nula de esta prueba:

Paso 5: Criterio de decisin y conclusin del investigador. Se debel estadstico calculado o de prueba Ct contra el

tabulado 22 nt , . El criterio de decisin esta basado en

calculado es mayor que el t de tablas positivo, cae en la

rechazo del lado derecho de la distribucin y la decisin q

tomar es rechazar la hiptesis nula ( 0 ); 2) si el t ca

menor que el t de tablas negativo, el t calculado cae en la

rechazo del lado izquierdo y la decisin igualmente es r

hi t i l ( 0 ) 3) i l t l l d t

7/26/2019 CEDEAC-3_1.pdf

31/101

los resultados de la prueba, y plantea las recome

pertinentes.

La significancia estadstica del coeficiente de correlacin en la prueba de h

afecta por el tamao de la muestra (n) o mejor an por los grados d

lgicamente a mayor tamao de la muestra el valor de r tiene mayor confi

se encuentra un valor de r relativamente bajo y n es grande, es posible qu

significativo al comparar el estadstico de prueba con el de contraste o

alternativamente se puede encontrar un r alto pero no significativo estaddebido a que n es muy pequeo y por consiguiente el nmero de grados

es bajo.

3.4. Ejercicios de computador

Usando los mismos datos del ejemplo hipottico de demanda plante

captulo anterior, a continuacin se presenta el diagrama de dispersin,

de covarianzas y de correlacin de las variables:

DIAGRAMAS DE DISPERSIN

7/26/2019 CEDEAC-3_1.pdf

32/101

MATRIZ DE COVARIANZAS

VARIABLE DX PX PZ PW DX 263.6213 -47.98225 60.01775 -53.78107 47PX -47.98225 9.514793 -11.63905 10.73373 -12PZ 60.01775 -11.63905 18.13018 -12.65089 16PW -53.78107 10.73373 -12.65089 13.40828 -16

I 47.89941 -12.99408 16.69822 -16.18343 63

MATRIZ DE CORRELACION

VARIABLE DX PX PZ PW DX 1.000000 -0.958056 0.868137 -0.904592 0.PX -0.958056 1.000000 -0.886170 0.950308 -0.PZ 0.868137 -0.886170 1.000000 -0.811397 0.PW -0.904592 0.950308 -0.811397 1.000000 -0.

I 0.371175 -0.530011 0.493410 -0.556062 1.

4. REGRESION SIMPLE LINEAL Y NO LINEAL

4.1. Objetivo del anlisis de regresinEl objetivo fundamental del anlisis de regresin es el estudio de la depe

una variable, llamada explicada, de una o ms variables llamadas exp

anlisis de regresin se apoya en el concepto matemtico de funcin, en

tiene una variable dependiente (variable explicada) y un conjunto d

independientes (variables explicativas) con el fin de estimar los coeparmetros de dicha funcin y efectuar predicciones (encontrar el valor e

la variable dependiente cuando se construyen escenarios reflejados en

que toman las variables independientes).

7/26/2019 CEDEAC-3_1.pdf

33/101

1. Especificacin: corresponde a la etapa en que el investigador defi

funcional del modelo que desea utilizar para explicar la variable d

siguiendo los lineamientos de la teora econmica.

2. Estimacin: durante esta se calculan los valores numricos de los c

o parmetros del modelo; para ello es necesario apoyarse en los m

estimacin y la aplicacin de rutinas de computador usandoestadsticos (Eviews).

3. Verificacin: consiste en corroborar la validez terica y estadstica

es decir, evaluar si los signos obtenidos para los coeficientes esti

los esperados y si el modelo cuenta con propiedades estadsticas (buen ajuste, alta relevancia y dependencia).

4. Prediccin: muchas veces los modelos elaborados por los econ

tienen solo como objeto mostrar la relacin entre variables y la m

dicha relacin entre estas a travs de una forma funcional, sino qlos modelos tienen implicaciones en trminos de prediccin. En e

puede encontrarse el efecto esperado sobre la variable depend

diversos valores de las variables independientes fuera del rango m

este procedimiento la inferencia estadstica juega un papel importa

4.2. Funcin de regresin muestral y poblacional

La lnea de regresin XXYE / es la unin de los p

7/26/2019 CEDEAC-3_1.pdf

34/101

grfica de la lnea de regresin poblacional cuando el gasto en consumo d

se desea explicar por el ingreso.

Por otro lado, cuando la lnea de regresin es construida con los datos

recibe el nombre de funcin de regresin muestral. Como todo proced

inferencia estadstica, lo que se pretende es que la muestra sea

representacin de la poblacin. En este sentido, la funcin de regresi

constituye una representacin de la funcin de regresin poblacional. A

en la prctica, las muestras de variables aleatorias son usadas para in

las caractersticas de la poblacin.

La siguiente grfica presenta un ejemplo de dos lneas de regresin mu

el gasto en consumo semanal de un hogar versus el ingreso.

7/26/2019 CEDEAC-3_1.pdf

35/101

4.3. Supuestos del modelo de regresin

Los supuestos del modelo junto con los mtodos de estimacin carac

resultados obtenidos de la regresin (coeficientes, pruebas de hiptesis

de confianza, prediccin, etc.). En particular, los supuestos ms impo

modelo recaen sobre el trmino del error. Teniendo en cuenta que la

regresin poblacional puede expresarse tambin de la forma iY 1

modelo de regresin lineal cuenta con los siguientes supuestos:

Supuesto 1: El modelo de regresin es lineal en los parmetros:

iii uXY ++= 21

Supuesto 2: Los valores de X son fijos en muestreos repetitivos. Tc

esto consiste en que X se supone no estocstica.

Supuesto 3: El valor medio de la perturbacin iu es igual a cero.

7/26/2019 CEDEAC-3_1.pdf

36/101

Por lo tanto los factores que no estn incluidos en el modelo

consiguiente, estn incorporados en iu , no afectan sistemticamente el

media de Y.

Supuesto 4: Homoscedasticidad o varianza constante de iu . Dado el v

la varianza de iu es constante para todas las observaciones. Es

varianzas condicionales de iu son idnticas.

2

2

2

]/[

]/[]/[

]/][[]/[

=

=

=

ii

iiii

iiiii

XuVar

XuEXuVar

XuEuEXuVar

La anterior ecuacin, establece que la varianza de iu para cada iX

nmero positivo constante igual a 2 . Ntese que el supuesto 4 impl

varianzas condicionales de iY tambin son homoscedsticas.

2]/[ =ii XYVar .

En contraste, si la varianza condicional de la poblacin Y varia co

situacin se conoce como Heteroscedasticidad, lo cual puede escribirse2]/[ iii XuVar =

Obsrvese el subndice sobre 2 en esta expresin indica que la var

poblacin Yahora no es constante.

Supuesto 5: No auto correlacin entre las perturbaciones. Dados d

7/26/2019 CEDEAC-3_1.pdf

37/101

7/26/2019 CEDEAC-3_1.pdf

38/101

Cuando el modelo de regresin cumple con los anteriores supuestos se

como modelo de regresin clsico y tiene las siguientes propie

estimadores son MELI (mejores estimadores lineales insesgados). Si se

supuesto de normalidad de los errores, los estimadores son ME

estimadores insesgados) y por lo tanto seguirn distribucin normal. C

intervalos de confianza, las predicciones y las pruebas de hiptesis tien

estadstica.

4.4. Mtodo de estimacin de mnimos cuadrados ordinarios

El objetivo principal de la etapa de estimacin es encontrar los valo

parmetros muestrales. El mtodo de estimacin ms popular recibe el

mnimos cuadrados ordinarios (MCO). El criterio de este mtodo c

proporcionar estimadores de los parmetros que minimicen la sum

cuadrados de los errores. Operativamente el proceso es construir u

objetivo en trminos de la suma de los cuadrados de los errores y

optimizacin (condiciones de primer orden - C.P.O., y condiciones d

orden - C.S.O.) obtener las frmulas de clculo de los estimadores.

Debido a que la funcin de regresin poblacional no se puede

directamente, los estimadores de mnimos cuadrados ordinarios se

partir de la funcin de regresin muestral (FRM). La FRM es:

iii eXY +21

iii eYY +

7/26/2019 CEDEAC-3_1.pdf

39/101

De acuerdo con el principio de mnimos cuadrados ordinarios:

221

2

iii XYe minmin

Derivando la anterior expresin con respecto a 1 y 2 e igualan

respectivamente, y resolviendo las ecuaciones normales, se encu

estimadores de los parmetros de la regresin:

( )( )

( )( )

( )XVar

YXCov

XXn

YXYXn

ii

iiii

=

=

,

222

XY 21

4.5. Varianzas y errores estndar de los estimadores

As como existen medidas de dispersin para las variables tambin la

los estimadores, por lo tanto, es necesario siempre presentar una

precisin de los estimadores de los parmetros del modelo. Esta me

error estndar e indica la confiabilidad de las estimaciones (si son pequ

ver que los parmetros muestrales van a ser muy parecidos a los pobl

La principal utilidad de los errores estndar de los estimadores es la co

de intervalos de confianza y la prueba de hiptesis. A continuacin se

forma de calcular la varianza y error estndar de cada estimador del

regresin lineal simple:

22

1 X

Vari ( )

( )

= 2

1 Xse i

7/26/2019 CEDEAC-3_1.pdf

40/101

4.6. Intervalos de confianza

En estadstica es comn efectuar inferencias basadas en estimacionesy en intervalos. Estas ltimas son menos riesgosas debido a que se e

dentro de un rango con cierto margen de confiabilidad. En particula

construirse intervalos de confianza para los parmetros del modelo de

as como para las predicciones.

Un intervalo de confianza para el parmetro 2 puede presentarse com

=+ 1Pr 2222222 setset

donde es el nivel de significancia estadstica y ( )2se es el error estn

1100 es el nivel porcentual de confianza del intervalo. Una versin

de esta expresin es: 222 set . De la misma forma para 1 :

]

11211121 Pr setset

121 set

Si por ejemploes 0.05, la interpretacin del intervalo de confianza p

dado un nivel de confianza del 95% (en 95 de cada 100 casos) en el la

el intervalo

( ) ( )222222,

setset + contendr el verdadero valor

4.7. Pruebas de hiptesis

7/26/2019 CEDEAC-3_1.pdf

41/101

Prueba de relevancia: la prueba de relevancia consiste e

estadsticamente qu tan significativo es un parmetro del modelo

manera puede identificarse si la variable independiente X aporta

importante al modelo de regresin. Siguiendo la estructura presen

captulo 2, para cada estimador i , i= 1, 2:

Paso 1: Planteamiento de la hiptesis.

Ho: 0i

Ha: 0i

Paso 2: Nivel de significancia :

Paso 3: El estadstico de prueba. Para la prueba de relevancia en e

regresin, el estadstico de prueba se define como:

22 ni

iC tset

,.~

Paso 4: Regiones de decisin: La siguiente grfica muestra la r

rechazo y aceptacin de la hiptesis nula.

7/26/2019 CEDEAC-3_1.pdf

42/101

Paso 5: Criterio de decisin y conclusin del investigador: Si Ct

rechaza la hiptesis nula. Si la prueba de hiptesis es rea

1 y se rechaza Ho se concluye que el intercepto del

significativo al nivel . Si la prueba se efecta para 2 y

Ho se concluye que iX es estadsticamente relevante al

significancia. Por otro lado, cuando no sea posible r

hiptesis nula, se puede decir que no existe evidencia para afirmar que iX sea relevante al nivel de significanc

Prueba de dependencia: esta prueba se lleva a cabo para evaluar si en

de regresin las variables independientes explican estadsticamen

conjunto la variable dependiente. Se desea que en un modelo de regreuna alta dependencia ocasionada por las variables explicativas. Esta

hiptesis como cualquier otra debe seguir una estructura similar a la

en el captulo 2. La hiptesis nula de esta prueba hace referenci

existencia de dependencia en el modelo (para el caso de regresin sim

solo hay una variable independiente se desea probar si 02

= ). L

alternativa argumenta lo contrario, sealando que al menos uno de los c

que acompaan las variables independientes es distinto de cero (en

simple esto es equivalente a 02 ).

El estadstico de prueba para el caso de un modelo de regresin linea21

22 nnC FtF ,.~ , donde FC es el estadstico calculado, que

distribucin Fcon un grado de libertad en el numerador y n-2 grados de

el denominador; y t es el estadstico t calculado en la prueba de relev

7/26/2019 CEDEAC-3_1.pdf

43/101

4.8. Prediccin

Una aplicacin del modelo de regresin es la prediccin o el pronvariable dependiente, de acuerdo con valores dados de las

independientes. Hay dos tipos de predicciones: la prediccin media y la

individual. A continuacin se presentan estos dos casos:

Prediccin media: es la prediccin del valor medio condicioncorrespondiente a un determinado valor de X, denotado como X

representa un punto sobre la lnea de regresin poblacional.

Si se desea predecir 0XYE / , la estimacin puntual de la prediccin

0210 XY + y la varianza de 0Y : ( ) ( )

( )

+=

2

2

0201

XX

XX

nYVari

.

Prediccin individual: es la prediccin de un valor individual de Y, corre

a un determinado valor de X. Si se desea predecir 0Y/ 0X , de igual fo

la prediccin media, la estimacin puntual es 0210 XY + , sin e

manera de calcular la varianza de 0Y es:

( ) ( )

( )

++=

2

202

01

1XX

XX

nYVar

i

4.9. El Coeficiente de Determinacin

7/26/2019 CEDEAC-3_1.pdf

44/101

respecto a que tan bien la lnea de regresin muestral se ajusta a los d

el caso de un modelo de regresin lineal simple se denota como 2r y

22rr = , donde res el coeficiente de correlacin lineal entre las var

X. Debido a que el 2r bajo los supuestos de modelo de regresin

encuentra entre 0 y 1, la manera de interpretarlo es en

argumentndose que dicho valor refleja la magnitud porcentual de la v

la variable Yexplicada por la variable X.

4.10. Modelos de regresin simple no lineal en las variables

En algunos casos el investigador requiere estimar otro tipo de modelos

las variables independientes no sean lineales, como por ejemplo

transformadas en trminos logartmicos, cuadrticos, raz cuadrada, cLas razones para estimar estos nuevos modelos pueden ser: m

resultados en trminos de bondad de ajuste, obtener elasticidades di

de la regresin, o en algunos casos porque la teora econmica lo s

ejemplo del modelo no lineal es el conocido como Cobb-Douglas, c

funcional es la siguiente:iu

ii eAXY2

=

Para estimar el modelo se efecta una linealizacin del mode

transformndolo en logaritmos. De esta manera:

iii uXLogLogAYLog ++= 2

Puede notarse que las variables dependiente e independiente se

transformadas en logaritmos y el trmino AL es el intercepto de la

7/26/2019 CEDEAC-3_1.pdf

45/101

Sea iYLogYT= , ALog=1 y ii XLogXT = , luego el modelo a estim

forma: iii uXTYT ++= 21 , y los coeficientes del modelo transforma

ser obtenidos por el mtodo de mnimos cuadrados ordinarios u

ecuaciones para los estimadores 1 y 2 presentadas en el numeral 4.4

Tericamente un modelo Cobb-Douglas es una funcin con elasticidad

a lo largo de todo su dominio, siendo diferente de una funcin linea

elasticidad depende especialmente de la observacin iX . En este

modelo Cobb-Douglas permite obtener directamente las elastic

coeficiente 2 representa la elasticidad de Yrespecto a X, y se interpre

aumento (cuando el valor de la elasticidad es mayor que cero) o d

(cuando el valor de la elasticidad es menor que cero) porcentual en la ocasionada por el incremento en un 1% de la variable X.

4.11. Ejercicios de Computador

Continuando con el ejemplo de datos hipotticos de demanda present

captulos anteriores, las siguientes salidas de computador muestran los

del modelo de regresin lineal simple de demanda y el modelo no lin

variables (doblemente logartmico) con las respectivas matrices d

covarianza de los coeficientes:

7/26/2019 CEDEAC-3_1.pdf

46/101

MODELO DE REGRESION LINEAL SIMPLE

Dependent Variable: DXMethod: Least SquaresDate: 10/03/06 Time: 16:38Sample: 1 13Included observations: 13

Variable Coefficient Std. Error t-Statistic Prob.

C 71.41791 3.130854 22.81100 0.000PX -5.042910 0.454825 -11.08759 0.000

R-squared 0.917870 Mean dependent var 40.3846Adjusted R-squared 0.910404 S.D. dependent var 16.8994S.E. of regression 5.058427 Akaike info criterion 6.22062Sum squared resid 281.4646 Schwarz criterion 6.30754

Log likelihood -38.43407 F-statistic 122.934Durbin-Watson stat 2.267643 Prob(F-statistic) 0.00000

Los resultados del modelo lineal muestran que la variable precio cue

signo esperado y es relevante al 1%, 5% y 10% de significancia. El valo

0.918, es decir, el 92% de la variacin de la demanda del bien X esta

por la variable precio. Adicionalmente se observa la existencia de de

conjunta en el modelo al 1%, 5% y 10% de significancia (Fc=12

coeficiente de la variable PX es interpretado como un efecto marginal, p

un incremento en una unidad del precio de X disminuye en promedio su

en 5.04 unidades, manteniendo todos los dems factores constantes.

MATRIZ DE VARIANZA COVARIANZA DE LOS COEFICIENTESDEL MODELO DE REGRESIN SIMPLE

7/26/2019 CEDEAC-3_1.pdf

47/101

MODELO DE REGRESION SIMPLE NO LINEAL EN LAS VARIABLES(DOBLEMENTE LOGARITMICO)

Dependent Variable: LOG(DX)Method: Least SquaresDate: 10/03/06 Time: 16:48Sample: 1 13Included observations: 13


C 4.799536 0.208899 22.97538 0.000LOG(PX) -0.722024 0.118417 -6.097307 0.000

R-squared 0.771676 Mean dependent var 3.59748Adjusted R-squared 0.750919 S.D. dependent var 0.49910S.E. of regression 0.249094 Akaike info criterion 0.19866Sum squared resid 0.682526 Schwarz criterion 0.28558

Log likelihood 0.708676 F-statistic 37.1771Durbin-Watson stat 2.124425 Prob(F-statistic) 0.00007

Los resultados del modelo doblemente logartmico indican que

logaritmo del precio es significativa (al 1%, 5% y 10%) y exhibe el signo

R2es 0.772, por lo tanto, el 77% de la variacin del logaritmo de la de

bien X es explicada por el logaritmo de su precio. Adicionalme

dependencia conjunta en el modelo (1%, 5% y 10% de signific

coeficiente de la variable LOG(PX) es interpretado como una elasticid

tanto, un incremento en un 1% del precio de X disminuye en pr

demanda en 0.72%, manteniendo todos los dems factores constantes.

MATRIZ DE VARIANZA COVARIANZA DE LOS COEFICIENTESDEL MODELO NO LINEAL EN LAS VARIABLES

(DOBLEMENTE LOGARITMICO)

7/26/2019 CEDEAC-3_1.pdf

48/101

5. REGRESION MULTIPLE LINEAL Y NO LINEAL

5.1. Expresin del modelo en forma matricial

En regresin mltiple se supone que las variaciones de Yi que se

explicar son debidas a K variables independientes, es decir X1, X2

como en la realidad no pueden presentarse relaciones determin

completo se considera la inclusin del trmino de perturbacin .

Resulta conveniente analizar el modelo clsico de regresin lineal

enfoque matricial. Supngase un modelo lineal de la forma:

+kkxxxY L33221

Si se tienen n observaciones independientes nyyy ,,, K21 de Y, podem

iy como:

ikikiii xxxy +L33221

Donde jix es el valor de la j-sima variable independiente para

observacin, ni ,,3,2,1 K= . Ahora defnanse las siguientes matrices, con

=

ny

y

y

M

2

1

Y ,

=

nknn

k

k

xxx

xxx

xxx

L

MM

L

L

21

22221

11211

X ,

=

k

M

2

1

,

=

n

M

2

1

P l t t l i t f i d l

7/26/2019 CEDEAC-3_1.pdf

49/101

5.2. Supuestos del modelo

Los supuestos del modelo son los siguientes:

1. XY += (Linealidad en los parmetros).

2. Xes de tamao kn x con rango k.

3. XXYX == )/(0)( EE

4. jiCovE ji == ,0)()'( 2 I .

5. X es no estocstica.

6. ( ) )I,0(.~X 2N

5.3. Mtodo de estimacin de mnimos cuadrados ordinarios

Se desea obtener un estimador

de un vector de parmetros descono

minimiza la suma del cuadrado de los errores S, donde:

)XY(')XY('2

=== S

Al minimizar Scon respecto a

se encuentra el estimador de mnimos

ordinarios de regresin mltiple:

( ) ( )Y'XX'X 1

=MCO

5.4. Matriz de varianzas y covarianzas de los estimadores

La matriz de varianza-covarianza de los estimadores es releva

determinacin de los errores estndar de los coeficientes y en la eje

7/26/2019 CEDEAC-3_1.pdf

50/101

1. Suma de cuadrados de los errores. Puede ser calc

YX''YY' =SCE .

2. Varianza del modelo. Dado que en la mayora de los casos la v

desconocida, se utiliza la informacin de la muestra para o

estimador de la misma: )()()(2 knSCEkn ==

YX''YY' .

Usando la informacin anterior, la matriz de varianza covarianz

coeficientes se puede calcular con la siguiente frmula:

12 XX'

= )(.covvar Matriz

5.5. Pruebas de hiptesis

Para efectuar pruebas de hiptesis es necesario obtener el error estnd

uno de los estimadores. Esta medida de dispersin corresponde a la ra

de cada uno de los elementos de la diagonal principal de la matriz de

covarianza. A continuacin se presentan los aspectos ms importa

efectuar las pruebas de relevancia y dependencia en un modelo de

mltiple:

Pruebas de relevancia: En estas pruebas se utilizan los t estadsticos

de los estimadores con su respectivo p-valor. A continuacin se presen

de obtenerlos:

1. t estadsticos. Los valores de t son calculados efectuando

bt di h b bilid d i l l d l t d ti

7/26/2019 CEDEAC-3_1.pdf

51/101

obtener dicha probabilidad es necesario el valor del estadstico

el nmero de grados de libertad )( kn y el nmero de colas de

(en este caso dos colas dado que es una prueba de significancia

Prueba de dependencia: Como se mencion en el captulo anterior el

utilizado para realizar la prueba es el F.

1. F estadstico. Mide la dependencia conjunta en el modelo resvariables explicativas. Puede ser obtenido en la forma matr

siguiente manera: [ ][ )1)(())(( = kknF YX''YY'YnYX'' 2

2. p valor. Arroja el nivel mnimo de significancia para rechazar l

nula. En el procedimiento se requiere el valor obtenido de F, loslibertad del numerador )1( k y grados de libertad del denominad

5.6. Coeficiente de determinacin ajustado ( )2R

El trmino ajustado se refiere a que es corregido por los correspondiende libertad. El 2R mide la bondad de ajuste del modelo de regresin

de explicacin de la variable dependiente por las variables independi

como lo hace el 2R convencional, sin embargo el 2R tiene la partic

que permite comparar modelos de regresin mltiple en los que s

variables adicionales. No obstante, se debe considerar que la comparvalidez cuando en cada modelo la variable dependiente y el tamao de

sean iguales. La forma de calcular el 2R se presenta a continuacin:

n 1

5 7 Inter alos de confian a

7/26/2019 CEDEAC-3_1.pdf

52/101

5.7. Intervalos de confianza.

Un intervalo de confianza para el parmetro Kkk ,,2,1, K= , tiene la

] 122 kkkkk setset Pr

kk set

2

donde es el nivel de significancia estadstica y kse es el error estn

El kse se obtiene mediante la frmula: ( ) ( )1

'

= kkk XXse . Puede neste intervalo de confianza corresponde a una expresin matemtica

presentada en el caso de regresin simple.

5.8. Modelos de regresin mltiple no lineal en las variables

En este numeral, se extender el caso de la funcin tipo Cob

desarrollado en el numeral 4.10 al caso de regresin mltiple no lin

variables. Considrense ms variables independientes Xs que pueden

variable Y, por lo tanto, el modelo Cobb-Douglas toma la forma:

ik uikiii eXXAXY

K32 32

Luego transformando el modelo en logaritmos:

iikkiii uXLogXLogXLogALogYLog +++++= L

3322

Sea iYLogYT= , ALog=1 , 22 ii XLogXT = ,..., ikik XLogXT = , entonces

a estimar es:

Bajo el esquema matricial los coeficientes del modelo transformado p

7/26/2019 CEDEAC-3_1.pdf

53/101

Bajo el esquema matricial los coeficientes del modelo transformado p

obtenidos a travs del mtodo de mnimos cuadrados ordinarios usando

de clculo presentada en el numeral 5.3. El coeficiente kk ,

representa la elasticidad de Yrespecto a Xky tiene la misma interpretac

el caso del modelo de regresin simple doblemente logartmico d

anterior. Por lo tanto, se tendrn 1k elasticidades en regresin

estimarse una funcin tipo Cobb-Douglas. Por otro lado, cabe de

ejercicios de estimacin diferentes al modelo Cobb-Douglas no permitdirectamente elasticidades constantes. Por ello es necesario tener en

forma que toman las variables en el modelo transformado antes d

interpretaciones de los coeficientes.

5.9. Ejercicios de Computador.

Ejemplo 1.

Usando la misma base de datos hipotticos de demanda de captulos a

continuacin se presentan los resultados de las estimaciones del

regresin mltiple lineal y no lineal en las variables, las matrices d

covarianza de los coeficientes, as como la comparacin entre l

observados y predichos de la demanda y sus residuos:

REGRESIN LINEAL MLTIPLE

7/26/2019 CEDEAC-3_1.pdf

54/101

REGRESIN LINEAL MLTIPLE

Dependent Variable: DX

Method: Least SquaresDate: 10/04/06 Time: 10:31Sample: 1 13Included observations: 13


C 72.73351 10.83288 6.714142 0.000

PX -4.588739 1.778623 -2.579939 0.032PW -0.386460 1.214240 -0.318273 0.758PZ 0.471929 0.688867 0.685080 0.512I -0.409388 0.201019 -2.036558 0.076

R-squared 0.947105 Mean dependent var 40.3846Adjusted R-squared 0.920657 S.D. dependent var 16.8994S.E. of regression 4.760208 Akaike info criterion 6.24218

Sum squared resid 181.2767 Schwarz criterion 6.45947Log likelihood -35.57419 F-statistic 35.8104Durbin-Watson stat 1.436480 Prob(F-statistic) 0.00003

Los resultados del modelo lineal muestran que la variable precio cue

signo esperado y es relevante al 5% y 10% de significancia. El valor

0.947, es decir, el 95% de la variacin de la demanda del bien X estapor las variables independientes. Adicionalmente se observa la ex

dependencia conjunta en el modelo al 1%, 5% y 10% de significancia (F

El coeficiente de la variable PX es interpretado como un efecto marg

tanto, un incremento en una unidad del precio de X disminuye en pr

demanda en 4.59 unidades, manteniendo todos los dems factores cons

Vale la pena aclarar que la variable ingreso an cuando es relevante

significancia, el signo de su coeficiente no es consistente con la teora

l i d bi l

7/26/2019 CEDEAC-3_1.pdf

55/101

MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES DEL MODREGRESIN LINEAL MULTIPLE

COEFICIENTE C PX PW PZ C 117.3513 -11.56233 1.349073 -6.616478 -0

PX -11.56233 3.163501 -1.826424 0.777287 -0PW 1.349073 -1.826424 1.474379 -0.192430 0

PZ -6.616478 0.777287 -0.192430 0.474538 -0I -0.600013 -0.022642 0.052888 -0.014848 0

VALORES OBSERVADOS Y ESTIMADOS DE LA DEMANDA Y LOS RESIDUOS A MODELO DE REGRESIN LINEAL MLTIPLE

obs Actual Fitted Residual Residual Plot1 37.0000 37.8104 -0.81044 | . *| . |2 38.0000 43.2972 -5.29718 | *. | . |3 18.0000 22.0098 -4.00977 | .* | . |4 50.0000 49.7111 0.28890 | . * . |5 22.0000 27.3714 -5.37143 | *. | . |

6 55.0000 59.4627 -4.46267 | * | . |7 42.0000 34.4728 7.52721 | . | . *8 29.0000 27.1267 1.87326 | . | * . |9 63.0000 62.7036 0.29637 | . * . |10 13.0000 10.3593 2.64072 | . | * . |11 60.0000 56.3697 3.63029 | . | *. |12 62.0000 59.7074 2.29265 | . | * . |13 36.0000 34.5979 1.40211 | . | * . |

MODELO DE REGRESION MULTIPLE NO LINEAL EN LAS VARIABLES

7/26/2019 CEDEAC-3_1.pdf

56/101

(DOBLEMENTE LOGARITMICO)

Dependent Variable: LOG(DX)Method: Least SquaresDate: 10/04/06 Time: 10:39Sample: 1 13Included observations: 13


C 3.042978 1.646616 1.848020 0.101LOG(PX) 0.115482 0.301528 0.382991 0.711LOG(PW) -0.336166 0.436617 -0.769933 0.463LOG(PZ) 0.671764 0.400484 1.677382 0.132LOG(I) -0.103431 0.084847 -1.219025 0.257

R-squared 0.902417 Mean dependent var 3.59748Adjusted R-squared 0.853626 S.D. dependent var 0.49910S.E. of regression 0.190953 Akaike info criterion -0.18986Sum squared resid 0.291703 Schwarz criterion 0.02742Log likelihood 6.234096 F-statistic 18.4954Durbin-Watson stat 1.510399 Prob(F-statistic) 0.00041

Los resultados del modelo doblemente logaritmo no son satisfactorios

ninguna de las variables incorporadas como regresores son sig

Asimismo, las variable LOG(PX) y LOG(I) no presentan los signos

limitando la validez terica del modelo.

MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES DEL MODOBLEMMENTE LOGARTMICO

COEFICIENTE C LOG(PX) LOG(PW) LOG(PZ) LOC 2.711343 -0.229656 -0.565544 -0.638982 -0.0

LOG(PX) -0.229656 0.090919 -0.022785 0.064962 0.0LOG(PW) -0.565544 -0.022785 0.190634 0.121451 0.0LOG(PZ) -0.638982 0.064962 0.121451 0.160387 0.0

VALORES OBSERVADOS Y ESTIMADOS DEL LOGARITMO DE LA DEMA

7/26/2019 CEDEAC-3_1.pdf

57/101

Y LOS RESIDUOS A PARTIR DEL MODELO DE REGRESINDOBLEMENTE LOGARTMICO

obs Actual Fitted Residual Residual Plot1 3.61092 3.50939 0.10153 | . | * . |2 3.63759 3.80097 -0.16339 | .* | . |3 2.89037 3.07102 -0.18064 | .* | . |4 3.91202 3.91411 -0.00209 | . * . |5 3.09104 3.11501 -0.02396 | . *| . |6 4.00733 4.10808 -0.10075 | . * | . |7 3.73767 3.59355 0.14412 | . | * . |8 3.36730 3.32110 0.04619 | . | * . |9 4.14313 4.38551 -0.24237 | * . | . |10 2.56495 2.69990 -0.13495 | . * | . |11 4.09434 3.84781 0.24653 | . | . *12 4.12713 4.00914 0.11799 | . | * . |13 3.58352 3.39174 0.19178 | . | * |

Ejemplo 2.

Ahora considere la siguiente informacin de una firma sobre los

produccin y la cantidad producida de un bien para estimar una funcin

cbica:

TABLA No. 3. COSTOS SEGN EL NIVEL DE PRODUCCIN

Obs. Q CT1 0 52 1 143 2 234 3 285 4 336 5 367 6 418 7 459 8 48

10 9 5011 10 5512 11 6113 12 6614 13 72

7/26/2019 CEDEAC-3_1.pdf

58/101

Donde:

CT: Costo total de produccinQ: Nivel de producto

ESTADISTICAS DESCRIPTIVAS

Q Q2 Q3 CTMean 10 136.6667 2100 66.19048Median 10 100 1000 55Maximum 20 400 8000 169Minimum 0 0 0 5Std. Dev. 6.204837 128.5365 2488.431 43.49899Observations 21 21 21 21

MODELO DE REGRESION MULTIPLE NO LINEAL ENLAS VARIABLES (FUNCIN CUBICA)

Dependent Variable: CTMethod: Least SquaresDate: 27/09/06 Time: 21:48Sample: 1 21Included observations: 21

Variable Coefficient Std. Error t-Statistic ProC 4.586862 0.962089 4.767605 0.00020Q 10.450570 0.427013 24.473660 0.00000Q2 -0.974658 0.050336 -19.363000 0.00000Q3 0.043001 0.001653 26.020450 0.00000R-squared 0.999236 Mean dependent var 66.1904Adjusted R-squared 0.999101 S.D. dependent var 43.4989S.E. of regression 1.304364 Akaike info criterion 3.53895Sum squared resid 28.92322 Schwarz criterion 3.73790Log likelihood -33.15899 F-statistic 7408,61

Durbin-Watson stat 0.882959 Prob(F-statistic)

MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES

6. INCUMPLIMIENTO DE LOS SUPUESTOS DEL MODELO

7/26/2019 CEDEAC-3_1.pdf

59/101

El cumplimiento de los supuestos del modelo clsico de regresin ga

los k obtenidos a travs del mtodo de mnimos cuadrados ordinario

mejores estimadores linePales insesgados. Cuando tales supu

violados, se empiezan a generar problemas en los resultados de la

haciendo que los parmetros obtenidos no cumplan con alguna

propiedades deseables de un estimador (eficiencia y consistencia). A cose describen de manera general los conceptos de multico

heteroscedaticidad autocorrelacin, y no normalidad, la forma de det

problemas en el modelo estimado y las posibles soluciones a la viola

supuestos de mnimos cuadrados ordinarios relacionados con estos con

6.1. Multicolinealidad

La multicolinealidad tiene que ver con la relacin lineal entre algn c

variables independientes en un modelo de regresin. Supngase e

modelo con cuatro variables independientes:

Cualquier relacin lineal entre las variables independientes de este m

ejemplo X2 con X3, o X2 con X5 y X4 puede generar prob

multicolinealidad. Por lo general, existen dos tipos de multicolinealidad:

1. Multicolinealidad Perfecta: Para entender el concepto de multic

perfecta es necesario expresar las variables independientes del

trminos de una combinacin lineal cuya suma algebraica sea ig

7/26/2019 CEDEAC-3_1.pdf

60/101

Los valores de pueden ser positivos o negativos y form

combinaciones. Cuando la suma algebraica para todas las obsde la muestra de esta combinacin lineal es cero se dice

multicolinealidad perfecta. De este caso se excepta que simult

los valores de sean cero, pues esta es una solucin trivial de la

En otras palabras, la multicolinealidad perfecta se presenta c

combinacin lineal de uno o ms vectores de variables explicativade manera perfecta uno o ms vectores idnticos a cualqui

variables explicativas en la base de datos.

2. Multicolinealidad Alta: Esta se presenta cuando la colinealidad

entre variables independientes es muy fuerte aunque no perfecta

La multicolinealidad se presenta debido a la tendencia definida de cierta

a lo largo de la muestra o a travs del tiempo. Tendencias o pa

comportamiento similares de las variables independientes en un

regresin sustentan la multicolinealidad. La multicolinealidad se puede

en datos provenientes de series de tiempo. Por ejemplo, es comn en

regresar variables que tienen que ver con la representacin de ciclos ec

Por ello, antes de efectuar la regresin es til elaborar diagramas de

entre las variables independientes con el objetivo de analizar el comp

tendencial de estas.

El problema de multicolinealidad es un problema ocasionado

observaciones en los datos recopilados de la muestra. La pre

7/26/2019 CEDEAC-3_1.pdf

61/101

Si existe multicolinealidad perfecta entre las variables independien

modelo de regresin, ( XX' )-1

no existe. Cuando esto ocurre no es posi

. En presencia de alta multicolinealidad se genera una ampliacin

estndar de

, por lo que el valor de los estadsticos "t" para cada

parmetros del modelo sern mucho menores que en aus

multicolinealidad, aumentndose la probabilidad de cometer error dedecir, que acepte Hono siendo verdadera. Por consiguiente, el mode

validez para realizar pruebas de relevancia.

6.1.1. Deteccin de Multicolinealidad

La deteccin de multicolinealidad en un modelo puede hacerse por m

visualizacin de contradicciones en los estadsticos que juzgan la b

ajuste (R2), dependencia (Fc) y los estadsticos que permiten evaluar la

de las variables en el modelo (tc). Otro mtodo de deteccin es la est

XX' ; si el valor obtenido de XX' es muy cercano a cero, puede con

es muy probable la existencia de multicolinealidad alta.

No obstante, se encuentran otras pruebas mucho ms formales e

estadsticos. Una de ellas es estimar coeficientes de correlacin entre

variables independientes y formular pruebas de hiptesis sobre los coef

correlacin estimados para comprobar la significancia de la relacin

trminos estadsticos. Por ejemplo, una vez calculado el coeficiente de

lineal entre X2 y X3, puede proponerse la siguiente prueba de hip

Ho: 032 ,X X (Si existe relacin lineal entre X2 y X3)

7/26/2019 CEDEAC-3_1.pdf

62/101

El estadstico de prueba es:

22232

32

1

2

= n

XX

XXC t

r

nrt ,

,

,.~

Donde es el valor que se desea probar del coeficiente de correla

poblacional. No obstante en la mayora de los casos este se asume c

cual solo se desea verificar si hay o no correlacin entre las variables ex

Si 22 nC tt , a un nivel de significancia determinado, se re

confirmando la existencia de relacin lineal entre X2 y X3, es decir el

regresin mostrar multicolinealidad.

El otro mtodo formal consiste en la estimacin de regresiones aux

ayudan a evaluar la relacin lineal existente entre un conjunto de

independientes. Para ello, se ejecuta una regresin entre las

independientes del modelo, por ejemplo X2 versus (X3, X4, X4, X5)

analizan los estadsticos resultantes de esta. Si hay relacin lineal e

variables, el R2, el Fc y el tc que acompaa a cada variable independ

regresin auxiliar sern altos. Las pruebas de hiptesis sobre re

dependencia estadstica en la regresin auxiliar determinan si ex

multicolinealidad. Es importante tener en cuenta que deben estimarseposibles regresiones auxiliares resultantes de las combinaciones

variables independientes o regresores del modelo original. El m

6.1.2. Correccin de Multicolinealidad

7/26/2019 CEDEAC-3_1.pdf

63/101

La correccin de multicolinealidad en un modelo puede ejecutarse medimtodos:

1. Eliminacin de Variables: Esta tcnica propone la eliminacin de

variables independientes relacionadas linealmente. El problema

esta tcnica es que se pueden eliminar variables import

tericamente explican la variable dependiente, presentndose po

sesgo de especificacin por omisin de variables.

2. Utilizacin de Informacin a priori: La informacin a priori co

proviene de estudios anteriores que pueden brindar algn indic

valor de algn parmetro correspondiente a una de las

independientes incluida en la ecuacin de regresin. Operativ

valor a prioridel parmetro es reemplazado en el modelo origina

proceder a estimar el modelo resultante.

3. Transformacin de Variables: Esta tcnica plantea una transfo

las variables del modelo original. El ms conocido es la transfo

primeras diferencias. Al trabajar con un modelo que inc

organizados en series de tiempo se presenta la posibilidad de co

ecuacin de primeras diferencias, asumiendo que con un rezag

una de las variables del modelo es posible eliminar la relacinpuede existir entre las variables independientes. El modelo ori

periodo t:

Luego la ecuacin en diferencias es:

7/26/2019 CEDEAC-3_1.pdf

64/101

Donde t* = t - t-1. Debe tenerse en cuenta que al estimar

modelo, la interpretacin de los coeficientes estimados no es la

en el modelo original, debido a que estos ahora representan

diferencias de las variables entre los periodos t y t-1.

4. Aumentar el tamao de la muestra: Este mtodo consiste en

muestra o conjunto de datos utilizados para estimar el modelo. E

solucin plausible dado que el problema de multicolinealidad es o

fundamentalmente por las observaciones en la muestra. C

incrementa el nmero de observaciones se piensa que es

reproducir el componente de colinealidad entre los regre

embargo, en muchos casos no es posible adquirir ms info

observaciones de las variables debido a restricciones fsicas,

econmicas.

Finalmente, se recomienda que el investigador una vez utilice algun

mtodos verifique si el problema de multicolinealidad fue corregido.

6.2. Heteroscedasticidad

El problema de heteroscedasticidad se presenta cuando es violado el s

varianza constante de los errores de la funcin de regr

heteroscedasticidad tiene que ver con la relacin entre una o ms de la

La presencia de heteroscedasticidad es muy comn en regresiones e

ti d d t d t t l P j l d l

7/26/2019 CEDEAC-3_1.pdf

65/101

partir de datos de corte transversal. Por ejemplo, cuando se recole

provenientes de estratos, de regiones, por tamao de la familia o pempresa. En general, puede presentarse en estudios que incluyen g

comportamientos marcados a lo largo de toda la muestra; por ejemplo

ingreso monetario del hogar segn el estrato, pues se puede pen

varianza del ingreso monetario del grupo de alta riqueza es ms alta

grupo de escasos recursos.

El problema de heteroscedasticidad repercute directamente sobre la est

los parmetros de la regresin. Los estimadores seguirn siendo ins

consistentes pero no eficientes. La heteroscedasticidad causa la subes

sobre estimacin de la varianza del modelo de regresin, por lo tanto e

error estndar de los parmetros, el valor de los estadsticos t y los in

confianza cambian con respecto a los resultados que deberan ob

ausencia de heteroscedasticidad. En este sentido, la pres

heteroscedasticidad en el modelo de regresin hace que las pruebas d

no tengan validez estadstica o que las inferencias sean errneas.

6.2.1. Deteccin de la heteroscedasticidad

A continuacin se presentan los mtodos para detectar la exis

heteroscedaticidad:

1. Anlisis de residuales: Este mtodo permite evaluar grficamen

heteroscedasticidad causada por una variable independiente en

dispersin entre Yt estimado y et2. Si estas grficas muest

tendencia especfica puede afirmarse que existe heteroscedasti

7/26/2019 CEDEAC-3_1.pdf

66/101

tendencia especfica, puede afirmarse que existe heteroscedasti

modelo de regresin.No obstante esta metodologa es indicativabasada en una prueba estadstica.

2. Anlisis de regresin: Es la utilizacin de una o ms regresiones

El procedimiento es similar al planteado para detectar multicoline

la salvedad de que ahora la regresin no se estima entre la

independientes, sino entre el cuadrado del trmino de error y el c

regresores del modelo original. Dentro de este mtodo se enc

pruebas de Park, White, Glejser, Breusch-Pagan-Godfrey, y

Quandt. A continuacin se presenta el procedimiento general pa

la prueba de White:

Si se tiene el siguiente modelo original:

Una vez estimado el modelo por el mtodo de mnimos

ordinarios (MCO), el investigador debe calcular el cuadrado de l

22 ttt YY , y luego estimar por MCO el siguiente modelo:

tttttttt XXXXXX ++++++= 2152

242

13221102

La prueba de hiptesis relacionada con el modelo anterior es:

El estadstico de prueba es 252 .~nR . En este caso el nmero de

7/26/2019 CEDEAC-3_1.pdf

67/101

libertad es cinco, que corresponde al nmero de variables explica

regresin de White. Asimismo, para modelos con ms variables elos grados de libertad sern equivalentes al nmero de regres

modelo auxiliar. Si 2.2

lgnR > a un nivel de significancia , l

nula es rechazada, por lo tanto, existe heteroscedasticidad en

original.

Es importante sealar que la prueba de White desarrollada

exclusivamente a la prueba de trminos cruzados debido a que

en la regresin auxiliar el trmino de interaccin de las

independientes del modelo original: ttXX 215 . Cuando este com

es agregado la prueba recibe el nombre de prueba de White si

cruzados. Este cambio tiene un efecto directo sobre los grados

de la prueba.

6.2.2. Correccin de heteroscedasticidad

Las medidas correctivas principalmente incluyen dos enfoques: cua

conocida y cuando 2 es desconocida.

1. Cuando se conoce 2 . En este caso se utiliza el mtodo d

cuadrados ponderados (M.C.P) para realizar una transformac

variables del modelo. Considere el modelo original el cua

heteroscedasticidad y 2 es conocida:

Este mtodo supone la siguiente transformacin:

XY ++=

7/26/2019 CEDEAC-3_1.pdf

68/101

ttt XY ++= 21

Donde 2 es la desviacin estndar del modelo. Se supone

transformacin permite que el modelo quede libre de heterosce

No obstante, para asegurarse de esto puede efectuarse cualqu

pruebas de deteccin presentadas anteriormente.

2. Cuando no se conoce 2 : Por lo regular es muy difcil tener co

previo de 2 . Para utilizar el mtodo de mnimos cuadrados p

debe recurrirse a supuestos ad hoc, con cierto grado de razonabi

2 para proceder a la transformacin de la regresin origi

manera, que el nuevo modelo cumpla con el sup

homocedasticidad. Considrese el siguiente modelo:

El investigador presume que la varianza de los errores tiene l

forma:

222tt XUE =

Esta expresin es planteada cuando se cree que la varianza de

es proporcional al cuadrado de la variable explicativa. Bajo este s

modelo transformado puede presentarse como sigue:

y que el modelo transformado ahora es tericamente homoceds

7/26/2019 CEDEAC-3_1.pdf

69/101

y que el modelo transformado ahora es tericamente homoceds

( ) ( ) ( ) ( ) ( ) 22222222 11 ==== ttttttt XXUEXXUEvE .

El mtodo indica que las observaciones de la muestra deben divi

raz cuadrada de la estructura generadora de la heteroscedasticid

para este ejemplo es equivalente a dividir por tX . Luego el proindica que el modelo transformado requiere estimarse por MCO.

razn por la cual el mtodo se denomina mnimos cuadrados p

dado que se ponderan las observaciones originales por un

conveniente verificar empricamente si luego de estimar

transformado el problema de heteroscedasticidad fue corregido.

6.3. Autocorrelacin

El problema de autocorrelacin se presenta en una regresin cuando

de las diferentes observaciones estn relacionados en el tiempo. Esto

el efecto de los errores en el tiempo no es instantneo sino por el c

persistente en el tiempo. La autocorrelacin es ms comn en series

en el tiempo que en informacin proveniente de encuestas en un

(seccin cruzada). La autocorrelacin puede estar relacionada con

econmicos; generalmente sta se presenta en un modelo con

macroeconmicas donde en el tiempo ocurre un evidente comp

tendencial.

generada en casos donde se usa una forma funcional incorrecta del m

hace que los datos se ajusten a una forma funcional que no es la ms a

7/26/2019 CEDEAC-3_1.pdf

70/101

q j q

Se argumenta, que la manipulacin de informacin puede llegar a gener

autocorrelacin. Un caso tpico se presenta en la cuentas naciona

muchos datos son obtenidos a partir de otros, aplicando tcnicas de in

o extrapolacin. Por ejemplo, cuando se convierten datos diarios a s

Finalmente, modelos especiales como los de rezagos distribuid

autoregresivos pueden originar autocorrelacin.

Entre las consecuencias de la autocorrelacin se tiene la sobrees

subestimacin de los estadsticos t que juzgan la significancia de la

independientes en el modelo. Aunque los estimadores siguen siendo ins

consistentes son ineficientes.En este sentido se afecta la validez est

las pruebas de hiptesis.

6.3.1. Deteccin de la autocorrelacin

Los mtodos ms comunes para detectar autocorrelacin son:

1. Anlisis de residuales: este mtodo plantea la construccin de

de dispersin para los errores en funcin de tiempo o en fun

perodo inmediatamente anterior. El primer paso es estimar

original por MCO. Luego los errores estimados de la reggraficados en un eje de coordenadas para identificar si exi

tendencia de los mismos en el tiempo, o de estos con su primer

7/26/2019 CEDEAC-3_1.pdf

71/101

auxiliar es el trmino de error t y los regresores sus respectiv

hasta el orden deseado por el investigador. Adicionalmente so

7/26/2019 CEDEAC-3_1.pdf

72/101

hasta el orden deseado por el investigador. Adicionalmente so

los regresores usados en el modelo original. La hiptesis nula coa que todos los coeficientes de autocorrelacin de orden (los c

que acompaan a los residuos rezagados en la regresin au

iguales a cero, mientras la hiptesis alterna es que al menos uno

distinto de cero. El estadstico de prueba es ( ) 22 .~ sRsn , don

nmero de errores rezagados en la regresin auxiliar. Paautocorrelacin de orden uno, que es la prctica ms comn, s s

uno. La hiptesis nula es rechazada cuando ( ) 22 sRsn > a

significancia ; en este caso se concluye que hay autocorrelaci

6.3.2. Correccin de la autocorrelacin

La correccin del problema de autocorrelacin incluye diferentes t

persiguen principalmente la transformacin de las variables del mod

objetivo de eliminar el patrn tendencial que siguen los errores. Se

tipos de metodologas de correccin de la autocorrelacin:

1. Cuando se conoce el coeficiente de autocorrelacin: la tran

recomendada sugiere rezagar un perodo las variables del

estimar una ecuacin de primeras diferencias. Para esto el mod

debe ser transformado hasta tomar la forma:

Esta ecuacin es estimada y se propone cualquiera de las t

2. Cuando no se conoce el coeficiente de autocorrelacin: En la

7/26/2019 CEDEAC-3_1.pdf

73/101

los casos a nivel emprico el coeficiente de autocorrelacin no Debido a esto el coeficiente de autocorrelacin debe ser

partiendo de la suposicin de un valor inicial del mismo.

Una de estos mtodos es el procedimiento Cochrane O

consiste en la estimacin de modelos con sucesivas transforma

un mtodo iterativo representado en un algoritmo que evala

proceso la tendencia que sigue el estimado de regresiones

Cuando la diferencia de entre un modelo estimado actual y su

es 0.01 se afirma que el coeficiente ha convergido y por cons

tendencia de crecimiento de este se ha eliminado.

Por otro lado existe el mtodo de correccin a travs del Durbin

Mediante esta tcnica, aunque no se conoce , este es posible

partir del estadstico d de la regresin del modelo original

obtenido el valor de las variables son transfo

cedeac-3_1.pdf

Documents