cedeac-3_1.pdf
TRANSCRIPT
-
7/26/2019 CEDEAC-3_1.pdf
1/101
E E
Centro de Estudiossobre Desarrollo EconmicoFacultad de EconomaUniversidad de los Andes
2006
3
APUNTES DE CLASE CEDE ISSN1909-4442
OCTUBRE DE
INTRODUCCINA LA ECONOMETRA
Ramn Antonio Rosales lvarezJorge Alexander Bonilla Londoo
-
7/26/2019 CEDEAC-3_1.pdf
2/101
CEDE
E E
APUNTES DE CLASE
2006
3
ISSN1909-4442
INTRODUCCINA LA ECONOMETRA
Ramn Antonio Rosales lvarezJorge Alexander Bonilla Londoo
OCTUBRE DE
-
7/26/2019 CEDEAC-3_1.pdf
3/101
-
7/26/2019 CEDEAC-3_1.pdf
4/101
INTRODUCCIN A LA ECONOMETRA*
RAMN ANTONIO ROSALES LVAREZ**
JORGE ALEXANDER BONILLA LONDOO
***
Resumen
La econometra es una de las importantes aplicaciones de estadstica matemtica, y una herramienta fundamental en investigacin econmica, el diseo y anlisis de poltica. El presendocumento desarrolla para aquellos que inician el estudio de
economa, los elementos tericos bsicos sobre la modelacieconomtrica. Se aborda el modelo clsico de regresin lineal y ssupuestos, y la manera de efectuar hiptesis. Este documento considera un desarrollo preliminar para la posterior iniciacin temas ms avanzados de econometra.
Palabras claves: anlisis de correlacin, mnimos cuadradordinarios, modelo economtrico, pruebas de hiptesis.
Clasificacin JEL: C01, C10 y C20.
-
7/26/2019 CEDEAC-3_1.pdf
5/101
INTRODUCTION TO ECONOMETRICS
Abstract
Econometrics is one of the most important applications tomathematical statistics and a fundamental tool in the economic resand in the design and analysis of economic policy. The pdocument develops the basic theory concepts of the economodeling for those that begin the study of economics. The specificassumptions, estimation, hypothesis testing and predictions fo
classical regression model are the principal topics presented in thisThe concepts, the tools and their applications developed indocument are relevant for tackling many practical problems in toworld and for the introduction in advanced econometric courses.
Key words: correlation analysis, least squares estimation, econommodel, hypothesis tests.
JEL classification: C01, C10 y C20
-
7/26/2019 CEDEAC-3_1.pdf
6/101
TABLA DE CONTENIDO1.LAMODELACINYLAECONOMETRA ......................................................................
1.1. Mtodos Cuantitativos de la Economa. .......... ........... .......... ........... .......... .......... ...1.2. Definiciones de la Econometra....... ........... .......... ........... ........... .......... ........... .......1.3. Objetivo de la Econometra...................................................................................1.4. El Procedimiento Economtrico........... .......... ........... .......... ........... .......... ........... ...1.5. El Modelo .......... ........... ........... .......... ........... ........... .......... ........... ........... ........... ....1.6. El Modelo Econmico ........... .......... ........... .......... ........... .......... ........... .......... ........
1.7. El Modelo Economtrico .......... ........... .......... ........... .......... ........... .......... ........... ....1.8. Elementos que componen el Modelo .............. .......... ........... .......... ........... .......... ....1.9. Clasificacin de las Variables................................................................................1.10. Clasificacin de las Ecuaciones............................................................................1.11. Clasificacin de los Modelos..................................................................................
2.ORGANIZACINDEDATOSYESTADSTICADESCRIPTIVA ...................................2.1. Objetivos de la Estadstica...... ........... .......... ........... ........... .......... ........... .......... ...........
2.2. Divisiones de la Estadstica..........................................................................................
2.4. Poblacin y Muestra .....................................................................................................
2.5. Parmetros Poblacionales y Estadsticos Muestrales ........... ........... .......... ........... ........
2.6. Medidas de Tendencia Central y de Dispersin ........... .......... ........... ........... .......... .......
2.7. Mtodos y Diagnsticos Grficos. .......... .......... .......... .......... ........... .......... .......... ..........
2.8 Ejercicios de computador ..............................................................................................
3.ANALISISDECORRELACION .........................................................................................3.1. Diagrama de Dispersin................................................................................................
3.2. Coeficiente de Correlacin Lineal.................................................................................
3.3. Pruebas de Hiptesis ....................................................................................................
3.4. Ejercicios de computador .............................................................................................
4.REGRESIONSIMPLELINEALYNOLINEAL.................................................................4.1. Objetivo del anlisis de regresin ................................................................................4.2. Funcin de regresin muestral y poblacional ...............................................................
4.3. Supuestos del modelo de regresin................................................................................
4.4. Mtodo de estimacin de mnimos cuadrados ordinarios.............................................
4.5. Varianzas y errores estndar de los estimadores .......... ........... .......... .......... .......... .......
4.6. Intervalos de confianza.................................................................................................
4.7. Pruebas de hiptesis .....................................................................................................
4.8. Prediccin.....................................................................................................................
4.9. El Coeficiente de Determinacin..................................................................................
4.10. Modelos de regresin simple no lineal en las variables .......... .......... ........... .......... .....4.11. Ejercicios de Computador ...........................................................................................
5.REGRESIONMULTIPLELINEALYNOLINEAL ...........................................................5.1. Expresin del modelo en forma matricial......................................................................
5.2. Supuestos del modelo....................................................................................................
5.3. Mtodo de estimacin de mnimos cuadrados ordinarios.............................................
5.4. Matriz de varianzas y covarianzas de los estimadores .......... ........... .......... .......... .........
-
7/26/2019 CEDEAC-3_1.pdf
7/101
6.2. Heteroscedasticidad........................................................................................................
6.3. Autocorrelacin ............................................................................................................
6.4. Error de especificacin..................................................................................................
6.5. No Normalidad de los errores .......................................................................................
6.6. Ejercicios de computador. ............................................................................................
7.INTRODUCCINAVARIABLESCUALITATIVAS .......................................................7.1. Regresin con variables independientes cualitativas ...................................................
7.2. Regresin con variable dependiente cualitativa ......... ........... ........... .......... ........... ........
-
7/26/2019 CEDEAC-3_1.pdf
8/101
INTRODUCCIN
El curso de Econometra hace parte del rea de mtodos cuantitativos eny se constituye en una herramienta importante en la investigacin eco
diseo y anlisis de poltica. El contenido y el desarrollo del curso s
introductorio y su inters es la aplicacin de los conceptos tericos. El c
proporcionarle al estudiante las bases iniciales para el manejo de los
modelos economtricos, los elementos necesarios para el manejo de la inanlisis de resultados e interpretacin de las salidas del computador, y fa
en sus aplicaciones, tales como la investigacin y la evaluacin de m
poltica.
El documento se encuentra dividido en siete secciones. La primera p
definicin de la econometra, sus objetivos, el concepto del mo
caracterizacin. La segunda trata de la organizacin de datos y la
descriptiva. La seccin tres aborda los aspectos bsicos del a
correlacin. La seccin cuatro presenta el modelo formal de regre
simple. La quinta seccin muestra el modelo de regresin lineal mltiple
seccin presenta la teora relacionada con el incumplimiento de los supmodelo. La seccin siete efecta una introduccin al anlisis tran
regresin con variables independientes cualitativas y de variable d
cualitativa. Al final del documento se incluye un anexo que de
procedimiento general de manipulacin de datos en el paquete ec
Eviews 4.1.
1. LA MODELACIN Y LA ECONOMETRA
1 1 Mtodos Cuantitativos de la Economa
-
7/26/2019 CEDEAC-3_1.pdf
9/101
La investigacin economtrica se inici con el anlisis estadstico de la
por Cournout (1838) y Marshall (1890). Posteriormente Tinbergen en 19
aporte a la econometra mediante el estudio del anlisis de los ciclos ec
Sin embargo, en el periodo de 1943-1950 la econometra comienza su
con los trabajos de la Comisin Cowles. La hiptesis bsica es:
econmicos se generan por sistemas de relaciones que son, e
estocsticos, dinmicos y simultneos".
La econometra hoy en da es una herramienta muy importante para e
comportamiento de los fenmenos econmicos. Su desarrollo ha sido
debido a la dinmica que han mostrado los adelantos en el anlisis m
en mtodos estadsticos y de computacin.
1.2. Definiciones de la Econometra
Dado que en la econometra se asocian la Teora Econmica, las Matem
Estadstica, diferentes definiciones han sido planteadas por los autores,
se tratan de relacionar estas tres reas del conocimiento.
G. Tintner: la econometra consiste en la aplicacin de la teora
matemtica y de los mtodos estadsticos a los datos econmicos para
resultados numricos y verificar los teoremas.
W.C. Hood y T.C. Koopmans: la econometra es una rama de la econo
la teora econmica y los mtodos estadsticos se fusionan en el an
datos numricos e institucionales.
-
7/26/2019 CEDEAC-3_1.pdf
10/101
Estas tres definiciones nos indican que la econometra es cuantitativa
en estrecho contacto con la realidad.
R. Frisch: la econometra a pesar de nutrirse de la Teora Econm
Matemticas y de la Teora Estadstica, no es ni "Estadstica Econ
"Teora Econmica", ni "Economa Matemtica".
O. Lange: la econometra es la ciencia que trata de la determinacin, po
estadsticos, de leyes cuantitativas concretas que rigen la vida econ
combina la Teora Econmica con la Estadstica Econmica y trata d
mtodos matemticos y de inferencia, una expresin concreta a
generales establecidas por la teora.
1.3. Objetivo de la Econometra
El objetivo de la econometra es expresar la teora econmica e
matemticos, verificar dicha teora por mtodos estadsticos, medir el
una variable sobre otra, predecir los sucesos futuros, o proveer recomede la poltica econmica.
1.4. El Procedimiento Economtrico
El anlisis economtrico involucra las siguientes etapas principales:
1. Especificacin del modelo: consiste en usar la teora, leyes
particulares econmicas, para investigar las relaciones entre
agentes de la economa.
-
7/26/2019 CEDEAC-3_1.pdf
11/101
verificacin tiene un papel muy importante dado que examina si la
cuantificada puede utilizarse adecuadamente con base en
econmica.
4. Prediccin: el modelo obtenido puede ser utilizado para la pred
desarrollo de muchas aplicaciones. Pueden surgir nuevos
tericos, y generarse implicaciones de poltica econmica a pa
conclusiones del modelo.
1.5. El Modelo
Un modelo es una representacin simplificada de la realidad. Los inves
los profesionales de diversas reas del conocimiento trabajan
esquemas, los cuales les permiten estudiar el comportamiento de un fen
inters.
A. Rosenblueth se refiri a los modelos cientficos de la siguiente m
construccin de modelos para los fenmenos naturales es una de
esenciales de la labor cientfica. Mas an, se puede decir que toda la
es sino la elaboracin de un modelo de la naturaleza. La intencin de el resultado de la investigacin cientfica, es obtener conocimiento y el
alguna parte del Universo".
1.6. El Modelo Econmico
Se denomina modelo econmico a cualquier conjunto de supuestos queuna economa o parte de una economa. En este sentido, la teora econm
entenderse como la formulacin y anlisis de modelos cuantitat
esquematizacin requiere un planteamiento particular de las interrelacione
-
7/26/2019 CEDEAC-3_1.pdf
12/101
2. Que la representacin sea simplificada, y
3. Que se haga en forma matemtica.
Al definir un modelo econmico como un conjunto de relaciones m
(usualmente ecuaciones) que expresan una teora econmica, no
necesariamente la especificacin concreta del tipo de funcin que re
variables involucradas. Un ejemplo de un modelo econmico es:
( )kXXXfY ,,, 21 K= (1)
donde Y = cantidad producida; Xi= cantidad del i-esimo insumo, i=1,2,,k
Aunque esta ecuacin, denominada funcin de produccin, no pre
estructura muy particular del arreglo de las variables X sobre Y, expres
general la relacin entre el producto y los insumos, y que son las
utilizadas de factores las que determinan la magnitud producida, y no lo co
Para establecer una forma concreta de la especificacin de un modeprecisar el tipo de relacin que existe entre las variables econmicas. Un
ello es una representacin lineal:
kkXXXY ++++= L22110 (2)
Est relacin puede ser correcta. Sin embargo, cuando no se conoce si e
es determinante en forma lineal sobre Y, puede ocurrir error de esp
Tambin se debe resaltar que este modelo hace nfasis en un nmero re
-
7/26/2019 CEDEAC-3_1.pdf
13/101
1.7. El Modelo Economtrico
El modelo economtrico es el modelo econmico que contiene las espec
necesarias para su validacin emprica. Es usual concebir el modelo ec
como un modelo conformado por una parte determinstica y una parte
trmino de error. El modelo economtrico para el ejemplo expuesto en
(2) tomara la forma:
+++++= kkXXXY L22110 (3)
donde kkXXX ++++ L22110 es la parte determinstica y es el
error o componente estocstico.
Los modelos economtricos por considerar un trmino aleatorio en su
hacen parte de los modelos probabilsticos. Una diferencia fundamenta
modelos econmicos y los modelos economtricos, es que los primeros s
validos, dado que han sido establecidos por la teora econmica y solo p
expresin general de ella. Por otro lado, los modelos economtricos
estado de las cosas o de una situacin especfica y aunque tiene sus b
teora econmica sus resultados pueden cambiar de un estudio a otro.
Los modelos economtricos se prueban a travs del uso sistem
informacin estadstica. Un modelo economtrico permite la inferencia epartir de los datos recopilados, por lo cual ste debe incorporar los
aleatorios que se suponen intervienen en la determinacin de las obs
Estas ltimas pueden constituyen una muestra si la aleatoriedad de lo
-
7/26/2019 CEDEAC-3_1.pdf
14/101
-
7/26/2019 CEDEAC-3_1.pdf
15/101
d) Forma funcional: un investigador puede postular que la relacin
variables de un modelo es de tipo lineal; no obstante, otro investiga
formular una especificacin funcional distinta, por ejemplo cuadrtic
otra fuente de error en la elaboracin del modelo, pues no se puede
certeza sobre su forma funcional an cuando la teora seale algunas
para corregirlo.
De acuerdo con lo anterior un procedimiento sugerido para llevar
formulacin de un modelo economtrico es el siguiente: 1) Delimitar el fe
estudio; 2) Tener claridad sobre el objetivo del modelo; 3) Seleccionar la
relevantes; 4) Establecer las relaciones entre las variables, y 5) Con
objetivo planteado, estructurar una especificacin y estimar el modeloinformacin y base de datos de las variables.
1.8. Elementos que componen el Modelo
Los elementos que componen el modelo son: las variables, las ecuac
parmetros.
Una variable es una caracterstica de una poblacin que puede tomar
valores. Solo son de inters aquellos valores de la variable que tienen un
econmico. Por ejemplo las variables: precio, produccin, ingreso, y c
insumo utilizado tienen regin econmicamente factible en los nmepositivos.
Una ecuacin es una igualdad conformada por una expresin matem
-
7/26/2019 CEDEAC-3_1.pdf
16/101
miden el efecto de las fluctuaciones de estas variables sobre la variable de
Los parmetros cumplen un papel muy importante en el modelo, ya que s
el investigador formula pruebas de hiptesis. Al observar la ecuac
coeficiente que no acompaa ninguna variable independiente se le co
constante paramtrica o intercepto; en algunos casos su magnitud
interpretacin econmica.
1.9. Clasificacin de las Variables
Desde el punto de vista econmico las variables se pueden clasificar com
endgenas y exgenas. Las variables endgenas son aquellas cuyos
determinan o calculan dentro del modelo. En contraste, las variables ex
caracterizan por que sus valores estn determinados fuera del modelo.
Tambin existen otras clasificaciones de las variables; desde el e
inferencia estadstica: variables aleatorias discretas y continuas, y de acue
rol en expresin matemtica: variables dependientes e independientes, e
explicativas. Otro grupo de variables lo constituyen las variables predeter
este pertenecen las variables exgenas con o sin rezago (o retardo) y las rezagadas. Una denominacin adicional son las variables espera
expectativas, las cuales son gran utilidad en la formulacin de modelos din
1.10. Clasificacin de las Ecuaciones
Bajo la perspectiva econmica las ecuaciones se pueden clasificar de l
forma:
-
7/26/2019 CEDEAC-3_1.pdf
17/101
hacen a los modelos. Ejemplos de ecuaciones de comportamie
demanda, la oferta, la inversin, el consumo, el ahorro, etc.
b) Ecuaciones tecnolgicas: El ejemplo tpico de una ecuacin tecno
funcin de produccin, la cual refleja el estado de la tecnologa de
de un pas.
c) Ecuaciones institucionales: Reflejan un mandato o voluntad del go
los estamentos que toman las decisiones en un pas. Ejemplo de
institucionales son: oferta monetaria, impuestos, subsidios, etc.
d) Ecuaciones de definicin: Son ecuaciones o identidades mate
econmicas vlidas por definicin. Generalmente son relaciones conmayora de los ejemplos de este tipo de ecuaciones se encuent
cuentas macroeconmicas. Una ecuacin de definicin es activo
capital, o la ecuacin de identidad macroeconmica del Producto Nac
para una economa con tres sectores.
e) Ecuaciones de equilibrio: Estas garantizan que el modelo tenga
Ejemplos de estas ecuaciones son: oferta igual a demanda, o aho
inversin.
1.11. Clasificacin de los Modelos
Segn la cobertura econmica o subdisciplina, los modelos p
microeconmicos o macroeconmicos. De acuerdo con el nmero d
independientes, los modelos se dividen en simples y mltiples. Si se c
-
7/26/2019 CEDEAC-3_1.pdf
18/101
2. ORGANIZACIN DE DATOS Y ESTADSTICA DESCRIPTIVA
2.1. Objetivos de la Estadstica
La estadstica es el lenguaje universal de la ciencia, tanto en sus ramas f
sociales. La estadstica es un instrumento formal que utilizado de maneracon precisin, permite describir resultados y adoptar decisiones respec
estos evidencian empricamente. La estadstica en su aplicacin sigue
cientfico y se define como la ciencia de recolectar, clasificar, describir e
datos numricos, es el lenguaje universal de la ciencia y el estudio de los
aleatorios. Dentro de sus objetivos fundamentales se encuentra la estimaco ms caractersticas desconocidas de una poblacin, la realizacin de in
pruebas de hiptesis.
Se considera fundador de la estadstica a Godofredo Achenwall, econom
(1719-1772), quien siendo profesor de la universidad de Leipzig, escrib
descubrimiento de una nueva ciencia que llam estadstica (palabra d
Staat que significa gobierno) y que defini como el conocimiento prof
situacin respectiva y comparativa de cada estado. Desde su a
estadstica se ha enriquecido continuamente con los aportes de m
filsofos y cientficos.
La teora general de la estadstica es aplicable a cualquier campo cientf
se toman observaciones. El estudio y aplicacin de los mtodos estad
necesarios en todos los campos del saber sean estos de nivel tcnico o
-
7/26/2019 CEDEAC-3_1.pdf
19/101
2.2. Divisiones de la Estadstica
La estadstica puede dividirse ampliamente en dos reas: estadstica d
deductiva y estadstica inferencial o inductiva. La estadstica descriptiva
en la que la mayora de la personas piensan cuando escuchan
"estadstica". Esta es el rea de la estadstica dedicada a la r
presentacin, y descripcin de datos numricos, cuyas conclusionesmismos no van ms all de la informacin que estos proporcionan. Por o
inferencia estadstica es el mtodo y conjunto de tcnicas que se u
obtener conclusiones ms all de los lmites del conocimiento aportado po
en otras palabras, busca obtener la informacin que describe y carac
poblacin a partir de los datos de una muestra.
2.3. Tipos de Variables
En estadstica cuando se recopila informacin, los datos se registran por
observacin o medicin de una variable aleatoria que proviene de la rea
un experimento. La variable se llama aleatoria, debido a la existencia
resultados posibles del experimento y que no hay certeza total de que a
uno de los resultados se obtenga siempre con una probabilidad del 10
tanto, el hecho que una variable tome un valor particular es considerado
aleatorio.
An, cuando las observaciones resultantes no siempre son numricas
experimentos, estas pueden cuantificarse asignndoles nmeros que
representen una categorizacin. Por esta razn, el inters se centra ge
-
7/26/2019 CEDEAC-3_1.pdf
20/101
infinito) y pueden arreglarse en una secuencia que corresponde uno a u
enteros positivos; mientras las segundas toman valores dentro de un i
recta de los nmeros reales. Si se tienen dos variables aleatorias, por
nmero de hijos por familia y el consumo de energa elctrica; la p
encuentra dentro del grupo de variables aleatorias discretas, y la segunda
conjunto de variables aleatorias continuas.
2.4. Poblacin y Muestra
El concepto de poblacin y muestra es muy importante en la inferencia
por lo que es conveniente presentar su definicin:
Poblacin: Es la coleccin completa de individuos, objetos o mtienen una caracterstica en comn. La poblacin debe
cuidadosamente en cada estudio cientfico de acuerdo con e
objetivo de la investigacin.
Muestra: Es un subconjunto de la poblacin; es decir, ella se c
algunos de los individuos, objetos o medidas de una poblacin.
es obtenida con el propsito de investigar, a partir del conocimie
caractersticas particulares, las propiedades de toda la poblacin.
primordial la seleccin de una muestra representativa de la po
necesario formalmente enfatizar en la aleatoriedad de la muestr
sobre la manera de seleccionar los elementos de la pob
conformarn la muestra. La palabra aleatoriedad para este caso
garantizar que cada elemento de la poblacin tenga la misma prob
ser elegido Se considera que una muestra es ms eficien
-
7/26/2019 CEDEAC-3_1.pdf
21/101
Bogot. Para este caso, la poblacin corresponde a todos los hogares de
mientras que la muestra estar constituida por aquellos hogares que p
seleccionados de manera aleatoria, como un grupo representativo de tod
habitan en Bogot.
2.5. Parmetros Poblacionales y Estadsticos Muestrales
El trmino parmetro es utilizado para referirse a una caracterstica descla poblacin, que desea estimarse o evaluarse a travs de una prueba de
que describe total o parcialmente su funcin de probabilidad o funcin d
de probabilidad. Por otro lado, el estadstico es una medida numr
caracterstica poblacional obtenida a partir de una muestra. Cabe ano
estadsticos son fundamentales en la realizacin de inferencias. El valor la varianza son ejemplos de tales medidas.
2.6. Medidas de Tendencia Central y de Dispersin
Las medidas de tendencia central se encuentran dentro de las medidas
que se emplean comnmente para describir conjuntos de datos. La tendede un conjunto de datos es la disposicin de stos para agruparse, ya se
del centro o de ciertos valores numricos. A este grupo de medidas pe
media, la mediana y la moda.
Existen otro tipo de medidas numricas denominadas medidas de dispeobjetivo es explorar la variabilidad de los datos, es decir qu tan dispers
observaciones en un conjunto de datos. Dentro de estas medidas se enc
varianza, la desviacin estndar, el recorrido o rango, entre otras.
-
7/26/2019 CEDEAC-3_1.pdf
22/101
luego, segn el inters del investigador presentarlos agrupados, en form
o intervalos. Es importante tener en cuenta que las fuentes de informacin
secundaria pueden almacenar sus datos sin agrupar o como datos a
Con base en lo anterior, es relevante conocer el procedimiento de clc
medidas numricas para ambos casos. Las expresiones algebraicas que
la forma de obtener las medidas de tendencia central y de dispersin se m
la Tabla No. 1.
Con los datos agrupados de una variable aleatoria es posible construir h
de frecuencias, los cuales pueden ser comparados con las representacion
de distribuciones de probabilidad ya conocidas de variables aleatorias. En
de los casos, estos histogramas se comparan con la distribucin normal,
inspeccin es posible identificar sesgos o apuntamientos en la distribucin
-
7/26/2019 CEDEAC-3_1.pdf
23/101
TABLA No. 1. MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN
Medida Numrica Datos sin agrupar Datos agrupados
Media=
=
n
i
i
nx
x1
=
=
k
i
ii
nxf
x1
, donde=
=
k
i
n
Donde fi es la frecuencia absolutaclase i, para todo i = 1,2,,k claintervalos.
Mediana
Valor central de ladistribucin (el 50% de losdatos se encuentran porencima de este valor).
)( mfjcLMediana +=
DondeL es el lmite inferior de ladonde se encuentra la mediana, fmfrecuencia de esa clase, ces la londe ese intervalo y j es el nmeobservaciones en esta clase nece
para completar un total de n/2.
ModaValor ms frecuente
Casos: Punto medio de la clase
frecuencia ms alta. El promedio de los p
medios de las consecutivas con frecueiguales ms altas.
Puntos medios de las clasconsecutivas con frecueiguales ms altas.
Medida Numrica Datos sin agrupar Datos agrupados
Varianza)()( 12
1
2
=
nxxsn
i
i
1
2
1
1
2
2
=
==
n
n
x
x
s
n
i
in
i
i
1
2
12
12
=
=
=
n
n
xf
xf
s
k
i
ii
i
k
i
i
Desviacin Estndar)1()( 2
1
2 == =
nxxssn
i
i
2
n 1
12
12
==
==
n
n
xf
xf
ss
k
i
i
i
k
i
i
-
7/26/2019 CEDEAC-3_1.pdf
24/101
2.8 Ejercicios de computador
Considrese el siguiente conjunto de datos hipotticos de un estudio de
TABLA No. 2. DATOS HIPOTTICOS EN EL ESTUDIO DE DEMANDA DEL B
No. deObs.
DX PX PZ PW I
1 37 7 5 7 62 38 6 7 5 8
3 18 10 3 13 34 50 4 9 4 185 22 9 3 11 3
6 55 2 12 3 217 42 8 5 8 28 29 8 5 9 199 63 2 18 3 2010 13 12 2 15 611 60 3 9 5 12
12 62 3 10 5 513 36 6 5 6 26
Donde:DX: es la demanda del bien XPX: es el precio del bien XPZ: es el precio del bien Z
PW: es el precio del bien WI: es el ingresoESTADSTICAS DESCRIPTIVAS
MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSION Y NORMALIDA
DX PX PZ PW Mean 40.38462 6.153846 7.153846 7.230769 11Median 38.00000 6.000000 5.000000 6.000000 8.Maximum 63.00000 12.00000 18.00000 15.00000 26Minimum 13.00000 2.000000 2.000000 3.000000 2.Std. Dev. 16.89940 3.210560 4.431820 3.811252 8.Sum 525.0000 80.00000 93.00000 94.00000 14Observations 13 13 13 13
-
7/26/2019 CEDEAC-3_1.pdf
25/101
3. ANALISIS DE CORRELACION
3.1. Diagrama de Dispersin
Una primera aproximacin con el fin de detectar algn tipo de relacin
variables (X y Y), consiste en ubicar los pares de valores de en un plano
hasta conformar la nube de puntos. Un diagrama de dispersin es la rep
grfica de todos los pares de valores en sistema de ejes de coordenadas.
El diagrama de dispersin no es un mtodo estadstico como tal, ms b
dentro de los llamados mtodos de "inspeccin preliminar", sin embar
manera simple de visualizar si existe alguna posible relacin entre las v
diagrama de dispersin puede presentar diferentes formas, tales como
presentan en las figuras siguientes:
-
7/26/2019 CEDEAC-3_1.pdf
26/101
la figura b) seala una relacin lineal de tipo inversa. Las figura c) y d
posibles relaciones cuadrticas entre las variables, exhibiendo un m
mnimo para la primera y segunda de estas figuras, respectivamente. L
mostrara una tendencia de tipo cbico entre las variables. La figura f) es
en el cul no puede identificarse por inspeccin algn tipo de relaci
variables, pues aparentemente ella no existe.
3.2. Coeficiente de Correlacin Lineal
Si bien es cierto que el diagrama de dispersin permite visualizar la exis
de una posible relacin lineal entre las variables, el investigador debe so
conclusiones en trminos de alguna medida estadstica. El coeficiente de
lineal es un estadstico que mide el tipo de relacin (signo) y la fuerza (m
coeficiente) de asociacin lineal entre dos variables. Usualmente el coe
correlacin lineal, representado por la letra r, bajo las condiciones de u
aleatorio ideal se considera una buena representacin del coeficiente de
poblacional (). La frmula para calcular r es la siguiente:
( )
YX
XYSS
YXCovr
,^
=
( )( )
( ) ( )
=
22yyxx
yyxxr
ii
ii
XY
( )( )
( ) ( )
( )
( )[ ] [
=
=
2222
2
2
2 yxnx
yxnyx
n
yy
n
xx
nyxyx
r
ii
ii
i
i
i
i
ii
ii
XY
-
7/26/2019 CEDEAC-3_1.pdf
27/101
covarianza, la cual mide la asociacin lineal absoluta entre las va
denominador es siempre positivo dado que en l se encuentran
cuadrados.
Si r tiende a 1 como seria el caso de la figura a) estara indicando una re
positiva o directa entre las variables. Si r tiende a -1, existira una rel
negativa o inversa entre las variables. Cuando r es exactamente igual
relacin lineal es perfecta, siendo posible ajustar todos los puntos a travlnea recta con pendiente positiva (ver figura g) o negativa (ver
respectivamente. Si r es cero no hay relacin lineal entre las variables
horizontal une todos los pares de valores localizados en el diagrama de
(ver figura i).
La ventaja principal del coeficiente de correlacin lineal es su fcil
interpretacin. Sin embargo, cuando las variables presentan algn tipo de lineal, r no puede medir esta clase de asociacin. As mimo, dado que
dependencia lineal solo entre pares de variables, no proporciona informa
la asociacin simultnea de ms de dos variables.
-
7/26/2019 CEDEAC-3_1.pdf
28/101
1. r es de naturaleza simtrica. Esto indica que el coeficiente de
entre X y Y es igual al coeficiente de correlacin entre Y y X.
2. r es independiente del origen y la escala. Si se define X*i= aXi+ c
+ d, donde a>0, b>0, y c y d son constantes, entonces r en
(variables transformadas) es igual al r entre X y Y (variables origina
3. Si X y Y son variables estadsticamente independientes, el coecorrelacin lineal entre X y Y es cero. No obstante, si r es ce
implica necesariamente que X y Y sean estadsticamente independ
Una de las condiciones para que el coeficiente de correlacin se pueda
que las variables sean continuas y con distribucin normal. En caso de qse cumpla como es el caso de variables discretas se debe buscar o
estadstica para evaluar la dependencia entre las variables. Una alternativ
son las tablas de contingencia.
3.3. Pruebas de Hiptesis
La formalidad estadstica sugiere realizar pruebas de hiptesis sobre los
poblacionales basndose en los estadsticos encontrados. Por ejemplo, a
el coeficiente de correlacin lineal estimado entre dos variables sea d
cero, esto no es suficiente para afirmar que el parmetro poblaciona
realidad distinto de cero, pues requiere recordarse que las inferencias s
con base en informacin muestral y existe un margen de error cuando se
tipo de procedimiento. A continuacin se presenta el esquema de
hiptesis para el coeficiente de correlacin lineal cuando el investiga
-
7/26/2019 CEDEAC-3_1.pdf
29/101
Paso 1: Planteamiento de la hiptesis:
Ho: 0
Ha: 0
Paso 2: Nivel de significancia. Representa el nivel de error mxim
para realizar la prueba. Este es establecido o defin
investigador y se denota con la letra . Los valores de s
con los cuales se trabajan pueden cambiar de una disciplina
otra. Bajo situaciones donde los experimentos tienen una al
control, usualmente se trabaja con niveles del 1% y 5%,
significativo y significativo, respectivamente). En las investig
las ciencias sociales, donde existe un limitado grado de co
las variables, pueden encontrarse significancias estadsticas
en algunas ocasiones hasta un 20%.
Paso 3: El estadstico de prueba. Es una medida estadstica calcul
de informacin muestral o experimental para llevar a caboPara el caso de correlacin lineal simple, el estadstico de
define como:
222
1
2
= nC t
r
nrt ,.~
donde r es el coeficiente de correlacin lineal muestral, n es
de la muestra, n-2 los grados de libertad de la prueba y
-
7/26/2019 CEDEAC-3_1.pdf
30/101
Paso 4: Regiones de decisin. Dado que la hiptesis alterna
smbolo , se trabaja con los dos lados de la distribucin
de rechazo estar repartida en los extremos de la f
probabilidad, con un valor de 2 a cada lado. Los valo
lmites derecho e izquierdo que limitan las regiones de
determinan mediante el uso de la tabla t con sus respecti
de libertad. Estos valores de t se denominan estad
contraste. La figura j muestra la regin de rechazo
aceptacin (AHo) de la hiptesis nula de esta prueba:
Paso 5: Criterio de decisin y conclusin del investigador. Se debel estadstico calculado o de prueba Ct contra el
tabulado 22 nt , . El criterio de decisin esta basado en
calculado es mayor que el t de tablas positivo, cae en la
rechazo del lado derecho de la distribucin y la decisin q
tomar es rechazar la hiptesis nula ( 0 ); 2) si el t ca
menor que el t de tablas negativo, el t calculado cae en la
rechazo del lado izquierdo y la decisin igualmente es r
hi t i l ( 0 ) 3) i l t l l d t
-
7/26/2019 CEDEAC-3_1.pdf
31/101
los resultados de la prueba, y plantea las recome
pertinentes.
La significancia estadstica del coeficiente de correlacin en la prueba de h
afecta por el tamao de la muestra (n) o mejor an por los grados d
lgicamente a mayor tamao de la muestra el valor de r tiene mayor confi
se encuentra un valor de r relativamente bajo y n es grande, es posible qu
significativo al comparar el estadstico de prueba con el de contraste o
alternativamente se puede encontrar un r alto pero no significativo estaddebido a que n es muy pequeo y por consiguiente el nmero de grados
es bajo.
3.4. Ejercicios de computador
Usando los mismos datos del ejemplo hipottico de demanda plante
captulo anterior, a continuacin se presenta el diagrama de dispersin,
de covarianzas y de correlacin de las variables:
DIAGRAMAS DE DISPERSIN
-
7/26/2019 CEDEAC-3_1.pdf
32/101
MATRIZ DE COVARIANZAS
VARIABLE DX PX PZ PW DX 263.6213 -47.98225 60.01775 -53.78107 47PX -47.98225 9.514793 -11.63905 10.73373 -12PZ 60.01775 -11.63905 18.13018 -12.65089 16PW -53.78107 10.73373 -12.65089 13.40828 -16
I 47.89941 -12.99408 16.69822 -16.18343 63
MATRIZ DE CORRELACION
VARIABLE DX PX PZ PW DX 1.000000 -0.958056 0.868137 -0.904592 0.PX -0.958056 1.000000 -0.886170 0.950308 -0.PZ 0.868137 -0.886170 1.000000 -0.811397 0.PW -0.904592 0.950308 -0.811397 1.000000 -0.
I 0.371175 -0.530011 0.493410 -0.556062 1.
4. REGRESION SIMPLE LINEAL Y NO LINEAL
4.1. Objetivo del anlisis de regresinEl objetivo fundamental del anlisis de regresin es el estudio de la depe
una variable, llamada explicada, de una o ms variables llamadas exp
anlisis de regresin se apoya en el concepto matemtico de funcin, en
tiene una variable dependiente (variable explicada) y un conjunto d
independientes (variables explicativas) con el fin de estimar los coeparmetros de dicha funcin y efectuar predicciones (encontrar el valor e
la variable dependiente cuando se construyen escenarios reflejados en
que toman las variables independientes).
-
7/26/2019 CEDEAC-3_1.pdf
33/101
1. Especificacin: corresponde a la etapa en que el investigador defi
funcional del modelo que desea utilizar para explicar la variable d
siguiendo los lineamientos de la teora econmica.
2. Estimacin: durante esta se calculan los valores numricos de los c
o parmetros del modelo; para ello es necesario apoyarse en los m
estimacin y la aplicacin de rutinas de computador usandoestadsticos (Eviews).
3. Verificacin: consiste en corroborar la validez terica y estadstica
es decir, evaluar si los signos obtenidos para los coeficientes esti
los esperados y si el modelo cuenta con propiedades estadsticas (buen ajuste, alta relevancia y dependencia).
4. Prediccin: muchas veces los modelos elaborados por los econ
tienen solo como objeto mostrar la relacin entre variables y la m
dicha relacin entre estas a travs de una forma funcional, sino qlos modelos tienen implicaciones en trminos de prediccin. En e
puede encontrarse el efecto esperado sobre la variable depend
diversos valores de las variables independientes fuera del rango m
este procedimiento la inferencia estadstica juega un papel importa
4.2. Funcin de regresin muestral y poblacional
La lnea de regresin XXYE / es la unin de los p
-
7/26/2019 CEDEAC-3_1.pdf
34/101
grfica de la lnea de regresin poblacional cuando el gasto en consumo d
se desea explicar por el ingreso.
Por otro lado, cuando la lnea de regresin es construida con los datos
recibe el nombre de funcin de regresin muestral. Como todo proced
inferencia estadstica, lo que se pretende es que la muestra sea
representacin de la poblacin. En este sentido, la funcin de regresi
constituye una representacin de la funcin de regresin poblacional. A
en la prctica, las muestras de variables aleatorias son usadas para in
las caractersticas de la poblacin.
La siguiente grfica presenta un ejemplo de dos lneas de regresin mu
el gasto en consumo semanal de un hogar versus el ingreso.
-
7/26/2019 CEDEAC-3_1.pdf
35/101
4.3. Supuestos del modelo de regresin
Los supuestos del modelo junto con los mtodos de estimacin carac
resultados obtenidos de la regresin (coeficientes, pruebas de hiptesis
de confianza, prediccin, etc.). En particular, los supuestos ms impo
modelo recaen sobre el trmino del error. Teniendo en cuenta que la
regresin poblacional puede expresarse tambin de la forma iY 1
modelo de regresin lineal cuenta con los siguientes supuestos:
Supuesto 1: El modelo de regresin es lineal en los parmetros:
iii uXY ++= 21
Supuesto 2: Los valores de X son fijos en muestreos repetitivos. Tc
esto consiste en que X se supone no estocstica.
Supuesto 3: El valor medio de la perturbacin iu es igual a cero.
-
7/26/2019 CEDEAC-3_1.pdf
36/101
Por lo tanto los factores que no estn incluidos en el modelo
consiguiente, estn incorporados en iu , no afectan sistemticamente el
media de Y.
Supuesto 4: Homoscedasticidad o varianza constante de iu . Dado el v
la varianza de iu es constante para todas las observaciones. Es
varianzas condicionales de iu son idnticas.
2
2
2
]/[
]/[]/[
]/][[]/[
=
=
=
ii
iiii
iiiii
XuVar
XuEXuVar
XuEuEXuVar
La anterior ecuacin, establece que la varianza de iu para cada iX
nmero positivo constante igual a 2 . Ntese que el supuesto 4 impl
varianzas condicionales de iY tambin son homoscedsticas.
2]/[ =ii XYVar .
En contraste, si la varianza condicional de la poblacin Y varia co
situacin se conoce como Heteroscedasticidad, lo cual puede escribirse2]/[ iii XuVar =
Obsrvese el subndice sobre 2 en esta expresin indica que la var
poblacin Yahora no es constante.
Supuesto 5: No auto correlacin entre las perturbaciones. Dados d
-
7/26/2019 CEDEAC-3_1.pdf
37/101
-
7/26/2019 CEDEAC-3_1.pdf
38/101
Cuando el modelo de regresin cumple con los anteriores supuestos se
como modelo de regresin clsico y tiene las siguientes propie
estimadores son MELI (mejores estimadores lineales insesgados). Si se
supuesto de normalidad de los errores, los estimadores son ME
estimadores insesgados) y por lo tanto seguirn distribucin normal. C
intervalos de confianza, las predicciones y las pruebas de hiptesis tien
estadstica.
4.4. Mtodo de estimacin de mnimos cuadrados ordinarios
El objetivo principal de la etapa de estimacin es encontrar los valo
parmetros muestrales. El mtodo de estimacin ms popular recibe el
mnimos cuadrados ordinarios (MCO). El criterio de este mtodo c
proporcionar estimadores de los parmetros que minimicen la sum
cuadrados de los errores. Operativamente el proceso es construir u
objetivo en trminos de la suma de los cuadrados de los errores y
optimizacin (condiciones de primer orden - C.P.O., y condiciones d
orden - C.S.O.) obtener las frmulas de clculo de los estimadores.
Debido a que la funcin de regresin poblacional no se puede
directamente, los estimadores de mnimos cuadrados ordinarios se
partir de la funcin de regresin muestral (FRM). La FRM es:
iii eXY +21
iii eYY +
-
7/26/2019 CEDEAC-3_1.pdf
39/101
De acuerdo con el principio de mnimos cuadrados ordinarios:
221
2
iii XYe minmin
Derivando la anterior expresin con respecto a 1 y 2 e igualan
respectivamente, y resolviendo las ecuaciones normales, se encu
estimadores de los parmetros de la regresin:
( )( )
( )( )
( )XVar
YXCov
XXn
YXYXn
ii
iiii
=
=
,
222
XY 21
4.5. Varianzas y errores estndar de los estimadores
As como existen medidas de dispersin para las variables tambin la
los estimadores, por lo tanto, es necesario siempre presentar una
precisin de los estimadores de los parmetros del modelo. Esta me
error estndar e indica la confiabilidad de las estimaciones (si son pequ
ver que los parmetros muestrales van a ser muy parecidos a los pobl
La principal utilidad de los errores estndar de los estimadores es la co
de intervalos de confianza y la prueba de hiptesis. A continuacin se
forma de calcular la varianza y error estndar de cada estimador del
regresin lineal simple:
22
1 X
Vari ( )
( )
= 2
1 Xse i
-
7/26/2019 CEDEAC-3_1.pdf
40/101
4.6. Intervalos de confianza
En estadstica es comn efectuar inferencias basadas en estimacionesy en intervalos. Estas ltimas son menos riesgosas debido a que se e
dentro de un rango con cierto margen de confiabilidad. En particula
construirse intervalos de confianza para los parmetros del modelo de
as como para las predicciones.
Un intervalo de confianza para el parmetro 2 puede presentarse com
=+ 1Pr 2222222 setset
donde es el nivel de significancia estadstica y ( )2se es el error estn
1100 es el nivel porcentual de confianza del intervalo. Una versin
de esta expresin es: 222 set . De la misma forma para 1 :
]
11211121 Pr setset
121 set
Si por ejemploes 0.05, la interpretacin del intervalo de confianza p
dado un nivel de confianza del 95% (en 95 de cada 100 casos) en el la
el intervalo
( ) ( )222222,
setset + contendr el verdadero valor
4.7. Pruebas de hiptesis
-
7/26/2019 CEDEAC-3_1.pdf
41/101
Prueba de relevancia: la prueba de relevancia consiste e
estadsticamente qu tan significativo es un parmetro del modelo
manera puede identificarse si la variable independiente X aporta
importante al modelo de regresin. Siguiendo la estructura presen
captulo 2, para cada estimador i , i= 1, 2:
Paso 1: Planteamiento de la hiptesis.
Ho: 0i
Ha: 0i
Paso 2: Nivel de significancia :
Paso 3: El estadstico de prueba. Para la prueba de relevancia en e
regresin, el estadstico de prueba se define como:
22 ni
iC tset
,.~
Paso 4: Regiones de decisin: La siguiente grfica muestra la r
rechazo y aceptacin de la hiptesis nula.
-
7/26/2019 CEDEAC-3_1.pdf
42/101
Paso 5: Criterio de decisin y conclusin del investigador: Si Ct
rechaza la hiptesis nula. Si la prueba de hiptesis es rea
1 y se rechaza Ho se concluye que el intercepto del
significativo al nivel . Si la prueba se efecta para 2 y
Ho se concluye que iX es estadsticamente relevante al
significancia. Por otro lado, cuando no sea posible r
hiptesis nula, se puede decir que no existe evidencia para afirmar que iX sea relevante al nivel de significanc
Prueba de dependencia: esta prueba se lleva a cabo para evaluar si en
de regresin las variables independientes explican estadsticamen
conjunto la variable dependiente. Se desea que en un modelo de regreuna alta dependencia ocasionada por las variables explicativas. Esta
hiptesis como cualquier otra debe seguir una estructura similar a la
en el captulo 2. La hiptesis nula de esta prueba hace referenci
existencia de dependencia en el modelo (para el caso de regresin sim
solo hay una variable independiente se desea probar si 02
= ). L
alternativa argumenta lo contrario, sealando que al menos uno de los c
que acompaan las variables independientes es distinto de cero (en
simple esto es equivalente a 02 ).
El estadstico de prueba para el caso de un modelo de regresin linea21
22 nnC FtF ,.~ , donde FC es el estadstico calculado, que
distribucin Fcon un grado de libertad en el numerador y n-2 grados de
el denominador; y t es el estadstico t calculado en la prueba de relev
-
7/26/2019 CEDEAC-3_1.pdf
43/101
4.8. Prediccin
Una aplicacin del modelo de regresin es la prediccin o el pronvariable dependiente, de acuerdo con valores dados de las
independientes. Hay dos tipos de predicciones: la prediccin media y la
individual. A continuacin se presentan estos dos casos:
Prediccin media: es la prediccin del valor medio condicioncorrespondiente a un determinado valor de X, denotado como X
representa un punto sobre la lnea de regresin poblacional.
Si se desea predecir 0XYE / , la estimacin puntual de la prediccin
0210 XY + y la varianza de 0Y : ( ) ( )
( )
+=
2
2
0201
XX
XX
nYVari
.
Prediccin individual: es la prediccin de un valor individual de Y, corre
a un determinado valor de X. Si se desea predecir 0Y/ 0X , de igual fo
la prediccin media, la estimacin puntual es 0210 XY + , sin e
manera de calcular la varianza de 0Y es:
( ) ( )
( )
++=
2
202
01
1XX
XX
nYVar
i
4.9. El Coeficiente de Determinacin
-
7/26/2019 CEDEAC-3_1.pdf
44/101
respecto a que tan bien la lnea de regresin muestral se ajusta a los d
el caso de un modelo de regresin lineal simple se denota como 2r y
22rr = , donde res el coeficiente de correlacin lineal entre las var
X. Debido a que el 2r bajo los supuestos de modelo de regresin
encuentra entre 0 y 1, la manera de interpretarlo es en
argumentndose que dicho valor refleja la magnitud porcentual de la v
la variable Yexplicada por la variable X.
4.10. Modelos de regresin simple no lineal en las variables
En algunos casos el investigador requiere estimar otro tipo de modelos
las variables independientes no sean lineales, como por ejemplo
transformadas en trminos logartmicos, cuadrticos, raz cuadrada, cLas razones para estimar estos nuevos modelos pueden ser: m
resultados en trminos de bondad de ajuste, obtener elasticidades di
de la regresin, o en algunos casos porque la teora econmica lo s
ejemplo del modelo no lineal es el conocido como Cobb-Douglas, c
funcional es la siguiente:iu
ii eAXY2
=
Para estimar el modelo se efecta una linealizacin del mode
transformndolo en logaritmos. De esta manera:
iii uXLogLogAYLog ++= 2
Puede notarse que las variables dependiente e independiente se
transformadas en logaritmos y el trmino AL es el intercepto de la
-
7/26/2019 CEDEAC-3_1.pdf
45/101
Sea iYLogYT= , ALog=1 y ii XLogXT = , luego el modelo a estim
forma: iii uXTYT ++= 21 , y los coeficientes del modelo transforma
ser obtenidos por el mtodo de mnimos cuadrados ordinarios u
ecuaciones para los estimadores 1 y 2 presentadas en el numeral 4.4
Tericamente un modelo Cobb-Douglas es una funcin con elasticidad
a lo largo de todo su dominio, siendo diferente de una funcin linea
elasticidad depende especialmente de la observacin iX . En este
modelo Cobb-Douglas permite obtener directamente las elastic
coeficiente 2 representa la elasticidad de Yrespecto a X, y se interpre
aumento (cuando el valor de la elasticidad es mayor que cero) o d
(cuando el valor de la elasticidad es menor que cero) porcentual en la ocasionada por el incremento en un 1% de la variable X.
4.11. Ejercicios de Computador
Continuando con el ejemplo de datos hipotticos de demanda present
captulos anteriores, las siguientes salidas de computador muestran los
del modelo de regresin lineal simple de demanda y el modelo no lin
variables (doblemente logartmico) con las respectivas matrices d
covarianza de los coeficientes:
-
7/26/2019 CEDEAC-3_1.pdf
46/101
MODELO DE REGRESION LINEAL SIMPLE
Dependent Variable: DXMethod: Least SquaresDate: 10/03/06 Time: 16:38Sample: 1 13Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 71.41791 3.130854 22.81100 0.000PX -5.042910 0.454825 -11.08759 0.000
R-squared 0.917870 Mean dependent var 40.3846Adjusted R-squared 0.910404 S.D. dependent var 16.8994S.E. of regression 5.058427 Akaike info criterion 6.22062Sum squared resid 281.4646 Schwarz criterion 6.30754
Log likelihood -38.43407 F-statistic 122.934Durbin-Watson stat 2.267643 Prob(F-statistic) 0.00000
Los resultados del modelo lineal muestran que la variable precio cue
signo esperado y es relevante al 1%, 5% y 10% de significancia. El valo
0.918, es decir, el 92% de la variacin de la demanda del bien X esta
por la variable precio. Adicionalmente se observa la existencia de de
conjunta en el modelo al 1%, 5% y 10% de significancia (Fc=12
coeficiente de la variable PX es interpretado como un efecto marginal, p
un incremento en una unidad del precio de X disminuye en promedio su
en 5.04 unidades, manteniendo todos los dems factores constantes.
MATRIZ DE VARIANZA COVARIANZA DE LOS COEFICIENTESDEL MODELO DE REGRESIN SIMPLE
-
7/26/2019 CEDEAC-3_1.pdf
47/101
MODELO DE REGRESION SIMPLE NO LINEAL EN LAS VARIABLES(DOBLEMENTE LOGARITMICO)
Dependent Variable: LOG(DX)Method: Least SquaresDate: 10/03/06 Time: 16:48Sample: 1 13Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 4.799536 0.208899 22.97538 0.000LOG(PX) -0.722024 0.118417 -6.097307 0.000
R-squared 0.771676 Mean dependent var 3.59748Adjusted R-squared 0.750919 S.D. dependent var 0.49910S.E. of regression 0.249094 Akaike info criterion 0.19866Sum squared resid 0.682526 Schwarz criterion 0.28558
Log likelihood 0.708676 F-statistic 37.1771Durbin-Watson stat 2.124425 Prob(F-statistic) 0.00007
Los resultados del modelo doblemente logartmico indican que
logaritmo del precio es significativa (al 1%, 5% y 10%) y exhibe el signo
R2es 0.772, por lo tanto, el 77% de la variacin del logaritmo de la de
bien X es explicada por el logaritmo de su precio. Adicionalme
dependencia conjunta en el modelo (1%, 5% y 10% de signific
coeficiente de la variable LOG(PX) es interpretado como una elasticid
tanto, un incremento en un 1% del precio de X disminuye en pr
demanda en 0.72%, manteniendo todos los dems factores constantes.
MATRIZ DE VARIANZA COVARIANZA DE LOS COEFICIENTESDEL MODELO NO LINEAL EN LAS VARIABLES
(DOBLEMENTE LOGARITMICO)
-
7/26/2019 CEDEAC-3_1.pdf
48/101
5. REGRESION MULTIPLE LINEAL Y NO LINEAL
5.1. Expresin del modelo en forma matricial
En regresin mltiple se supone que las variaciones de Yi que se
explicar son debidas a K variables independientes, es decir X1, X2
como en la realidad no pueden presentarse relaciones determin
completo se considera la inclusin del trmino de perturbacin .
Resulta conveniente analizar el modelo clsico de regresin lineal
enfoque matricial. Supngase un modelo lineal de la forma:
+kkxxxY L33221
Si se tienen n observaciones independientes nyyy ,,, K21 de Y, podem
iy como:
ikikiii xxxy +L33221
Donde jix es el valor de la j-sima variable independiente para
observacin, ni ,,3,2,1 K= . Ahora defnanse las siguientes matrices, con
=
ny
y
y
M
2
1
Y ,
=
nknn
k
k
xxx
xxx
xxx
L
MM
L
L
21
22221
11211
X ,
=
k
M
2
1
,
=
n
M
2
1
P l t t l i t f i d l
-
7/26/2019 CEDEAC-3_1.pdf
49/101
5.2. Supuestos del modelo
Los supuestos del modelo son los siguientes:
1. XY += (Linealidad en los parmetros).
2. Xes de tamao kn x con rango k.
3. XXYX == )/(0)( EE
4. jiCovE ji == ,0)()'( 2 I .
5. X es no estocstica.
6. ( ) )I,0(.~X 2N
5.3. Mtodo de estimacin de mnimos cuadrados ordinarios
Se desea obtener un estimador
de un vector de parmetros descono
minimiza la suma del cuadrado de los errores S, donde:
)XY(')XY('2
=== S
Al minimizar Scon respecto a
se encuentra el estimador de mnimos
ordinarios de regresin mltiple:
( ) ( )Y'XX'X 1
=MCO
5.4. Matriz de varianzas y covarianzas de los estimadores
La matriz de varianza-covarianza de los estimadores es releva
determinacin de los errores estndar de los coeficientes y en la eje
-
7/26/2019 CEDEAC-3_1.pdf
50/101
1. Suma de cuadrados de los errores. Puede ser calc
YX''YY' =SCE .
2. Varianza del modelo. Dado que en la mayora de los casos la v
desconocida, se utiliza la informacin de la muestra para o
estimador de la misma: )()()(2 knSCEkn ==
YX''YY' .
Usando la informacin anterior, la matriz de varianza covarianz
coeficientes se puede calcular con la siguiente frmula:
12 XX'
= )(.covvar Matriz
5.5. Pruebas de hiptesis
Para efectuar pruebas de hiptesis es necesario obtener el error estnd
uno de los estimadores. Esta medida de dispersin corresponde a la ra
de cada uno de los elementos de la diagonal principal de la matriz de
covarianza. A continuacin se presentan los aspectos ms importa
efectuar las pruebas de relevancia y dependencia en un modelo de
mltiple:
Pruebas de relevancia: En estas pruebas se utilizan los t estadsticos
de los estimadores con su respectivo p-valor. A continuacin se presen
de obtenerlos:
1. t estadsticos. Los valores de t son calculados efectuando
bt di h b bilid d i l l d l t d ti
-
7/26/2019 CEDEAC-3_1.pdf
51/101
obtener dicha probabilidad es necesario el valor del estadstico
el nmero de grados de libertad )( kn y el nmero de colas de
(en este caso dos colas dado que es una prueba de significancia
Prueba de dependencia: Como se mencion en el captulo anterior el
utilizado para realizar la prueba es el F.
1. F estadstico. Mide la dependencia conjunta en el modelo resvariables explicativas. Puede ser obtenido en la forma matr
siguiente manera: [ ][ )1)(())(( = kknF YX''YY'YnYX'' 2
2. p valor. Arroja el nivel mnimo de significancia para rechazar l
nula. En el procedimiento se requiere el valor obtenido de F, loslibertad del numerador )1( k y grados de libertad del denominad
5.6. Coeficiente de determinacin ajustado ( )2R
El trmino ajustado se refiere a que es corregido por los correspondiende libertad. El 2R mide la bondad de ajuste del modelo de regresin
de explicacin de la variable dependiente por las variables independi
como lo hace el 2R convencional, sin embargo el 2R tiene la partic
que permite comparar modelos de regresin mltiple en los que s
variables adicionales. No obstante, se debe considerar que la comparvalidez cuando en cada modelo la variable dependiente y el tamao de
sean iguales. La forma de calcular el 2R se presenta a continuacin:
n 1
5 7 Inter alos de confian a
-
7/26/2019 CEDEAC-3_1.pdf
52/101
5.7. Intervalos de confianza.
Un intervalo de confianza para el parmetro Kkk ,,2,1, K= , tiene la
] 122 kkkkk setset Pr
kk set
2
donde es el nivel de significancia estadstica y kse es el error estn
El kse se obtiene mediante la frmula: ( ) ( )1
'
= kkk XXse . Puede neste intervalo de confianza corresponde a una expresin matemtica
presentada en el caso de regresin simple.
5.8. Modelos de regresin mltiple no lineal en las variables
En este numeral, se extender el caso de la funcin tipo Cob
desarrollado en el numeral 4.10 al caso de regresin mltiple no lin
variables. Considrense ms variables independientes Xs que pueden
variable Y, por lo tanto, el modelo Cobb-Douglas toma la forma:
ik uikiii eXXAXY
K32 32
Luego transformando el modelo en logaritmos:
iikkiii uXLogXLogXLogALogYLog +++++= L
3322
Sea iYLogYT= , ALog=1 , 22 ii XLogXT = ,..., ikik XLogXT = , entonces
a estimar es:
Bajo el esquema matricial los coeficientes del modelo transformado p
-
7/26/2019 CEDEAC-3_1.pdf
53/101
Bajo el esquema matricial los coeficientes del modelo transformado p
obtenidos a travs del mtodo de mnimos cuadrados ordinarios usando
de clculo presentada en el numeral 5.3. El coeficiente kk ,
representa la elasticidad de Yrespecto a Xky tiene la misma interpretac
el caso del modelo de regresin simple doblemente logartmico d
anterior. Por lo tanto, se tendrn 1k elasticidades en regresin
estimarse una funcin tipo Cobb-Douglas. Por otro lado, cabe de
ejercicios de estimacin diferentes al modelo Cobb-Douglas no permitdirectamente elasticidades constantes. Por ello es necesario tener en
forma que toman las variables en el modelo transformado antes d
interpretaciones de los coeficientes.
5.9. Ejercicios de Computador.
Ejemplo 1.
Usando la misma base de datos hipotticos de demanda de captulos a
continuacin se presentan los resultados de las estimaciones del
regresin mltiple lineal y no lineal en las variables, las matrices d
covarianza de los coeficientes, as como la comparacin entre l
observados y predichos de la demanda y sus residuos:
REGRESIN LINEAL MLTIPLE
-
7/26/2019 CEDEAC-3_1.pdf
54/101
REGRESIN LINEAL MLTIPLE
Dependent Variable: DX
Method: Least SquaresDate: 10/04/06 Time: 10:31Sample: 1 13Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 72.73351 10.83288 6.714142 0.000
PX -4.588739 1.778623 -2.579939 0.032PW -0.386460 1.214240 -0.318273 0.758PZ 0.471929 0.688867 0.685080 0.512I -0.409388 0.201019 -2.036558 0.076
R-squared 0.947105 Mean dependent var 40.3846Adjusted R-squared 0.920657 S.D. dependent var 16.8994S.E. of regression 4.760208 Akaike info criterion 6.24218
Sum squared resid 181.2767 Schwarz criterion 6.45947Log likelihood -35.57419 F-statistic 35.8104Durbin-Watson stat 1.436480 Prob(F-statistic) 0.00003
Los resultados del modelo lineal muestran que la variable precio cue
signo esperado y es relevante al 5% y 10% de significancia. El valor
0.947, es decir, el 95% de la variacin de la demanda del bien X estapor las variables independientes. Adicionalmente se observa la ex
dependencia conjunta en el modelo al 1%, 5% y 10% de significancia (F
El coeficiente de la variable PX es interpretado como un efecto marg
tanto, un incremento en una unidad del precio de X disminuye en pr
demanda en 4.59 unidades, manteniendo todos los dems factores cons
Vale la pena aclarar que la variable ingreso an cuando es relevante
significancia, el signo de su coeficiente no es consistente con la teora
l i d bi l
-
7/26/2019 CEDEAC-3_1.pdf
55/101
MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES DEL MODREGRESIN LINEAL MULTIPLE
COEFICIENTE C PX PW PZ C 117.3513 -11.56233 1.349073 -6.616478 -0
PX -11.56233 3.163501 -1.826424 0.777287 -0PW 1.349073 -1.826424 1.474379 -0.192430 0
PZ -6.616478 0.777287 -0.192430 0.474538 -0I -0.600013 -0.022642 0.052888 -0.014848 0
VALORES OBSERVADOS Y ESTIMADOS DE LA DEMANDA Y LOS RESIDUOS A MODELO DE REGRESIN LINEAL MLTIPLE
obs Actual Fitted Residual Residual Plot1 37.0000 37.8104 -0.81044 | . *| . |2 38.0000 43.2972 -5.29718 | *. | . |3 18.0000 22.0098 -4.00977 | .* | . |4 50.0000 49.7111 0.28890 | . * . |5 22.0000 27.3714 -5.37143 | *. | . |
6 55.0000 59.4627 -4.46267 | * | . |7 42.0000 34.4728 7.52721 | . | . *8 29.0000 27.1267 1.87326 | . | * . |9 63.0000 62.7036 0.29637 | . * . |10 13.0000 10.3593 2.64072 | . | * . |11 60.0000 56.3697 3.63029 | . | *. |12 62.0000 59.7074 2.29265 | . | * . |13 36.0000 34.5979 1.40211 | . | * . |
MODELO DE REGRESION MULTIPLE NO LINEAL EN LAS VARIABLES
-
7/26/2019 CEDEAC-3_1.pdf
56/101
(DOBLEMENTE LOGARITMICO)
Dependent Variable: LOG(DX)Method: Least SquaresDate: 10/04/06 Time: 10:39Sample: 1 13Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 3.042978 1.646616 1.848020 0.101LOG(PX) 0.115482 0.301528 0.382991 0.711LOG(PW) -0.336166 0.436617 -0.769933 0.463LOG(PZ) 0.671764 0.400484 1.677382 0.132LOG(I) -0.103431 0.084847 -1.219025 0.257
R-squared 0.902417 Mean dependent var 3.59748Adjusted R-squared 0.853626 S.D. dependent var 0.49910S.E. of regression 0.190953 Akaike info criterion -0.18986Sum squared resid 0.291703 Schwarz criterion 0.02742Log likelihood 6.234096 F-statistic 18.4954Durbin-Watson stat 1.510399 Prob(F-statistic) 0.00041
Los resultados del modelo doblemente logaritmo no son satisfactorios
ninguna de las variables incorporadas como regresores son sig
Asimismo, las variable LOG(PX) y LOG(I) no presentan los signos
limitando la validez terica del modelo.
MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES DEL MODOBLEMMENTE LOGARTMICO
COEFICIENTE C LOG(PX) LOG(PW) LOG(PZ) LOC 2.711343 -0.229656 -0.565544 -0.638982 -0.0
LOG(PX) -0.229656 0.090919 -0.022785 0.064962 0.0LOG(PW) -0.565544 -0.022785 0.190634 0.121451 0.0LOG(PZ) -0.638982 0.064962 0.121451 0.160387 0.0
VALORES OBSERVADOS Y ESTIMADOS DEL LOGARITMO DE LA DEMA
-
7/26/2019 CEDEAC-3_1.pdf
57/101
Y LOS RESIDUOS A PARTIR DEL MODELO DE REGRESINDOBLEMENTE LOGARTMICO
obs Actual Fitted Residual Residual Plot1 3.61092 3.50939 0.10153 | . | * . |2 3.63759 3.80097 -0.16339 | .* | . |3 2.89037 3.07102 -0.18064 | .* | . |4 3.91202 3.91411 -0.00209 | . * . |5 3.09104 3.11501 -0.02396 | . *| . |6 4.00733 4.10808 -0.10075 | . * | . |7 3.73767 3.59355 0.14412 | . | * . |8 3.36730 3.32110 0.04619 | . | * . |9 4.14313 4.38551 -0.24237 | * . | . |10 2.56495 2.69990 -0.13495 | . * | . |11 4.09434 3.84781 0.24653 | . | . *12 4.12713 4.00914 0.11799 | . | * . |13 3.58352 3.39174 0.19178 | . | * |
Ejemplo 2.
Ahora considere la siguiente informacin de una firma sobre los
produccin y la cantidad producida de un bien para estimar una funcin
cbica:
TABLA No. 3. COSTOS SEGN EL NIVEL DE PRODUCCIN
Obs. Q CT1 0 52 1 143 2 234 3 285 4 336 5 367 6 418 7 459 8 48
10 9 5011 10 5512 11 6113 12 6614 13 72
-
7/26/2019 CEDEAC-3_1.pdf
58/101
Donde:
CT: Costo total de produccinQ: Nivel de producto
ESTADISTICAS DESCRIPTIVAS
Q Q2 Q3 CTMean 10 136.6667 2100 66.19048Median 10 100 1000 55Maximum 20 400 8000 169Minimum 0 0 0 5Std. Dev. 6.204837 128.5365 2488.431 43.49899Observations 21 21 21 21
MODELO DE REGRESION MULTIPLE NO LINEAL ENLAS VARIABLES (FUNCIN CUBICA)
Dependent Variable: CTMethod: Least SquaresDate: 27/09/06 Time: 21:48Sample: 1 21Included observations: 21
Variable Coefficient Std. Error t-Statistic ProC 4.586862 0.962089 4.767605 0.00020Q 10.450570 0.427013 24.473660 0.00000Q2 -0.974658 0.050336 -19.363000 0.00000Q3 0.043001 0.001653 26.020450 0.00000R-squared 0.999236 Mean dependent var 66.1904Adjusted R-squared 0.999101 S.D. dependent var 43.4989S.E. of regression 1.304364 Akaike info criterion 3.53895Sum squared resid 28.92322 Schwarz criterion 3.73790Log likelihood -33.15899 F-statistic 7408,61
Durbin-Watson stat 0.882959 Prob(F-statistic)
MATRIZ DE VARIANZAS Y COVARIANZAS DE LOS ESTIMADORES
6. INCUMPLIMIENTO DE LOS SUPUESTOS DEL MODELO
-
7/26/2019 CEDEAC-3_1.pdf
59/101
El cumplimiento de los supuestos del modelo clsico de regresin ga
los k obtenidos a travs del mtodo de mnimos cuadrados ordinario
mejores estimadores linePales insesgados. Cuando tales supu
violados, se empiezan a generar problemas en los resultados de la
haciendo que los parmetros obtenidos no cumplan con alguna
propiedades deseables de un estimador (eficiencia y consistencia). A cose describen de manera general los conceptos de multico
heteroscedaticidad autocorrelacin, y no normalidad, la forma de det
problemas en el modelo estimado y las posibles soluciones a la viola
supuestos de mnimos cuadrados ordinarios relacionados con estos con
6.1. Multicolinealidad
La multicolinealidad tiene que ver con la relacin lineal entre algn c
variables independientes en un modelo de regresin. Supngase e
modelo con cuatro variables independientes:
Cualquier relacin lineal entre las variables independientes de este m
ejemplo X2 con X3, o X2 con X5 y X4 puede generar prob
multicolinealidad. Por lo general, existen dos tipos de multicolinealidad:
1. Multicolinealidad Perfecta: Para entender el concepto de multic
perfecta es necesario expresar las variables independientes del
trminos de una combinacin lineal cuya suma algebraica sea ig
-
7/26/2019 CEDEAC-3_1.pdf
60/101
Los valores de pueden ser positivos o negativos y form
combinaciones. Cuando la suma algebraica para todas las obsde la muestra de esta combinacin lineal es cero se dice
multicolinealidad perfecta. De este caso se excepta que simult
los valores de sean cero, pues esta es una solucin trivial de la
En otras palabras, la multicolinealidad perfecta se presenta c
combinacin lineal de uno o ms vectores de variables explicativade manera perfecta uno o ms vectores idnticos a cualqui
variables explicativas en la base de datos.
2. Multicolinealidad Alta: Esta se presenta cuando la colinealidad
entre variables independientes es muy fuerte aunque no perfecta
La multicolinealidad se presenta debido a la tendencia definida de cierta
a lo largo de la muestra o a travs del tiempo. Tendencias o pa
comportamiento similares de las variables independientes en un
regresin sustentan la multicolinealidad. La multicolinealidad se puede
en datos provenientes de series de tiempo. Por ejemplo, es comn en
regresar variables que tienen que ver con la representacin de ciclos ec
Por ello, antes de efectuar la regresin es til elaborar diagramas de
entre las variables independientes con el objetivo de analizar el comp
tendencial de estas.
El problema de multicolinealidad es un problema ocasionado
observaciones en los datos recopilados de la muestra. La pre
-
7/26/2019 CEDEAC-3_1.pdf
61/101
Si existe multicolinealidad perfecta entre las variables independien
modelo de regresin, ( XX' )-1
no existe. Cuando esto ocurre no es posi
. En presencia de alta multicolinealidad se genera una ampliacin
estndar de
, por lo que el valor de los estadsticos "t" para cada
parmetros del modelo sern mucho menores que en aus
multicolinealidad, aumentndose la probabilidad de cometer error dedecir, que acepte Hono siendo verdadera. Por consiguiente, el mode
validez para realizar pruebas de relevancia.
6.1.1. Deteccin de Multicolinealidad
La deteccin de multicolinealidad en un modelo puede hacerse por m
visualizacin de contradicciones en los estadsticos que juzgan la b
ajuste (R2), dependencia (Fc) y los estadsticos que permiten evaluar la
de las variables en el modelo (tc). Otro mtodo de deteccin es la est
XX' ; si el valor obtenido de XX' es muy cercano a cero, puede con
es muy probable la existencia de multicolinealidad alta.
No obstante, se encuentran otras pruebas mucho ms formales e
estadsticos. Una de ellas es estimar coeficientes de correlacin entre
variables independientes y formular pruebas de hiptesis sobre los coef
correlacin estimados para comprobar la significancia de la relacin
trminos estadsticos. Por ejemplo, una vez calculado el coeficiente de
lineal entre X2 y X3, puede proponerse la siguiente prueba de hip
Ho: 032 ,X X (Si existe relacin lineal entre X2 y X3)
-
7/26/2019 CEDEAC-3_1.pdf
62/101
El estadstico de prueba es:
22232
32
1
2
= n
XX
XXC t
r
nrt ,
,
,.~
Donde es el valor que se desea probar del coeficiente de correla
poblacional. No obstante en la mayora de los casos este se asume c
cual solo se desea verificar si hay o no correlacin entre las variables ex
Si 22 nC tt , a un nivel de significancia determinado, se re
confirmando la existencia de relacin lineal entre X2 y X3, es decir el
regresin mostrar multicolinealidad.
El otro mtodo formal consiste en la estimacin de regresiones aux
ayudan a evaluar la relacin lineal existente entre un conjunto de
independientes. Para ello, se ejecuta una regresin entre las
independientes del modelo, por ejemplo X2 versus (X3, X4, X4, X5)
analizan los estadsticos resultantes de esta. Si hay relacin lineal e
variables, el R2, el Fc y el tc que acompaa a cada variable independ
regresin auxiliar sern altos. Las pruebas de hiptesis sobre re
dependencia estadstica en la regresin auxiliar determinan si ex
multicolinealidad. Es importante tener en cuenta que deben estimarseposibles regresiones auxiliares resultantes de las combinaciones
variables independientes o regresores del modelo original. El m
6.1.2. Correccin de Multicolinealidad
-
7/26/2019 CEDEAC-3_1.pdf
63/101
La correccin de multicolinealidad en un modelo puede ejecutarse medimtodos:
1. Eliminacin de Variables: Esta tcnica propone la eliminacin de
variables independientes relacionadas linealmente. El problema
esta tcnica es que se pueden eliminar variables import
tericamente explican la variable dependiente, presentndose po
sesgo de especificacin por omisin de variables.
2. Utilizacin de Informacin a priori: La informacin a priori co
proviene de estudios anteriores que pueden brindar algn indic
valor de algn parmetro correspondiente a una de las
independientes incluida en la ecuacin de regresin. Operativ
valor a prioridel parmetro es reemplazado en el modelo origina
proceder a estimar el modelo resultante.
3. Transformacin de Variables: Esta tcnica plantea una transfo
las variables del modelo original. El ms conocido es la transfo
primeras diferencias. Al trabajar con un modelo que inc
organizados en series de tiempo se presenta la posibilidad de co
ecuacin de primeras diferencias, asumiendo que con un rezag
una de las variables del modelo es posible eliminar la relacinpuede existir entre las variables independientes. El modelo ori
periodo t:
Luego la ecuacin en diferencias es:
-
7/26/2019 CEDEAC-3_1.pdf
64/101
Donde t* = t - t-1. Debe tenerse en cuenta que al estimar
modelo, la interpretacin de los coeficientes estimados no es la
en el modelo original, debido a que estos ahora representan
diferencias de las variables entre los periodos t y t-1.
4. Aumentar el tamao de la muestra: Este mtodo consiste en
muestra o conjunto de datos utilizados para estimar el modelo. E
solucin plausible dado que el problema de multicolinealidad es o
fundamentalmente por las observaciones en la muestra. C
incrementa el nmero de observaciones se piensa que es
reproducir el componente de colinealidad entre los regre
embargo, en muchos casos no es posible adquirir ms info
observaciones de las variables debido a restricciones fsicas,
econmicas.
Finalmente, se recomienda que el investigador una vez utilice algun
mtodos verifique si el problema de multicolinealidad fue corregido.
6.2. Heteroscedasticidad
El problema de heteroscedasticidad se presenta cuando es violado el s
varianza constante de los errores de la funcin de regr
heteroscedasticidad tiene que ver con la relacin entre una o ms de la
La presencia de heteroscedasticidad es muy comn en regresiones e
ti d d t d t t l P j l d l
-
7/26/2019 CEDEAC-3_1.pdf
65/101
partir de datos de corte transversal. Por ejemplo, cuando se recole
provenientes de estratos, de regiones, por tamao de la familia o pempresa. En general, puede presentarse en estudios que incluyen g
comportamientos marcados a lo largo de toda la muestra; por ejemplo
ingreso monetario del hogar segn el estrato, pues se puede pen
varianza del ingreso monetario del grupo de alta riqueza es ms alta
grupo de escasos recursos.
El problema de heteroscedasticidad repercute directamente sobre la est
los parmetros de la regresin. Los estimadores seguirn siendo ins
consistentes pero no eficientes. La heteroscedasticidad causa la subes
sobre estimacin de la varianza del modelo de regresin, por lo tanto e
error estndar de los parmetros, el valor de los estadsticos t y los in
confianza cambian con respecto a los resultados que deberan ob
ausencia de heteroscedasticidad. En este sentido, la pres
heteroscedasticidad en el modelo de regresin hace que las pruebas d
no tengan validez estadstica o que las inferencias sean errneas.
6.2.1. Deteccin de la heteroscedasticidad
A continuacin se presentan los mtodos para detectar la exis
heteroscedaticidad:
1. Anlisis de residuales: Este mtodo permite evaluar grficamen
heteroscedasticidad causada por una variable independiente en
dispersin entre Yt estimado y et2. Si estas grficas muest
tendencia especfica puede afirmarse que existe heteroscedasti
-
7/26/2019 CEDEAC-3_1.pdf
66/101
tendencia especfica, puede afirmarse que existe heteroscedasti
modelo de regresin.No obstante esta metodologa es indicativabasada en una prueba estadstica.
2. Anlisis de regresin: Es la utilizacin de una o ms regresiones
El procedimiento es similar al planteado para detectar multicoline
la salvedad de que ahora la regresin no se estima entre la
independientes, sino entre el cuadrado del trmino de error y el c
regresores del modelo original. Dentro de este mtodo se enc
pruebas de Park, White, Glejser, Breusch-Pagan-Godfrey, y
Quandt. A continuacin se presenta el procedimiento general pa
la prueba de White:
Si se tiene el siguiente modelo original:
Una vez estimado el modelo por el mtodo de mnimos
ordinarios (MCO), el investigador debe calcular el cuadrado de l
22 ttt YY , y luego estimar por MCO el siguiente modelo:
tttttttt XXXXXX ++++++= 2152
242
13221102
La prueba de hiptesis relacionada con el modelo anterior es:
El estadstico de prueba es 252 .~nR . En este caso el nmero de
-
7/26/2019 CEDEAC-3_1.pdf
67/101
libertad es cinco, que corresponde al nmero de variables explica
regresin de White. Asimismo, para modelos con ms variables elos grados de libertad sern equivalentes al nmero de regres
modelo auxiliar. Si 2.2
lgnR > a un nivel de significancia , l
nula es rechazada, por lo tanto, existe heteroscedasticidad en
original.
Es importante sealar que la prueba de White desarrollada
exclusivamente a la prueba de trminos cruzados debido a que
en la regresin auxiliar el trmino de interaccin de las
independientes del modelo original: ttXX 215 . Cuando este com
es agregado la prueba recibe el nombre de prueba de White si
cruzados. Este cambio tiene un efecto directo sobre los grados
de la prueba.
6.2.2. Correccin de heteroscedasticidad
Las medidas correctivas principalmente incluyen dos enfoques: cua
conocida y cuando 2 es desconocida.
1. Cuando se conoce 2 . En este caso se utiliza el mtodo d
cuadrados ponderados (M.C.P) para realizar una transformac
variables del modelo. Considere el modelo original el cua
heteroscedasticidad y 2 es conocida:
Este mtodo supone la siguiente transformacin:
XY ++=
-
7/26/2019 CEDEAC-3_1.pdf
68/101
ttt XY ++= 21
Donde 2 es la desviacin estndar del modelo. Se supone
transformacin permite que el modelo quede libre de heterosce
No obstante, para asegurarse de esto puede efectuarse cualqu
pruebas de deteccin presentadas anteriormente.
2. Cuando no se conoce 2 : Por lo regular es muy difcil tener co
previo de 2 . Para utilizar el mtodo de mnimos cuadrados p
debe recurrirse a supuestos ad hoc, con cierto grado de razonabi
2 para proceder a la transformacin de la regresin origi
manera, que el nuevo modelo cumpla con el sup
homocedasticidad. Considrese el siguiente modelo:
El investigador presume que la varianza de los errores tiene l
forma:
222tt XUE =
Esta expresin es planteada cuando se cree que la varianza de
es proporcional al cuadrado de la variable explicativa. Bajo este s
modelo transformado puede presentarse como sigue:
y que el modelo transformado ahora es tericamente homoceds
-
7/26/2019 CEDEAC-3_1.pdf
69/101
y que el modelo transformado ahora es tericamente homoceds
( ) ( ) ( ) ( ) ( ) 22222222 11 ==== ttttttt XXUEXXUEvE .
El mtodo indica que las observaciones de la muestra deben divi
raz cuadrada de la estructura generadora de la heteroscedasticid
para este ejemplo es equivalente a dividir por tX . Luego el proindica que el modelo transformado requiere estimarse por MCO.
razn por la cual el mtodo se denomina mnimos cuadrados p
dado que se ponderan las observaciones originales por un
conveniente verificar empricamente si luego de estimar
transformado el problema de heteroscedasticidad fue corregido.
6.3. Autocorrelacin
El problema de autocorrelacin se presenta en una regresin cuando
de las diferentes observaciones estn relacionados en el tiempo. Esto
el efecto de los errores en el tiempo no es instantneo sino por el c
persistente en el tiempo. La autocorrelacin es ms comn en series
en el tiempo que en informacin proveniente de encuestas en un
(seccin cruzada). La autocorrelacin puede estar relacionada con
econmicos; generalmente sta se presenta en un modelo con
macroeconmicas donde en el tiempo ocurre un evidente comp
tendencial.
generada en casos donde se usa una forma funcional incorrecta del m
hace que los datos se ajusten a una forma funcional que no es la ms a
-
7/26/2019 CEDEAC-3_1.pdf
70/101
q j q
Se argumenta, que la manipulacin de informacin puede llegar a gener
autocorrelacin. Un caso tpico se presenta en la cuentas naciona
muchos datos son obtenidos a partir de otros, aplicando tcnicas de in
o extrapolacin. Por ejemplo, cuando se convierten datos diarios a s
Finalmente, modelos especiales como los de rezagos distribuid
autoregresivos pueden originar autocorrelacin.
Entre las consecuencias de la autocorrelacin se tiene la sobrees
subestimacin de los estadsticos t que juzgan la significancia de la
independientes en el modelo. Aunque los estimadores siguen siendo ins
consistentes son ineficientes.En este sentido se afecta la validez est
las pruebas de hiptesis.
6.3.1. Deteccin de la autocorrelacin
Los mtodos ms comunes para detectar autocorrelacin son:
1. Anlisis de residuales: este mtodo plantea la construccin de
de dispersin para los errores en funcin de tiempo o en fun
perodo inmediatamente anterior. El primer paso es estimar
original por MCO. Luego los errores estimados de la reggraficados en un eje de coordenadas para identificar si exi
tendencia de los mismos en el tiempo, o de estos con su primer
-
7/26/2019 CEDEAC-3_1.pdf
71/101
auxiliar es el trmino de error t y los regresores sus respectiv
hasta el orden deseado por el investigador. Adicionalmente so
-
7/26/2019 CEDEAC-3_1.pdf
72/101
hasta el orden deseado por el investigador. Adicionalmente so
los regresores usados en el modelo original. La hiptesis nula coa que todos los coeficientes de autocorrelacin de orden (los c
que acompaan a los residuos rezagados en la regresin au
iguales a cero, mientras la hiptesis alterna es que al menos uno
distinto de cero. El estadstico de prueba es ( ) 22 .~ sRsn , don
nmero de errores rezagados en la regresin auxiliar. Paautocorrelacin de orden uno, que es la prctica ms comn, s s
uno. La hiptesis nula es rechazada cuando ( ) 22 sRsn > a
significancia ; en este caso se concluye que hay autocorrelaci
6.3.2. Correccin de la autocorrelacin
La correccin del problema de autocorrelacin incluye diferentes t
persiguen principalmente la transformacin de las variables del mod
objetivo de eliminar el patrn tendencial que siguen los errores. Se
tipos de metodologas de correccin de la autocorrelacin:
1. Cuando se conoce el coeficiente de autocorrelacin: la tran
recomendada sugiere rezagar un perodo las variables del
estimar una ecuacin de primeras diferencias. Para esto el mod
debe ser transformado hasta tomar la forma:
Esta ecuacin es estimada y se propone cualquiera de las t
2. Cuando no se conoce el coeficiente de autocorrelacin: En la
-
7/26/2019 CEDEAC-3_1.pdf
73/101
los casos a nivel emprico el coeficiente de autocorrelacin no Debido a esto el coeficiente de autocorrelacin debe ser
partiendo de la suposicin de un valor inicial del mismo.
Una de estos mtodos es el procedimiento Cochrane O
consiste en la estimacin de modelos con sucesivas transforma
un mtodo iterativo representado en un algoritmo que evala
proceso la tendencia que sigue el estimado de regresiones
Cuando la diferencia de entre un modelo estimado actual y su
es 0.01 se afirma que el coeficiente ha convergido y por cons
tendencia de crecimiento de este se ha eliminado.
Por otro lado existe el mtodo de correccin a travs del Durbin
Mediante esta tcnica, aunque no se conoce , este es posible
partir del estadstico d de la regresin del modelo original
obtenido el valor de las variables son transfo