capitulo11 violacion del supuesto de homocedasticidad: causas, consecuencias, deteccion y correccion
TRANSCRIPT
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
1/10
J. Ramoni PerazziEconometría I
Capítulo 11. 1
VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS,CONSECUENCIAS, DETECCION Y CORRECCION
SUPUESTO DE RESIDUOS HOMOCEDASTICOS: LA VARIANZA DE LASPERTURBACIONES Ui, CONDICIONADA A LAS VARIABLES EXPLICATIVASINCLUIDAS EN EL MODELO, ES CONSTANTE, 2.
V(Ui / Xi) = E(Ui2) = 2 i= 1, 2,…n
Consumo (Y)
1 + 2 X2i
80100
Ingreso (X)
OBSERVE QUE A MEDIDA QUE EL NIVEL DE INGRESO AUMENTA, ELCONSUMO PROMEDIO TAMBIEN CRECE, PERO LA VARIANZA DELCONSUMO (DISTRIBUCION EN TORNO A LA MEDIA PARA CADA NIVEL DEINGRESO) PERMANECE CONSTANTE A CUALQUIER NIVEL DE INGRESO.
HETEROCEDASTICIDAD: V(Ui / Xi) = E(Ui2) = i2 NO CONSTANTE
Consumo (Y)
1 + 2 X2i
80100
Ingreso (X)
TANTO EL CONSUMO PER SE COMO SU VARIANZA CRECEN CON ELINGRESO.
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
2/10
J. Ramoni PerazziEconometría I
Capítulo 11. 2
CAUSAS DE HETEROCEDASTICIDAD:
MODELOS DE ENSAYO Y ERROR: LA EXPERIENCIA REDUCE LOSERRORES DE COMPORTAMIENTO EN EL TIEMPO, O ENCOMPARACION CON LOS MENOS EXPERIMENTADOS VARIANZA
DECRECE (SECRETARIAS, OPERADORES DE MAQUINARIAS, …)
INGRESO DISCRECIONAL: A MENOS INGRESO, MAYOR PMgC.PERSONAS CON BAJOS RECURSOS TIENDEN A GASTAR TODO SUINGRESO (AHORRO 0). PERSONAS CON MAS ALTO NIVEL DEINGRESO TIENEN MAS OPCIONES EN CUANTO A COMO DISTRIBUIRSU INGRESO VARIANZA CRECE.
Salarios (COM) como función del tamaño de empresa (NE)
1000
2000
3000
4000
5000
6000
7000
0 2 4 6 8 10
N E
C O M
MEJORAS EN LOS SISTEMAS DE RECOLECCION DE DATOS
MALA ESPECIFICACION DEL MODELO DE REGRESION: FORMAFUNCIONAL INCORRECTA, OMISION DE VARIABLES RELEVANTES.
ASIMETRIA EN LA DISTRIBUCION DE VARIABLES EXPLICATIVAS
INCLUIDAS EN EL MODELO (INGRESO, RIQUEZA, EDUCACION, ETC)
MANIPULACION DE LOS DATOS: INCORRECTA TRANSFORMACIONDE LOS DATOS (DIFERENCIAS O RAZONES).
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
3/10
J. Ramoni PerazziEconometría I
Capítulo 11. 3
OUTLIERS O FACTORES ATIPICOS: OBSERVACIONES QUE SON MUYDIFERENTES CON RESPECTO AL RESTO DE LA MUESTRA
Consumo como función del ingreso para distintos países
OUTLIER (Chile)
200
400
600
800
1000
0. 4 0. 6 0. 8 1. 0 1. 2
IN C
E X P E N D
NOTA: LOS PROBLEMAS DE HETEROCEDASTICIDAD SON MASFRECUENTES EN DATOS DE CORTE TRANSVERSAL (INDIVIDUOS,EMPRESAS, PAISES… DE DIFERENTE TAMAÑO, CONDICION, ETC).DISTINTOS INDIVIDUOS O UNIDADES EN UN PUNTO DADO DEL TIEMPOTIENDEN A SER MAS HETEROGENEOS.
EN SERIES DE TIEMPO LAS VARIABLES TIENDEN A PRESENTARMAGNITUDES SIMILARES EN EL TIEMPO POR EL EFECTO AGREGACIÓN.
CONSECUENCIAS DE LA HETEROCEDASTICIDAD:
EN PRESENCIA DE HETEROCEDASTICIDAD, LOS ESTIMADORES MCO
SERAN LINEALES, INSESGADOS Y CONSISTENTES (β̂ i n>> i) PERONO EFICIENTES. DEJAN DE SER MELI.
LA VARIANZA NO ES MINIMA LOS RESULTADOS DE LAS PRUEBASt Y F NO SON CONFIABLES
EN EFECTO, PARA EL MODELO: Yi = 1 + 2 Xi + Ui
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
4/10
J. Ramoni PerazziEconometría I
Capítulo 11. 4
VAR ( β̂ 2) = σ
2
2i
2
x CON HOMOCEDASTICIDAD
VAR (βˆ 2) =
22
2i
2
i
2
2i
)(
σ
x
x
CON HETEROCEDASTICIDAD
DETECTANDO HETEROCEDASTICIDAD:
NATURALEZA DEL PROBLEMA: DATOS CORTE TRANSVERSAL: AMAYOR HETEROGENEIDAD DE LA MUESTRA, MAYOR PROBABILIDAD DEHETEROCEDASTICIDAD.
METODO GRAFICO: EXAMEN POSTMORTEM DE LOS RESIDUOS ALCUADRADO EN BUSCA DE PATRONES SISTEMATICOS (
iû usados comoproxies de ui)
iû2 vs Ŷi INFORMACION GENERAL
iû2 vs Xi INFORMACION ESPECIFICA
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
5/10
J. Ramoni PerazziEconometría I
Capítulo 11. 5
METODOS FORMALES:
EXISTE UNA VARIEDAD DE TEST DE HETEROCEDASTICIDAD, TODOSELLOS BASADOS EN DETERMINAR SI EXISTE O NO ALGUN TIPO DERELACION ESTADISTICAMENTE SIGNIFICATIVA ENTRE LOS RESIDUOS Y
ALGUNA OTRA VARIABLE. LOS PRIMEROS TESTS, COMO EL DE PARK YGLEJSER RESULTAN POCO CONFIABLES DADO QUE NADA GARANTIZAQUE LOS RESIDUOS DE LAS REGRESIONES SOBRE LOS QUE SE BASANSEAN A SU VEZ HETEROCEDASTICOS. SIN EMBARGO, ESTOS TESTSSIRVIERON DE BASE PARA OTROS MÀS ROBUSTOS Y DE USO MÁSFRECUENTE ACTUALMENTE:
HETEROCEDASTICIDAD IMPLICA QUE EXISTE UMA RELACION ENTRE LAVARIANZA DE LOS RESIDUOS Y UNA O MAS VARIABLES DENTRO OFUERA DEL MODELO. DE ALLI QUE EL OBJETIVO DE TODOS ESTOSTESTS SEA PROBAR SI EXISTE O NO TAL RELACION-.
.1. TEST BREUSCH-PAGAN-GODFREY1:
SEA Yi = 1 + 2 X2i + ... + k Xki +ui
ASUMA i2 = 1 + 2 Z2i + … + m Zmi + vi
DONDE LAS VARIABLES Zs PUEDEN SER O NO LAS MISMAS VARIABLESXs. SE LLEVA A CABO UNA PRUEBA DE SIGNIFICACION CONJUNTA COMOSIGUE:
H0: 2 = … = m = 0 RESIDUOS HOMOCEDASTICOS
H1: AL MENOS UN 0 RESIDUOS HETEROCEDASTICOS
PASOS: i) ESTIME EL MODELO Y OBTENGA LOS RESIDUOSiû s
ii) CALCULE σ̂ 2 = iû2/n
iii) CONSTRUYA LA VARIABLE pi= iû2 / σ̂ 2
iv) REGRESE pi CONTRA LAS Zs Y OBTENGA LA SCReg v) CALCULE = SCReg/2 2m-1
DESVENTAJAS: EL TEST ES SENSIBLE AL SUPUESTO DE NORMALIDADDE LOS RESIDUOS ui.
1 EXISTEN OTROS TEST DE HETEROCEDASTICIDAD: TEST DE CORRELACION DESPEARMAN, GOLDFELD-QUANT, KOENKER-BASSETT, POR NOMBRAR ALGUNOS.
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
6/10
J. Ramoni PerazziEconometría I
Capítulo 11. 6
2. TEST GENERAL DE WHITE:
SEA Yi = 1 + 2 X2i + 3 X3i +ui
Yiû2 =1 + 2 X2i + 3 X3i + 4 X2i2 + 5 X3i2 + 6 X2iX3i + ui
H0: 2 = … = m = 0 RESIDUOS HOMOCEDASTICOS
H1: AL MENOS UN 0 RESIDUOS HETEROCEDASTICOS
PASOS: i) ESTIME EL MODELO Y OBTENGA LOS RESIDUOSiû s
ii) ESTIME LA REGRESION AUXILIAR REGRESSION
iû2 = f(X2i, X3i, X2i2, X3i2, X2iX3i ) Y OBTENGA EL R2.
iii) CALCULE nR2 2k-1
DESVENTAJAS: HAY QUE SER CUIDADOSOS AL APLICAR EL TEST AMODELOS CON MUCHOS REGRESORES
MEDIDAS REMEDIALES:
1) UTILIZAR LA INFORMACION REFERIDA A LA DESIGUAL VARIABILIDADDE LA VARIABLE DEPEDIENTE
A) MINIMOS CUADRADOS GENERALIZADOS2: APLICAR MCO A VARIABLESTRANSFORMADAS DE MODO TAL QUE SATISFAGAN LOS SUPUESTOS
SEA Yi = 1(1) + 2 X2i +ui CON VAR (ui) = i2 CONOCIDA3
DIVIDA LA ECUACION ENTRE i
Yi /i = 1(1/i) + 2 (X2i /i) +(ui/i)
Yi* = 1(1*) + 2 X2i* +ui*
2 CUANDO LOS MCG MINIMIZAN LA SUMA CUADRATICA DE LOS RESIDUOS PONDERADOS,(( û i/ i)2), SE LE CONOCEN COMO MINIMOS CUADRADOS PONDERADOS.3 SI LA VARIANZA ES DESCONOCIDA, UTILICE LA VARIANZA ESTIMADA (MCG FACTIBLES)
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
7/10
J. Ramoni PerazziEconometría I
Capítulo 11. 7
DONDE ui* SON HOMOCEDASTICOS
VAR (ui*) = E(ui*)2 = E(ui/i)2 = (1/i)2 E(ui)2 = (1/i)2 (i2) = 1 CONSTANTE
B) TRANSFORMACION DE WHITE PARA ERRORES ESTANDAR ROBUSTOS(REGRESION ROBUSTA)
WHITE SUGIERE CORREGIR LA ESTIMACION DE LOS ERRORES ESTANDAR
DE LOS ̂ COMO SIGUE:
VAR( β̂ j) =
n
i
ji
i
n
i
ji
w
uw
1
22
2
1
2
)ˆ(
ˆˆ
DONDE jŵ SON LOS RESIDUOS DE LA REGRESION AUXILIAR DE X j CON
RESPECTO A LOS DEMAS REGRESORES.VENTAJA: PERMITE OBTENER ESTIMADORES MELI SIN ALTERAR LASESTIMACIONES
DESVENTAJA: IGNORA OTRAS POSIBLES FORMAS DE HETEROCEDAS-
TICIDAD:
V(Ui) = 2Xi2 V(Ui) = 2Xi V(Ui) = 2 [E(Yi)]2
2) REDUCIR LA DESIGUAL VARIABILIDAD DE LA VARIABLE DEPENDIENTE
TRANSFORMACION LOGARITMICA DE LAS VARIABLES, LO CUALREDUCE LA ESCALA Y POR ENDE LA DIFERENCIA ENTRE VALORES.
DEFLACTAR LAS VARIABLES A PARTIR DE ALGUNA MEDIDA DE TAMAÑO
EN TERMINOS MATRICIALES: ̂MCG=(X’ -1X)-1X’ -1y
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
8/10
J. Ramoni PerazziEconometría I
Capítulo 11. 8
EJEMPLO 1: SUELDOS EN FUNCION DE ANTIGUEDAD Y EDUCACION.
Dependent Variable: SUELDO
Method: Least Squares
Included observations: 1796
Coefficient Std. Error t-Statistic Prob.
C 1171633. 35643.85 32.87055 0.0000
ANTIG 83698.63 4229.935 19.78722 0.0000
ANTIG2 -1320.920 105.3072 -12.54349 0.0000
DOCTOR 399479.1 21392.34 18.67393 0.0000
R-squared 0.510215 Mean dependent var 2215022.
Adjusted R-squared 0.509395 S.D. dependent var 551425.7
S.E. of regression 386236.3 Akaike info criterion 28.56851
Sum squared resid 2.67E+14 Schwarz criterion 28.58075
Log likelihood -25650.52 Hannan-Quinn criter. 28.57303
F-statistic 622.2488 Durbin-Watson stat 2.043191
Prob(F-statistic) 0.000000
Heteroskedasticity Test: White
F-statistic 70.22060 Prob. F(7,1788) 0.0000
Obs*R-squared 387.2763 Prob. Chi-Square(7) 0.0000
Scaled explained SS 356.7119 Prob. Chi-Square(7) 0.0000
Dependent Variable: SUELDO
Method: Least Squares
Included observations: 1796White Heteroskedasticity-Consistent Standard Errors Covariance
Coefficient Std. Error t-Statistic Prob.
C 1171633. 28518.22 41.08366 0.0000
ANTIG 83698.63 4276.930 19.56979 0.0000
ANTIG2 -1320.920 113.8430 -11.60300 0.0000
DOCTOR 399479.1 21298.57 18.75614 0.0000
R-squared 0.510215 Mean dependent var 2215022.
Adjusted R-squared 0.509395 S.D. dependent var 551425.7
S.E. of regression 386236.3 Akaike info criterion 28.56851
Sum squared resid 2.67E+14 Schwarz criterion 28.58075
Log likelihood -25650.52 Hannan-Quinn criter. 28.57303
F-statistic 622.2488 Durbin-Watson stat 2.043191
Prob(F-statistic) 0.000000
Sueldo promedio de profesores sin
título de doctorado, independientemente
de su anti uedad
Los sueldos aumentan
en promedio Bs. 83698con cada año de
experiencia, pero a una
tasa decreciente
(1320,92)
Los doctores gananen promedio Bs.399479 más que los
no doctores
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
9/10
J. Ramoni PerazziEconometría I
Capítulo 11. 9
EJEMPLO 2: DE NUEVO LOS VEHICULOS
Dependent Variable: PRECIOMethod: Least SquaresIncluded observations: 93
Variable Coefficient Std. Error t-Statistic Prob.
C -0.127778 1.837829 -0.069527 0.9447DOMESTICO -3.061851 1.208065 -2.534508 0.0130POTENCIA 0.147522 0.011589 12.72898 0.0000
R-squared 0.646517 Mean dependent var 19.50968 Adjusted R-squared 0.638662 S.D. dependent var 9.659430S.E. of regression 5.806422 Akaike info criterion 6.387532Sum squared resid 3034.308 Schwarz criterion 6.469229Log likelihood -294.0203 F-statistic 82.30447
Durbin-Watson stat 1.521892 Prob(F-statistic) 0.000000
White Heteroskedasticity Test:
F-statistic 2.245308 Probability 0.070533Obs*R-squared 8.612539 Probability 0.071548
Dependent Variable: LOG(PRECIO)Included observations: 93
Variable Coefficient Std. Error t-Statistic Prob.
C -2.464940 0.334486 -7.369332 0.0000DOMESTICO -0.104167 0.048544 -2.145823 0.0346
LOG(POTENCIA) 1.097530 0.068214 16.08951 0.0000
R-squared 0.742607 Mean dependent var 2.865452 Adjusted R-squared 0.736888 S.D. dependent var 0.454686S.E. of regression 0.233229 Akaike info criterion -0.041867Sum squared resid 4.895610 Schwarz criterion 0.039829
Log likelihood 4.946833 F-statistic 129.8302Durbin-Watson stat 1.575917 Prob(F-statistic) 0.000000
White Heteroskedasticity Test:
F-statistic 1.026644 Probability 0.398104Obs*R-squared 4.146409 Probability 0.386554
Residuosheterocedásticos
al 8%
-
8/18/2019 CAPITULO11 VIOLACION DEL SUPUESTO DE HOMOCEDASTICIDAD: CAUSAS, CONSECUENCIAS, DETECCION Y CORR…
10/10
J. Ramoni PerazziEconometría I
Capítulo 11. 10
EJEMPLO 3: DE NUEVO TASA DE ASESINATOS
Dependent Variable: MIncluded observations: 44
Variable Coefficient Std. Error t-Statistic Prob.
C 7.754432 2.987502 2.595624 0.0131D1 2.042382 1.128044 1.810551 0.0777D2 4.697114 1.330173 3.531205 0.0011Y -3.131790 1.511907 -2.071417 0.0448
R-squared 0.644531 Mean dependent var 5.402909 Adjusted R-squared 0.617870 S.D. dependent var 4.463791S.E. of regression 2.759365 Akaike info criterion 4.954386Sum squared resid 304.5637 Schwarz criterion 5.116585Log likelihood -104.9965 F-statistic 24.17576
Durbin-Watson stat 2.085119 Prob(F-statistic) 0.000000
White Heteroskedasticity Test:
F-statistic 1.358711 Probability 0.256813Obs*R-squared 7.944225 Probability 0.242218
Residuos
homocedásticos