tema 4: problemas provocados por los datos económicos · 1. multicolinealidad. concepto y tipos 2....
TRANSCRIPT
Tema 4 1
Tema 4: Problemas Provocados Por Los Datos Económicos
1. Multicolinealidad. Concepto y tipos
2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción
3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica
4. Influencia real y potencial de las observaciones
5. Detección de outliers
6. No normalidad en las perturbaciones. Consecuencias
7. El contraste de normalidad de Jarque-Bera
Tema 4 2
4.1. Multicolinealidad. Concepto Y Tipos
• M. EXACTA: cuando una de las variables explicativas es combianación lineal determinista de todas las demás.
• M. APROXIMADA: cuando una de las variables es aproximadamente igual a una combinación lineal de las restantes.
0...2211 =+++ kk xxx ααα
0...2211 =++++ υααα kk xxx
Tema 4 3
23 5xx =
υ+= 2*3 5xx
X2 X3 X3*
10 50 52
15 75 75
18 90 97
24 120 129
30 150 152
4.1. Multicolinealidad. Concepto Y Tipos
Tema 4 4
Tema 4: Problemas Provocados Por Los Datos Económicos
1. Multicolinealidad. Concepto y tipos
2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción
3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica
4. Influencia real y potencial de las observaciones
5. Detección de outliers
6. No normalidad en las perturbaciones. Consecuencias
7. El contraste de normalidad de Jarque-Bera
Tema 4 5
4.2. Detección, Medición, Consecuencias...
• 1.- En los resultados de los modelos:– R2, R2 corregido, F,... Altos, mientras que los contrastes de
significación individual son no significativos– Grandes alteraciones en los estimadores al cambiar
ligeramente el modelo.– Signos incorrectos según la teoría económica.
Tema 4 6
4.2. Detección, Medición, Consecuencias...
• 1.- Analizando las correlaciones– Matriz de correlaciones de las X, (si rij>0.8 correlación
fuerte entre xi y xj)– Calcular el determinante de la matriz de correlaciones de
las X, si tiende a cero existe multicolinealidad– Estimando regresiones auxiliares.
Si R2 (1) muy elevado existe elevada multicolinealidad
υ++++= kkj xaxaxax ...2211 (1)
Tema 4 7
• Utilizando el modelo (1), la varianza del estimador del modelo original queda:
• Donde r2j es el coeficiente de determinación de (1)
)1(1
)1(ˆ)ˆ( 2
2
2
22
2
2
2
jn
iiji
un
iijji
un
iii
uj
RxRxVar
−=
−
==
∑∑∑===
σσ
υ
σβ
4.2. Detección, Medición, Consecuencias...
FIV
Tema 4 8
4.2. Detección, Medición, Consecuencias...
• Veamos como varía el FIV a medida que aumenta el coeficiente de determinación de (1)
Rj2 FIV
0.00 1.00
0.50 2.00
0.80 5.00
0.90 10.00
0.99 100.00
0.999 1000.00
Tema 4 9
4.2. Detección, Medición, Consecuencias...
• 1.- Intervalos de confianza amplios
• 2.- Contrastes de significación individuales indican coeficientes no significativos
• 3.- Medidas de bondad del ajuste satisfactorias• 4.- Estimaciones poco robustas. Sensibles ante cambios en la
variable• 5.- Modelo útil para predecir pero no para análisis estructural
)(ˆˆ)(ˆˆ)()( kknkkkknk StSt βββββ −− +≤≤−
Tema 4 10
4.2. Detección, Medición, Consecuencias...
1685
064
1243
202
421
X2X1Y
1685
1264
043
202
421
X2X1Y
0.5523r 0.8101R
(0.0358) (2.4151) (1.5431) t(0.0851) (0.1848) (0.7737)
0030.04463.01939.1ˆ
232
32
==
=
++= iii XXY
0.8285r 0.8143R
(0.2158) (1.4752) (1.6187) t(0.1252) (0.2721) (0.7480)
0270.04014.02108.1ˆ
232
32
==
=
++= iii XXY
Tema 4 11
Tema 4: Problemas Provocados Por Los Datos Económicos
1. Multicolinealidad. Concepto y tipos
2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción
3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica
4. Influencia real y potencial de las observaciones
5. Detección de outliers
6. No normalidad en las perturbaciones. Consecuencias
7. El contraste de normalidad de Jarque-Bera
Tema 4 12
4.3. Soluciones a La Multicolinealidad
• 1.- Más información muestral.• Puede no ser posible.• Nuevas observaciones presentan multicolinealidad.
• 2.- Usar información extramuestral (MCR).• 3.- Aplicar componentes principales a la matriz X y realizar
la regresión con los componentes.• 4.- Eliminar la variables explicativa. (Cuidado con los errores
de especificación del modelo).• 5.- Convivir con el problema.
Tema 4 13
Tema 4: Problemas Provocados Por Los Datos Económicos
1. Multicolinealidad. Concepto y tipos
2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción
3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica
4. Influencia real y potencial de las observaciones
5. Detección de outliers
6. No normalidad en las perturbaciones. Consecuencias
7. El contraste de normalidad de Jarque-Bera
Tema 4 14
Tema 4: Problemas Frecuentes Provocados Por Los Datos Económicos
• Conviene explorar la existencia de unidades muestrales(individuos, años,...) atípicas
a) ¿Hay ‘individuos’ u observaciones cuyas variables X están muyalejadas de la media muestral? INFLUENCIA POTENCIAL
b) ¿Hay individuos ‘raros’ que distorsionan los resultados del modelo de regresión? INFLUENCIA REAL O EFECTIVA
c) ¿Hay individuos atípicos cuyos errores MC son anormalmente altos? OUTLIERS
Tema 4 15
4.4. Análisis De Los Residuos Y Detección De Outliers
• 1.- Influencia potencial.La influencia potencial de una unidad muestral indica el ‘peso’ de esa observación en la obtención de los valores ajustados por MC de Y (variable endógena). Se mide mediante el leverage
Leverage"" H matriz la de ii elemento ')'(
')'(ˆˆ
1
1
==
===−
−
ii
nxnh
XXXXH
HYYXXXXXY β
Tema 4 16
4.4. Análisis De Los Residuos Y Detección De Outliers
∑=
−
−+=
−=
−===
<<
n
ii
iii
iiui
uu
ii
xx
xxn
h
heVHIMeeEeV
hn
1
2
2
2
22
)(
)(1:simple linealregresión En
)1()(
)()'()(
min(1/n) 1/1
σ
σσ
Tema 4 17
4.4. Análisis De Los Residuos Y Detección De Outliers
asegurada Influencia 5.0)max(hriesgo Posible 5.0)max(h 0.2
potencial influencia No 2.0)max(h (1981)Huber
2h :(1978)y Welsch Hoaglin
/)(
)1(1
ii
ii
ii
ii
>≤≤
≤
>
=
+=
nk
nkhMedia
isDMahalanobn
h
ii
iii
Tema 4 18
4.4. Análisis De Los Residuos Y Detección De Outliers
• 2.- Influencia realMide la capacidad real de cambiar los resultados de la estimación. La supresión de una observación llevaría a modificaciones importantes en las estimaciones, errores estándar, etc. Puede ocasionar:– Que variables son significativas– Signo de los coeficientes– No linealidad de la relación– No normalidad– Deterioro de la capacidad predictiva del modelo
Tema 4 19
4.4. Análisis De Los Residuos Y Detección De Outliers
• Denotando por (1) el modelo estimado con toda la información y por (2) al modelo estimado sin la observación i
• Se puede definir el estadístico Distacia de Cook (di)
)()( ˆˆ )2(
ˆˆ )1(ii XY
XY
β
β
=
=
2
)()(
2
)()(
ˆ)ˆˆ)('()'ˆˆ(
ˆ)ˆˆ()'ˆˆ(
u
ii
u
iii
kXX
kYYYYD
σββββ
σ−−
=−−
=
Tema 4 20
4.4. Análisis De Los Residuos Y Detección De Outliers
• Se contrasta la hipótesis nula:
• La distancia de Cook se distribuye bajo la Ho como una F con k, y n-k grados de libertad.
• ¿Qué hacer?:1. Revisar posibles errores en los datos.2. Probar formas funcionales alternativas.3. Eliminar la observación problemática.4. Introducir variables ficticias para el elemento i.
)influyente es NOn observació (La : )(0
iH ββ =
Tema 4 21
Tema 4: Problemas Provocados Por Los Datos Económicos
1. Multicolinealidad. Concepto y tipos
2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción
3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica
4. Influencia real y potencial de las observaciones
5. Detección de outliers
6. No normalidad en las perturbaciones. Consecuencias
7. El contraste de normalidad de Jarque-Bera
Tema 4 22
4.5. Análisis De Los Residuos Y Detección De Outliers
• OutliersIndividuo que presenta un residuo mínimo-cuadrático anormalmente elevado. Estas observaciones pueden: – Ejercer influencia sobre medidas de bondad del ajuste– Inexactitudes del modelo a estimar
• Formas no lineales• Omision de variables relevantes• Hetrocedasticidad• No normalidad
Tema 4 23
4.5. Análisis De Los Residuos Y Detección De Outliers
• Residuos estandarizados
• Problemas1. No tiene en cuenta que los errores MCO son
heterocedasticos2. Si el outlier tiene influencia real, su error estará
infravalorado
)1,0(~)ˆ(2
N
ne
YYSe ii
e
i
∑−
=
Tema 4 24
4.5. Análisis De Los Residuos Y Detección De Outliers
• Residuos studentizados
De esta forma, errores pequeños pueden ser considerados outliers
• Problemas1. Si el outlier tiene influencia real, su error estará
infravalorado
kniiu
ii
ie
i
iiui
th
YYSe
heVar
−−
−=
−=
~)1(ˆ
)ˆ(
)1()(
2
2
σ
σ
Tema 4 25
4.5. Análisis De Los Residuos Y Detección De Outliers
• Residuos studentizados con omisión
)1(
~)1(ˆ
)ˆ(
)(
1)(2
)(
)(
)(
ii
iii
knii
iu
iii
ie
ii
he
e
th
YY
S
e
i
−=
−
−= −−
σ
Tema 4 26
Tema 4: Problemas Provocados Por Los Datos Económicos
1. Multicolinealidad. Concepto y tipos
2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción
3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica
4. Influencia real y potencial de las observaciones
5. Detección de outliers
6. No normalidad en las perturbaciones. Consecuencias
7. El contraste de normalidad de Jarque-Bera
Tema 4 27
4.7. Contraste de Jarque - Bera
( )
0
1
22 2
2
::
3~
6 4
H NormalidadH No Normalidad
KN KJB S χ −−
= +
( )
( )
( )
( )3
2
3 4
1 12
22
11
1 1
;11
N N
i ii i
NN
iiii
e e e eN NS K
e ee eNN
= =
==
− −= =
−−
∑ ∑
∑∑