tema 4: problemas provocados por los datos económicos · 1. multicolinealidad. concepto y tipos 2....

27
Tema 4 1 Tema 4: Problemas Provocados Por Los Datos Económicos 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción 3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica 4. Influencia real y potencial de las observaciones 5. Detección de outliers 6. No normalidad en las perturbaciones. Consecuencias 7. El contraste de normalidad de Jarque-Bera

Upload: others

Post on 19-Mar-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 1

Tema 4: Problemas Provocados Por Los Datos Económicos

1. Multicolinealidad. Concepto y tipos

2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción

3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica

4. Influencia real y potencial de las observaciones

5. Detección de outliers

6. No normalidad en las perturbaciones. Consecuencias

7. El contraste de normalidad de Jarque-Bera

Page 2: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 2

4.1. Multicolinealidad. Concepto Y Tipos

• M. EXACTA: cuando una de las variables explicativas es combianación lineal determinista de todas las demás.

• M. APROXIMADA: cuando una de las variables es aproximadamente igual a una combinación lineal de las restantes.

0...2211 =+++ kk xxx ααα

0...2211 =++++ υααα kk xxx

Page 3: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 3

23 5xx =

υ+= 2*3 5xx

X2 X3 X3*

10 50 52

15 75 75

18 90 97

24 120 129

30 150 152

4.1. Multicolinealidad. Concepto Y Tipos

Page 4: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 4

Tema 4: Problemas Provocados Por Los Datos Económicos

1. Multicolinealidad. Concepto y tipos

2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción

3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica

4. Influencia real y potencial de las observaciones

5. Detección de outliers

6. No normalidad en las perturbaciones. Consecuencias

7. El contraste de normalidad de Jarque-Bera

Page 5: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 5

4.2. Detección, Medición, Consecuencias...

• 1.- En los resultados de los modelos:– R2, R2 corregido, F,... Altos, mientras que los contrastes de

significación individual son no significativos– Grandes alteraciones en los estimadores al cambiar

ligeramente el modelo.– Signos incorrectos según la teoría económica.

Page 6: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 6

4.2. Detección, Medición, Consecuencias...

• 1.- Analizando las correlaciones– Matriz de correlaciones de las X, (si rij>0.8 correlación

fuerte entre xi y xj)– Calcular el determinante de la matriz de correlaciones de

las X, si tiende a cero existe multicolinealidad– Estimando regresiones auxiliares.

Si R2 (1) muy elevado existe elevada multicolinealidad

υ++++= kkj xaxaxax ...2211 (1)

Page 7: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 7

• Utilizando el modelo (1), la varianza del estimador del modelo original queda:

• Donde r2j es el coeficiente de determinación de (1)

)1(1

)1(ˆ)ˆ( 2

2

2

22

2

2

2

jn

iiji

un

iijji

un

iii

uj

RxRxVar

−=

==

∑∑∑===

σσ

υ

σβ

4.2. Detección, Medición, Consecuencias...

FIV

Page 8: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 8

4.2. Detección, Medición, Consecuencias...

• Veamos como varía el FIV a medida que aumenta el coeficiente de determinación de (1)

Rj2 FIV

0.00 1.00

0.50 2.00

0.80 5.00

0.90 10.00

0.99 100.00

0.999 1000.00

Page 9: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 9

4.2. Detección, Medición, Consecuencias...

• 1.- Intervalos de confianza amplios

• 2.- Contrastes de significación individuales indican coeficientes no significativos

• 3.- Medidas de bondad del ajuste satisfactorias• 4.- Estimaciones poco robustas. Sensibles ante cambios en la

variable• 5.- Modelo útil para predecir pero no para análisis estructural

)(ˆˆ)(ˆˆ)()( kknkkkknk StSt βββββ −− +≤≤−

Page 10: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 10

4.2. Detección, Medición, Consecuencias...

1685

064

1243

202

421

X2X1Y

1685

1264

043

202

421

X2X1Y

0.5523r 0.8101R

(0.0358) (2.4151) (1.5431) t(0.0851) (0.1848) (0.7737)

0030.04463.01939.1ˆ

232

32

==

=

++= iii XXY

0.8285r 0.8143R

(0.2158) (1.4752) (1.6187) t(0.1252) (0.2721) (0.7480)

0270.04014.02108.1ˆ

232

32

==

=

++= iii XXY

Page 11: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 11

Tema 4: Problemas Provocados Por Los Datos Económicos

1. Multicolinealidad. Concepto y tipos

2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción

3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica

4. Influencia real y potencial de las observaciones

5. Detección de outliers

6. No normalidad en las perturbaciones. Consecuencias

7. El contraste de normalidad de Jarque-Bera

Page 12: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 12

4.3. Soluciones a La Multicolinealidad

• 1.- Más información muestral.• Puede no ser posible.• Nuevas observaciones presentan multicolinealidad.

• 2.- Usar información extramuestral (MCR).• 3.- Aplicar componentes principales a la matriz X y realizar

la regresión con los componentes.• 4.- Eliminar la variables explicativa. (Cuidado con los errores

de especificación del modelo).• 5.- Convivir con el problema.

Page 13: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 13

Tema 4: Problemas Provocados Por Los Datos Económicos

1. Multicolinealidad. Concepto y tipos

2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción

3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica

4. Influencia real y potencial de las observaciones

5. Detección de outliers

6. No normalidad en las perturbaciones. Consecuencias

7. El contraste de normalidad de Jarque-Bera

Page 14: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 14

Tema 4: Problemas Frecuentes Provocados Por Los Datos Económicos

• Conviene explorar la existencia de unidades muestrales(individuos, años,...) atípicas

a) ¿Hay ‘individuos’ u observaciones cuyas variables X están muyalejadas de la media muestral? INFLUENCIA POTENCIAL

b) ¿Hay individuos ‘raros’ que distorsionan los resultados del modelo de regresión? INFLUENCIA REAL O EFECTIVA

c) ¿Hay individuos atípicos cuyos errores MC son anormalmente altos? OUTLIERS

Page 15: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 15

4.4. Análisis De Los Residuos Y Detección De Outliers

• 1.- Influencia potencial.La influencia potencial de una unidad muestral indica el ‘peso’ de esa observación en la obtención de los valores ajustados por MC de Y (variable endógena). Se mide mediante el leverage

Leverage"" H matriz la de ii elemento ')'(

')'(ˆˆ

1

1

==

===−

ii

nxnh

XXXXH

HYYXXXXXY β

Page 16: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 16

4.4. Análisis De Los Residuos Y Detección De Outliers

∑=

−+=

−=

−===

<<

n

ii

iii

iiui

uu

ii

xx

xxn

h

heVHIMeeEeV

hn

1

2

2

2

22

)(

)(1:simple linealregresión En

)1()(

)()'()(

min(1/n) 1/1

σ

σσ

Page 17: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 17

4.4. Análisis De Los Residuos Y Detección De Outliers

asegurada Influencia 5.0)max(hriesgo Posible 5.0)max(h 0.2

potencial influencia No 2.0)max(h (1981)Huber

2h :(1978)y Welsch Hoaglin

/)(

)1(1

ii

ii

ii

ii

>≤≤

>

=

+=

nk

nkhMedia

isDMahalanobn

h

ii

iii

Page 18: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 18

4.4. Análisis De Los Residuos Y Detección De Outliers

• 2.- Influencia realMide la capacidad real de cambiar los resultados de la estimación. La supresión de una observación llevaría a modificaciones importantes en las estimaciones, errores estándar, etc. Puede ocasionar:– Que variables son significativas– Signo de los coeficientes– No linealidad de la relación– No normalidad– Deterioro de la capacidad predictiva del modelo

Page 19: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 19

4.4. Análisis De Los Residuos Y Detección De Outliers

• Denotando por (1) el modelo estimado con toda la información y por (2) al modelo estimado sin la observación i

• Se puede definir el estadístico Distacia de Cook (di)

)()( ˆˆ )2(

ˆˆ )1(ii XY

XY

β

β

=

=

2

)()(

2

)()(

ˆ)ˆˆ)('()'ˆˆ(

ˆ)ˆˆ()'ˆˆ(

u

ii

u

iii

kXX

kYYYYD

σββββ

σ−−

=−−

=

Page 20: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 20

4.4. Análisis De Los Residuos Y Detección De Outliers

• Se contrasta la hipótesis nula:

• La distancia de Cook se distribuye bajo la Ho como una F con k, y n-k grados de libertad.

• ¿Qué hacer?:1. Revisar posibles errores en los datos.2. Probar formas funcionales alternativas.3. Eliminar la observación problemática.4. Introducir variables ficticias para el elemento i.

)influyente es NOn observació (La : )(0

iH ββ =

Page 21: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 21

Tema 4: Problemas Provocados Por Los Datos Económicos

1. Multicolinealidad. Concepto y tipos

2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción

3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica

4. Influencia real y potencial de las observaciones

5. Detección de outliers

6. No normalidad en las perturbaciones. Consecuencias

7. El contraste de normalidad de Jarque-Bera

Page 22: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 22

4.5. Análisis De Los Residuos Y Detección De Outliers

• OutliersIndividuo que presenta un residuo mínimo-cuadrático anormalmente elevado. Estas observaciones pueden: – Ejercer influencia sobre medidas de bondad del ajuste– Inexactitudes del modelo a estimar

• Formas no lineales• Omision de variables relevantes• Hetrocedasticidad• No normalidad

Page 23: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 23

4.5. Análisis De Los Residuos Y Detección De Outliers

• Residuos estandarizados

• Problemas1. No tiene en cuenta que los errores MCO son

heterocedasticos2. Si el outlier tiene influencia real, su error estará

infravalorado

)1,0(~)ˆ(2

N

ne

YYSe ii

e

i

∑−

=

Page 24: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 24

4.5. Análisis De Los Residuos Y Detección De Outliers

• Residuos studentizados

De esta forma, errores pequeños pueden ser considerados outliers

• Problemas1. Si el outlier tiene influencia real, su error estará

infravalorado

kniiu

ii

ie

i

iiui

th

YYSe

heVar

−−

−=

−=

~)1(ˆ

)ˆ(

)1()(

2

2

σ

σ

Page 25: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 25

4.5. Análisis De Los Residuos Y Detección De Outliers

• Residuos studentizados con omisión

)1(

~)1(ˆ

)ˆ(

)(

1)(2

)(

)(

)(

ii

iii

knii

iu

iii

ie

ii

he

e

th

YY

S

e

i

−=

−= −−

σ

Page 26: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 26

Tema 4: Problemas Provocados Por Los Datos Económicos

1. Multicolinealidad. Concepto y tipos

2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación y la predicción

3. 'Soluciones' a la multicolinealidad con y sin información adicional: cómo afrontar el problema en la práctica

4. Influencia real y potencial de las observaciones

5. Detección de outliers

6. No normalidad en las perturbaciones. Consecuencias

7. El contraste de normalidad de Jarque-Bera

Page 27: Tema 4: Problemas Provocados Por Los Datos Económicos · 1. Multicolinealidad. Concepto y tipos 2. Cómo detectar y medir el grado de multicolinealidad. Consecuencias para la estimación

Tema 4 27

4.7. Contraste de Jarque - Bera

( )

0

1

22 2

2

::

3~

6 4

H NormalidadH No Normalidad

KN KJB S χ −−

= +

( )

( )

( )

( )3

2

3 4

1 12

22

11

1 1

;11

N N

i ii i

NN

iiii

e e e eN NS K

e ee eNN

= =

==

− −= =

−−

∑ ∑

∑∑