modelos de variable dependiente binaria -logit y probit-

31
Modelos de Variable Dependiente Binaria -Logit y Probit- Maestría en Evaluación de Proyectos ITBA-UCEMA Daniel Lema

Upload: darrin

Post on 26-Jan-2016

161 views

Category:

Documents


3 download

DESCRIPTION

Modelos de Variable Dependiente Binaria -Logit y Probit-. Maestría en Evaluación de Proyectos ITBA-UCEMA Daniel Lema. Modelos Logit y Probit. Modelos de regresión donde la variable dependiente es binaria o dummy Por ejemplo: - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Modelos de Variable Dependiente Binaria -Logit y Probit-

Modelos de Variable Dependiente Binaria

-Logit y Probit-

Maestría en Evaluación de Proyectos

ITBA-UCEMA

Daniel Lema

Page 2: Modelos de Variable Dependiente Binaria -Logit y Probit-

Modelos Logit y Probit

• Modelos de regresión donde la variable dependiente es binaria o dummy

• Por ejemplo:

• Un modelo que trata de explicar los factores determinantes de que una familia sea propietaria de una casa.

• En particular, cuantificar la relación entre ingreso y propiedad

Page 3: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Se selecciona una muestra de hogares y se registra el ingreso y si la familia es propietaria o no de una casa. El modelo puede expresarse

• Yi=Xi + i

• Donde Yi = 1 si el hogar es propietario de su casa y cero en caso contrario.

• Xi es el ingreso del hogar i

Page 4: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Se puede aplicar MCO a este problema

• Pero existen 3 inconvenientes

• 1. Las predicciones del modelo no necesariamente estarán entre cero y uno

Page 5: Modelos de Variable Dependiente Binaria -Logit y Probit-

• 2. Considere el término de error. Para un valor dado de Xi el término de error sólo puede tomar uno de los siguientes dos valores

i––Xi cuando Yi = 1i––Xi cuando Yi = 0• En consecuencia los errores no se distribuyen

como una normal (de hecho lo hacen como una binomial)

Se puede demostrar que los errores son heteroscedásticos

Page 6: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Estos problemas no impiden absolutamente la aplicación de MCO

• Se puede ajustar por heteroscedasticidad

• Los errores no normales son menos problemáticos en muestras grandes

• Predicciones negativas o mayores a uno no son un problema serio (pueden ignorarse, por ej.)

Page 7: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Sin embargo, algunos supuestos del modelo son restrictivos

• Por ejemplo la constancia del efecto marginal de un cambio en el ingreso sobre la probabilidad de ser propietario ()

• Esperaríamos un efecto bajo para ingresos muy bajos y muy altos.

• Y un efecto mayor para ingresos promedio.• Esto implicaría una relación de este tipo

entre probabilidad de ser propietario e ingreso

Page 8: Modelos de Variable Dependiente Binaria -Logit y Probit-

0

0.2

0.4

0.6

0.8

1

X

p

Page 9: Modelos de Variable Dependiente Binaria -Logit y Probit-

• La relación es no lineal

• La variable dependiente está restringida entre cero y uno

• Dos modelos producen una relación de este tipo

• Un modelo basado en la función logística

• Un modelo derivado de una función de distribución normal acumulada

Page 10: Modelos de Variable Dependiente Binaria -Logit y Probit-

Modelo Logit

• Expresando el modelo explícitamente en términos de probabilidades tenemos

• Pi = Xi

• Donde Pi es la probabilidad de que el hogar i sea propietario de una casa

• Una relación que genera un gráfico como el anterior es:

)(1

1iXi

eP

Page 11: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Definimos la razón de probabilidades (odds ratio) como:

i

i

P

P

1En el caso de la propiedad de casas representa la razón de la probabilidad de que una familia posea una casa respecto de la probabilidad de que no la posea.

Por ejemplo, si Pi = 0.8 significa que las probabiliades son 4 a 1 a favor de que la familia posea una casa (0.8/0.2)

Page 12: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Si tomamos el logaritmo natural de la razón de probabilidades obtenemos

iii

ii XZ

P

PL

1

ln

• Entonces, el Li resulta lineal en X y también en los parámetros

• L es llamado modelo Logit

Page 13: Modelos de Variable Dependiente Binaria -Logit y Probit-

• La interpretación del modelo es la siguiente:

es la pendiente y mide el cambio en L ocasionado por un cambio unitario en X, es decir, dice cómo el logaritmo de las porbabilidades a favor de tener una casa cambian a mediada que el ingreso cambia en una unidad.

es el valor de L si el ingreso es cero

Page 14: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Dado un nivel de ingreso X* si se desea estimar la probabilidad de tener una casa (y no las probabilidades a favor de tener una casa) se puede calcular a partir de la definición de Pi una vez estimados los parámetros.

• El método de estimación es por Máxima Verosimilitud (MV)

Page 15: Modelos de Variable Dependiente Binaria -Logit y Probit-

El Modelo Probit

• La aproximación al problema es similar al Logit pero se supone una relación no lineal distinta (aunque muy similar) entre Xi y Pi

• Se basa en la distribución normal acumulada

• Se supone que la decisión de poseer o no una casa depenede de un índice I (conocido como variable latente)

Page 16: Modelos de Variable Dependiente Binaria -Logit y Probit-

• El índice I está determinado por una o varias variables explicativas. Por ej ingreso

• Cuanto mayor sea el índice mayor la probabilidad de tener una casa

• Ii = Xi

• Se supone un umbral crítico I* a partir del cuál, si I supera a I* entonces una familia posee una casa.

• El umbral I*, al igual que I, no es observable• Si se supone que está distribuido normalmente

con la misma media y varianza es posible estimar los parámetros del índice y también alguna información sobre el I*.

Page 17: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Pi = P (Y=1|X) = P(I*i ≤ Ii)

= P(Zi ≤ Xi) = F(Xi)

Donde Z es una variable estándar normal, Z ~

N(0, F es la función de distribución normal

acumulada

Page 18: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Explícitamente

Ii Zi dzeIF 2/2

2

1)(

Xi Z dze

2/2

2

1

Page 19: Modelos de Variable Dependiente Binaria -Logit y Probit-

0

0.2

0.4

0.6

0.8

1

X

p

0 - ∞+ ∞

Pi

Ii = + Xi

Pr (I*i≤ Ii)

Pi = F(Ii)

Page 20: Modelos de Variable Dependiente Binaria -Logit y Probit-

Interpretación de los Coeficientes• Una diferencia fundamental respecto a los

modelos lineales es que la influencia que tienen las variables explicativas sobre la probabilidad de elegir la opción dada por yi = 1 (la derivada parcial, dyi/dxi = βk en los modelos lineales) no es independiente del vector de características xi.

• Una primera aproximación a la relación entre las variables explicativas y la probabilidad resultante es calcular los efectos marginales sobre la variable latente (y*) .

Page 21: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Si el efecto marginal expresa el cambio de la variable dependiente provocado por un cambio unitario en una de las independientes manteniendo el resto constante, los parámetros estimados del Logit y el Probit reflejan el efecto marginal de las xik en yi de la misma forma que en el MLP, puesto qe E (y*|x) = x´β.

Page 22: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Los efectos marginales pueden construirse sobre la probabilidad y, de hecho, este es el tipo de presentación más frecuente.

• El efecto de la k−ésima variable explicativa, manteniendo el resto constante, puede ser calculado como:

• siendo F (.) la función de distribución y f (.) la función de densidad.

Page 23: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Por lo tanto, en un modelo binario la influencia que tienen las explicativas sobre la probabilidad de elegir la opción dada por yi = 1 no depende simplemente del valor los coeficientes, sino también del valor que toman las variables explicativas.

• Por ej: El efecto marginal máximo ocurrirá cuando Pr (y = 1) = 0.5

Page 24: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Esto significa que, a diferencia de lo que ocurre en el MLP, el efecto de una variable sobre la probabilidad varía con el valor de esa variable (es decir, no es independiente del vector de características xi).

Page 25: Modelos de Variable Dependiente Binaria -Logit y Probit-

• En Logit

• En Probit

Page 26: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Los resultados previos suponen que si bien los coeficientes de estos modelos no son directamente interpretables, sus valores relativos si lo son.

• Por ej. el cociente βj/ βk mide la importancia relativa de los efectos marginales de las variables xj y xk.

• Dado que los efectos marginales varian con x resulta conveniente calcularlos para valores concretos de la variable.

• Los “efectos marginales medios”, obtenidos a partir de la media muestral de la variable, son una de las formas más comunes de presentación de losresultados

Page 27: Modelos de Variable Dependiente Binaria -Logit y Probit-

• También se puede calcular, por ejemplo, el efecto medio respecto al conjunto de las

• observaciones:

Page 28: Modelos de Variable Dependiente Binaria -Logit y Probit-

Inferencia

• La inferencia no presenta diferencias sustanciales respecto al Modelo Lineal Gaussiano, por lo que para llevar a cabo hipótesis sobre el valor de un coeficiente puede emplearse un estadístico de la t−Student tradicional (aunque, siendo rigurosos, la distribución apropiada sería la Normal).(ratio z)

• Por su parte, para contrastar la validez de un conjunto de restricciones como las que definen la significación global del modelo puede el test de razón de verosimilitud (LR)

Page 29: Modelos de Variable Dependiente Binaria -Logit y Probit-

• LR

Page 30: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Por ultimo, una forma de evaluación del modelo es la que se deriva de la bondad del ajuste.

• Evidentemente, al tratarse de modelos no lineales carece de sentido plantear la bondad del ajuste en los t´erminos que definen el coeficiente de determinación (R2).

• Existen criterios alternativos que, en cierto modo, siguen la misma idea.

• Todas estas medidas deben interpretarse con cierta cautela

• Su validez como criterios de selección del modelo es ciertamente limitada.

Page 31: Modelos de Variable Dependiente Binaria -Logit y Probit-

• Una medida es el pseudo R2 de Mc Fadden:

• En este caso, si los coeficientes son poco significativos la capacidad explicativa del modelo será muy reducida y el Loglikelihood sin restricciones será muy similar al L0; por el contrario, cuanto mayor sea la capacidad explicativa del modelo, más proximo estará R2 a uno.