especificación, identificación e interpretación del...

8
Especificación, identificación e interpretación del modelo logit mixto Seminario: MODELOS DE ELECCIÓN MODAL Valencia, 10 de noviembre de 2005 Alfonso Orro Arcay Grupo de Ferrocarriles y Transportes E.T.S. de Ingenieros de Caminos, Canales y Puertos UNIVERSIDAD DE A CORUÑA caminos.udc.es/grupos/ferroca/orro/ Especificación, identificación e interpretación del modelo logit mixto 2 Modelos de elección modal Valencia, 10 de noviembre de 2005 El modelo logit mixto Surge como modelo hedónico o logit con coeficientes aleatorios a finales de la década de los 70 Reformulación y fuerte impulso a finales de los 90 Gran auge en la literatura científica en los últimos años Puede aproximar cualquier modelo de utilidad aleatoria con la precisión deseada (haciendo despreciable el término Gumbel) pero ¿debe sustituirlos siempre? Complejo de especificar y estimar Requiere simulación para la estimación Clásica maximizar una función de verosimilitud Bayesiana Parece oportuno reservarlo para aquellos casos en los que son necesarias sus capacidades

Upload: hoangtu

Post on 27-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Especificación, identificación e interpretación del modelo logit mixto

Seminario:

MODELOS DE ELECCIÓN MODALValencia, 10 de noviembre de 2005

Alfonso Orro ArcayGrupo de Ferrocarriles y Transportes

E.T.S. de Ingenieros de Caminos, Canales y Puertos

UNIVERSIDAD DE A CORUÑA

caminos.udc.es/grupos/ferroca/orro/

Especificación, identificación e interpretación del modelo logit mixto 2

Modelos de elección modalValencia, 10 de noviembre de 2005

El modelo logit mixtoSurge como modelo hedónico o logit con coeficientes aleatorios afinales de la década de los 70

Reformulación y fuerte impulso a finales de los 90

Gran auge en la literatura científica en los últimos años

Puede aproximar cualquier modelo de utilidad aleatoria con la precisión deseada (haciendo despreciable el término Gumbel) pero ¿debe sustituirlos siempre?

Complejo de especificar y estimarRequiere simulación para la estimación

Clásica maximizar una función de verosimilitudBayesiana

Parece oportuno reservarlo para aquellos casos en los que son necesarias sus capacidades

Especificación, identificación e interpretación del modelo logit mixto 3

Modelos de elección modalValencia, 10 de noviembre de 2005

Las posibilidades del modelo logit mixtoDos especificaciones alternativas:

Componentes de error énfasis en la estructura del error: correlaciones y heteroscedasticidades patrones de sustitución entre alternativas

Coeficientes aleatorios análogo al logit convencional, pero suponiendo que los coeficientes del modelo son variables aleatorias distribución de los gustos en la población

Utilizar una especificación u otra es principalmente interpretación

Más utilizada la especificación de coeficientes aleatorios

Enfoque de la ponencia:¿Cuándo utilizar el logit mixto?Aspectos a tener en cuenta en la especificación¿Qué resultados se pueden obtener?Líneas de trabajo, ideas pendientes de contraste, hechos demostrados ...

Especificación, identificación e interpretación del modelo logit mixto 4

Modelos de elección modalValencia, 10 de noviembre de 2005

Correlación en el logit mixtoEl logit mixto permite especificar correlación:

explícitamentea través de la especificación de coeficientes aleatorios

Entre alternativas:Nidos separados

Necesario artificio para mantener la misma matriz de covarianza del logit jerárquicoNo parece necesario emplear simulación existiendo una formulación cerrada ampliamente conocida

Nidos cruzadosPuede ser una alternativa interesante si no se dispone de programas para estimar modelos con formulación cerrada (PCL, CNL, GNL...)

Entre observaciones:Varias elecciones del mismo individuo Muy sencillo de especificar con el logit mixto mismo valor del coeficiente individual en todas las eleccionesDependencia de elecciones anteriores también es sencillo de introducir sin cambiar el procedimiento de estimación

Especificación, identificación e interpretación del modelo logit mixto 5

Modelos de elección modalValencia, 10 de noviembre de 2005

Variaciones en los gustosComposición de la función de utilidad indirecta condicional de cada individuo desde el punto de vista del analista:

Sesgo específico del individuo hacia la alternativaUtilidad derivada de las características de nivel deservicio (tiempos de viaje, costes, seguridad...)Término aleatorio de media cero

En la población se pueden considerar que los gustos o preferencias:Son constantes realmente serían valores medios y la variación se absorbe en el término aleatorioPresentan variaciones sistemáticas media para individuos con las mismas características resto de la variación en el término aleatorio

con atributos socioeconómicos del individuocon características del viajecon el valor de la variable de nivel de servicio realmente gustos constantes e influencia no lineal de la variable riesgo

Tienen variación aleatoria con distribución conocida (supuesta) se puede determinar media y varianza o parámetros similares la propia del logit mixto

Gustos delindividuo

Especificación, identificación e interpretación del modelo logit mixto 6

Modelos de elección modalValencia, 10 de noviembre de 2005

Variaciones en los gustosVariaciones sistemáticas con atributos del individuo o del viaje:

Se pueden introducir como interacción entre variablesOfrecen más información que las aleatorias se estima el valor para cada individuo o cada situaciónRequieren más datos para la estimación y la aplicaciónPueden incluirse en los modelos de parámetros fijos y también añadirlas en los de parámetros aleatorios

Variaciones aleatorias:Permiten estudiar la variabilidaden la poblaciónCon varias elecciones por individuose pueden obtener distribucionescondicionales

Especificación, identificación e interpretación del modelo logit mixto 7

Modelos de elección modalValencia, 10 de noviembre de 2005

Especificación de coeficientes aleatoriosCoeficientes a establecer como aleatorios:

Parece menos interesante para los del sesgo específico:En la práctica sólo supone heteroscedasticidadDificultades de identificación al mezclarse dos distribuciones

Interesan los ratios entre coeficientesEn especificaciones lineales son las tasas marginales de sustitución generalmente con respecto al parámetro del coste: valor subjetivo de los atributos o disposición a pagar (p.ej. valor del tiempo)Si ambos coeficientes son aleatorios (p.ej. normales):

La distribución del valor subjetivo es indeterminadaPueden aparecer valores muy elevados o no calculables si la distribución incluye el 0

Varios autores aconsejan mantener fijo el coeficiente del coste

Para seleccionar los coeficientes aleatoriosDudosa estimabilidad con todos los coeficientes aleatoriosTest de multiplicadores de Lagrange el propio Train no lo cita en su libroTest t de los parámetros de desviación y test de razón de verosimilitud

Permiten escoger entre parámetros fijos o aleatorios, al menos en problemas sencillosFallan en el caso de no linealidad

Especificación, identificación e interpretación del modelo logit mixto 8

Modelos de elección modalValencia, 10 de noviembre de 2005

Confusión entre no linealidad y aleatoriedadSi un atributo interviene de forma no lineal con coeficiente constante en la función de utilidad y se especifica lineal con coeficiente aleatorio puede aparecer significativa la desviación

Esto sucederá si el atributo está aleatoriamente distribuido en la muestra

Es una variación sistemática, que depende del valor del atributo

Riesgo ante un cambio en el atributo cambian las valoraciones no válidos para prognosis

Posibles métodos de detecciónEspecificar modelos con estimación de no linealidad no habitualProcedimientos de detección de no linealidades coeficiente por rangosEstudios con múltiples respuestas por individuo la distribución condicional puede ser similar a la poblacional si la variación del atributo es similar

Especificación, identificación e interpretación del modelo logit mixto 9

Modelos de elección modalValencia, 10 de noviembre de 2005

Distribuciones para los coeficientesMás frecuentes: Normal, lognormal, triangular, uniforme

Problemas con las distribuciones:Normal: cambio de signo aparece probabilidad de, p. ej., valores del tiempo negativos

lognormal difícil de estimar con procedimiento clásicodebe recordarse que la media no coicide con la moda

distribuciones censuradas

Colas de las distribuciones probabilidad de valores excesivosdistribuciones triangulares y uniformes

difíciles de estimar por métodos bayesianosdistribuciones truncadas

Líneas de trabajo: distribuciones más flexibles como SB de Johnson ...

Especificación, identificación e interpretación del modelo logit mixto 10

Modelos de elección modalValencia, 10 de noviembre de 2005

Distribuciones para los coeficientesBuen ajuste con distribuciones limitadas

Algunos resultados de parámetros individuales sugieren que los valores negativos previstos con la normal no aparecen en estos parámetros

Hay autores que sostienen que esto indica que la normal no tiene problemasOtra posibilidad es que estos valores apunten a distribuciones truncadasSe ha sugerido que la media de la normal puede desplazarse respecto al valor real para minimizar la probabilidad de valores negativos

Se han desarrollado métodos de ayuda para la selección de distribuciones

0

0.0001

0.0002

0.0003

0.0004

0.0005

0.0006

0.0007

-4000 -2000 0 2000 4000 6000 8000

Valor del tiempo (pts/h)

TN -N

TO - N

TN - TR

TO - TR

Especificación, identificación e interpretación del modelo logit mixto 11

Modelos de elección modalValencia, 10 de noviembre de 2005

IdentificaciónSegún la teoría de la maximización de la utilidad aleatoria la elección sólo está condicionada por las diferencias entre utilidades normalizar escala y nivel

Seleccionar solución única de infinitas soluciones que generan las mismas probabilidades

Algoritmo de maximización (más con simulación) puede dar resultados no identificados signos para detectarlo:

Desviaciones típicas elevadasHessiano singularInestabilidad de las estimaciones

La identificación de la componente sistemática es sencilla, normalizar:Constantes específicasVariables socioeconómicasVariables en categorías

Especificación, identificación e interpretación del modelo logit mixto 12

Modelos de elección modalValencia, 10 de noviembre de 2005

Identificación del logit mixtoLa identificación del logit mixto presenta problemas que no aparecen en otros modelos estudiar con cuidado la matriz de covarianza de las diferencias entre utilidades

Si se especifican coeficientes aleatorios en variables con variación en la muestra no hay problemas de identificación (salvo problemas de multicolinealidad)

La mayoría de los problemas de identificación surgen de la dificultad de separar la distribución Gumbel del término iid. de la distribución especificada para un coeficiente no es una falta de identificación completa

difícil identificar que parte de la variabilidad corresponde a cada distribuciónse normaliza la escala de la Gumbel y una de las restantes varianzas implicadas (ver casos particulares)no son válidas todas las normalizaciones necesario normalizar la varianza mínima para que no sean precisas matrices de covarianza definidas negativasla varianza mínima se obtiene del modelo casi sin identificar

Especificación, identificación e interpretación del modelo logit mixto 13

Modelos de elección modalValencia, 10 de noviembre de 2005

Identificación del logit mixtoConsideraciones generales de identificación de los términos de desviación en el logit mixto:

Sesgos específicos:con dos alternativas ninguna desviación es identificablecon tres o más alternativas estimables todas las desviaciones menos una, debefijarse a cero la varianza menor ↔ fijar que la alternativa de mínima varianza tenga sólo la componente Gumbel y en las restantes la Gumbel más una varianza adicional

Variables de pertenencia a nidos y variables de alternativas en categoríasCon dos nidos o dos categorías (si la variable entre en todas las utilidades) uno de los dos parámetros no está identificado, la normalización es arbitraria

Con tres o más nidos o categorías todos los parámetros de desviación están identificados, también con dos categorías si la variable no entra en todas las utilidades

Especificación, identificación e interpretación del modelo logit mixto 14

Modelos de elección modalValencia, 10 de noviembre de 2005

Identificación del logit mixtoAtributos socioeconómicos del individuo como variables mudas se aplican las reglas de la variable con la que interaccione para no anularse en las diferencias

Atributos del individuo en categorías interactuando con las constantes específicas de las alternativas:

son identificables todas las desviaciones menos unadebe fijarse a cero la mínima varianza de todas las presentes

Consideraciones sobre la estimabilidad de los coeficientes aleatorios que interactúan con variables continuas con variación en la muestra:

Formalmente no hay problemas de identificaciónSi la variabilidad que introducen es menor que la del término Gumbel van a ser muy difíciles de estimar

Especificación, identificación e interpretación del modelo logit mixto 15

Modelos de elección modalValencia, 10 de noviembre de 2005

Resultados del logit mixtoPrognosis elecciones que predice el modelo

Para los modelos con coeficientes aleatoriosDiversos estudios concluyen que no hay grandes diferencias con las prognosis de modelos más sencillosParece que las diferencias son mayores en alternativas con baja probabilidad de elecciónTampoco parece haber grandes diferencias en prognosis entre especificar unas distribuciones u otras

La correlación puede hacer variar notablemente los resultados de las prognosis

Interpretación de resultados:Las valoraciones de los atributos pasan a ser en sí mismas variables aleatorias (sus estimaciones siempre lo son al serlo los estimadores)No sé tiene un único valor del tiempo sino una distribución en la población nuevas posibilidades pero también dificultades para la evaluación social de inversionesInteresante para conocer la valoración de elementos que pueden ser valorados negativa, neutra o positivamente por los usuarios

Especificación, identificación e interpretación del modelo logit mixto

Seminario:

MODELOS DE ELECCIÓN MODALValencia, 10 de noviembre de 2005

Alfonso Orro ArcayGrupo de Ferrocarriles y Transportes

E.T.S. de Ingenieros de Caminos, Canales y Puertos

UNIVERSIDAD DE A CORUÑA

[email protected]

Documentos en pdf con formulaciones, referencias, demostraciones y aplicaciones en:

caminos.udc.es/grupos/ferroca/orro/