capÍtulo 16

85
CAPÍTULO 16 Modelos Tobit y Selección 16.1 . Introducción En este capítulo se consideran dos temas muy relacionados: regresión cuando la variable dependiente de interés es incompleta y a la regresión observada cuando la variable dependiente es completamente observado también se observa en una muestra seleccionada que no es representante de la población. Esto incluye los modelos limitados variable dependiente, variable latente modelos Tobit generalizados, modelos, modelos y selección. Todos estos modelos comparten la característica común que incluso en el caso más sencillo de mor- talidad media condicional lineal en los regresores, regresión de MCO no conduce a estimaciones de parámetros debido a que la muestra no es representativa de la población. Alter- nativa procedimientos de estimación, la mayoría dependen de supuestos distributivos fuertes, son necesarias para asegurar la coherencia estimación de parámetros. Principales causas de forma incompleta datos observados son el truncamiento y censura. Para datos truncados algunas observaciones sobre la variable dependiente y los regresores se pierden. Por ejemplo, los ingresos pueden ser la variable dependiente y sólo las personas de bajos ingresos están incluidos en la muestra. Para información de datos censurados en la variable dependiente se pierde, pero no los datos de los regresores. Por ejemplo, la gente de todos los niveles de ingresos puede estar incluida en la muestra, pero por razones de confidencialidad los ingresos de personas de altos ingresos pueden ser de distintos colores y sólo informó que sobrepase, por ejemplo, 100.000 dólares por año. El truncamiento implica una mayor pérdida de información que censurar. Un ejemplo destacado de truncamiento y la censura es el modelo tobit, que debe su nombre a Tobin (1958), que consideró regresión lineal por debajo de lo normal. Problemas similares surgen de truncamiento y censura en otros modelos presentados en los

Upload: katherine-lissete-birreo-mateo

Post on 19-Dec-2015

237 views

Category:

Documents


3 download

TRANSCRIPT

CAPTULO 16Modelos Tobit y Seleccin16.1 . IntroduccinEn este captulo se consideran dos temas muy relacionados: regresin cuando la variable dependiente de inters es incompleta y a la regresin observada cuando la variable dependiente es completamente observado tambin se observa en una muestra seleccionada que no es representante de la poblacin. Esto incluye los modelos limitados variable dependiente, variable latente modelos Tobit generalizados, modelos, modelos y seleccin.Todos estos modelos comparten la caracterstica comn que incluso en el caso ms sencillo de mor- talidad media condicional lineal en los regresores, regresin de MCO no conduce a estimaciones de parmetros debido a que la muestra no es representativa de la poblacin. Alter- nativa procedimientos de estimacin, la mayora dependen de supuestos distributivos fuertes, son necesarias para asegurar la coherencia estimacin de parmetros.Principales causas de forma incompleta datos observados son el truncamiento y censura. Para datos truncados algunas observaciones sobre la variable dependiente y los regresores se pierden. Por ejemplo, los ingresos pueden ser la variable dependiente y slo las personas de bajos ingresos estn incluidos en la muestra. Para informacin de datos censurados en la variable dependiente se pierde, pero no los datos de los regresores. Por ejemplo, la gente de todos los niveles de ingresos puede estar incluida en la muestra, pero por razones de confidencialidad los ingresos de personas de altos ingresos pueden ser de distintos colores y slo inform que sobrepase, por ejemplo, 100.000 dlares por ao. El truncamiento implica una mayor prdida de informacin que censurar. Un ejemplo destacado de truncamiento y la censura es el modelo tobit, que debe su nombre a Tobin (1958), que consider regresin lineal por debajo de lo normal. Problemas similares surgen de truncamiento y censura en otros modelos presentados en los captulos posteriores, especialmente en el caso de censura duracin los datos presentados en el Captulo 17. Ms en general, el truncamiento y censura son ejemplos de la falta de datos los problemas que se estudian en el Captulo 27.La primera generacin de mtodos de estimacin hiptesis requiere una fuerte distribucin.Aunque aparentemente menores salidas de suposiciones, como heterosedasticidad homocedsticas utilizndose errores errores cuando se supone, no puede conducir a estimaciones de parmetros.Por esta razn los modelos presentados en este captulo proporcionan un econometra aplicacin de mtodos de regresin semiparamtrico. Mtodos simples para concentrar529

MODELOS TOBIT Y SELECCINformas de censura y truncamiento como tope de codificacin se han aplicado correctamente.Sin embargo, en general los modelos con seleccin de aspectos hasta la fecha no hay ningn procedimiento ampliamente aceptado.Seccin 16.2 presenta teora general de censurados y truncados no lineal regresion modelos, con especializacin en el modelo tobit en la Seccin 16.3 . Una alternativa de modelo de datos censurados, las dos partes de modelo, es introducido en la Seccin 16.4 . La seleccin de la muestra se presenta en la Seccin 16.5 . Una aplicacin a la salud gastos operativos en la Seccin 16.6 contrasta las dos partes de modelos y de seleccin de la muestra. El modelo no observables de Roy hiptesis se presenta en la Seccin 16.7 . Seccin 16.8 ges- tin totalmente los modelos estructurales de maximizacin de la utilidad de las soluciones o por extensin de modelos de ecuaciones simultaneas a muestras seleccionadas. Concentrar estimacin se presenta en la Seccin 16.9 .16.2 . Modelos censurados y truncadospresentamos mtodos generales para la estimacin de modelos paramtricos completamente cuando los datos estn censurados o truncado. Estos mtodos pueden ser aplicados a los modelos presentados en los captulos posteriores tales como modelos y la duracin. El ejemplo ms destacado, el modelo tobit para censurar o truncado en modelos lineales, se presenta en la Seccin 16.2.1 y tratamiento por separado en la Seccin 16.3 .16.2.1 . Censura y truncamiento Ejemplo* * y que denotan una variable observada que es incompleta. Para el truncamiento desde abajo, y * slo se observa si supera un umbral. En aras de la sencillez, que umbral cero.* * A continuacin, observamos y = y si y > 0. Dado que los valores negativos no aparecen en la muestra, el truncado media supera la media de y . De la censura desde abajo a cero, y * no est completamente observada cuando y 0, pero se sabe que y < 0 y por la sencillez y se establece en 0. Desde los valores negativos se escalan hasta cero, la censura significa tambin supera la media de y . Evidentemente, muestra significa truncado o censurados en las muestras no se puede utilizar sin ajuste para estimar la poblacin original.Este captulo se estudian cuestiones similares en modelos de regresin. Con un poco de suerte, el truncamiento y censurar slo podra dar lugar a un desplazamiento hacia arriba o hacia abajo en la interseccin, dejando pendiente puede llegar sin cambios; sin embargo, este no es el caso. Por ejemplo, si E[y |x] = x en el modelo original, a continuacin, el truncamiento o censurar conduce a E[y|x] que no lineal en x y para que LA OPERACIN son inconsistentes las estimaciones de y por lo tanto incompatibles las estimaciones de los efectos marginales.Como ejemplo, considere el siguiente ejemplo de oferta de mano de obra* datos simulados. La relacin entre nmero de horas trabajadas, y , y salario por hora,w, se especifica que de lineal y formulario de registro con los datos de proceso de generacinY = -2500 + 1000 matrcula lnw +, (16.1 ) N [0, 2 1000 ], matrcula lnw N [2,75 , 0. 2 60 ].530

16.2 . CENSURADOS Y truncados LOS MODELOSTobit: censurados y truncados Medios400020000RealMedia Variable latente truncado-2000 censura significacensura condicional significa diferentes medios-40001 2 3 4 5logaritmo natural de los salariosFigura 16.1 : regresin Tobit de las horas de registro salario promedio condicional: sin censura (parte inferior), censurados media condicional (en el centro), y trunca media condicional (superior) de la censura/truncado desde abajo a las cero horas. Los datos generados a partir de un modelo de regresin lineal clsico.Este es un modelo tobit, estudi en detalle en la Seccin 16.3 . El modelo supone que elaumento de salario, aumento de horas anual 10 horas. %1 * elasticidad salario 1000/y , lo que equivale a, por ejemplo, 0,5 para el trabajo a tiempo completo (2.000 horas).* Para cada Figura 16.1 presenta un grfico de dispersin de matrcula lnw y genera una muestra de 200* observaciones. La incondicional significa para y , que es -2500 + 1000 matrcula lnw, est dada por la curva ms baja, que es una lnea recta.* Con censurar a cero, los valores negativos de y se ponen a cero negativo debido a que la gente con horas de trabajo desee optar por no trabajar. Para este ejemplo concreto es el caso de aproximadamente el 35% de las observaciones. Este empuja hacia arriba la media de baja* los salarios, ya que los muchos valores negativos de los aos se desplazan hasta cero.* Tiene poco impacto en los salarios elevados, ya que, a continuacin, algunas observaciones sobre el problema del ao cero. La curva en la figura 16.1 la censura da media, usando la frmula que figura ms adelante en (16,23 ).* Con el truncado con el cero, el 35% de la poblacin con valores negativos de y se cay por completo. Esto hace que aumente la media por encima de la censura significa, ya que los valores iguales a cero ya no estn incluidos en los datos utilizados para la media. La curva superior en la figura 16.1 se trunca el resultado da media, usando la frmula que figura ms adelante en (16,23 ).Est claro que censurados y truncados medio condicional son no-lineales en x incluso si la media de la poblacin subyacente es lineal. Estimacin mediante MCO truncado o cen- patrocinados datos lleven a incompatible estimacin de la pendiente parmetro, ya que por vi- sual de inspeccin Figura 16.1 una aproximacin lineal de la truncada no lineal y censurados medios tendr ms plana que la de pendiente el original no truncada.Anlisis debe basarse en las frmulas para la censura o trunca condi- media. Desafortunadamente, estos son el resultado de una fuerte distribucin hiptesis, como veremos.531

MODELOS TOBIT Y SELECCIN16.2.2 . Censura y truncamiento mecanismoscomo es habitual en anlisis de regresin, nos vamos a indicar el valor observado de la variable dependiente. La salida de anlisis habitual es que y es la forma incompleta* valor observado de la variable dependiente y latente, donde la observacin es* y = g(y ),para un determinado funcin g( ). Principales ejemplos del g( ) inmediatamente.

* Con censura Censura que tenga siempre en cuenta los regresores x, completamente observar y para un subconjunto* de los posibles valores de y , e incompleta y para observar las dems posibles* los valores de y . Si la censura es desde abajo (o de la izquierda), podemos observar* * y si y > L y = * (16.2 ) L si y L.Por ejemplo, todos los consumidores podrn tomarse muestras positivas con bienes durables* * los gastos (y > 0) y otros con cero gastos (y 0). Si la censura es desde arriba (o desde la derecha) observamos* * y si y < U y = * (16,3 ) U si y U.Por ejemplo, ingresos anuales los datos pueden ser codificados por encima de U = $100,000 . Esta forma de censura se llama tipo 1 censura en la duracin literatura (consulte la seccin 17.4.1 ).* La forma incompleta observ las observaciones sobre el problema del ao se ajustan a L o U de la sencillez.* En general, necesitamos que observ las observaciones de forma incompleta y es conocido* que se han perdido (es decir, observamos que y se encuentra fuera del correspondiente) y los regresores x continan siendo completamente.Truncamientoel truncamiento implica una prdida de informacin, ya que todos los datos de las observaciones en el obligado se pierden. Con truncamiento desde abajo observamos slo* * y = y si y > L. (16.4 )Por ejemplo, slo los consumidores que compraron bienes duraderos pueden ser muestreados (L = 0).Con el truncamiento de arriba observamos slo* * y = y si y < U. (16.5 )Por ejemplo, slo las personas de bajos ingresos pueden ser muestreados.Datos de IntervaloIntervalo de datos son los datos registrados en intervalos. Los datos de la encuesta son a menudo recaudado de esta manera para recordar y ayuda a proporcionar una mayor anonimato en las respuestas a ms personal532

16.2 . MODELOS censurados Y truncados. Por ejemplo, los ingresos se pueden registrar en intervalos de 10.000 dlares y, a continuacin, parte superior- est codificado en 100.000 dlares. Estos datos son censurados en varios puntos, con los datos observados* y es el intervalo concreto en el que el ser vistos y mentiras.16.2.3 . Censurados y truncados MLECensura y truncamiento son fciles de tratar si el investigador se aplica totalmente para- mtricas. Este puede ser el caso de datos de intervalo o de datos codificados en las que, por ejemplo, es razonable suponer una distribucin log-normal de los ingresos o un modelo binomial negativa para la cantidad de visitas al mdico.* Si la distribucin condicional de y dado los regresores x es especificado, entonces el- cativas de esta distribucin puede ser coherente y eficiente estimado por ML estimaciones basadas en la distribucin condicional de la censura o truncado. En concreto,* * * * f (y |x) y F (y |x) indican la funcin de densidad de probabilidad condicional (o problemas defuncin * capacidad de comunicacin) y funcin de distribucin acumulada de la variable latente y .A continuacin, uno siempre puede obtener f (y|x) y F(y|x), el correspondiente pdf condicional y* * cdf de la variable dependiente y, dado que y = g(y) es una transformacin de y .La limitacin del enfoque paramtrico es el uso de hiptesis distribucin fuerte. Por ejemplo, para el modelo de regresin lineal con normalidad la MLE sigue siendo coherente incluso si los errores son anormales), pero la censura MLE se vuelve incoherente si los errores son anormales) (consulte la seccin 16.3.2 ). Modelos ms flexibles y concentrar mtodos se presentan en secciones posteriores.MLECensura Censura y truncamiento cambiar tanto el condicional y el condicional significa den- sity. Comenzamos con la densidad.Considerar ML estimacin dada la censura desde abajo. Y> L la densidad de y es* * el mismo que el de y , sof (y|x) = f (y|x). Para y = L, el lmite inferior, la densidad* * discreto, con masa igual a la probabilidad de observar y L, orf (L|x). Por lo tanto, de la censuraF desde abajo (y|x) enfocar> L, f (y|x) = F (L|x) = L.* enfocar tal como se menciona despus (16,3 ), y cuando y = L L no es necesario. Incluso si no hay* * valor de y se observa cuando a L la densidad es an F (L|x).* La densidad es un hbrido de los pdf y la fdc de y . Similar al anlisis de resultados modelos binarios, es aparte es extremadamente conveniente introducir un indicador variable1 enfocar> L, d = (16,6 ) 0 = L. enfocarla densidad condicional dada la censura desde abajo puede ser escrito como* * 1-d f (y|x) = f (y|x d) F (L|x) . (16.7 )533

MODELOS TOBIT Y SELECCINde una muestra de N observaciones independientes, el censurado MLE maximizaN * * ln LN () = ln f (yi|xi, ) + (1 - di)lnF (Li|xi, ") , (16,8 )i=1!di* donde son los parmetros de la distribucin de y . Para garantizar la generalidad la censuralmite inferior Li est permitido varan entre los individuos, aunque por lo general Li = L. Los censurados MLE es coherente y asintticamente normal, siempre que la densidad de la original* * variable sin censura y |f (x, ) est correctamente especificado.Cuando la censura es, por el contrario desde arriba, el registro de probabilidad es similar (16,8 ),* excepto que ahora d = 1 enfocar< U y d = 0, de lo contrario, y F (L|x, ) es reemplazado por* 1 - F (U|x, ). Un ejemplo destacado es derecho de duracin datos censurados (vase la seccin 17.4 ).MLEde truncado truncado por la parte inferior de L, y reprimiendo dependencia de x, la densidad condicional de los observados y es* f (y) = f (y|y> L)* = f (y) /Pr[y|y> L]* * = f (y) / [1 - F (L) ].El truncado MLE por lo tanto maximizaN * * " ln LN () = !ln f (yi|xi, ) - ln[ 1] - F (Li|xi, ) ]. (16,9 )i=1si en su lugar el truncamiento es desde arriba, el registro de probabilidad es (16,9 ), excepto que 1 -* * F (L|x, ) es reemplazado por F (U|x, ).Ignorando la censura o truncamiento conduce a contradiccin. Por ejemplo, si el truncamiento * se omite el MLE maximiza i ln f (yi|xi, ), que es el malo de la funcin probabilidad como se cae el segundo trmino en (16,9 ). Coherencia de los censurados y truncados MLE requiere especificacin correcta de f ( ), que a su vez requiere una adecuada especificaciones* * de la variable latente densidad f ( ). Incluso si f ( ) es un LEF densidad (vase la seccin 5.7.3 ), la densidad, y no solo la media, deben estar correctamente especificado si censura o truncamiento.Datos de Intervalo MLE* Supongamos que la variable latente y slo se observ que se encuentran en la (J + 1) intervalos mutuamente excluyentes ( -, a1], (a1, a2],... , (aJ, ), donde a1, a2,... ,aJ son conocidos. Luego desde* * * Pr[a j < y j+1] = Pr[y j+1] - Pr[y] j* * = F (j+1) - F (j),el intervalo de datos MLE maximizaNJ * * ln LN () = dij ln F (a j+1 |xi, ) - F (a j|xi, ) , (16,10 )i=1 j=0534

16.2 . MODELOS censurados Y truncadosen la dij, j = 0,... ,J, son indicadores binarios igual a uno si yij (a j, j+1] y cero en caso contrario. Esto es similar a un probit ordenado o modelo logit (consulte la seccin 15.9.1 ), excepto en los lmites del intervalo a1,... an ,aJ son conocidos.16.2.4 . Poisson censurados y truncados MLE Ejemplo* * * - y suponer que es Poisson y distribuidos, por lo que f (y) = e /y! Y ln f (y) = - + y ln - ln y!, con media = exp(x ).Supongamos que el nmero de visitas a una clnica de salud tiene un modelo, pero los datos son slo est disponible para las personas que visitaron el centro de salud. A continuacin, los datos se han truncado desde abajo* * * * * a cero y slo observar y = y si y > 0. Entonces F (0) = Pr[y 0] = Pr[y =- 0] = e , y de (16.9 ) la truncan MLE de maximizaNln LN () = !- exp(xi) + yi xi- ln yi! - Ln[1 - exp(- exp(xi " )) ].i=1supongamos que los datos estn censurados desde arriba a los 10 porque de codificacin, as que* * * * que observamos y = y < 10 y que y = 10 si y 10. Entonces, el Pr[y 10] =* * 1 - Pr[ 10] y < = 1 - si y9 k=0 f (k). (16,8 ) la censura de MLE maximiza5Nln LN () = di- exp(xi) + yi xi - ln yi!I=1 & 69 - ) k + (1 - di) ln eexp(xi (exp(xi)) /k! .K=0en ambos casos, el resultado de primer orden las condiciones son mucho ms complicados que los de Poisson MLE sin truncamiento o censurar. Adems, en ambos casos haciendo caso omiso de la truncacin o censurar y maximizar la densidad original lleva a las estimaciones de parmetros consistentes.16.2.5 . Censurados y truncados medio condicionalCensura y truncamiento cambio la media condicional.Por ejemplo, considere el Poisson truncado desde abajo a cero. El truncado den-* * * sity es f ( [1 - F (0) ], y* y) /= 1, 2,... , por lo que la media truncada es k=1 kf (k) / [1 - * * - F (0)] = k=0 kf (k) / [1 - F (0)] = / (1 - e). Por lo tanto,E[y|x] = exp(x ) / [1 - exp(- exp(x ) ],en lugar de exp(x ) si no hay truncamiento.Esta expresin para E[y|x] se puede utilizar para estimar NLS. Hay poca ventaja de NLS en lugar de ML estimacin, sin embargo, el truncamiento de NLS distribucin estimador se basa en supuestos que son esencialmente tan fuerte como los que se necesitan para mantener la consistencia del estimador ML ms eficiente.535

MODELOS TOBIT Y SELECCIN16.3 . Modelo Tobittruncado y la censura se plantean ms a menudo de la econometra en el modelo de regresin lineal con error distribuido normalmente, cuando slo los resultados positivos son completamente. Este modelo se denomina modelo tobit de Tobin (1958), quien lo aplic a los gastos en bienes de consumo duraderos. El modelo en la prctica suele ser demasiado restrictiva. Sin embargo, es presentado con cierto detalle, ya que proporciona la base para obtener informacin ms general modelos como los que se presentan en las siguientes secciones de este captulo.16.3.1 . Modelo Tobitcensurado normal el modelo de regresin, o modelo tobit, es uno con la censura desde abajo a cero donde la variable latente es lineal en los regresores error con el aditivo que se distribuye normalmente y homocedsticas utilizndose. AsY = x + (16,11 )donde el trmino de error N 2 [0, ] (16,12 )2 * ha variance constantes en todas las observaciones. Esto implica que la variable latente y N [x 2, ]. La observ y se define como (16.2 ) con L = 0, por lo que* * y si y > 0, y = * (16,13 ) - si y 0,en la que - significa que y se observa que falta. No existe un valor en particular de y es necesariamente* observ cuando y 0, aunque en algunos lugares, como bienes durables los gastos que observamos y = 0.Las Ecuaciones (16,11 ) - (16,13 ) definir el prototipo modelo tobit analizados por a- bin (1958). Ms en general, los modelos Tobit comienzan con (16,11 ) y (16,12 ) para la variable latente pero puede tener otros mecanismos, incluyendo la censura censura desde arriba, censurando de tanto por debajo como por encima de las dos-lmite modelo tobit), y el intervalo de datos censurados. Los resultados de esta seccin se limita a la censura en mecanismo (16,13 ). La utilizacin de los modelos de las secciones posteriores se denominan a veces modelos Tobit generalizados.La normalizacin L = 0 no solo es natural en muchos lugares, pero algunos de esos ni- malization es necesaria para un modelo lineal con intercepto y umbral constante pa-* esen- ciales L. a continuacin observamos y si y > L, o de modo equivalente if1 + (1 - L) +x22 +>L o ) se identifica. Ms gen- x22 +>0. Por lo tanto, slo la diferencia (1 - L* generalmente, el modelo latente y = x + con censura variable umbral L = x esobservacionalmente equivalente * latente modelo y = x ( - ) + con umbral fijo de L = 0. Estos resultados son consecuencia de la censura que surgen en un modelo lineal con aditivo error y no en modelos no lineales, como el anterior ejemplo Poisson.536

16.3 . MODELO TOBIT* aplicando la expresin general (16.7 ) densidad de la censura, aqu f (y) es laN [x 2, ] densidad y* * F (0) = Pr[y 0]= 0] = =Pr[x + -x / 1 - x / ,donde ( ) es el estndar normal cdf y utiliza la ltima igualdad simetra de la distribucin normal estndar. Por lo tanto, la censura de densidad puede ser expresada como1 1 . d 1-d x f (y) = exp - ( 2) 1 - , (16,14 ) 22 2 2 y - x se define en (16.6 ) con L = 0. En el caso de que el indicador binario d El Tobit MLE = ( , 2 ) aumenta la censura de probabilidad funcin (16,8 ). (16,14 ) esto se haceN 1 1 2 1 ln LN ( 2, ) = di - ln 2 - ln - (16,15 ) 2 i=1 2 yi - xi 2di)ln + (1 - 1 -xi2 2.,una mezcla de densidades continuas y discretas. La primera de las condiciones son ln LNN 1 =2 di(yi - xi) - (1 - i di) (16,16 )i=1 (1 - xi = 0 i) 5 26 ln LNN 1 yi - xi + (1 - 2 4 =2 di - + di) i xi 1 = 0,i=1 2 2 (1 - i) 2 3using (z) /Z = (z) = i where ( ) es el estndar pdf normal, y con las definiciones es consistente si la densidad es correctamente (xi/ ) y i = (xi/ ). Como es habitual, es decir, si el dgp es (16,11 ) y (16,12 ) y la censura es mecanismo (16,13 ). La MLE es asinttico normal con varianza matriz distribuida en, por ejemplo, Maddala (1983, p. 155) y Amemiya (1985, p. 373).Tobin (1958) propuso ML estimacin del modelo tobit y afirm que el habitual ML teora aplicada. Amemiya (1973) proporcion una prueba oficial que la teora no habitual, a pesar de la discreta mixtos de carcter continuado de las censuradas densidad. El apndice de este libro clsico de Amemiya detalles la teora asinttica de estimadores extremum presenta en la Seccin 5.3 .537

MODELOS TOBIT Y SELECCINq Si los datos se trunca, en lugar de censurar, de abajo a cero, entonces el Modelo Tobit MLE = ( 2 , ) maximiza el registro normal truncada de probabilidad funcinN 1 2 1 1 2 . ln LN ( 2, ) = - ln - ln 2 - 2 i=1 2 2 2 yi - xi - ln xi/ ,(16,17 )* obtenidos con (16,9 ) y distribuida, como en (16,11 ) y (16,12 ).16.3.2 . Incoherencia del MLEuna gran debilidad del MLE es su fuerte dependencia de distribucin- sunciones bsicas. Si el error es heterosedasticidad anormales)o el MLE se organi- zaciones tienda.Esto puede ser visto en el ML de primer orden (16,16 ), que es una funcin bastante ms complejas que las variables de di, yi,i, y yo. La primera ecuacin en (16,16 ) satisface E[ln LN/] = 0, una condicin necesaria para la coherencia (ver Seccin 5.3.7 ), siE[di] = i, E[di yi] = i +i xi.Estas condiciones pueden ser momentos de espera si el dgp es (16,11 ) y (16,12 ) y la censura es mecanismo (16,13 ). Sin embargo, es poco probable que mantenga bajo cualquier otra especificacin de la dgp, ya que dependen en gran medida de normalidad y tanto homoskedas- ticity. Por ejemplo, withheteroskedastic errorsthe estimador es coherente, ya que, a continuacin, E[di] = 2 2 (xi/i) = i unlessi = .Estimacin Consistente con heterosedasticidad errores normales es posible mediante la especificacin de un modelo de heteroscedasticidad, digamos 2 i = exp(zi). De la censura desde abajo a cero2 el registro de probabilidad ln LN (, ) es la de (16,15 ) with sustituido por exp(zi).Requiere consistencia, entonces los errores normales y la correcta especificacin de la forma funcional de la heteroscedasticidad.Es evidente que, con censura o truncamiento, supuestos distribucin importante incluso para convertirse en algo slido en las distribuciones en la invariacin censura o se- truncado. Pruebas de especificacin para el modelo tobit se examinan en la Seccin 16.3.7 .En muchas aplicaciones de datos censurados el modelo tobit no es el adecuado. Ms en general los modelos presentados en las secciones siguientes de este captulo se utiliz en su lugar.16.3.3 . Censurados y truncados en regresin lineal significaCensura y truncamiento en el modelo de regresin lineal (16,11 ), que observ de- fender variable y que tiene distribucin condicional significa que x , condi-cionales 2 varianza otros than homocedsticas utilizndose incluso if es, y de la distribucin, que es nonnor- mal incluso if se distribuye normalmente. Presentamos los resultados generales de regresin lineal en esta seccin especializada antes de errores normalmente distribuidos en las secciones 16.3 .4-538

16.3 . MODELO TOBIT16.3.7 . Los resultados proporcionan una visin adicional con respecto a las consecuencias de trunca- y la censura y forma la base de la no-ML mtodos de estimacin presentada en secciones posteriores.Comenzaremos con la media truncada. Los efectos del truncamiento es intuitivamente- ropeos han usado. El truncamiento de la Izquierda excluye los valores pequeos, por lo que el significa que aumente, mientras que por la derecha el truncamiento la media debera disminuir. Desde el truncamiento reduce el rango de variacin, la variacin debe disminuir.* A la izquierda el truncamiento a cero slo observar y si y > 0. Si se suprimen las expectativas de dependencia x por simplicidad de notacin, la izquierda media truncada es* E[x] = |y >= + = =* E[E x E x |x +x E ,donde la segunda igualdad utiliza (16,11 ), y la ltima igualdad asume0] (16,18 )|x + >0 +>0 + E |x + >0|> -x , es independiente de x. Tal como se esperaba, la media truncada es superior a x , ya que E[|>c] para cualquier constante c superar E[].Para datos de izquierda censurarse en cero supongamos que observamos y = 0, en lugar de simplemente queY 0. La censura significa se obtiene por primera vez el acondicionador observable y en el indicador binario d definido en (16.6 ) con L = 0 y, a continuacin, est ulos incondicionados. La dependencia de x por simplicidad de notacin una vez ms, tenemos el de la izquierda significa censuraE[x] = Ed[Ey|y|d[d]] = Pr[d = 0] E[y|d = 0] + Pr[d = 1] E[y|d = 1]* * * * (16,19 ) = 0 Pr[y 0] + Pr[ 0] y > E[y |y > 0]* * * = Pr[ 0] y > E[y |y > 0],* * donde Pr[ 0] y > = 1 - Pr[y 0] = Pr[>- x ] es uno menos la censura* * probabilidad y E[y |y > 0] es el media truncada ya derivados de (16,18 ).En resumen, para el modelo de regresin lineal con censura o truncamiento de baja a cero, el medio condicional estn dadas por* variable latente: E[y |x] = x izquierda truncado (0): E[y|x, y> 0] = x + , , (16,20 )" izquierda-censurados (en 0): E[y|x] = Pr[>- x E!] x|>- x + E |> -x .Est claro que a pesar de que el original media condicional es lineal, censurar o conectar- conduce a condicional significa que son no-lineales por lo que la operacin no ser coherente las estimaciones.Uno de los enfoques posibles para llevar es una paramtrica uno de asumir una distribucin de .Esto lleva a las expresiones de E|> -x y Pr[> -x ] y por lo tanto el conectar- media condicional o censurados. Lo hacemos de la siguiente seccin para dis- nantes errores.539

MODELOS TOBIT Y SELECCINinversa de Mills como relacin de corte vara segnrelacin inversa de Mills 2,5 N[0,1 ] cdfN[0,1 ] Densidad1,5 21.5inversa de Mills, pdf y cdf0-2 -1 0 1 2punto de corte cFigura 16.2 : razn inversa de Mills para la distribucin normal estndar como la censura o punto de corte c aumenta. CDF normal estndar y densidad tambin representado.Un segundo enfoque trata de evitar o reducir al mnimo esos presupuestos paramtricos. Consideramos que esta en una seccin posterior, sino sealar aqu que, independientemente de la distribucin forx desde la media truncada es de un solo modelo de ndices de disminucin en trmino de correccin E|> -x es una funcin montona decreciente en x .16.3.4 . Medios censurados y truncados en el Modelo Tobitpara el modelo tobit la regresin error es normal y se utiliza el siguiente resultado, obtenido en la Seccin 16.10.1 .La Proposicin 16.1 (trunca momentos del Estndar Normal): Supongamos que z N [0, 1]. A continuacin la izquierda truncado momentos de z son(i) E[z|z> c] = (c) / [1 - (c) ], y E[z|z> -c] = (c) / (c),2 (ii) E[z |z> c] = 1 + c(c) / [1 - (c) ], y2 2 (iii) V[z|z> c] = 1 + c(c) / [1 - (c)] -(c) / [1 - (c)]Resultado (i) de la Proposicin 16.1 se muestra en la Figura 16.2 . Consideramos que el truncamiento de z N [0, 1] desde abajo en c, donde c va de -2 a 2. La curva ms baja es la normal estndar density(c) evalu en c. La curva normal estndar es el cdf (c) evalu en c y proporciona la probabilidad de truncamiento si el truncamiento es en c.Esta probabilidad es de aproximadamente 0,023 a c = -2 y 0,977 en c = 2. La curva superior da la media truncada E[z|z> c] = (c) / [1 - (c) ]. Como era de esperar este est cerca de E[z] = 0 para c = -2, desde entonces no hay truncamiento y E[z|z> c]> c. Lo que no se espera a priori es that(c) / [1 - (c)] es aproximadamente lineal, especialmente para c> 0. Momentos en el truncamiento es desde arriba se puede obtener mediante, por ejemplo, E[z|z < c] = -E[ -z| -z> -c] = -(c)/ (c).540

16.3 . MODELO TOBITestn aplicando este resultado (16,18 ), el trmino de error

ha truncado significa -x E |> -x = E | > (16,21 )x x =(- ) / [1 - ( )]x x =( ) /[ ( )]x = ( ),donde la segunda lnea utiliza la Proposicin 16.1 , la tercera lnea utiliza simetra alrededor de cero of(z), y definimos(z) (z) = . (16,22 ) (z)seguimos la definicin y la terminologa de Amemiya (1985) y muchos otros en defining( ) como en (16,22 ) y que es la razn inversa de Mills. De Johnson y Kotz (1970, p. 278), Molinos tabulados en realidad la proporcin (1- (z) /(z) cuya en- verse(z) / [1 - (z)] = (z) / ( -z) es la funcin de las luces de emergencia de la normal distribucin de *. Por lo tanto algunos autores en su lugar escribir (16,21 ) como E|> -x = ( -x / ),* where (z) = (z) / ( -z) se conoce como la razn inversa de Mills.Adems, Pr[>- x ] = Pr[- 0] = x +( x / ), a laizquierda de censura (0): E[y|x] = (x / ) x +( x / ).La diferencia es del mismo modo (vase Ejercicio 16.1 ). Definingw = x / , tenemos* 2 variable latente: V[y |x] = , (16,24 )2 a la izquierda de truncado (0): V[y|x, y> 0] = 1 -w(w) - (w) ,2 a la izquierda de censura (0): V[y|x] = (w)2. 2 "2 w + w(w) + 1 - (w) [w + (w) ].El truncamiento y censurar claramente inducir heteroscedasticidad y de truncamientoy|V[x] 2 < que reduce el truncamiento variabilidad, tal como se esperaba.Estos resultados suponen errores normales. Maddala (1983, pg. 369) da resultados similares a la Proposicin 16.1 para el log-normal, logstica, uniforme, Laplace, exponencial y distribuciones gamma.16.3.5 . Efectos marginales en el Modelo Tobitel efecto marginal es el efecto de la media condicional de la variable dependiente de los cambios en los regresores. Este efecto vara en funcin de si el inters se encuentra en la variable latente significa x o las truncado o censurados en medios (16,23 ).541

MODELOS TOBIT Ydiferenciar cada SELECCIN con respecto a x los rendimientos* variable latente: E[y |x] /X = , (16,25 )2 izquierda truncado (0) :E[s, s> 0 |x] /X = {1 -w(w) -(w) }, a la izquierda de censura (0): E[y|x] /X = (w),wherew = x / y use (z) /Z = (z) and(z) /Z = -z(z). La sim- ple expresin de la censura significa se obtiene tras algunas manipulaciones. Puede ser descompuesto en dos efectos, uno para y = 0 y uno para y> 0 (vase McDonald y Moffitt, 1980).En algunos casos el truncamiento o censurar es slo un artefacto de la recoleccin de datos, por lo que el truncado y censurados medios no son de inters intrnseco y estamos interesados enE[y |x] /X = . Por ejemplo, con respecto a la parte superior de los ingresos de datos codificados que son claramente lici- en medir el efecto de la escolaridad en los ingresos promedio en lugar de los ingresos de los no-codificado.En otros casos ha truncado o censurar las consecuencias conductuales. En un modelo de la jornada de trabajo, por ejemplo, los tres efectos marginales en (16,25 ) corresponden a los efectos de un cambio de un regresor en, respectivamente, (1) horas de trabajo deseado, (2) las horas de trabajo para los trabajadores, y (3) las horas de trabajo para los trabajadores y nonworkers.(1) es evidente que necesitamos una estimacin de , pero para (2) y (3) LA OPERACIN pendiente, los coeficientes aunque incoherente que, en realidad puede proporcionar una razonable estimacin cruda del efecto marginal desde el truncado y censurados medios son todava bastante lineal en x.16.3.6 . Los estimadores alternativos para el Modelo Tobitadems de la MLE, estimacin consistente de NLS es posible basado en la expresin correcta de la trunca o censurados. Consideramos que el NLS estimador y otros estimadores de mnimos cuadrados.Estimador de NLSlos resultados en la (16,23 ) se puede utilizar para permitir estimacin consistente de los parmetros del modelo de Tobit. Por ejemplo, con datos truncados, minimizarNO2 ( 2, ) = yi - xi - (xi/ )i=12 con respecto a y , pero luego de realizar inferencia el het- eroskedasticity en (16,24 ). UN estimador similar puede obtenerse de datos censurados.Este estimador no se utiliza en la prctica. Coherencia, correccin de la especificacin de la media truncada, que a partir de (16,21 ) requiere normalidad y homocedasticidad de los errores. Uno podra as estimacin de ML desde este se basa en supuestos tan fuerte y es plenamente eficaz. Por otra parte, en la prctica, el NLS estimador puede ser impreciso.En la figura 16.2 es evidente that (x / ) es aproximadamente lineal en x /, que conduzca a collinearity prximo porque x tambin es un regresor. En la seccin 16.5 se consideran modelos que permitan trminos de correccin similar a (x / ) en (16,23 ) que tienen la ventaja de depender en parte de los regresores distintos de los de x.542

16.3 . MODELO TOBITHeckman Two-Step Estimator(16,23 ) la trunca (en cero) significa esE[y|x] = x +( x / ). (16,26 )en lugar de utilizar NLS, esto puede ser estimada en los siguientes dos pasos si se dispone de datos censurados. En primer lugar, para el total de la muestra no regresin probit de d a x, donde la variable binaria d es igual a uno si y> 0 se observa, para dar estimacin coherente , donde = / . En segundo lugar, para la muestra truncada regresin por MCO de y sobre x y(x ) para proporcionar estimaciones consistentes de y .Este procedimiento de estimacin, debido a Heckman (1976, 1979), se presenta en Seccin 16.5.4 cuando se aplican a la seleccin de la muestra ms general modelo. Seccin16.10.2 se deriva el error estndar de los que tiene en cuenta la regressor(x ) dependen de parmetros estimados y de heteroscedasticidad inducida por truncamiento.LA OPERACIN de la estimacin Modelo TobitLa OPERACIN estimaciones usando datos censurados o que se trunc son incompatibles para . Esto es porque los medios censurados y truncados en (16,23 ) no son iguales a x , violando la condicin esencial de la coherencia de LA OPERACIN.Para datos censurados, LA OPERACIN proporciona una aproximacin lineal de la regresin no lineal curva censura. Es evidente en la figura 16.1 y (16,25 ) que esta lnea es ms plana que la lnea de regresin para datos sin censura, que tiene pendiente igual a la verdadera pendiente parmetro.Goldberger (1981) demostraron que si analticamente y y x son normalmente distribuidos y hay censura desde abajo a cero, entonces la operacin pendiente parmetros convergen para p veces el verdadero parmetro pendiente, en donde p es la fraccin de la muestra con posi- los valores de y. Estas condiciones son restrictivas, pero se relajaron un tanto por Ruud (1986). En la prctica, esta proporcionalidad resultado proporciona una buena aproximacin emprica a la incoherencia de la operacin si un modelo tobit es en su lugar apropiado.De igual modo, el truncamiento de la recta de regresin es ms plana que la no truncada regres- sion. Goldberger (1981) obtuvo un resultado analtico similar al de la cen patrocinados. Si y y x son normalmente distribuidos y no hay censura desde abajo a cero, entonces la operacin pendiente parmetros convergen a un mltiplo de la verdadera pendiente pa esen- ciales. Los mltiples, la expresin de que es bastante larga, se encuentra entre cero y uno, y la contraccin es la misma para todos los coeficientes pendiente. Truncar LA OPERACIN por lo tanto subestima la magnitud absoluta de la verdadera inclinacin parmetros.16.3.7 . Pruebas de especificacin para el Modelo Tobitdada la fragilidad del modelo tobit es una buena prctica para probar la distribucin de las especificaciones. Hay cuatro estrategias generales.El primer enfoque es para anidar el modelo tobit ricos dentro de un modelo paramtrico y aplicar una Wald, LR, LM o prueba. Dado que la hiptesis nula modelo, el modelo tobit, lo ms fcil es estimado, es natural que usar LM pruebas. Esto es particularmente base intuitiva- ward para la realizacin de pruebas de heteroscedasticidad de la forma 2i = exp(xi) en el censurado543

MODELOS TOBIT Y SELECCINmodelo de regresin. Utilizando el formulario de la OPG LM test (vase la seccin 7.3.5 ) que com-2 pute N veces la descentra debido al uso de regresin auxiliar de 1 a s1i y s2i, donde fi = f (yi|xi, , ) es la densidad de (16,14 ) with sustituido por exp(x ), las expresiones para s1i = ln fi/ y s2i = ln fi/ se obtienen por menor adapta- cin de las expresiones de (16,16 ), y tilde indica evaluacin de la MLE censurados Tobit con todos los componentes de excepto que para la interseccin igual a cero. Un enfoque similar para probar la hiptesis de distribucin normal errores es ms difcil ya que no hay una generalizacin de las estndar normal.Un segundo enfoque consiste en utilizar pruebas momento condicional (vase la seccin 8.2 ) que no requieren especificaciones de una hiptesis alternativa modelo. En particular, la primera de las condiciones (16,16 ) de la MLE censurados Tobit momento sugieren condicional ensayos sobre la base de la residual generalizado = yi - di xi - (1 - i ei . 2 di) (1 - i)Si el modelo tobit est correctamente especificado a continuacin, E[ei|xi] = 0, puesto que la regularidad- implica que E[ ln f (yi) /] = E[ez] = 0 0. A continuacin, podemos aplicar un m-prueba de H0 :-1 N contra Ha : E[ez] =0 con N i=1 eizi, donde ei = ei evaluado en2 Tobit la MLE ( , ). En la seccin 8.2.2 esta prueba puede ser llevado a cabo por comput-2 ing N veces la descentra debido al uso de regresin auxiliar de 1 en eizi, s1i, s2i, donde fi = f (yi|xi, 2, fi/ y2 s2i = ln fi/ ) es la densidad de (16,14 ) y s1i = ln2 dado en (16,16 ) se evalan en ( , ). Las variables zi pueden ser las variables xi, en cuyo caso la prueba puede ser interpretado como una prueba de omitido- gressors, o poderes de los componentes de xi. Momento Condicional pruebas basadas en momentos orden superior tambin se han desarrollado. Para obtener ms detalles, vase Chesher e irlandeses (1987) y Pagano y Vella (1989).Un tercer enfoque es para adaptar algunos de los mtodos de diagnstico y pruebas desarrolladas por la derecha duracin datos censurados (vase el captulo 19) a la izquierda de censurados datos distribuidos normalmente.Un ltimo mtodo compara el Tobit MLE con otras alternativas de estimacin de , nunca el semiparamtrico estimaciones presentadas en la Seccin 16.9 , que son coherentes con las hiptesis ms dbil distribucin.Para obtener ms detalles, consulte Pagano y Vella (1989), que actual teora con algunas preci- samente y Melenberg y Van Soest (1996), que proporcionan una informacin ms completa aplicacin. Ambos documentos considerar pruebas de especificacin para los ms ricos muestra modelo de seleccin (vase la seccin 16.5 ) adems de las de la modelo tobit.16.4 . Two-Part Modelolos modelos precedentes para restringir los datos censurados la censura mecanismo para ser de la misma generacin que como modelo la variable resultado. Ms en general, la censura mecanismo y los resultados pueden ser modelados por procesos separados. Por ejemplo, para explicar los gastos hospitalarios anuales individuales pueden determinar un proceso hospital globalizacin y un segundo proceso pueden explicar como consecuencia los gastos de hospital. El caso de544

16.4 . DOS PARTE MODELOpostula dos mecanismos separados es fuerte si no hay razn de peso para creer que ciertos valores se dio cuenta demasiado grandes o demasiado pequeo una frecuencia de es- tancia con un modelo ms sencillo. Por ejemplo, uno puede observar muchos ms ceros que es consistente con, por ejemplo, la distribucin de Poisson. UNA de dos parte modelo que permite los ceros y no-ceros que se generan en diferentes densidades aade flexibilidad. De hecho, es un tipo especfico de mezcla modelo.Hay dos enfoques para dicha generalizacin. Las dos partes de modelo, en esta seccin, se especifica un modelo de la censura y de un modelo para el resultado depender de los resultados que se observan. La seleccin de la muestra modelo, que se presenta en la siguiente seccin, en lugar especifica un conjunto de distribucin de la censura- nismo y de los resultados, y, a continuacin, busca el implcito distribucin condicional de los resultados observados. Estos enfoques son contrastados en la Seccin 16.5.7 .16.4.1 . Two-Part ModeloNo podemos permitir que una persona con plena observancia resultado ser llamado un participante en la actividad que se est estudiando. Definir un indicador binario variable d = 1 para los participantes y d = 0 para los maestros no participantes. Supongamos que y>0 se observa para los participantes y y = 0 se observa para los maestros no participantes. Para los maestros no participantes observamos slo Pr[d = 0]. Para los participantes la densidad condicional de y dada y> 0 se especifica que f (y|d = 1), para algunos eleccin de densidad f ( ). Las dos partes de modelo y, a continuacin, dado por elPr[d = 0 |x] si a = 0, f (y|x) = (16,27 ) Pr[d = 1 |x] f (y|d = 1, x) enfocar> 0.Este modelo se present en detalle por Cragg (1971) como una generalizacin del modelo tobit, que puede presentarse como un caso especial de (16,27 ). Un claro modelo de la decisin de participar d es un modelo logit o probit. Una variable latente es la frmula que d = 1 ifi = x + mayor que cero, y el modelo es entonces visto como un obstculo modelo desde cruzar una valla o umbral conduce a la participacin. A fin de garantizar los valores positivos de los participantes, la densidad f (y|d = 1, x) debera ser, para un valor variable aleatoria, como el log-normal, o una densidad apropiada como la normal truncada desde abajo a cero.Para simplificar los mismos regresores generalmente aparecen en ambas partes del modelo, pero esto puede estar relajado y si es obvio que hay exclusin las restricciones. Estimacin de mxima verosimilitud es sencilla como se separa en estimacin de un modelo de eleccin discreta todas las observaciones y estimacin de los parmetros de la densidad f (y|d = 1, x) usando slo las observaciones con y > 0.16.4.2 . Ejemplos de Modelos Two-PartDuan et al. (1983) presentan una de las principales aplicaciones de este modelo de pronstico medi- cal los gastos, utilizando datos de la Rand Health Insurance Experiment. Ellos se especifican un modelo probit para si o no los gastos mdicos efectuados durante el ao, as que Pr[d = 1 |x] = x11 y un modelo log-normal para los gastos mdicos dado2 que algunos gastos se efectuaron, por lo tanto ln y|d = 1, x N [x2 2 ,,2 ]. A continuacin, espera545

MODELOS TOBIT Y SELECCINlos gastos mdicos en toda la poblacin, est dado porE[y|x] = x11 exp[ 2 2/2 + x22], (16,28 )2 donde el segundo trmino utiliza el resultado de que, si ln y N ( , ] E[x] = exp( +2 / 2). Mullahy (1998) considera que tales retransformation en ms detalle.Dos de los modelos son especialmente populares para modelar datos de recuento. Por ejemplo, para modelar el nmero de visitas al mdico no es un modelo para determinar si o no un paciente visita a un mdico y un segundo modelo para determinar el consiguiente nmero de visitas a las personas con al menos una visita. Entonces, el Pr[d = 1] se especifica que la probabilidad de que una Poisson variable binomial negativa o mayor que cero, mientras que la densidad f (y|d = 1) se especifica que un Poisson o binomial negativa densidad truncado desde abajo a cero. Este modelo, debido a Mullahy (1986), se denomina modelo un obstculo en el recuento literatura y se describe detalladamente en la Seccin 20.4.5 .Para los datos continuos de dos modelos son utilizados para los modelos con exceso gasto ceros (Cragg la motivacin original). Una alternativa, una seleccin de la muestra, es de- claraciones siguiente.16.5 . Seleccin de la muestraseleccin de la Muestra modelos pueden surgir en muchos ajustes y as, hay muchos modelos seleccin de la muestra. Esta seccin comienza con una discusin general de seleccin de la muestra antes centrado en un ejemplo destacado, el modelo bivariado seleccin de la muestra estudiada por Heckman (1979). Otro ejemplo, el Roy modelo, se trata por separado en la Seccin 16.7 .16.5.1 . Seleccin de la muestra Los Modelosestudios observacionales raramente se basan en puras muestras aleatorias. La mayora de las veces se utiliza el muestreo exgenos (vase la seccin 3.2.4 ) y estimadores habituales pueden ser aplicados. En cambio, si una muestra, de forma intencional o no, se basa en parte en valores de una variable dependiente, las estimaciones de parmetros puede no ser coherente a menos que se tomen medidas correctivas. Estas muestras pueden definirse de modo general como muestras seleccionadas.Hay muchos modelos, ya que hay muchas maneras que una muestra seleccionada puede ser generado. De hecho, es muy fcil de ser consciente de que la muestra seleccionada se utiliza. Por ejemplo, estudiar interpretacin de las puntuaciones medias en el tiempo en un logro como prueba el Scholastic Aptitude Test, cuando la prueba es voluntaria. Una disminucin en el tiempo, puede ser debido a deterioro real de conocimientos de los alumnos. Sin embargo, puede simplemente reflejar el efecto seleccin que son relativamente ms estudiantes han llevado a cabo las pruebas con el tiempo y la nueva prueba secuestradores son los relativamente ms dbiles los estudiantes.Seleccin puede ser debido a la libre seleccin, con el resultado de inters determinado en parte por eleccin individual de participar o no en la actividad de inters.Tambin puede ser el resultado de seleccin de la muestra, con las personas que participan en la actividad de inters deliberadamente sobremuestr - un caso extremo que muestra slo los participantes.En cualquier caso, se plantean cuestiones parecidas y seleccin modelos se denominan generalmente muestra- visionales modelos.546

16.5 . SELECCIN DE LA MUESTRA LOS MODELOSEste captulo presenta slo tres de los muchos modelos de la literatura. El modelo ms simple es el modelo tobit ya presentados en la Seccin 16.3 . Un prototipo modelo habitual que se da en llamar el modelo bivariado seleccin de la muestra se presenta en el resto de esta seccin. Este modelo generaliza el modelo tobit censura mediante la introduccin de una variable latente que difiere de la variable latente genera el resultado de inters. Otra popular modelo llamado Roy modelo se presenta en la Seccin 16.7 .Este modelo considera un resultado que tiene uno de dos valores segn el valor que toma una variable aleatoria censura. Estos modelos corresponden a, respectivamente, el modelo tobit tipos 1, 2 y 5 en la terminologa de Amemiya (1985, p. 384).Estimacin consistente en la presencia de seleccin de la muestra se basa en aspectos distributivos relativamente fuerte en supuestos, aun en el caso de es- timation semiparamtrico. Datos Experimentales estudios proporcionan una alternativa atractiva como la seleccin pro- blemas puede evitar la asignacin aleatoria. Sin embargo, los experimentos pueden ser difciles de aplicar en el campo de la economa de costos y razones ticas. Los efectos del tratamiento, detalladas en el Captulo 25, procura aplicar el enfoque experimental de datos de observacin.16.5.2 . Seleccin de la muestra un modelo bivariado (Tipo 2 Tobit)le permiten Y2 indican el resultado de inters. En el estndar modelo tobit truncado este* resultado se observa si y2> 0. UN modelo general latente introduce un diferente* * * * variable, y1, y2 los resultados y se observa si y1> 0. Por ejemplo, y1 determina* * * si trabaja o no y y2 determina la cantidad de trabajo, e y1 =a2 puesto que hay costos fijos para trabajar como gastos de desplazamiento que son ms importantes para determinar la participacin de las horas de trabajo una vez.Seleccin de la muestra el modelo bivariado comprende una participacin ecuacin que> 0, y1 = (16,29 )* 1 1 * 0 enfocar enfocar1 0y el consiguiente resultado ecuacin queY2 si > 0 y2 = (16,30 ) - siY1 Y1 0.Este modelo especifica que y2 se observa en cualquier valor significativo cuandoY1> 0, mientras que y2 no tiene por qu tomar en 0. El modelo estndar especifica un modelo lineal con aditivo Y1 errores en el variables latentes, de modoY1 = x11 +1, (16,31 )Y2 = x22 +2,de los problemas que puedan surgir a la hora de estimar 2 if1 and2 estn correlacionados. El modelo tobit es* * claramente el caso especial en que y1 = y2.No hay ninguna denominacin generalmente aceptada para este modelo. Heckman (1979) se utiliza para ilustrar estimacin ofrecida seleccin de la muestra. El modelo es equivalente a un modelo tobit* con umbral estocstico (Nelson, 1977). Supongamos que observamos L , donde* * Y2 se define como en (16,31 ) y el umbral es L = z +v* * y2 y2> si en lugar de L = 0 en547

MODELOS TOBIT Y SELECCIN* Seccin 16.3 . Entonces, lo que es equivalente, observamos L = (x 22 - z ) + (2 -v) = x * * * y2 si y1> 0, donde y1 = x1 y donde denota la unin de x2Y2 - y1 and111 +1 z, y que se definen en una manera obvia. Amemiya (1985, p. 384) llama a la modelo un modelo tobit tipo 2. Wooldridge (2002, p. 506) llama al modelo probit con una seleccin ecuacin. Otros llaman este modelo, el modelo tobit generalizado o la seleccin de la muestra, aunque hay muchos de estos modelos.Estimacin de ML es sencillo dado el supuesto adicional que el cor- relacionados con errores comunes son normalmente distribuidos y homocedsticas utilizndose, con1 0 1 12 N , . (16,32 ) 2 0 12 22como para el modelo probit en la Seccin 14.4.1 , la normalizacin 21 = 1 se utiliza desde slo el signo de Y1 es observado.(16,29 ) y (16,30 ), * * y1> 0 observamos y2, con probabilidad igual a* * * la probabilidad de que y1> 0 veces la probabilidad condicional de y2 dado que y1> 0.* * * * Por lo tanto, positivo y2 de la densidad de las observables es f (y2 |y1> 0) Pr[y1> 0].* De y1 0 todo lo que se observa es que se ha producido este evento, y la densidad es la probabilidad de que esto ocurra. Seleccin de la muestra el modelo bivariado por lo tanto tiene probabilidad funcin8n 1-y1i! * Y1i L = !Pr[y i 1 , 0] f (y2i | Y1i> 0) Pr[y1i > " 0] , (16,33 )i=1donde el primer trmino es la contribucin independiente cuando Y1i 0, desde entonces y1i = 0, yel segundo es la continua contribucin al y1i> 0. Esta probabilidad funcin es aplicable a modelos bastante general, no slo de modelos lineales con errores normales.Especializada en modelos lineales con errores normales conjunto da una densidad bivarianteF ( * * y1, y2 ) que es normal, lo que da lugar a una densidad condicional en el segundo trmino que es normal univariante y fciles de manipular. Amemiya (1985, pgs. 385- 387) proporciona informacin detallada, incluyendo la forma exacta de la probabilidad.El clsico aplicacin precoz de este modelo de oferta de mano de obra, donde observ deseo o propensin a trabajar, mientras que y2Y1 es el Nuevo Programa de las naciones unidas es el nmero de horas trabajadas. El modelo tambin es conceptualmente ms atractiva para la oferta de trabajo que el modelo tobit en la Seccin 14.2.1 que requiere el artificio de "deseado" horas de trabajo. Este prototipo preci- samente tiene la complicacin que los datos de una tecla regresor, el salario ofrecido, no est para esas personas que no trabajan. Esta complicacin se realiza mediante la adicin de una ecuacin para el salario ofrecido y sustituyendo este, aunque el modelo es entonces, estrictamente hablando, no slo un modelo bivariado seleccin de la muestra. Ver Mroz (1987) para una excelente aplicacin de oferta de mano de obra.16.5.3 . Medio condicional en el modelo bivariado Seleccin de la muestraen esta seccin se obtiene la media truncada condicional en el bivariado muestra de seleccio- modelo. A diferencia de x2 2 , por lo que la operacin regresin de y2 en x2 conduce a- inconsistente tienda las estimaciones de parmetros. No obstante, la expresin de la media condicional puede ser548

16.5 . SELECCIN DE LA MUESTRA LOS MODELOSutilizados para motivar una alternativa procedimiento de estimacin en la seccin siguiente que se basa en supuestos distributivos ms dbiles que los de la MLE.Consideramos que el truncado en la muestra selectividad modelo donde solamente los valores positivos de y2 se utilizan. En general, este esE[y2 |x, Y1> 0] = E[ x22 +2 |x11 +1> 0] (16,34 ) = x22 + E[2 |1> - x11],donde x denota la unin de x1 y x2. Si el errors1 and2 son independientes, a continuacin, el ltimo trmino simplifica a E[2] = 0 y regresin por MCO de y2 en x2 dar un- tancia estimacin de 2 ,. Sin embargo, la correlacin entre los dos errores significa que la media truncada ya no es la de obtener E[2 |1> que si los errores (1, 2-x1) en (16,31 ) son normales como en (16,32 ) y, a continuacin, Ecuacin (16,36 )x22 y tenemos en cuenta para la seleccin.1] when1 and2 estn correlacionadas, Heckman (1979) seala en el siguiente implica que2 =121 + (16,35 ),donde el azar variable of1 es independiente. Para obtener este resultado, tenga en cuenta que, en general la distribucin normalz1 11 12 N 1 , z2 2 21 22implica la distribucin condicional normal-1 -1 z2 |z1 N 2 + 21 11 (z1 - 1), 22 - 21 11 12 ,un resultado que implica que-1 z2 = 2 + 21 11 (z1 - 1) + (16,36 )donde N [0, 22 - 21 12] es independiente de z1. Para la densidad dada -1 11(16,32 ) hemos escalares y 1 = 2 = 0 y 21 = 1, de modo que (16,36 ) se especializa en (16,35 ).Mediante (16,35 ), la media truncada (16,34 ) se convierteE[y2 |x, Y1> 0] = 2 + E (121 +) |1> - x11=x2 x22 +12E[1 |1> - x11],donde utilizamos independencia of and1. El plazo de seleccin es similar a la de las ms simple modelo tobit y utilizando de nuevo la expresin de E[z|z> -c] en la proposicin 16.1 obtenemosE[y2 |x, Y1> 0] = x22 +12 x 1 1 , (16,37 )where(z) = (z) / (z) y hemos utilizado 21 = 1. Del mismo modo, la Proposicin 16.1 (iii) da como resultado la varianza truncanV[y2 |x, Y1> 0] = 2 2 - 2 12 (x11) x11 + (x11). (16,38 )el anlisis precedente especifica ningn valor para y2 y2 cuando puede ser igual a cero cuando Y1 0] = x 2 + E[2 |1> - x1i1] (16,59 ) =2i x2i2 + g(x1i1),donde la segunda igualdad asume that2i|xi,1i tiene distribucin justa que depende de x1i similar a la hiptesis (16,41 ). La distribucin de (1, 2) no se especifica para que la funcin g( ) es desconocida, dando lugar a un problema de estimacin semiparamtrico. Dado que es posible que g 1 y la identificacin de este modelo con g( ) no especificado- duccin de(x11) = x1 exclusin restriccin que al menos, uno de los componentes de x1 no aparece en x2.Por otra parte, las ms correlacionadas x 11 es con el x2 el mejor 2 y g( ) puede distin- guidos. El modelo (16,59 ) es un modelo lineal parcialmente, que se puede calcular utilizando mtodos presentados en la Seccin 9.7.3 . Mtodos populares incluyen el Robinson (1988a) g diferenciacin y el uso de un estimador de expansin de la serie dela regresin es de y2i en x2i2 + g(x1i1), donde 1(x11). Desde 1 es desconocido puede ser obtenida por regresin565

MODELOS TOBIT Y SELECCINdel resultado binario y1i en x1i, utilizando uno de los modelo binario concentrar esti- macin en la Seccin 14.7 . Estos mtodos proporcionan estimaciones consistentes de los parmetros 2 , pendiente. Adems de estimar la interseccin, necesario para el anlisis de los niveles en lugar de cambios en y2, vase Andrews y Schafgens (1998).Newey, Powell, y Walker (1990) aplic este enfoque de oferta de mano de obra femenina.La participacin modelo de indicadores se estim utilizando varios mtodos diferentes y la ecuacin de los resultados y2 se estim utilizando el mtodo de Robinson (1988a).Melenberg y Van Soest (1996), modelado vacaciones los gastos mediante el uso de una amplia gama de mtodos concentrar tanto para la seleccin de la muestra y bivariante censurado regres- sion modelos. Un modelo ms ricos es proporcionada por el Das, Newey y Vella (2003).Manski (1989) considera dos variables identificacin en el modelo de seleccin de la muestra relativamente mnimas suposiciones y siempre los lmites de la media y de efectos marginales, sujeta a los regresores y la seleccin.16,10 . Derivaciones para el Modelo Tobit16.10.1 . Momentos de truncado2 considerar Normal Estndar z N [0, 1], con density(z) = (1/ 2) exp( -z / 2) y de la fuerza de defensa civil (z). Desde Pr[z> c] = 1 - (c), la densidad condicional de z|z> c is(z) / (1 - (c)). El fol- mnimos ( E[z|z> c] = z ((z) / [1 - (c) ]) dzc( 92 = z(1) exp( -z / 2) dz [1 - (c)]c/ 2 ( 92 = - (1 z / 2) dz [1 - (c)]c/ 2) exp( -:2 = - (1Z / 2) exp( -z / 2) [1 - (c)]c= c) / [1 - (c) ].Del mismo modo,( 2 2 E[z |z> c] = z ( (z) / [1 - (c) ]) dzc( 92 = z z (z 1 / 2) dz [1 - (c)]c/ 2) exp(- ( 9 2 = z - (1/z / 2) dz [1 - (c)]c2) exp(-2 := z ( -) exp( -z / 2) [1 - (c)]c (Z 1/ 2 92 - (z) - (1 ) exp( -z / 2) dz [1 - (c)]c/Z 2= c(c) / [1 - (c)] + (1 - c) / [1 - (c)] = c(c) / [1 - ( C)] + 1.566

16,10 . DERIVACIONES PARA EL MODELO TOBITse deduce despus de un poco de lgebra2 2 V[z|z> c] = E[z |z> c] - (E[z|z> c])2 2 = 1 + c(c) / [1 - (c)] -(c) / [1 - (c) ].16.10.2 . Teora asinttica de Heckman para Two-Step estimador del Modelo Tobitla varianza asinttica de la matriz de dos paso Heckman estimador es complicada por su dependencia de primer paso las estimaciones de parmetros. Hay varias maneras de obtener la varianza asinttica, como el de Amemiya (1985, pgs. 369- 370). Aqu se aplican, en cambio el resultado general de secuencial de dos paso de estimadores-m en la Seccin 6.6 .Consideramos el caso ms simple de la modelo Tobit (vase la seccin 16.3.6 ). Los mtodos se pueden adaptar a dos pasos de estimadores para la seleccin de la muestra modelo bivariado (sec- cin 16.5.4 ) y ecuaciones simultneas modelo Tobit (Seccin 16.8.2 ). Un enfoque bastante diferente ms simple es usar el mtodo bootstrap pares (vase la seccin 11.2 ).(16,26 ) queremos estimar los parmetros = [ ] en la ecuacin:yi yi positivo = xi +( xi) + i= wi( ) +i,donde wi() =[xi variance i se(xi)] andi = yi - xi -(xi) es heteroscedstico con definidos en (16,24 ). El primer paso del procedimiento de dos pasos es obteneruna estimacin i 2 del parmetro desconocido por un probit MLE. Lo anterior se deduce que la ecuaciones normales para las dos partes de la Heckman de dos paso estimador sonN 2 (yi -(xi) (xi)) (16,60 ) xi (1 - i=1 (xi) xi = 0,N- diwi() ( yi - wi () ) = 0,i=1donde la primera ecuacin da el probit de primer orden las condiciones de , y la segunda ecuacin da de primer orden para las condiciones para la operacin de positivo yi (di = 1).N estas ecuaciones pueden combinarse como i=1 h(xi, ) = 0 donde = (, ). Pord -1 -1 la costumbre de primer orden series de Taylor - N [0, G (G-1 N -1 0 S0 0 ) ]] dondeN G0 = lim N E[ i=1 H(xi, ) /] y S0 = lim N E[ i=1 h(xi, )h(xi, ) ]. Estamos interesados en el subcomponente correspondiente a . Simplificacin se produce porque H(xi, ) / es el bloque triangular porque no aparece en el primer conjunto de ecuaciones.Particiones produce el resultado general-1 " V[ 2] = G22!S22 + G21 [ -1 G11 S11 -1 G11 ] G21 - G21 -1 G11 S12 - S21 -1 G11G21 -1 G22,donde las matrices se definen en la Seccin 6.6 .567

MODELOS TOBIT Y SELECCINEspecializada para el problema en este caso, se considerar en primer lugar los trminos de G0. A continuacin,2 1 N ( G11 = lim N i=1 (xi (1xi) - xi (xi))xi,1 N ( G21 = lim N i=1 diwixi) ,1 N G22 = lim N i=1 E[diwi wi].La expresin para G11 utiliza el conocimiento que -1 G11 es slo la varianza de la MLE probit.La expresin para G21 utilizaH 2i- diwi() ( E = E yi - wi() ) 1 DIWI() = E wi ( ) = E diwixi .La expresin para G22 utilizaH 2i ) ( = diwi( yi - wi () ) = diwi wi. 2En cuanto a S0 tenemosS11 = -1 G11, S21 = 0,1 N S22 = lim N i=1 E[di( yi - wi() 2) ].La expresin de S11 sigue aplicando la matriz de informacin la igualdad. Teniendo expectativas y algunas manipulaciones conduce a S21 = 0, y S22 ]. es simplemente V[i combinando estos resultados da la Heckman de dos paso estimador N (, V), donde-V = 1 1 W W W + W W D VDW W - W , (16,61 )y donde W W =i=1 di wi wi, D = Diag(xi) / | , V es la varianza ma-2 trix para la primera fase de probit MLE, y es una matriz diagonal con ith entrada . Esta estimacin es fcil de obtener si matrix comandos estn disponibles. La parte ms difcil puede ser analticamente obtaining i 2 =V[i] en (16,24 ). Si esto es difcil, podemos usar en su lugar 2 i = (yi - xi + i (xi 2 ) siguiendo el enfoque de Blanco (1980).16,11 .La mayora de las principales consideraciones prcticas los paquetes incluyen ML estimacin del modelo tobit con normalidad. La modelo es fcil de estimar como uno puede estimar cada parte por separado. En principio568

16,12 . NOTAS BIBLIOGRFICASbivariado muestra el modelo de seleccin puede ser estimado como de Heckman de dos paso modifi- utilizando slo un probit OLS y rutina. Sin embargo, los errores estndar son difciles de calcular debido a los dos de carcter gradual de la calculadora, y es mucho ms fcil de obtener errores estndar utilizando un paquete de Heckman con procedimiento de dos pasos.Estimadores concentrar Aplicacin generalmente requiere un cdigo especializado en programacin lenguaje como GAUSS. Algunos paquetes tambin permiten ML estimacin de censurados y truncados variantes de otros modelos, como el Poisson y binomial negativa para datos de recuento.Censura y truncamiento se gestionan fcilmente si uno ve como razonable la distribucin especificada. Por ejemplo, los datos sobre los ingresos de colores se gestionan fcilmente si la distribucin log-normal se ajusta bien a los datos. Censurados LAD, que se basa en mucho ms dbil distribu- hiptesis, tambin puede ser utilizado en esta situacin.Mucho ms problemtico es el manejo modelos con seleccin de la muestra. El ms para- mtricas las versiones de estos modelos pueden depender de supuestos distributivos que se estima que sea fuerte. Las versiones concentrar todava tienen que luchar con la identificacin- que una variable que determina la participacin es tambin determinar el resultado de inters. Una ruta ms prometedora, a menudo en la literatura sobre los efectos del tratamiento, es el de limitar atencin a los casos en que es razonable suponer que la seleccin es slo de observables.16,12 . Notas bibliogrficasLa literatura sobre los modelos de muestras seleccionadas es enorme. Libro los tratamientos son proporcionados por Maddala (1983) y Gourieroux (2000), y resmenes cortos son proporcionados por Amemiya (1984, 1985) y Greene (2003).Tobit 16,3 (1958) propuso y aplic el modelo tobit de datos relativos a los gastos realizados. Amemiya (1973) estableci formalmente su consistencia y normalidad asinttica. Heckman (1974) es una excelente aplicacin oferta de mano de obra femenina con un anlisis detallado de los resultados.16.4 Los numerosos estudios de la Rand Health Insurance Experimant, como el de Duan et al. (1983), son las principales aplicaciones de las dos partes de modelo.16,5 Heckman (1976, 1979) present a las dos etapas de la calculadora muestra dos variables- visionales que modelo es tambin la base para muchos ms recientes procedimientos de estimacin semiparamtrico. Mroz (1987) es una excelente aplicacin de oferta de mano de obra femenina que hace hincapi en el papel de los supuestos sobre los salarios exogeneidad.16.7 Hay muchas variantes en las ideas de Roy (1951), al igual que hay muchas variantes del modelo tobit. L-F. Lee (1978) proporciona una buena aplicacin anticipada a la unin de pseudoartrosis diferencial salarial.16.8 El trabajo de presidente Dubin y McFadden (1984) es un destacado ejemplo de micre estructurales- conometric anlisis basado en las especificaciones completas de funcin de utilidad y distribu- cin de aspectos.16.9 Concentrar binario estimacin de modelos de seleccin se presenta en detalle en los libros de M-J. Lee (1996), Horowitz (1997), y Pagano y Ullah (1999) y en los estudios por569

MODELOS TOBIT Y SELECCINVella (1998) y L-F. Lee (2001). Chay y Honor (1998) y "Chay y Powell (2001) proporcionan aplicaciones para modelos censurados y Melenberg y Van Soest (1996) adems dos variables estimacin modelos seleccin de la muestra.Ejercicios16-1 Esta cuestin considera el impacto de los diferentes grados de truncado en el modelo tobit.* (A) generar 200 saca de una variable latente y = k + 3x + u, donde u N [0, 3] y el regresor x uniforme[0, 1]. Elegir k tal que se genere ap-* duracin aproximada 30% de y a ser negativo.(B) generar una censura o trunca submuestra, excluyendo las observaciones* que corresponden a y < 0.(C) calcular el modelo usando todos 2.000 observaciones, como si la variable latente se observan, en el Sudn. Evaluar los resultados a la luz de las propiedades tericas de la operacin, teniendo en cuenta que slo se dispone de una rplica.(D) mediante la submuestra de truncado y> 0 slo, estimamos el modelo por MCO.(E) utilizar la opcin mxima verosimilitud truncada la estimacin de parmetros utilizando todas las observaciones. Evaluar los resultados a la luz de las propiedades de la MLE truncada. Comparar con el de los mnimos cuadrados los resultados de las dos anteriores partes.(F) Repita todos los pasos anteriores utilizando un valor de k, para generar 20, 40 y 50% observaciones censuradas. Compare sus resultados con los que se basan en observaciones 30% censuradas. Por lo tanto, sugerir lo que es la consecuencia de las estimaciones de los parmetros de los niveles ms altos de censura. Reforzar su- plejos utilizando teora en la medida de lo posible.16-2 considerar una variable latente modelada por N 2 [0, ]. Sup-plantean yi = ** * yi si yi < Iu y es una constante conocida para cada uno de ellos en- YI Ui , donde el lmite superiorindividua de iu (es decir, datos) y puede ser diferente en las personas.yiUi si yi = xi +i withiest censurada desde arriba, de forma que podemos observar yi =(a) registro de probabilidad funcin para este modelo. [Nota: Tenga en cuenta que esto es diferente de la habitual tanto debido a la presencia de la interfaz de usuario y porque la misma se invirti con yi = (b)* * yi si yi < Ui .] Obtener la expresin de la media truncada E[yi|xi, yi < Ui ]. [Pista: Para z N [0, 1], tenemos E[z|z> c] = (c) / [1 - (c) ]. Adems, E[z|z < c] = -E[ -z|- z> -c] y -z N [0, 1] .] (c) Por lo tanto dar de Heckman de dos paso estimador para este modelo.(D) obtener la expresin de la censura significa E[yi|xi ]. [Pista: Una parte esencial es la respuesta de la parte (b) .]16-3 Esta cuestin considera las consecuencias de especificaci en el modelo tobit. El punto de partida es el modelo de ejercicio 16.1 .* (A) Generar y con heteroscedasticidad dejando que u N 2 [0, z], donde z> 0 es elegido para ser el apropiado de un valor variable que se correlaciona con la x, aunque no perfectamente. Otra vez k para obtener el 30% de observaciones censuradas. La MLE para uso normal censura para estimar este modelo y comparar sus resultados con los correspondientes homocedsticas utilizndose caso.570

16,12 . NOTAS BIBLIOGRFICAS(b) tener en cuenta las consecuencias de no-normalidad en la muestra. Utilizar la simulacin macro disponibles en algunos paquetes para llevar a cabo un Monte Carlo evaluacin, basada en una muestra de 1.000 observaciones y 500 repeticiones. Repiti en cada uno de- generar una muestra de observaciones censuradas, que los errores son extradas de una mezcla de dos normales: N [1, 9] o N [0.4 , 1]- habilidades 0.4 y 0.6 , respectivamente. Estimar el modelo usando los censurados Tobit MLE y compare los resultados con el caso normal. Llevar a cabo un anlisis de la salida de Monte Carlo los dos estimadores. Extraer conclusiones sobre el impacto de no-normalidad en la distribucin del estimador.* * * 16-4 considerar un modelo de regresin de Poisson donde y tiene densidad f (y ) = y * -e /y !, i . Porque de bacalao- YI = 0, 1, 2,... ,y que tenemos independencia de* * * ing error slo observar completamente y cuando y 2. Cuando y = 0 o 1 slo nos ob-* * servir que y 1. Supongo que es codificada como y = 1. Definir los datos observados* * * y = y para yi 2 y y = 1 foryi = 0 o 1.(A) obtener la densidad f (y) de la que se observa a.(B) Obtener E[y]. [Hay algunos lgebra aqu.]* Ahora los regresores con E[y |x] = exp(x ) y definir el indicador* * variable d = 1 2 y ambientarse para su d = 0 ambientarse para su = 0 o 1.(C) Dar la frmula exacta para este ejemplo de la funcin objetiva de un es- timator que ofrezca un estimador de utilizando datos sobre yi , di , y xi.(D) Dar la frmula exacta para este ejemplo de la funcin objetiva de un es- timator que proporciona un estimador consistente de utilizando datos de slo di y xi.(E) es posible estimar utilizando sistemticamente datos sobre tan solo di y xi ? Explique su respuesta.16-5, usando un 50% de la submuestra aleatoria RAND datos sobre los gastos mdicos durante un perodo de 12 meses utilizada en este captulo, y la utilizacin de una especificacin de los modelos similares, queremos considerar la siguiente pregunta: Qu modelo es el adecuado para modelar los datos sobre los gastos?(A) con el resumen de datos de los gastos variables, analizar las implicaciones de la alta proporcin de gasto cero. Esto es una violacin de la suposicin de normalidad? Hay una transformacin de los gastos que la hiptesis de normalidad ms apropiado?(B) tres modelos son considerados candidatos, cada uno con el mismo conjunto de covari- ates. Estos datos son los mismos que en los datos Ejercicio 20.6 . Los modelos son: (i) el modelo tobit, (ii) las dos partes ( "obstculo") modelo (TPM), y (iii) el modelo de seleccin. Explicar cmo cada una de estas se establecer la relacin y las conexiones entre ellos, y cmo se puede comparar y elegir entre ellos. Si que se pueden encontrar en cualquier punto especfico- problemas o estimacin, estado y sugerir cmo puede manejar. Prestar atencin a la eleccin de exclusin las restricciones.(C) Estimacin a su vez el modelo tobit, el TPM y la seleccin modelos. Para el TPM tiene dos ecuaciones, y el segundo es para aquellos que tienen nicamente los gastos positivos. En el caso del modelo de seleccin, utilice los MLE y en dos etapas (Heckman) estimadores. Discutir las razones subyacentes

SELECCIN 571 MODELOS TOBIT Yla exclusin restriccin requerida para la estimacin del modelo de seleccin. Hay evidencia de que el problema de seleccin es un problema grave?(D) Cmo podemos comparar la estadstica de los tres modelos? Lo que aparece un modelo para proporcionar el mejor ajuste a los datos? Por qu criterio?(E) supongamos que nuestro inters principal es el impacto de dos variables sobre los gastos, ingresos, registro y registro de (1 + coaseguro). Utilizar los resultados de la esti- mado modelo tobit y TPM para hacer una comparacin entre los efectos marginales de un cambio en estas variables sobre los gastos. Habida cuenta de que existe una gran heterogeneidad en la muestra, indican la forma de presentar los resultados de su anlisis en el ms informativo.(F) explicar brevemente cmo regresin (vase la seccin 4.6 ) proporciona un alter- mtodo nativo de analizar los mismos datos. Cules son las principales ventajas y desventajas de este mtodo en la actual situacin de los datos?572