beiov22n4_ap_eboj.pdf

Upload: todd-martinez

Post on 11-Feb-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    1/10

    ARTCULOS DE APLICACIN

    3. ARTCULOS DE APLICACIN

    TARIFICACIN DEL SEGURO DEL AUTOMVIL: MTODOS DE

    ANLISIS MULTIVARIANTE

    Eva Boj del ValDepartamento de Matemtica Econmica, Financiera y Actuarial

    Universidad de Barcelona

    1. Introduccin

    La tarificacin de los seguros, desde el punto devista tcnico1, tiene como objetivo el correcto clcu-lo de primas equitativas2 y suficientes3. Distingui-

    mos dos sistemas de tarificacin: a priori y a pos-teriori. Para la realizacin de un proceso de tarifi-cacin el actuario hace uso de mtodos estadsticos,principalmente de tcnicas de anlisis multivarian-te. En este trabajo nos centramos en las tcnicasestadsticas que se aplican en la tarificacina prioridel seguro del automvil, en concreto en el ModeloLineal Generalizado (MLG) y la Regresin Basadaen Distancias (RBD).

    Para una correcta tarificacin es necesario teneren cuenta las peculiariedades que cada cobertura

    tiene actualmente en Espaa y en qu modo se rea-liza la recogida de datos, tanto a nivel de entidadaseguradora individual como a nivel de bases de da-tos y plataformas del sector asegurador.

    El trabajo se ha estructurado como sigue: en elapartado 2 realizamos una breve descripcin de losprocesos de tarificacin de los seguros no vida; enel apartado 3 describimos el tipo de datos con elque realizar el clculo de primas y los mtodos es-tadsticos aplicables para su resolucin, en especialel MLG y la RBD; en el apartado 4 discutimos las

    peculariedades del seguro obligatorio del autom-vil en Espaa y en qu modo deben ser tenidas encuenta en el clculo de sus tarifas; finalmente, en elapartado 5, comentamos las aportaciones recientesy perspectivas futuras de investigacin respecto dela RBD en su aplicacin en el mbito actuarial.

    2. Tarificacin de los seguros no vida

    El actuario debe elaborar unas bases tcnicasque comprendan, entre otros aspectos: informacingenrica (explicacin del riesgo asegurable, los fac-tores de riesgo considerados en la tarifa y los siste-

    mas de tarificacin utilizados) e informacin esta-dstica sobre el riesgo (la estadstica utilizada indi-cando el tamao de la muestra, las fuentes, el m-todo de obtencin y el perodo a que se refiera).Desde el punto de vista legal los seguros directosse clasifican en los seguros de viday el resto, tam-bin denominados de no vida. Los seguros de vidacubren el riesgo de muerte y/o supervivencia de laspersonas y los riesgos complementarios de acciden-te y enfermedad (vase [8] para un mayor detalle enla clasificacin de los ramos). En este trabajo nos

    ocupamos de la tarificacin de los seguros no vida,y en especial del seguro del automvil.

    2.1. La prima o precio del seguro

    Supongamos que disponemos de una cartera o conjunto de plizas infinita cuyos elementos sonidnticos, es decir, que observamos el mismo riesgode un ramo de no vida. Para cada pliza observa-mos los datos referentes a la siniestralidad, recogidaen las variables aleatorias nmero de siniestros (engeneral del perodo de un ao), N, y sus correspon-dientescuantas, Xipara i= 1, . . . , N . Elcoste total

    por pliza, S, viene dado por la suma: S=Ni=1

    Xi. Si

    asumimos como hiptesis del proceso de riesgo la deequidistribucin de las cuantas de los siniestros, lade independencia entre dichas cuantas y la de inde-pendencia entre la cuanta por siniestro y el nmero

    1Ley 30/1995 de Ordenacin y Supervisin de los Seguros Privados.2El principio de equidad se refiere a que la prima se ajuste al riesgo de siniestralidad de cada pliza, es decir, que el

    asegurado pague segn el riesgo que incorpora. Este criterio implica tener en cuenta los factores de riesgo que explican en

    mayor medida el comportamiento de la estructura aleatoria de siniestralidad.3El principio de suficiencia se refiere a que en trminos esperados las primas sean suficientes para cubrir todos los

    riesgos de la cartera considerada y que permitan hacer rentable, en condiciones de estabilidad a largo plazo, a la empresa

    aseguradora.

    22

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    2/10

    ARTCULOS DE APLICACIN

    de siniestros, la esperanza del coste totalpor pliza,E[S], la calculamos como el producto de la esperan-za del nmero de siniestros por la esperanza de lacuanta de un siniestro:E[S] =E[N]E[X]. Estacantidad se denomina prima puracon bases de se-gundo orden, P. Cambiamos el riesgo aleatorio queconlleva la pliza, que puede tomar cualquier valorpositivo o nulo, por un valor cierto fijo que coincidecon la esperanza matemtica del coste total:

    P =E[N] E[X] . (1)

    La prima pura (1) es la componente base delprecio del seguro, con esta cantidad la entidad ase-guradora acumula la cantidad suficiente para ha-

    cer frente a los siniestros previstos y esperados. Suclculo debe estar basado en informacin estads-tica propia de cada ramo, y en su caso, de cadaproducto o modalidad de seguro. Por ello, es nece-sario partir de una base de datos de calidad, tantoa nivel individual de entidad aseguradora, como anivel sectorial.

    En la prctica no se dispone ni de una carterainfinita ni de suficiente informacin estadstica, porlo que laprima de riesgose corresponde con la espe-ranza matemtica (1) ms un recargo de seguridad

    o de solvencia. Adems, hasta la obtencin del pre-cio final del seguro, aadimos la parte de gastos degestin interna y externa de la entidad asegurado-ra, la parte de beneficios y los recargos externos ala prima e impuestos repercutibles (ver [8]). En estetrabajo nos ocupamos nicamente del clculo de laprima pura sin entrar en la aplicacin de recargosde solvencia, para lo cual sera necesario tener encuenta que las diferentes coberturas no son inde-pendientes entre s.

    2.2. Tarificacina priori o class-rating

    El sistema de tarificacin a priori asigna unaprima a un riesgo que se incorpora en una carte-ra sin tener necesariamente experiencia sobre la si-niestralidad que conlleva. nicamente es necesarioconocer determinadas caractersticas para asignaruna siniestralidad esperada y con ella una prima.

    Supongamos que disponemos de la experienciade una cartera para una determinada cobertura deseguro en un perodo fijado. Para cada pliza, sehan observado los datos referentes a las variablesaleatorias de siniestralidad(nmero de siniestros y

    sus correspondientes cuantas), y una serie de fac-

    tores potenciales de riesgo, los cuales pueden hacerreferencia a caractersticas del objeto asegurado oa otros condicionamientos de este: caractersticasdel asegurado, del tomador del seguro, condicionessocio-econmicas que lo rodean, etc. Los principiostcnicos en que se basa la tarificacin a priori con-sisten en un proceso que debe solucionar las siguien-tes fases ([35], [19], [4], [6]):

    1) La determinacin de la estructura de tarifaque consiste en ([8]):

    - La seleccin de las variables de tarifa:es la eleccin de los factores de riesgoo caractersticas que utilizaremos paradistinguir a los asegurados con diferen-

    tes riesgos asociados ya que influyen enla siniestralidad. Los factores selecciona-dos pasan a ser las denominadas varia-bles tarificadoras o de tarifa;

    - La determinacin de las clases de ta-rifa: es la eleccin de las clases o agru-paciones de clases de las variables tarifi-cadoras que acaban discriminando a losdiferentes grupos de riesgo en la tarifafinal;

    - La obtencin de los grupos de tarifa:es la obtencin de grupos homogneosde riesgo, exclusivos y exhaustivos, for-mados a partir de las clases de tarifaanteriores;

    - La inclusin de los gastos en la tarifa;

    - Y el tratamiento especial y adecuadode los grandes riesgos.

    2) El clculo de la prima para cada grupo detarifa, que consiste en la estimacin de las primasde riesgo equitativas y suficientes que ajusten la si-niestralidad para cada grupo de tarifa a partir de la

    esperanza del nmero de siniestros y de la cuantapor siniestro.

    3) Por ltimo, se realiza la adecuacin de la ta-rifa al mercado competitivo teniendo en cuenta lacompetencia de mercado y los segmentos de pobla-cin a los que va dirigida la cobertura.

    Formamos pocos grupos si buscamos una tarifaresultante sencilla y aplicable, que diferencie mni-mamente los riesgos de calidades diferentes, o for-mamos una agrupacin ms fina si el objetivo esmayor ajuste en la prima individual y ms detalle

    en la tarifa final.

    23

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    3/10

    ARTCULOS DE APLICACIN

    Los pasos de seleccin de variables tarificadoras,de determinacin de las clases de tarifa y de obten-cin de los grupos de tarifa, dentro de la fase dedeterminacin de la estructura de tarifa, estn en-tre ellos estrechamente vinculados, y su resolucinno es independiente en funcin de las metodologasde anlisis estadstico utilizadas (ver [8]).

    Para la realizacin de un proceso de tarificacina priories conveniente que la experiencia en que sebasa la tarifa pertenezca a un intervalo temporal loms cercano posible al de actualizacin, y son nece-sarias revisiones peridicas con datos actualizadosque repitan el proceso con todas sus fases, empezan-do por la seleccin de variables de tarifa ([13]). Si elperodo de observacin es el ao ms reciente los si-niestros pueden ser siniestros en curso o pendientesde reclamacin, ya que ese ao es el que tiene los si-niestros ms inmaduros. En tal caso es convenienterealizar, previamente al estudio de tarificacin, unarevisin de reservas de siniestros pendientes con elobjetivo de obtener niveles actualizados de sinies-tralidad. Este es el caso del seguro obligatorio delautomvil cuando analizamos la cuanta por sinies-tro para la cobertura de responsabilidad civil dedaos personales, ya que el perodo de maduracinde dichos siniestros es largo.

    2.3. Tarificacin a posteriori oexperience-rating

    El sistema de tarificacin a posteriori, en opo-sicin al de la tarificacin a priori, parte de unaprima inicial para cada unidad de riesgo, individuoo grupo, que se modifica de acuerdo a la experienciaindividual o colectiva para dar lugar a las primas delos perodos sucesivos. En un sentido amplio, la ex-presinexperience-ratingse aplica a todo problemade actualizacin de tarifas mediante la incorpora-

    cin de nueva informacin.La justificacin de estos sistemas est en que

    dentro de cada clase de riesgo existe heterogeneidaddebida a la influencia de ciertos factores de riesgono considerados (conocidos o desconocidos) o a laincorrecta agrupacin de las clases de los s conside-rados. La heterogeneidad queda recogida por la si-niestralidad de los perodos sucesivos. Al considerarla experiencia propia de cada pliza obtenemos unmayor grado de equidad en las primas de ejerciciosposteriores. Incorporamos la informacin evolutiva

    mediante un sistema de bonificaciones y penaliza-

    ciones (sistema bonus-malus).

    En el seguro del automvil ([27], [30], [36], [37])su aplicacin suele tomar como referencia el n-

    mero de siniestros declarados en un perodo de unao; si no se han declarado siniestros a las garantascomputables se asciende por la escala de descuentosuno o ms escalones. Por cada siniestro declarado alas garantas computables se desciende por la escalauno o ms tramos, bien reducindose los descuentos,bien aplicando recargos. Tambin se han realizadoestudios basados en las cuantas de los siniestrosdeclarados ([33]).

    3. Tarificacin y anlisis multivariante

    En este apartado, describimos el tipo de datoscon el que realizar los estudios de tarificacin y lastcnicas de anlisis multivariante empleadas parasu resolucin.

    3.1. Datos: experiencia de siniestralidady factores de riesgo

    Una fase previa a todo el proceso de tarificacines la recopilacin de los datos. Es imprescindibleprocesar la mxima informacin en torno al riesgoasegurado. La siniestralidad evoluciona en el tiem-po por lo que es posible que a partir de un momento

    sea explicada por factores no tenidos en cuenta an-teriormente.

    Una vez recopilados los datos, el paso bsico esla seleccin de las variables de tarifa que influyenpor un lado en el nmero de siniestros, N, y, porotro, la seleccin de las variables de tarifa que in-fluyen en la cuanta de un siniestro,X. El conjuntode factores de riesgo que explican ambas variablesno tienen por qu coincidir. Su seleccin, hasta laformacin de los grupos de tarifa, se realiza median-te mtodos estadsticos de anlisis multivariante de

    seleccin de predictores (ver [8]).

    Experiencia de siniestralidad

    El objetivo es clasificar las plizas segn el ries-go que incorporan, por lo que la variable aleatoriaque recoge la siniestralidad (coste total, S, nme-ro de siniestros, N, o cuanta de un siniestro, X)es la variable dependiente. El nmero de siniestros,N, es una variable discreta numrica que toma valo-res en los naturales. Dependiendo de la metodologaestadstica utilizada, a veces es tratada como cuan-

    titativa, y a veces como categrica ordinal.

    24

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    4/10

    ARTCULOS DE APLICACIN

    Factores de riesgo

    Los factores potenciales de riesgo, F =(f1, f2, . . . , fP), son los predictores, mediante alguno

    de ellos (variables de tarifa) explicamos la estructu-ra de riesgo. Son caractersticas medibles que ob-servamos y que tienen una posible relacin de causacon la siniestralidad objeto de estudio. Es necesarioque tengan una definicin y que puedan ser repre-sentados a travs de variables.

    En general el conjunto de factores de riesgo esde tipo mixto (mezcla de variables cuantitativas ycualitativas), y es importante disponer de los datosen sus escalas originales. En ocasiones nos encon-tramos predictores continuos discretizados de ante-

    mano (por ejemplo la edad del conductor en inter-valos de edad). Esto implica una prdida de infor-macin al pasar a una escala de medida menor. Re-sulta imposible obtener los datos originales, cuanti-tativos, de los ya codificados como discretizaciones,pues no sabemos qu valor tom la variable dentrode cada grupo, slo sabemos entre qu valores os-cil. En este caso no somos capaces de deshacer laagrupacin original para realizar otra que propor-cione mejores resultados.

    El pequeo esfuerzo que representa para una en-tidad aseguradora la correcta gestin inicial de da-tos (aparte de la gestin obligada para la ESA4 querequiere UNESPA5) supone una mejora significati-va en el largo y costoso proceso de tarificacin queha de servir a largo plazo para la obtencin de mayo-res beneficios. El mercado espaol es competitivo yello implica un reto para las compaas que confanen mtodos simples de tarificacin que no tienen encuenta la composicin de sus carteras.

    Datos ponderados:

    Cuando nos centramos en un perodo de obser-

    vacin pueden haber plizas que no han estado envigor durante el perodo completo porque se hanincorporado a lo largo del perodo o porque hanvencido a lo largo del mismo y no han renovado.Para reflejar este hecho una posibilidad es extrapo-lar el resultado de siniestralidad a todo el perodo,y otra es ponderar la siniestralidad segn el tantopor uno de perodo en que la pliza ha estado vivacon respecto al tiempo total ([5]).

    Por otro lado, debido al gran volumen de las

    carteras de seguros (n 104) es usual trabajar condatos agregados. En este caso, los pesos se corres-ponden con el nmero de plizas para el nmeromedio de siniestros y el coste total medio, y con elnmero de siniestros para la cuanta media por si-niestro. Para agregar los ndatos consideramos quetodos los factores son categricos (discretizando deuna manera adecuada a los continuos (ver [8])) yconstruimos una tabla cruzada de todos ellos. Pa-samos a tener tantas observaciones diferentes, m,como el producto del nmero de clases de todos losfactores menos las combinaciones de celdas vacas.

    En el tratamiento del nmero de siniestros condatos agregados (o en general ponderados) tenemosdos posiblidades ([15]). Una es la de trabajar di-

    rectamente con la variable aleatoria nmero totalde siniestros por celda (o combinacin), Nu parau= 1, . . . ,my otra ms habitual es trabajar con la

    frecuencia de siniestralidad. La frecuencia de sinies-tralidad se obtiene dividiendo la variable aleatorianmero total de siniestros por celda,Nu, por el n-mero de expuestos o plizas de dicha celda, eu:

    Nueu

    para u = 1, . . . ,m. La ponderacin, wu, de la fre-cuencia de siniestralidad de cada celda es wu= eu.

    En el tratamiento de las cuantas de los sinies-tros con datos agregados tambin tenemos las dos

    posibilidades anteriores: trabajar directamente conla variable aleatoria coste total de los siniestrosporcelda,Suparau = 1, . . . ,m; o trabajar con la cuan-ta mediapor celda construida dividiendo la varia-ble aleatoria coste total de los siniestros por celda,Su, por el nmero de siniestros de dicha celda, nu:Sunu

    parau = 1, . . . ,m. La ponderacin de la cuantamedia de cada celda es wu= nu.

    Podemos realizar dos procesos de seleccin depredictores diferentes, uno para el nmero de sinies-tros y otro para las cuantas de dichos siniestros. Losconjuntos de variables de tarifa as obtenidos pue-den o no coincidir. Como resultado de la tarificacinobtenemos una prediccin para el nmero esperadode siniestros por pliza y una para la cuanta espe-rada de un siniestro, cuyo producto nos proporcionala prima pura (1).

    3.2. Modelos de prediccin

    Los primeros artculos sobre modelos estadsti-cos en el seguro del automvil se centran en el n-mero de siniestros prestando menos atencin a las

    4Estadstica sectorial del Seguro de Automviles.5

    Unin Espaola de Entidades Aseguradoras y Reaseguradoras.

    25

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    5/10

    ARTCULOS DE APLICACIN

    cuantas. Histricamente el debate principal ha es-tado basado en si se deba utilizar un modelo aditivoo uno multiplicativo para establecer la relacin en-tre el nmero medio de siniestros y los factores deriesgo. Los dos modelos son casos particulares delMLG: el modelo aditivo clsico de funcin de enlaceidentidad y de error Normal ([28], [29], [?]), es decir,el modelo clsico de regresin; y el modelo multipli-cativo, de funcin de enlace logartmica, combinadocon una distribucin de Poisson ([38]). En [38] en-contramos al MLG presentado como una extensindel modelo clsico de regresin lineal, y como la for-malizacin probabilstica motivada en los inicios porel modelo de Bailey y Simons ([2],[3]) entre otros.

    El modelo de prediccin ms sencillo es el mode-

    lo clsico de regresin lineal por mnimos cuadradosordinarios. Pero diversas limitaciones de este mode-lo (las deficiencias de ajuste en muchas situacionesreales, la restriccin a respuestas gausianas o anlo-gas) motivan a buscar modelos ms generales quepermitan seleccionar la funcin de prediccin de unafamilia ms amplia que la de las funciones lineales,permitiendo alguna no linealidad. En este apartadonos detenemos en dos formas importantes de intro-ducir esta no linealidad correspondientes a los MLGy a la RBD.

    Ambos modelos de prediccin son extensiones endirecciones distintas del modelo de mnimos cuadra-dos ordinarios, y estn contenidos en la clase mu-cho ms grande de los modelos no lineales. Fijadauna clase, encontramos el elemento de ella ms ade-cuado a unos datos concretos de acuerdo con algncriterio de proximidad, como mnimos cuadrados omxima verosimilitud. Los modelos ms sencillosson ms robustos, mientras que cuando se permiteuna familia grande existe el peligro de caer en lasobreparametrizacin.

    LosModelos Lineales Generalizados ([31],[20])han sido muy aplicados en tarificacin ([26],[15], [7], [8]).

    Cuando tarificamos respecto de la cuanta delos siniestros es apropiado utilizar una distribucinGamma o una Gaussiana Inversa preferiblementea una Normal ya que estas distribuciones no to-man valores negativos y tienen asimetra positiva;y cuando tarificamos respecto del nmero de sinies-tros es apropiado utilizar una distribucin de Pois-son, una Binomial o una Binomial Negativa. Vase

    [31] pp. 337, 400 y 413-414 para un estudio deta-

    llado sobre la funcin de enlace y la distribucin deerror ptimas para unos datos determinados y unaseleccin de predictores concreta. Los datos emplea-dos en la referencia anterior son datos actuariales decuantas de siniestros extraidos de [1] referentes a lacobertura de daos propios, estos mismos datos sehan empleado en [11] con RBD.

    En general, el MLG ms apropiado para unosdatos es el que proporciona una menor desvianzala medida que en estos modelos generaliza la su-ma de cuadrados residual. Las diferentes manerasde reducirla son ([32]): variar la funcin de enlace,variar la distribucin del error, y/o variar las va-riables de tarifa incluidas en el modelo. Lo usual,aunque no ptimo, es fijar una funcin de enlace y

    una distribucin del error y a posteriorirealizar laseleccin de variables de tarifa mediante un procesode seleccin de predictores haciendo uso del esta-dstico de test F basado en desvianzas ([15], [34],[38]). Los programas informticos que ofrecen lasconsultoras a las entidades aseguradoras suelen im-plementar nicamente y de manera cerrada el MLGde distribucin del error Gamma para las cuantasy de Poisson para el nmero de siniestros, pudien-do elegir entre el link identidad para componer unatarifa aditiva y el logartmico para una multiplica-

    tiva. El MLG resultante permite cubrir la fase deseleccin de variables de tarifa y tambin el clculode la prima pura (1). Esto no ocurre si la tcnicaestadstica utilizada para la seleccin de variablesde tarifa se basa por ejemplo en anlisis cluster oanlisis discriminante (ver [8]).

    LaRegresin Basada en Distanciasfue pro-puesta por Cuadras en [16]. Detalles y aportacionesposteriores pueden verse en [17], [18], [8] y [12].

    La RBD es una extensin del modelo clsico deregresin: la informacin aportada por las variables

    de tarifa queda reflejada en una matriz de distan-cias, intuitivamente la respuesta se proyecta en elespacio eucldeo obtenido mediante escalado mul-tidimensional mtrico de esta distancia. Con pre-dictores cuantitativos y mtrica l2 se obtiene comocaso particular el modelo de mnimos cuadrados or-dinarios.

    Un resumen del procedimiento es como sigue:partimos de una respuesta continua, y,centrada, yun conjunto de predictores F (que pueden ser detipo mixto), mediante una mtrica eucldea ([14],

    [24]) calculamos la matriz de distancias al cuadra-

    26

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    6/10

    ARTCULOS DE APLICACIN

    do, 2, y la de productos escalares G = 12J2J,

    donde Jes la matriz de centrado J= In 1n1n1Tn .

    Una descomposicinXXT = G (que existe por lacondicin eucldea) da una configuracin eucldeacentrada X, sobre la que aplicamos mnimos cua-drados ordinarios. La prediccin,y = Hy dondeH= X(X

    TX)

    1XTy, puede obtenerse directamen-

    te sin explicitar X como H = G+G siendo G+

    la pseudo-inversa de Moore-Penrose de G ([21]).Calculamos la prediccin para un nuevo individuo{n + 1} haciendo uso de la frmula de interpolacinde Gower ([22], [25]) y obtenemos la frmula de pre-diccinyn+1= 12(g d)G+y, donde g es el vectorfila que contiene la diagonal de G y d es el vectorfila que contiene las distancias del nuevo individuo

    al resto, d = (d2n+1,1, . . . , d2n+1,n)T. En el caso ge-neral de predictores de tipo mixto podemos utilizarel coeficiente de similaridad de Gower ([23], [24]).

    Hemos construido implcitamente, mediante ladistancia, una funcin no linealX = (F)que rela-ciona las variables observadas F con los predictoreseucldeos latentes X.

    Esta no linealidad hace que la seleccin de varia-bles de tarifa sea ms complicada que en el modeloclsico, pues no es aplicable el test F usual. En [12]proponemos una solucin adaptando un mtodo de

    bootstrap no paramtrico para la estimacin de losp-valores de un estadstico F generalizado. Al igualque el MLG, la RBD permite cubrir todas las fasesde la tarificacin hasta la estimacin de las primaspuras.

    4. Tarificacin del seguro del automvil enEspaa en funcin de las coberturas

    El seguro obligatorio del automvil cubre la res-ponsabilidad civil a terceros respecto a los daospersonales y materiales ocasionados a terceras per-

    sonas como consecuencia de un hecho de la circu-lacin. Ambas coberturas tienen frecuencia de si-niestralidad y cuanta media de un siniestro muydiferentes, por lo que diferenciamos la informacincon el objetivo de calcular la esperanza del costetotal por pliza, (1) por separado. Por el mismomotivo tratamos cada cobertura adicional al seguroobligatorio del automvil hasta llegar a un todo ries-go (responsabilidad civil suplementaria, daos pro-pios, rotura de lunas, incendio, robo, ...) tambinpor separado. Las primas puras totales por pliza

    las calculamos como la suma aritmtica de las pri-

    mas puras correspondientes a cada cobertura ([26]).Si denotamos por c al nmero esperado de sinies-tros y por mc a la cuanta esperada de un siniestrorespecto a la cobertura c(siendo c: daos materia-les, daos personales, daos propios, etc), la primapura total es:

    PT =c

    c mc. (2)

    En el proceso de tarificacin realizamos la selec-cin de variables de tarifa por separado para cadacobertura y adems, dentro de cada cobertura, se-leccionamos el conjunto de predictores respecto delnmero de siniestros y respecto de la cuanta de

    un siniestro. Los conjuntos de variables de tarifapueden o no coincidir. Como resultado obtenemosuna prediccin para el nmero esperado de sinies-tros por pliza y una para la cuanta esperada deun siniestro para cada cobertura, lo que nos permi-te calcular la prima pura total (2). El estudio detarificacin puede llevarse a cabo con los datos dela cartera o haciendo uso de las estadsticas basadasen datos sectoriales.

    En el seguro del automvil, y dependiendo de lacobertura, los factores tenidos en cuenta son:

    - Factores relativos al vehculo asegurado : valor,antigedad, categora, clase, tipo, marca, modelo,nmero de plazas, potencia, peso, o relacin poten-cia / peso, color, etc

    -Factores relativos al conductor: edad, sexo, an-tigedad del carnet, estado civil, profesin, nmerode hijos, posibilidad de conductores ocasionales, re-sultado de la experiencia en el pasado, etc

    -Factores relativos a la circulacin: zona de cir-culacin, uso del vehculo, kilmetros anuales, etc

    En la prctica, la calidad del ajuste, tanto si uti-

    lizamos el MLG o la RBD depende de la coberturay de si analizamos el nmero o las cuantas de lossiniestros. Por ejemplo, para la cobertura de daosmateriales es usual obtener un buen ajuste cuandoanalizamos el nmero de siniestros con predictorescomo la edad del conductor, la antigedad del car-net, la potencia del vehculo,... En cambio, cuandoanalizamos las cuantas de los siniestros en la cober-tura de daos personales es difcil obtener un buenajuste ya que las cuantas dependen en gran medidade elementos que la entidad aseguradora no puede

    controlara priori.

    27

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    7/10

    ARTCULOS DE APLICACIN

    4.1. Escenario actual del seguro del au-tomvil en Espaa

    Para una correcta tarificacin del seguro del au-

    tomvil debemos tener presentes las peculariedadesque dicho seguro tiene en Espaa. En los ltimosaos han habido cambios gracias a la utilizacin anivel sectorial de las nuevas tecnologas de la in-formtica y de las telecomunicaciones por parte deUNESPA y gracias al servicio transaccional pres-tado por TIREA6. En unos aos los servicios hancrecido de forma importante (1994: CICOS7, 2002:SDM8, 2000: SINCO9, 2001: ESA,...). Nos referimosa [9] para un mayor detalle.

    La Estadstica sectorial del Seguro de Au-

    tomviles, ESAUNESPA ha realizado estadsticas comunes en

    papel hasta 1997. Estas estadsticas han permitido alas entidades aseguradoras disponer de informacinestadstica detallada a nivel sectorial. Actualmente,la ESA, desde el ao 2001, ha retomado el anlisisestadstico. El servicio ESA est compuesto por unabase de datos con el total de expuestos y siniestrosaportados por las entidades aseguradoras colabora-doras. En esta nueva estadstica slo las entidadesaseguradoras que colaboran de forma activa tienen

    acceso a los resultados agregados de las explotacio-nes estadsticas, cosa que implica un mayor gradode compromiso por parte de las entidades asegu-radoras y una mayor validez en los resultados. Lasentidades aseguradoras no participantes reciben tanslo un documento-resumen con informacin brevey genrica.

    Dada la magnitud de las nuevas tecnologas, lasconsultas de las estadsticas descriptivas resultantesde la explotacin se realizan de forma on-line, exis-tiendo la posibilidad de descargarlas en ficheros de

    tipo Excel. Es posible solicitar dos tipos de explota-cin: explotacin global, con el total de datos carga-dos por la totalidad de las entidades aseguradorascolaboradoras, y explotacin individual, para cadauna de las entidades aseguradoras participantes. Decada explotacin, se puede obtener un resumen eje-cutivo, o un informe con informacin de detalle. Elresumen ejecutivo proporciona un resumen para ca-

    da una de las garantas contempladas, por ao deestadstica y tipo de vehculo. La informacin dedetalle se divide en dos grandes bloques: por un la-do todo lo referente a responsabilidad civil, y porotro, daos propios, incendio, lunas, robo, ocupan-tes, retirada de carnet y defensa Jurdica. Ademsse recogen aparte los casos especiales de flotas ymercancas peligrosas. Como novedad se incorporainformacin sobre el segundo conductor.

    Con el fin de actualizar la informacin, en estaestadstica se han modificado algunas de las varia-bles de tarifa utilizadas histricamente. Por ejem-plo, la situacin del riesgo se mide por la provinciade la pliza y no por el lugar de ocurrencia del si-niestro. Tambin se han actualizado las categoras

    y usos de los vehculos, y adicionalmente se utili-za la informacin tcnica de cada vehculo aporta-da por el cdigo de Base SIETE10. El cdigo baseSIETE incluye codificadas las principales caracte-rsticas tcnicas de todos los vehculos susceptiblesde ser asegurados en Espaa y radica en Centro Za-ragoza. Concretamente, las variables de tarifa porlas que se pueden obtener resultados son: la edad,la antigedad del carnet y el sexo del conductor, laprovincia y la antigedad de la pliza, el tipo (y sussubcategoras), el uso, la antigedad y el valor del

    vehculo.El servicio ESA (que funciona desde el ao 2001,

    y por lo tanto es un servicio bastante reciente) eraun servicio totalmente necesario para llenar el vacode informacin tcnica del riesgo elemental produ-cido en el Sector Asegurador desde la ltima ela-boracin de la Estadstica Comn de Automvilesdel ao 1997. De cara a la tarificacin es importanteresaltar que en la ESA las variables de tarifa utiliza-das y sus clases han sido actualizadas. A diferenciade las estadsticas comunes anteriores que incluan

    informes actuariales, los resultados de la ESA sonmeramente descriptivos, pero permiten a las entida-des aseguradoras descargar las consultas en ficheroscon los que realizar sus propios estudios.

    Respecto a las garantas correspondientes a laresponsabilidad civil obligatoria en que se puededesglosar la estadstica, stas son: responsabilidadcivil de daos materiales, responsabilidad civil de

    6Tecnologas de la Informacin y Redes para las Entidades Aseguradoras.7Centro Informtico de Compensacin de Siniestros.8Servicio de gestin de Siniestros de Daos Materiales.9Fichero histrico de SINiestralidad de COnductores.10

    Sistema Informativo de Especificaciones Tcnicas.

    28

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    8/10

    ARTCULOS DE APLICACIN

    daos corporales, responsabilidad civil total y, comonovedad en las dos ltimas estadsticas, responsa-bilidad civil de siniestros tramitados por el sistemaCICOS y que son acreedores.

    5. Aportaciones recientes y perspectivasde futuro

    - En el apartado 3.1 hemos visto que es habi-tual trabajar con datos ponderados, por lo que paracompletar la aplicabilidad de la RBD en la tarifi-cacin construimos la versin heteroscedstica delmodelo de prediccin y adaptamos a este caso lametodologa bootstrap de seleccin de predictoresincluido el estadstico de test que se desarrolla parael caso homocedstico en [12]. Parte de estos resul-

    tados se han presentado ya en el XXIX CongresoNacional de Estadstica e investigacin Operativa

    celebrado en Tenerife en mayo de 2006 ([11]). Eneste trabajo se presenta la formulacin y una apli-cacin con los datos de [1] referentes a cuantas desiniestros para la cobertura de daos propios. Ob-tenemos mejores resultados de ajuste con la RBDque con el MLG. Como era de esperar para estacobertura, las variables de tarifa resultantes hacenreferencia a caractersticas del vehculo.

    - Otro grupo de desarrollos se refiere a proble-

    mas numricos o computacionales de la RBD. Den-tro de este mbito hemos presentado el trabajo Im-plementing PLS for distance-based regression([10])en el que adaptamos los Mnimos Cuadrados Parcia-les a la RBD con aplicacin carteras de seguros delmercado Espaol moderadamente grandes, n 104.

    - Por otro lado, fijado un conjunto de predicto-res, obtenemos una mayor flexibilidad si selecciona-mos de forma adaptativa la distancia de una familiade mtricas eucldeas indexadas por un hiperpar-metro . De este modo el ajuste del modelo resul-

    tante es ptimo dentro de una familia de mtricasdada. Unos primeros resultados pueden encontrarseen [21].

    - Finalmente, una extensin de la RBD es laRBD-MLG, que consiste en incorporar una funcinde enlace que relacione la esperanza de la respuestacon el predictor lineal, en este caso una combinacinlineal de los predictores euclideos X.

    Agradecimientos

    Este trabajo est financiado, en parte, por el

    Ministerio de Ciencia y Tecnologa y FEDER, pro-

    yecto MTM2006-09920/ que tiene de ttuloAnlisisMultivariante No Lineal: Tcnicas No Paramtricas

    y Basadas en Distanciasy del que es investigadorprincipal el Dr. Pedro Delicado Useros del Departa-mento de Estadstica e Investigacin Operativa dela Universidad Politcnica de Catalua. Agradezcolas sugerencias de mis compaeros Ma Merc Cla-ramunt y Josep Fortiana.

    Referencias

    [1] Baxter L.A., Coutts S. M., and Ross G.A.F.(1980). Applications of Linear Models in MotorInsurance. Transactions of the 21st Internatio-nal Congress of Actuaries,2, 11-29.

    [2] Bailey R.A., and Simon L.J. (1960). Two stu-dies in automobile insurance ratemaking.Actua-rial Studies in Non-Life Insurance Bulletin,1:4,192-217.

    [3] Bailey R.A. (1963). Insurance rates with mini-mum bias.Proceedings of the Casualty ActuarialSociety,50, 4-11.

    [4] Boj E., Claramunt M. M., and Fortiana J.(2000). Una alternativa en la seleccin de losfactores de riesgo a utilizar en el clculo de pri-mas. Anales del Instituto de Actuarios Espao-

    les,Tercera poca 6, 11-35.[5] Boj E., Claramunt M.M., and Fortiana J.

    (2001). Weighted metric scaling applied to auto-mobile insurance data when the exposure baseis not the unit. Proceedings of the Fifth Interna-tional congress on Insurance: Mathematics and

    Economics. Penn State University.

    [6] Boj E., Claramunt M.M., and Fortiana J.(2001). Herramientas estadsticas para el estu-dio de perfiles de riesgo. Anales del Instituto deActuarios Espaoles,Tercera poca 7, 59-89.

    [7] Boj E., Claramunt M.M., Fortiana J., and Vidie-lla A. (2002). The use of distance-based regres-sion and generalised linear models in the ratemaking process. An empirical study. Mathema-tics Preprint Series, Institut de Matemtica dela Universitat de Barcelona 305.

    [8] Boj E., Claramunt M.M., and Fortiana J.(2004). Anlisis multivariante aplicado a la se-leccin de factores de riesgo en la tarificacin.Cuadernos de la Fundacin MAPFRE Estudios,

    88.

    29

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    9/10

    ARTCULOS DE APLICACIN

    [9] Boj E., Claramunt M.M., Fortiana J., and Ve-gas A. (2005a). Bases de datos y estadsticas delseguro de automviles en Espaa: influencia enel clculo de primas. Estadstica Espaola, 47,539-566.

    [10] Boj E., Claramunt M.M., Gran A., andFortiana J. (2005b). Implementing PLS forDistance-Based Regression: Computational is-sues. PLS AND RELATED METHODS. Pro-ceedings of the PLS05 International Sympo-

    sium, 153-158.

    [11] Boj E., Claramunt M.M., and Fortiana J.(2006). Regresin basada en distancias en pre-sencia de heteroscedasticidad. XXIX CongresoNacional de Estadstica e investigacin Opera-

    tiva, 279-280, Mayo de 2006, Tenerife.

    [12] Boj E., Claramunt M.M., and Fortiana J.(2007). Selection of Predictors in Distance-Based Regression.Communications in Statistics Simulation and Computation, 36:1, (to ap-pear).

    [13] Booth P., Chadburn R., Cooper D., Haber-man S., and James D. (1999). Modern ActuarialTheory and Practice. Chapman & Hall. BocaRaton (California).

    [14] Borg I., and Groenen P. (2005). Modern mul-tidimensional scaling: theory and applications.Second Edition. Springer-Verlag. New York.

    [15] Brockman M.J., and Wright T.S. (1992). Sta-tistical Motor Rating: Making Effective Use ofyour Data.Journal of the Institute of Actuaries,119:3, 457-543.

    [16] Cuadras C.M. (1989). Distance Analysis inDiscrimination and Classification using bothContinuous and Categorical Variables. In: Dod-ge, Y. (ed.), Recent Developments in Statistical

    Data Analysis and Inference. Elsevier SciencePublisher, North-Holland, Amsterdam, 459-474.

    [17] Cuadras C.M., and Arenas C. (1990). Adistance-based model for prediction with mixeddata. Communications in Statistics Theoryand Methods,19, 2261-2279.

    [18] Cuadras C.M., Arenas A., and Fortiana J.(1996). Some Computational Aspects of aDistance-Based Model for prediction. Commu-nications in Statistics Simulation and Compu-

    tation,25, 593-609.

    [19] de Wit G.W. (1986). Risk Theory, a Tool forManagement. In: M. Goovaerts et al. eds., In-surance and Risk Theory. Reidel. Dordrecht-Boston, MA, 7-17.

    [20] Dobson A.J. (2001). An Introduction to Ge-neralized Linear Models. Second Edition. Chap-man & Hall. London.

    [21] Esteve A. (2003). Distancias estadsticas y re-laciones de dependencia entre conjuntos de va-

    riables. Tesis Doctoral. Universidad de Barcelo-na.

    [22] Gower J.C. (1966). Some distance properties oflatent root and vector methods used in multiva-riate analysis, Biometrika,53, 325-338.

    [23] Gower J.C. (1971). A general coefficient of si-milarity and some of its properties, Biometrics,27, 857-874.

    [24] Gower J.C., and Legendre P. (1986). Metricand Euclidean Properties of Dissimilarity Coef-ficients. Journal of Classification,3, 5-48.

    [25] Gower J.C., and Hand D.J. (1996). Biplots.London: Chapman and Hall.

    [26] Haberman S., and Renshaw A.E. (1996). Ge-neralized Linear Models and Actuarial Science.

    The Statistician,45:4, 407-436.[27] Heras A., Vilar J.L., and Gil J.A. (2002).

    Asymptotic fairness of Bonus-Malus System andoptimal scales of premiums. The Geneva Paperson Risk and Insurance Theory,27, 61-82.

    [28] Lemaire J. (1977). Selection procedures of re-gression analysis applied to automobile insu-rance. Mitteilungen der Vereinigung Schweize-rischer Versicherungs-Mathematiker,77:2, 143-160.

    [29] Lemaire J. (1979). Selection procedures ofregression analysis applied to automobile insu-rance. Part II: Sample Inquiry and Underwri-ting Applications.Mitteilungen der VereinigungSchweizerischer Versicherungs-Mathematiker,79:1, 65-72.

    [30] Lemaire J. (1995). Bonus-malus system in au-tomobile insurance. Kluwer-Nijhof Publishing.Boston, MA.

    [31] McCullagh P., and Nelder J.A. (1989).Genera-lized Linear Models. Second Edition. Chapman

    & Hall. London.

    30

  • 7/23/2019 BEIOv22n4_AP_EBoj.pdf

    10/10

    ARTCULOS DE APLICACIN

    [32] Millenhall S.J. (1999). A systematic relations-hip between minimum bias and generalized li-near models.Proceedings of the Casualty Actua-rial Society,86, 393-487.

    [33] Morillo I. (2001). Sistemas de Bonus-Malus:Comparaciones y alternativas. Tesis Doctoral.Universidad de Barcelona.

    [34] Stroinski K.J., and Currie I.D. (1989). Selec-tion of Variables for Motor Insurance Rating.Insurance: Mathematics and Economics,8, 35-46.

    [35] van Eeghen J., Greup E.K., and Nijssen J.A.(1983).Rate Making. Survey of Actuarial Scien-ce,2, Nationale-Nederlanden N. V. Rotterdam.

    [36] Vegas A. (1993). Fundamentos tcnicos del sis-tema Bonus-Malus.Previsin y Seguro,22, 141-

    167.[37] Vilar J.L., Gil J.A., and Heras A. (2004). Es-

    tudio de la estructura de una cartera de plizasy de la eficiencia de un sistema Bonus-Malus.Cuadernos de la Fundacin MAPFRE Estudios,84.

    [38] Zehnwirth B. (1994). Ratemaking: from Baileyand Simon (1960) to Generalised Linear Regres-sion Models. Casualty Actuarial Society WinterForum, 615-659.

    31