escuela politÉcnica nacional · 2019. 4. 7. · pérdida para calcular la tasa técnica a priori,...

127
ESCUELA POLITÉCNICA NACIONAL ESCUELA DE POSGRADO EN INGENIERÍA Y CIENCIAS REGRESIÓN SEMIPARAMÉTRICA PARA EL CÁLCULO DE TARIFAS EN EL SEGURO DE VEHÍCULOS TESIS PREVIA A LA OBTENCIÓN DEL GRADO DE MAGISTER EN ESTADÍSTICA APLICADA WEHRLI ENRIQUE PÉREZ CAICER [email protected] Director: DR. HOLGER CAPA SANTOS [email protected] 2011

Upload: others

Post on 25-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

ESCUELA POLITÉCNICA NACIONAL

ESCUELA DE POSGRADO EN INGENIERÍA Y CIENCIAS

REGRESIÓN SEMIPARAMÉTRICA PARA EL CÁLCULO DE

TARIFAS EN EL SEGURO DE VEHÍCULOS

TESIS PREVIA A LA OBTENCIÓN DEL GRADO DE MAGISTER E N

ESTADÍSTICA APLICADA

WEHRLI ENRIQUE PÉREZ CAICER

[email protected]

Director: DR. HOLGER CAPA SANTOS

[email protected]

2011

Page 2: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

ESCUELA POLITÉCNICA NACIONAL

FACULTAD DE CIENCIAS

ORDEN DE ENCUADERNACIÓN

De acuerdo con lo estipulado en el Art. 17 del instructivo para la Aplicación del Reglamento del Sistema de Estudios, dictado por la Comisión de Docencia y Bienestar Estudiantil el 9 de agosto del 2000, y una vez comprobado que se han realizado las correcciones, modificaciones y más sugerencias realizadas por los miembros del Tribunal Examinador al informe del proyecto de titulación {ó tesis de grado} presentado por Wehrli Pérez Caicer Se emite la presente orden de empastado, con fecha mes día de año. Para constancia firman los miembros del Tribunal Examinador:

NOMBRE FUNCIÓN FIRMA

DR. HOLGER CAPA SANTOS Director

M.SC. JAIME ANDRADE GONZALEZ Examinador

DR. JULIO MEDINA VALLEJO Examinador

_________________________

DR. EDUARDO ÁVALOS

DECANO

Page 3: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

DECLARACIÓN

Yo, Wehrli Enrique Pérez Caicer, declaro bajo juramento que el trabajo aquí

descrito es de mi autoría; que no ha sido previamente presentada para ningún

grado o calificación profesional; y, que he consultado las referencias bibliográficas

que se incluyen en este documento.

La Escuela Politécnica Nacional puede hacer uso de los derechos

correspondientes a este trabajo, según lo establecido por la Ley de Propiedad

Intelectual, por su Reglamento y por la normatividad institucional vigente.

Wehrli Enrique Pérez Caicer

Page 4: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

CERTIFICACIÓN

Certifico que el presente trabajo fue desarrollado por Wehrli Enrique Pérez Caicer,

bajo mi supervisión.

Dr. Holger Capa Santos

DIRECTOR

Page 5: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

AGRADECIMIENTOS

Agradezco a Dios por todas las bendiciones y vicisitudes recibidas en mi vida.

A todos mis profesores, especialmente al M.Sc. Gaudencio Zurita y al Dr. Holger

Capa, que a lo largo de los años han contribuido significativamente en mi

formación profesional.

A mis Padres, hermanos y amigos, que son mi apoyo permanente.

Page 6: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

DEDICATORIA

A la memoria de mi madre, María Luisa.

A mi padre, Enrique.

A mi esposa, Roxana.

Page 7: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

ÍNDICE DE CONTENIDO

LISTA DE FIGURAS ……………………………...……………………………………… i

LISTA DE TABLAS …………………………….………..…..………………...………… ii

LISTA DE ANEXOS …………………………….……..…………………...…………… iii

RESUMEN …………………………….……………….………………………………… iv

ABSTRACT …………………………….……………….……………………...………… v

CAPÍTULO 1 ....................................................................................................................... 1

1 INTRODUCCIÓN ............................................................................................... 1

CAPÍTULO 2 ....................................................................................................................... 3

2 ASPECTOS TÉCNICOS DE LA TARIFACIÓN DE LOS SEGUROS DE

VEHÍCULOS EN LAS COMPAÑÌAS DE SEGUROS DEL ECUADOR. .................... 3

2.1 PROCESO DE SUSCRIPCIÓN DEL SEGURO DE VEHÍCULOS ............. 4

2.2 PROCESO DE ATENCIÓN DE SINIESTROS DEL SEGURO DE

VEHÍCULOS ....................................................................................................................... 9

2.3 PRIMA, EL PRECIO DEL SEGURO ............................................................. 12

CAPÍTULO 3 ..................................................................................................................... 17

3 - MODELO ACTUARIAL UTILIZADO PARA TARIFACIÓN EN

SEGURO DE VEHÍCULOS. ............................................................................................ 17

3.1 DISTRIBUCIÓN PARA EL NÚMERO DE SINIESTROS .......................... 17

3.1.1 DISTRIBUCIÓN DE POISSON PARA EL NÚMERO DE SINIESTRO S . 18

3.2 DISTRIBUCIÓN DE LA CUANTÍA DE UN SINIESTRO .......................... 19

3.2.1 DISTRIBUCIÓN LOGNORMAL PARA EL VALOR DEL SINIESTRO . 20

3.3 DISTRIBUCIÓN DEL TOTAL DE SINIESTROS ........................................ 21

3.3.1 EL MÉTODO DE RAZÓN DE PÉRDIDA PARA CALCULAR PRIMAS 23

3.4 TASA TÉCNICA ............................................................................................... 25

CAPÍTULO 4 ..................................................................................................................... 27

4 DESCRIPCIÓN TEÓRICA DE LOS MODELOS DE REGRESIÓN Y

REGRESIÓN SEMIPARAMÉTRICA ........................................................................... 27

Page 8: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

4.1 REGRESIÓN CON POLINOMIOS LOCALES Y NUDOS ......................... 27

4.2 REGRESIÓN CON POLINOMIOS LOCALES PENALIZADOS .............. 29

4.2.1 SUAVIZADORES LINEALES ........................................................................ 31

4.2.2 GRADOS DE LIBERTAD EN LOS POLINOMIOS LOCALES

PENALIZADOS ................................................................................................................ 31

4.3 MODELOS MIXTOS ....................................................................................... 33

4.3.1 DESCRIPCIÓN DEL MODELO ..................................................................... 33

4.3.2 ESTIMACIÓN DE PARÁMETROS ............................................................... 36

4.3.3 ESTIMACIÓN DE LA MATRIZ DE COVARIANZAS ............ ................... 37

4.4 PARÁMETRO DE SUAVIZACIÓN ............................................................... 38

4.5 ELECCIÓN DEL NÚMERO DE NUDOS ...................................................... 38

4.6 INFERENCIA ESTADÍSTICA ........................................................................ 39

4.6.1 INFERENCIA PARA POLINOMIOS LOCALES PENALIZADOS SIN

REPRESENTACIÓN DE MODELO MIXTO ............................................................... 39

4.6.2 INFERENCIA PARA POLINOMIOS LOCALES PENALIZADOS CON

REPRESENTACIÓN DE MODELO MIXTO ............................................................... 40

4.7 PRUEBAS DE SIGNIFICACIÓN ................................................................... 44

4.7.1 PRUEBA DE RAZÓN DE VEROSIMILITUD RESTRINGIDA ...... ........... 44

4.7.2 PRUEBA F ........................................................................................................ 45

4.8 MODELOS SEMIPARAMÉTRICOS CON POLINOMIOS LOCALES

PENALIZADOS ................................................................................................................ 46

CAPÍTULO 5 ..................................................................................................................... 48

5 UNA APLICACIÒN DE REGRESIÓN SEMIPARAMÉTRICA PARA LA

TARIFACIÓN DE LOS SEGUROS DE VEHICULOS EN UN SUBCONJUNTO DE

ASEGURADOS DE UNA COMPAÑÍA DE SEGUROS. .............................................. 48

5.1 ESTADÍSTICAS DESCRIPTIVAS ................................................................. 50

5.1.1 GÉNERO DEL ASEGURADO ........................................................................ 50

5.1.2 EDAD DEL ASEGURADO .............................................................................. 51

5.1.3 ANTIGÜEDAD DEL VEHÍCULO .................................................................. 53

5.1.4 SUMA ASEGURADA ....................................................................................... 54

5.1.5 TASA COBRADA ............................................................................................. 56

5.1.6 TASA TÉCNICA ............................................................................................... 57

5.2 MODELO DE REGRESIÓN PARA LA TASA TÉCNICA .......................... 58

Page 9: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

5.2.1 TRANSFORMACIÓN BOX-COX PARA LA TASA TÉCNICA ....... ......... 58

5.2.2 MODELO 1: REGRESIÓN LINEAL MÚLTIPLE ............... ........................ 60

5.2.3 MODELO 2: REGRESIÓN DE POLINOMIO DE GRADO 3 ....... ............. 61

5.2.4 MODELO 3: REGRESIÓN MÚLTIPLE CON LOGARITMO NATURAL

63

5.3 REGRESIÓN SEMIPARAMÉTRICA PARA LA TASA TÉCNICA .......... 63

5.3.1 INTRODUCCIÓN A SEMIPAR, LIBRERÍA DE R ............. ........................ 63

5.3.2 MODELO 1: TRES VARIABLES NO LINEALES .............. ......................... 68

5.3.3 MODELO 2: CON PARÁMETRO SUAVIZADOR ...................................... 70

5.4 SELECCIÓN DEL MODELO ......................................................................... 73

5.5 VARIACIONES AL MODELO EN EL NÚMERO DE NODOS ................. 77

CAPÍTULO 6 ..................................................................................................................... 82

6 ANÁLISIS COMPARATIVO CONTABLE DE LOS RESULTADOS

REALES Y LOS OBTENIDOS DE APLICAR EL MODELO PROPUES TO ........... 82

CAPÍTULO 7 ..................................................................................................................... 89

7 CONCLUSIONES Y RECOMENDACIONES .............................................. 89

7.1 CONCLUSIONES ............................................................................................. 89

7.2 RECOMENDACIONES ................................................................................... 91

REFERENCIAS ................................................................................................................ 92

ANEXOS ............................................................................................................................ 94

1.1. GLOSARIO DE SEGURO DE VEHÍCULOS ................................................ 95

2.2 ESTIMACIÓN DE PARÁMETROS ...................................................................... 103

Propiedades de b por el método de mínimos cuadrados: ............................... 103

2.4 INTERVALOS DE CONFIANZA ........................................................................... 105

2.4.1 Intervalos de confianza para β ............................................................................ 105

2.5 PRUEBAS DE HIPÓTESIS ..................................................................................... 107

2.6 ESTIMADOR DE MAXIMA VEROSIMILITUD RESTRINGIDA ( REML) ........ 111

Page 10: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

i

LISTA DE FIGURAS

Figura 1- Proceso de Suscripción del Seguro de Vehículos .................................................. 4

Figura 2- Carátula de una póliza de seguros de vehículos ecuatoriana ................................. 8

Figura 3- Ejemplo de una forma de pago de un seguro de vehículos sujeto a cobranza ....... 9

Figura 4- El Proceso de Atención de siniestros ................................................................... 10

Figura 5- Ejemplo de una tabla de costo del Seguro. Suma Asegurada USD 9,000 ........... 15

Figura 6- Ejemplo de uso de nodos ..................................................................................... 28

Figura 7- Diagrama de Caja de la Tasa Técnica por Género............................................... 51

Figura 8- Histograma de la Edad del Asegurado ................................................................. 52

Figura 9- Influencia de la edad del Asegurado en la Tasa Técnica ..................................... 52

Figura 10- Histograma de la Antigüedad del Vehículo ....................................................... 54

Figura 11- Influencia de la antiguedad del vehículo en la Tasa Técnica ............................ 54

Figura 12- Histograma de la Suma Asegurada .................................................................... 55

Figura 13- Histograma del logaritmo natural de la Suma Asegurada ................................. 55

Figura 14- Influencia de la Suma Asegurada en la Tasa Técnica ....................................... 56

Figura 15- Histograma de la Tasa Cobrada ......................................................................... 57

Figura 16- Histograma de la Tasa Técnica .......................................................................... 57

Figura 17- Transformación de Box-Cox a la variable Tasa Técnica ................................... 60

Figura 18- Efecto de autocorrelación de los efectos aleatorios y del error ......................... 65

Figura 19- Ejemplo de la relación entre los grados de libertad y el parámetro suavizador . 67

Figura 20- Gráfico del ajuste de la regresión semiparamétrica por variable predictora ...... 72

Figura 21- Autocorrelación del error ................................................................................... 76

Figura 22- Autocorrelación de los u .................................................................................... 76

Figura 23- Autocorrelación del error ................................................................................... 79

Figura 24- Autocorrelación de los efectos aleatorios u ....................................................... 79

Figura 25- Gráfico del ajuste con nodos modificados ......................................................... 80

Figura 26- Bandas de predicción para el quinto año con el modelo semiparamétrico

seleccionado......................................................................................................................... 82

Figura 27- Histograma de la Tasa Técnica y su ajuste semiparamétrico ............................ 83

Page 11: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

ii

LISTA DE TABLAS

Tabla 1- Distribuciones de probabilidad para variables aleatorias continuas utilizadas para

la estimación del monto de siniestros .................................................................................. 19

Tabla 2- Ejercicio Contable hasta Margen de Contribución, del 5to año del seguro de

vehículos, con tasa técnica actuarial .................................................................................... 86

Tabla 3- Ejercicio Contable hasta Resultado Técnico, del 5to año del seguro de vehículos,

con tasa técnica actuarial ..................................................................................................... 87

Tabla 4- Ejercicio Contable hasta Margen de Contribución, del 5to año del seguro de

vehículos, con tasa técnica bajo regresión semiparamétrica ............................................... 87

Tabla 5- Ejercicio Contable hasta resultado técnico, del 5to año del seguro de vehículos,

con tasa técnica bajo regresión semiparamétrica. ................................................................ 87

Page 12: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

iii

LISTA DE ANEXOS

ANEXO 1: GLOSARIO DE SEGURO DE VEHÍCULOS ................................................ 95

ANEXO 2: REGRESIÓN MÚLTIPLE ............................................................................ 102

ANEXO D - Modelo de la orden de encuadernación ........................................................ 112

Page 13: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

iv

RESUMEN

El principal objetivo de esta investigación, es modelar la tasa técnica a aplicar en

las tarifas de seguros de vehículos, mediante una regresión semiparamétrica

entre variables del vehículo y de su propietario.

Debido a que la regresión semiparamétrica es una generalización de los modelos

de regresión lineal, se utilizará esta técnica para mejorar el ajuste. Estos modelos

utilizan polinomios locales, lo cual facilita la explicación y suavización del modelo

final resultante. Así, se puede realizar mejores ajustes entre las covariables y la

variable a ser explicada. La técnica también contempla indicadores que ayudan

para determinar si es que existe linealidad.

Se posee una base de datos facilitada por una empresa de seguros de vehículos

del Ecuador durante cuatro años de observaciones, no están incluidos los

vehículos pesados.

Los datos y el modelo serán sometidos a pruebas de hipótesis, considerando el

objetivo de la investigación. Además, se utilizarán ciertas prácticas comunes de la

tarificación en el mercado asegurador ecuatoriano como el método de Razón de

Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el

modelo de regresión semiparamétrica.

Para la modelación, se utilizará el software de libre distribución R, y el

complemento "Semipar" de M.P. Wand.

Finalmente, se ilustrará el resultado económico bajo el supuesto de "ceteris

paribus", que se obtiene por utilizar el modelo propuesto en reemplazo de la

técnica tradicional de tarificación de la compañía de seguros de automoviles.

Palabras clave: Regresión Semiparamétrica. Tasa Técnica, Razón de Pérdida,

Tarifa actuarial, Seguro de Vehículos.

Page 14: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

v

ABSTRACT

The main objective of this research is to model the technical rate to be applied in automobile insurance rates, using semi-parametric regression between variables of the car and the owner of the vehicle. Because the semi-parametric regression is a generalization of linear regression models, we use this technique to improve the fit. These models often use polinomios locales functions that can be defined as local polynomials, which makes explaining and smoothing the resulting final model. Thus, we reach to make better adjustments between the covariates and the variable to be explained. The technique also provides indicators that help us to determine if there is linearity. We have a small database kindly provided by an automobile insurance company of Ecuador during four years of observations. Heavy vehicles are not included. The data and the model will be subjected to hypothesis testing, given the objective of the research. In addition, we will use some common practices in the insurance market pricing Ecuador as the method of Loss Ratio technique to calculate the a priori, which will be estimated by the semiparametric regression model. For modeling, we will use the free software R, and the complement "SEMIPAR" of M.P. Wand. Finally, we illustrate the economic result under the assumption of "ceteris paribus", which is obtained by using the proposed model to replace the traditional technique of pricing of auto insurance company. Keywords: Semi-parametric regression. Technical rate, Loss Ratio, Actuarial Rate, Automobil Insurance

Page 15: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

1

CAPÍTULO 1 1 INTRODUCCIÓN

Son varios los modelos estadísticos y actuariales utilizados para calcular la tasa

técnica de seguros. El método de Razón de Pérdida, calcula la tasa porcentual del

costo del seguro de vehículos, utilizando las estadísticas de Siniestros Pagados,

el número de asegurados, el número de siniestros, y las estadísticas del Valor

Asegurado. Esta fórmula se aplica a cualquier grupo de asegurados que puedan

clasificarse por variables cualitativas como Región, Marca, Modelo, entre otros.

Pero cuando se encuentran grupos de asegurados que puedan clasificarse por

variables cuantitativas como Edad del Asegurado, Valor Asegurado del Vehículo,

Años de uso del Vehículo, una mejor técnica es la regresión.

La regresión semiparamétrica es una generalización de los modelos de regresión,

porque en un mismo modelo se contiene una parte paramétrica y otra no

paramétrica; adicionalmente esta regresión puede ser lineal o no lineal.

Puesto que en la actualidad se empieza a disponer de variables cuantitativas y

cualitativas que no se han incorporado explícitamente en los modelos de tarifación

tradicional, es necesario plantear modelos que permitan aprovechar de mejor

manera esta información.

La regresión semiparamétrica tiene la ventaja de que las variables no

necesariamente deben seguir una distribución de probabilidad teórica predefinida,

sino que utilizan métodos que mezclan estimación de máxima verosimilitud con

técnicas de suavización, pudiendo adaptarse de una mejor manera en la

explicación del modelo dentro de un rango definido. En las tarifas de seguros,

existe un rango de precios, edad, valor asegurado y antigüedad de vehículos, que

ya están establecidos por las tendencias del mercado que hacen posible

incorporar un modelo de regresión para la predicción.

Page 16: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

2

Dado que actualmente, se han desarrollado diversas aplicaciones de la regresión

semiparamétrica en los campos financieros, económicos, de seguros, industriales,

del medio ambiente, etc., se trata, por tanto, de trabajar con modelos ya

internacionalmente aceptados.

Debido a que existe el paquete R de libre disponibilidad para la experimentación

de estos modelos, resulta muy conveniente para un primer ensayo utilizar esta

combinación de herramientas para la resolución del problema planteado.

La flexibilidad en el manejo de las bases de datos hace posible una

experimentación de este tipo, ya que se pueden validar varios caminos de

tarifación con mucha rapidez buscando una validación metodológica con la

compañía de seguros, de manera que su aplicación sea atractiva y práctica.

Page 17: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

3

CAPÍTULO 2 2 ASPECTOS TÉCNICOS DE LA TARIFACIÓN DE LOS

SEGUROS DE VEHÍCULOS EN LAS COMPAÑÌAS DE

SEGUROS DEL ECUADOR.

Para definir el seguro de vehículos, es necesario primero definir sus principales

componentes descritos a continuación por tres fuentes: El Diccionario de la Real

Academia Española, El Diccionario Mapfre de Seguros y el Decreto Supremo

1147 “Legislación sobre el Contrato de Seguro” del Ecuador, Año 1963.

Las definiciones pueden ser encontradas en el Anexo 1, en orden alfabético.

SEGURO DE VEHÍCULOS

El seguro de vehículos es un contrato en donde la COMPAÑÍA ASEGURADORA

ofrece una INDEMNIZACIÓN por los daños ocurridos al AUTOMÓVIL de

propiedad del ASEGURADO siempre y cuando estos daños hayan sido

previamente acordados en el contrato. Para tener el derecho de

INDEMNIZACIÓN, el ASEGURADO tuvo que anticiparle a la COMPAÑÍA DE

SEGUROS un pago en moneda llamado PRIMA. La duración típica de un contrato

de seguros de vehículos es de un año y puede renovarse siempre que exista

acuerdo mutuo.

En el Ecuador, la Suma Asegurada para el Seguro de Vehículos corresponde al

Valor Comercial o Valor de Mercado, es decir, el Precio por el que normalmente

puede adquirirse un bien u otro de características similares.

El Seguro de Vehículos tiene las siguientes coberturas:

• RESPONSABILIDAD CIVIL

• DAÑO PARCIAL O Y/O TOTAL AL VEHÍCULO ASEGURADO

• ROBO PARCIAL Y/O TOTAL AL VEHÍCULO ASEGURADO

•ACCIDENTES PERSONALES PARA OCUPANTES DEL VEHÍCULO

ASEGURADO

• OTROS EVENTOS NO EXCLUÍDOS EN LA PÓLIZA.

Page 18: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

4

2.1 PROCESO DE SUSCRIPCIÓN DEL SEGURO DE VEHÍCULOS

Al principio y hasta que no sea efectiva la póliza, el cliente será llamado

“SOLICITANTE”; éste normalmente es el propietario del Vehículo o al menos tiene

un interés de asegurarlo.

Figura 1- Proceso de Suscripción del Seguro de Vehículos

2.1.1 SOLICITUD DE SEGUROS

El SOLICITANTE busca un Asesor Productor de Seguros o una Compañía de

Seguros local y hace una Solicitud de Aseguramiento. Esta Solicitud es un

formulario que describe al menos las siguientes características:

• Datos Personales del Solicitante: Nombre, Dirección, Teléfono.

• Datos del(los) Vehículo(s) a Asegurar: Marca, Modelo, Antigüedad, Uso,

Tonelaje.

• Coberturas solicitadas: Responsabilidad Civil, Daños Parciales o Totales, Robo

Parcial o Total, Accidentes Personales para Ocupantes u otras coberturas.

• Existencia de otros seguros que el Solicitante ya tiene para el Vehículo

Asegurado

• Datos de contacto y sitio en donde se puede coordinar una Inspección del

Vehículo.

Con esta información, si existe Asesor Productor de Seguros, este se dirige hacia

la Compañía de Seguros y si no lo hubo, la Compañía de Seguros asigna la

solicitud a un Ejecutivo de Cuentas y este analiza los datos de la Solicitud para

Page 19: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

5

determinar si se trata de un riesgo que el puede tramitar en base a un MANUAL

DE SUSCRIPCIÓN proporcionado por la Compañía de Seguros y que tiene una

serie de reglas en donde los Ejecutivos de Cuenta encontrarán en qué casos ellos

pueden asegurar, en qué otros casos pueden pedir autorización y en cuales

deben explicarle al Solicitante que la Compañía de Seguros no asegura.

2.1.2 ORDEN DE INSPECCIÓN

Si las características del riesgo son tales que si es posible avanzar en una

negociación, el siguiente paso será contactar al Solicitante para coordinar una

Inspección del Vehículo para constatar la existencia y el estado del mismo al

momento de la celebración del contrato; esto es muy importante, porque ningún

contrato de seguro cubrirá daños ocurridos antes de la celebración del mismo.

La Inspección del Vehículo será realizada por un Inspector calificado, sea

empleado de la compañía o contratado por ella, para ese fin. La inspección

consiste en una revisión física en compañía del Solicitante, que da origen a un

documento final que debe firmarlo junto con las observaciones encontradas.

Los datos más usuales que contiene una inspección de vehículos son:

• Datos del Propietario: Nombre, Dirección, Cédula o Registro Único de

Contribuyente.

• Datos del Vehículo: Marca, Modelo, Antigüedad, Uso, Número de Motor, Número

de Chasis, Número de Placa o Serie previa a la Placa de circulación.

• Improntas: También es usual que durante la inspección se obtenga una impronta

física o un calcado del Número de Motor y/o Número de Chasis; esto será la

prueba de que el Vehículo revisado es el mismo que consta en la Matrícula y el

mismo que será posteriormente asegurado. Así se puede reducir el riesgo de

fraude de que el Solicitante pretenda asegurar un vehículo que no existe.

• Daños o Averías encontradas al momento de la inspección: Se suele tener una

figura típica de un vehículo en la hoja de inspección para señalar con una X sobre

la zona afectada y así saber qué parte tenía restos de daños anteriores. La

compañía de seguros no indemnizará daños anteriores y si fueran nuevos daños

Page 20: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

6

que afectan a zonas ya dañadas, se aplicará un demérito que reducirá la

indemnización hasta que solo quede el precio del nuevo daño.

• Estado de las llantas: Es muy importante saber si las llantas se encuentran en

estado malo, regular o bueno, o si es posible establecer otro tipo de escala de

medición. Este dato podría suspender el proceso de suscripción hasta que el

Asegurado demuestre haber adquirido llantas en buen estado.

• Estado Mecánico: Algunas compañías de seguros son más estrictas e

incorporan un chequeo básico mecánico especialmente en los Vehículos cuyo

peso sea mayor a 3.5 Toneladas (Vehículos Pesados).

• Kilometraje recorrido: El Kilometraje recorrido junto con la antigüedad, es

importante para tener una idea de las probabilidades de exposición a riesgos de

daños; por ejemplo, Choque. También podría ayudar a contrastar la versión del

Asegurado acerca del uso que le da al mismo.

• Uso: El Uso podría ser Particular (Ej: De uso Familiar), Comercial o Público.

• Accesorios: Las compañías de seguro solo aseguran aquellos accesorios que

son propios del modelo estándar del vehículo y aquellos que han sido constatada

su existencia durante una inspección; algunos inclusive logran anotar el número

de serie de cada uno de los accesorios (o de los más importantes) para

posteriores derechos de indemnización. La mayoría de las compañías de seguros

tienen una lista de accesorios que no cubren bajo ningún concepto.

• Observaciones: Finalmente, el Inspector de Riesgos anota las anomalías o

detalles más importantes al final; incluso aquellas que por motivos de faltas de

información no pudieron anotarse. Esto servirá para el análisis.

• Firmas: La firma del Inspector asignado y del Solicitante, Propietario o Persona

encargada por el Solicitante para atender la inspección de Riesgos.

• Anexos: Se anexan fotos y documentos como la fotocopia de la matrícula y/o

fotocopia de la cédula o RUC del Solicitante y/o Licencia de Conducir.

El Inspector entrega el Informe de Inspección completo al Ejecutivo de Cuenta y si

éste confirma con el análisis del Informe de Inspección de que el Riesgo si puede

ser asumido por la Compañía según el MANUAL DE SUSCRIPCIÓN y los

Page 21: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

7

distintos medios de aprobación entonces el siguiente paso será confeccionar al

Solicitante una COTIZACIÓN.

2.1.3 COTIZACIÓN

La cotización es un documento en el cual se detalla brevemente la información del

Solicitante y la Información del Vehículo, y en donde se especifica el precio del

seguro, llamado PRIMA, y se mencionan las coberturas y exclusiones que la

Compañía de Seguros está dispuesta a cotizar.

Se adicionan también todos los detalles de la forma de pago, si es que habrá

alternativas de financiamiento; es decir medios de pago como contado, débito de

cuenta o tarjeta de crédito.

Recibida la COTIZACIÓN, el Asegurado deberá decidir si la acepta, tiene la

posibilidad de negociar con la Compañía de Seguros, o la rechaza.

Si cree poder tener la posibilidad de negociar se repite el proceso de

COTIZACIÓN hasta que el Solicitante acepte a pagar la PRIMA.

2.1.4 PRIMA

La prima es el precio del seguro, y puede ser pagada de Contado o financiada; en

caso de ser financiada, el proceso se divide en dos: primero se paga la cuota

inicial, y el resto de cuotas o letras de cambio, mediante el proceso de

COBRANZAS. El pago de la cuota inicial, permite que la Compañía emita la

PÓLIZA.

2.1.5 PÓLIZA

Adicional al pago, el Solicitante deberá entregar los documentos necesarios para

el archivo del contrato e indicar la forma de pago y medio exacto que elige. De

esta forma, al recibir los documentos y el valor monetario de la cuota o letra inicial

(o de contado si es el caso), junto a toda la documentación, incluida la solicitud de

seguro, cotización aceptada e informe de inspección, se procede a elaborar el

documento de la PÓLIZA.

Page 22: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

8

La PÓLIZA es un documento en donde se describen todos los puntos del contrato

y lo que no está en la póliza simplemente no es parte del contrato. La póliza debe

ser firmada tanto por el representante asignado de la compañía de Seguros como

por el Solicitante desde ahora llamado Asegurado; sin esta firma se entenderá

que el Asegurado no ha aceptado las condiciones del contrato y esto puede

causar problemas al momento del siniestro. En caso de que el cliente firme la

póliza, la compañía de seguros, si hubiere Asesor Productor de Seguros y

siniestro, procede a pagar el porcentaje de comisión pactado anualmente bajo un

CONTRATO DE AGENCIAMIENTO, que es entregado y controlado por la

Superintendencia de Bancos y Seguros.

La Figura 2, muestra una carátula original de una póliza de seguros de vehículos,

según el formato aprobado por la Superintendencia de Bancos y Seguros.

Figura 2- Carátula de una póliza de seguros de vehículos ecuatoriana

Page 23: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

9

2.1.6 COBRANZA

Luego el proceso de COBRANZA se activa hasta que el cliente durante el tiempo

pactado de pago de cuotas o letras termine y la totalidad de la prima sea cobrada,

Por ejemplo, como se indica en la figura 3.

En caso de que este no tenga un buen término, la póliza establecerá qué

acciones se tomarán en cada caso, desde la anulación del contrato o hasta la

pérdida de cobertura por siniestros presentados.

Figura 3- Ejemplo de una forma de pago de un seguro de vehículos sujeto a cobranza

2.2 PROCESO DE ATENCIÓN DE SINIESTROS DEL SEGURO DE

VEHÍCULOS

Durante la vigencia del contrato, pueden ocurrir los eventos cubiertos por la

Póliza; a estos eventos se los denomina siniestros.

2.2.1 NOTIFICACIÓN A LA COMPAÑÍA DE SEGUROS

Cuando se da el siniestro, el Asegurado deberá comunicarse hasta tres (3) días

hábiles posteriores a su conocimiento, con la Compañía de Seguros.

La Compañía de Seguros solicitará al Asegurado los documentos

correspondientes que deberá presentar según el tipo de evento ocurrido. Por

ejemplo; si se trata de un robo, dentro del paquete de los documentos se deberá

incluir la denuncia respectiva a las autoridades competentes y/o parte policial en

caso de accidente donde hayan llegado las autoridades.

Page 24: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

10

Figura 4- El Proceso de Atención de siniestros

2.2.2 INSPECCIÓN DE SINIESTROS

La compañía de seguros también deberá realizar una inspección al vehículo

cuando sea posible hacerlo, salvo en caso de ROBO TOTAL DEL VEHÍCULO, en

donde obviamente el Asegurado no conoce donde se encuentra el vehículo.

2.2.3 ANÁLISIS DE LA DOCUMENTACIÓN

La Inspección del Siniestro junto a la documentación probatoria del evento

permitirá a la Compañía de Seguros establecer si tiene o no cobertura y cuál es el

monto estimado del siniestro.

2.2.4 NOTIFICACIÓN DE COBERTURA

La Compañía de Seguros cuenta con 45 días calendarios contados desde la

fecha de recepción del último documento del siniestro por parte del Asegurado,

para indicar si va a indemnizar o no y la forma en que lo hará.

Si la Compañía de Seguros no se pronuncia durante ese tiempo, el Asegurado

puede acercarse a la Superintendencia de Bancos y ejercer uno de sus derechos

de RECLAMO ADMINISTRATIVO y así obligar a indemnizar a la Compañía de

Seguros.

Page 25: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

11

2.2.5 PROCESO DE ATENCIÓN DE LA INDEMNIZACIÓN

Según el monto, se deben realizar las reservas de siniestros a los que está

obligado constituir por la Superintendencia de Bancos y Seguros. Estas reservas

se podrán actualizar dependiendo de la evolución del caso.

Las reservas y montos se establecen mediante el análisis de Peritos de Seguros,

figura contemplada en la Superintendencia de Bancos y Seguros, al profesional

que se dedica a realizar ajuste de siniestros.

2.2.6 LIQUIDACIÓN DEL SINIESTRO Y PAGO DE LA R.A.S. A.

Si el siniestro es cubierto por la póliza, la Compañía de Seguros decidirá la forma

de indemnización, que puede ser dinero, o mediante la reposición, reparación o

reconstrucción de lo afectado. Durante la indemnización, si es que ésta es elegida

como reparación, intervienen distintos procesos y proveedores; por ejemplo, los

Talleres Mecánicos y distribuidores de piezas y repuestos.

La compañía de Seguros interactúa con ellos, para obtener la mejor posibilidad de

reparación en menor tiempo, costo y calidad hacia el Asegurado.

Cada vez que ocurre un siniestro, la suma asegurada se reduce en el mismo

monto de la indemnización. A la indemnización se le restan todos los valores

deducibles según como se haya previamente indicado en la póliza. Los valores a

deducir más usuales son: Franquicia Deducible y Depreciación de piezas donde el

porcentaje máximo se especifica en la póliza.

Debido a que la suma asegurada se ha reducido en el mismo monto de la

indemnización, el Asegurado, deberá volver a pagar una prima por la diferencia

del monto asegurado consumido y proporcional al tiempo de vigencia que hace

falta para el fin del contrato. Esta prima siempre será menor que la prima original

y es denominada RESTITUCIÓN DE LA SUMA ASEGURADA. Es tan común

como los siniestros de pérdida parcial ocurren; de hecho, existe desde hace

muchos años una cláusula llamada RESTITUCIÓN AUTOMÁTICA DE SUMA

ASEGURADA (R.A.S.A.), en donde se asume que en la indemnización se deduce

también la R.A.S.A. que tienen por defecto casi todas las pólizas.

Page 26: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

12

Pagando la R.A.S.A., el Asegurado ya puede estar seguro de que si al poco

tiempo le vuelve a ocurrir otro siniestro, se repetirá el proceso de indemnización

sin que haya perjuicio económico adicional por merma de suma asegurada o

exceso de eventos en el seguro.

2.2.7 FIRMA DE ACTA DE FINIQUITO

El Asegurado, una vez recibida la indemnización se obliga a firmar el acta de

finiquito, salvo que no esté de acuerdo con la indemnización recibida; en este

caso, la Póliza contempla que en caso de desacuerdo, las partes se someterán a

los tribunales correspondiente según la Ley de Arbitraje y Mediación, pudiendo

llegar a instancias superiores hasta la resolución del conflicto.

2.3 PRIMA, EL PRECIO DEL SEGURO

Todas las compañías de seguros deben conocer de forma anticipada cuál debería

de ser el precio del seguro o la fórmula a aplicar para la mayoría de casos que se

le van a presentar en el año. Esto facilita el proceso de suscripción y aumenta la

productividad de la Compañía; incluso, es conveniente elaborar cotizadores u

hojas electrónicas que impriman la cotización, además del software para producir

pólizas y administrar siniestros. Las cotizaciones se hacen en base a una

TARIFA, que es un conjunto de reglas que marcan un determinado precio

dependiendo de las características del riesgo ingresado por el Ejecutivo de

Cuentas.

La construcción de la tarifa se realiza en base a resultados de ESTUDIOS

ESTADÍSTICOS-ACTUARIALES que la compañía de seguros está obligada a

presentar, como LA NOTA TÉCNICA, a la Superintendencia de Bancos y Seguros

para la obtención de la aprobación de las condiciones generales respectivas de

un producto de seguros que va luego al área comercial, junto al CONTRATO DE

REASEGUROS que respalda la cobertura que se ofrecerá a los clientes.

Las compañías realizan análisis estadístico de siniestralidad para observar el

funcionamiento de la política de precios y administración de siniestros al menos

Page 27: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

13

en el último año, y dependiendo de sus resultados se hacen ajustes porcentuales

a las tarifas utilizadas para el nuevo año.

En la mayoría de las compañías de seguros las características que marcan la

diferencia en el precio en el seguro de vehículos son:

• Zona o Región Geográfica: Usualmente ciudad de residencia del

Asegurado.

• Uso del Vehículo: Particular, Comercial o Público

• Tonelaje (Si es mayor a 3,5 Toneladas se considera Vehículo Pesado, sino

Vehículo Liviano)

• Antigüedad: En la práctica, vehículos de antigüedad mayor a diez años,

solo se aseguran contra PERDIDA TOTAL, y ya no contra PERDIDAS

PARCIALES.

• Tipo de Riesgo: Varía en cada compañía; puede ser una clasificación a

discreción por la marca, o porque contiene una pieza muy apetecida para

ROBO PARCIAL, o porque son de muy bajo costo o de fabricación escaza,

etc.

• Tipo de cobertura Solicitada: Puede ser COBERTURA DE TODO RIESGO,

COBERTURA DE RIESGOS NOMBRADOS, COBERTURA DE SOLO

RESPONSABILIDAD CIVIL, COBERTURA DE SOLO PÉRDIDA TOTAL,

etc.

Aunque existen variadas características que acompañan al cálculo de la Prima,

ninguna de las citadas anteriormente describe características del Asegurado o

Conductor Principal. Esto es una desventaja porque es posible encontrar

diferencias significativas entre el perfil del Asegurado que hacen que un vehículo

de las mismas características sea un riesgo bajo o alto para la compañía

aseguradora.

Las compañías que también incluyen información del Asegurado para obtener el

precio de la prima son compañías que tienen CASA MATRIZ en otros países,

donde generalmente la actividad actuarial está mucho más desarrollada o el

organismo de control es más exigente en este campo y existen estudios

actualizados.

Page 28: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

14

Debido a que todas las compañías de seguros son celosas de transmitir su

conocimiento Técnico de cómo confeccionan sus tarifas, es difícil conocer por

compañía, qué metodologías aplican; sin embargo, una vez que una compañía

realiza un estudio técnico o valida su tarifa del año anterior, el resultado es que la

tarifa sea una tabla de variables clasificadas o segmentadas que generan

múltiples casillas, y dentro de cada casilla se encontrará la TASA.

La TASA se multiplica por la Suma Asegurada y esta genera la PRIMA NETA

ANUAL a pagar (si el contrato es anual).

����� � ���� �� ����� � ����

Por tanto,

���� ������

���� �� �����

La PRIMA NETA ANUAL, por instrucción de la Superintendencia de Bancos y

Seguros será contabilizada en los libros como si estuviese pagada de CONTADO

en el ciento por ciento de los contratos.

La compañía de seguros solo podrá enviar al resultado, la parte correspondiente a

la PRIMA NETA GANADA, producto de una fórmula que se creó, en base a que la

probabilidad de ocurrencia de siniestros es uniforme durante el tiempo de vigencia

del contrato y bajo la generalidad de que ésta fue diseñada con un recargo

promedio de 20% de la prima neta anual para gastos administrativos.

Page 29: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

15

Figura 5- Ejemplo de una tabla de costo del Seguro. Suma Asegurada USD 9,000

LA PRIMA TOTAL que paga el Asegurado ilustrada en la Figura 4, se compone

de la siguiente fórmula:

+ PRIMA NETA ANUAL

+ CONTRIBUCIÓN A LA SUPERINTENDENCIA DE BANCOS (3,5% de la Prima

neta anual)

+ CONTRIBUCIÓN AL SEGURO SOCIAL CAMPESINO (0,5% de la Prima neta

anual)

+ DERECHO DE EMISIÓN (Tabla de la resolución que va desde USD 0 hasta

USD 9)

+OTROS CARGOS SUJETOS A I.V.A. 12% (Valores agregados que utilizan

como medio, la póliza de seguro, y previamente pactados entre el Asegurado y la

Compañía de Seguros. Ej: Asistencia Legal al Asegurado durante Siniestros)

+Impuesto al Valor Agregado (I.V.A. considerando como base imponible la suma

de todos los valores arriba descritos)

+OTROS CARGOS NO SUJETOS A I.V.A. 0% (Valores agregados que utilizan

como medio, la póliza de seguro, y previamente pactados entre el Asegurado y la

Compañía de Seguros y que por medio del Servicio de Rentas Internas no

generan I.V.A., como los seguros de Vida, Accidentes y Salud; por ejemplo:

Servicios Exequiales para las víctimas del Accidente de Tránsito.

Page 30: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

16

+ INTERES DE FINANCIACIÓN sujetos a la tasa máxima dispuesta por el Banco

Central.

La suma de los rubros anteriores es igual a la PRIMA TOTAL que paga el

Asegurado DE CONTADO (donde los intereses serán iguales a cero) o

Financiados (intereses mayores a cero).

2.3.1 PRIMA TÉCNICA o TASA TÉCNICA

La unidad objetivo de estudio en el seguro de vehículos para la construcción de

una tarifa puede ser la PRIMA o la TASA; ésta última es la PRIMA / SUMA

ASEGURADA, porque de cualquiera de ellas se puede obtener el precio del

Seguro.

En el mercado asegurador ecuatoriano y en esta tesis, la unidad de estudio en

adelante será la TASA.

La TASA que fluctúa en el mercado de seguros de vehículos no es única, sino

que depende de muchos factores; tampoco es precisamente el resultado de un

estudio técnico-actuarial.

Posiblemente sea más un margen de negociación, que las Compañías de

Seguros hacen para que no existan muchas diferencias entre un Asegurado y

otro, o entre su aseguradora y la competencia; la tasa que fluctúa en el mercado

de seguros responde o debe responder a la TASA TÉCNICA.

La Tasa Técnica es el resultado de una fórmula que toma el concepto conocido

de la razón de pérdida, más los componentes que agregan recargos; por lo

general, proporcionales al precio de venta.

Page 31: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

17

CAPÍTULO 3

3 - MODELO ACTUARIAL UTILIZADO PARA

TARIFACIÓN EN SEGURO DE VEHÍCULOS.

3.1 DISTRIBUCIÓN PARA EL NÚMERO DE SINIESTROS

En el tiempo, han sido muchos los esfuerzos por ajustar distribuciones de

probabilidad para representar el número de siniestros que podrían ocurrir en el

tiempo [0,t) de un riesgo asegurable.

Según la definición revisada de riesgo asegurable, este debe ser aleatorio,

posible, ajeno a la voluntad humana (salvo ciertos casos controlados) y debe

tener un efecto económico.

De esta forma, los siniestros de una cartera asegurada en una Compañía de

Seguros aparecen para ella de manera independiente; es decir, que no tienen

relación entre ellos. También es importante indicar que los siniestros no se

contagian, aunque en eventos catastróficos ocurren varios siniestros al mismo

tiempo, se podría determinar que existe un espacio de tiempo al menos

infinitesimal entre ellos.

Las distribuciones que son utilizadas para representar el número de siniestros

usualmente son:

- Distribución de Poisson

- Distribución Binomial

- Distribución Binomial Negativa

Durante este trabajo de tesis, se tomará en cuenta la Distribución de Poisson

Page 32: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

18

3.1.1 DISTRIBUCIÓN DE POISSON PARA EL NÚMERO DE

SINIESTROS

Siméon-Denis Poisson, francés que vivió entre 1781 hasta 1840, presentó un

trabajo en 1838 de “Investigación sobre la probabilidad de los juicios en materias

criminales y civiles”, en donde se hablaba ya de esta particular distribución.

Posteriormente Ladislaus Josephovich Bortkiewicz, ruso que vivió entre 1868

hasta 1931, presentó un libro en 1898 titulado la “Ley de los pequeños números”,

donde se daban detalles y ejemplos de su aplicación y se formalizó la fórmula de

esta distribución.

Actualmente se podría definir a la distribución de Poisson, bajo la perspectiva de

seguros, de la siguiente manera:

Sea tN la variable aleatoria asociada al número de siniestros en [ )t,0 , de forma

que

[ ] ( )tPnNP nt ==

Se demuestra que si el proceso estocástico { }0; ≥tNt verifica las condiciones:

Es de incrementos independientes

Es de incrementos estacionarios

La probabilidad de que en un instante [ )tt ,0' ∈ ocurra más de un siniestro, y de

que sucedan infinitos siniestros en un intervalo finito es nula, entonces tN sigue el

modelo de Poisson, es decir:

[ ] ( ) ( )nt

nt tn

etPnNP λ

λ

!

===

Donde λ es el número medio de siniestros correspondiente a un intervalo

unitario (también se conoce como intensidad de siniestralidad).

Page 33: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

19

3.2 DISTRIBUCIÓN DE LA CUANTÍA DE UN SINIESTRO

Para la cuantía de siniestros, el primer supuesto básico es que son cifras

económicas, positivas y son independientes del número de siniestros en el tiempo

[0,t).

En la mayoría de casos, los valores que pueden tomar son continuos, y no

discretos como el caso del número de siniestros en el tiempo [0,t).

Son varias las distribuciones de probabilidad para variables aleatorias continuas

que se utiliza para ajustar datos de cuantías de siniestros en las compañías de

seguros, su uso depende de las características de los datos y la estructura de

riesgo del tipo de seguro.

Tabla 1- Distribuciones de probabilidad para variables aleatorias continuas utilizadas para la estimación del monto de siniestros

DISTRIBUCIONES BÁSICAS DISTRIBUCIÓN NORMAL

DISTRIBUCIÓN LOGÍSTICA

DISTRIBUCIONES DE COLAS LIVIANAS

DISTRIBUCIÓN EXPONENCIAL

DISTRIBUCIÓN ERLANG

DISTRIBUCIÓN CHI CUADRADA

DISTRIBUCIÓN GAMMA

DISTRIBUCIÓN BETA

DISTRIBUCIÓN GAUSSIANA INVERSA

DISTRIBUCIONES DE COLAS PESADAS

DISTRIBUCIÓN LOGNORMAL

DISTRIBUCIÓN DE WEIBULL

DISTRIBUCIÓN DE PARETO

DISTRIBUCIÓN LOGGAMMA

DISTRIBUCIÓN BENKTANDER DE TIPO 1.

DISTRIBUCIÓN BENKTANDER DE TIPO 2.

Véase http://www.statistik.lmu.de/~kneib/risikotheorie/download/schadenhoehenverteilungen.pdf

En esta tesis, se mencionan de forma teórica cuando el caso es distribución

lognormal.

Page 34: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

20

3.2.1 DISTRIBUCIÓN LOGNORMAL PARA EL VALOR DEL SINIESTRO

Se supone que la cuantía de un siniestro se debe a unas causas, siendo:

=sX Tamaño del siniestro debido a las s primeras causas,

=sρρρ ,......., 21 Causa o variables de impulso

Ahora, se asume que:

1. sρρρ ,......., 21 son variables independientes

2. sss XX *1+=∆ ρ

=∆ sX Incremento de cuantía del siniestro por la incidencia de la causa 1+sρ ,

habiéndose producido ya las

( )sii ,.....2,1==ρ

De aquí

s

ss X

X∆=+1ρ

Y

∑ ∑−

=

=

∆=+

1

0

1

01

n

s

n

x s

s

X

Xs

ρ

Donde

∑−

=

=+

1

01

n

ss

ρ Suma de las n primeras causas.

Pasando al límite:

,log1

00 1

∑ ∫−

∞→→∆=

==∆n

n

x

x

s

s Xu

du

X

X ,10 =X unidad de medida.

Al sumar s variables independientes y al hacer tender ∞→n se da entrada al

teorema del límite central, con lo que la suma:

∑−

=+=

1

01

n

ssρη

Tiende a una distribución normal

( )σαη ;N→

Pero si η es ( )σα ;N y Xlog=η , se dice que X es logarítmica normal.

Page 35: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

21

La ley de probabilidad de η es:

2

2

1

2

1

−−σ

α

πσ

y

e

Y haciendo el cambio de variable

xY log=

dxx

dy1=

La función densidad de x será:

( )2

log

2

1

2

1

−−= σ

α

πσ

x

ex

xf Siendo su función de distribución:

[ ] ( ) ∫

−−==≤

x u

dueu

xFxP0

log

2

12

2

1 σα

πσρ

Y sus parámetros son:

Media 2

2

1

1

σαα

+== e

Varianza ( )1222 −= + σσα ee

3.3 DISTRIBUCIÓN DEL TOTAL DE SINIESTROS

Hay varios tipos de desarrollos teóricos acerca de la distribución total de

siniestros. En esta tesis se va a presentar dos tipos de casos:

CASO 1: AQUELLA QUE CONSIDERA QUE EL NÚMERO DE

SINIESTROS Y LA CUANTÍA DE SINIESTROS SON INDEPENDIENTES

EN EL TIEMPO [0,t).

���������� ������� � �ú���� ���������� �������� � ��� ���������� ��������

CASO 2: AQUELLA QUE CONSIDERA COMO UNA DISTRIBUCIÓN

COMPUESTA ENTRE EL NÚMERO DE SINIESTROS Y LA CUANTÍA DE

SINIESTROS EN EL TIEMPO [0,t).

Page 36: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

22

���������� ������� � ���� �������� �� ��� ���������� ��� ������

CASO 1

Se supone que:

( ) =nxG / La probabilidad de que, ocurridos n siniestros, la cuantía de los daños

sea x≤

( ) =tPn La probabilidad de que ocurran n siniestros en [ )t,0 .

La distribución del daño total en [ )t,0 será:

( ) ( ) ( )∑∞

=

=0

/,n

n nxGtPtxF

Sea

( ) ( ) =XV n* Probabilidad de que habiendo ocurrido n siniestros alcancen la cuantía

X. Es decir, la convolución n- ésima de ( )XV .

Que en el caso en que exista independencia será:

( ) ( ) ( ) ( )∑∞

=

=0

*,n

nn xVtPtxF

CASO 2

Filip Lundberg, sueco que vivió entre 1876 y 1965 escribió en su tesis doctoral en

1903, sobre Aproximaciones de función de probabilidad en la teoría de riesgo

aplicado a seguros; Harald Cramer, también sueco, que vivió entre 1893 y 1985,

quien había trabajado en varios campos de la matemática, se inició en el estudio

actuarial entre 1920 y 1929 mientras trabajaba en una compañía de seguros y en

1955 presentó avances en la teoría de riesgos colectivos.

En esta teoría se presentó la siguiente definición:

( )( )

∑=

=tN

jjYtR

1

Donde ( )tN es el número de siniestros entre [0,t)

jY es el j-ésimo monto de siniestros

Y se asume independencia entre ( ){ },.....,, 21 YYtN

Page 37: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

23

Ahora se debe encontrar ( )xGt , y asumiendo que el número de siniestros sigue

una distribución Poisson con parámetro λ

( ) ( )[ ] ( ) ( )∑∞

=

=≤=0

*

n

nnt xFtpxtRPxG

( ) ( )∑

=

−=0

*

!n

nn

t xFn

te

λλ

Este es el problema usual más importante en los seguros de no vida, donde en

primera instancia se deben encontrar:

( )xF es la distribución del monto de un siniestro

( )xF n* es la convolución n-ésima de ( )xF

( )tpn es la distribución del número de siniestros

Entonces con este resultado se calcula ( ) ( ) ( )∑∞

==

0

*

n

nnt xFtpxG , que es la

distribución total de los siniestros.

La solución puede darse por el método recursivo de Panjer (Harry Panjer 1980) o

por Transformación rápida de Fourier (Henrici 1970)

3.3.1 EL MÉTODO DE RAZÓN DE PÉRDIDA PARA CALCULAR PRIMAS

El método de Razón de Pérdida toma como fundamento el Caso 1 para la

Distribución del total de Siniestros.

Suponiendo que el periodo de observación es [ )t,0 y siendo:

=n Variable aleatoria asociada al número de siniestros que han de ocurrir en [ )t,0

=iX Variable aleatoria asociada a la cuantía del siniestro i-ésimo

La cuantía total en dicho periodo [ )t,0 , viene dada por

( ) ( ) =+++= nt XXXX ..21 Cuantía total

Este proceso se supone Evolutivo y Estacionario y de varianza finita

Se considera evolutivo porque en la práctica puede venir tipificado; por ejemplo,

con la inflación;

Page 38: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

24

estacionario porque no depende del tiempo físico (año o mes calendario)

Suponiendo que:

- Se han producido n siniestros

- Que las variables iX son independientes entre sí y del número de

siniestros ocurridos. - La distribución de la cuantía total del daño en [ )t,0 viene dada por

( ) ( )[ ] ( ) ( ) ( )XVtPXXPtXF n

nnt

*

0

*, ∑∞

=

=≤=

Donde:

( ) =tPn Probabilidad de que ocurran n siniestros

( ) ( ) =XV n* Probabilidad de que habiendo ocurrido n siniestros alcancen la cuantía

X. Es decir, la convolución n- ésima de ( )XV .

Las distribuciones ( )tPn y ( ) ( )XV n* se pueden estimar a partir de los datos

observados.

Considerando que:

1. ( )tPn es una distribución de tipo discreto, con media:

( )∑∞

=

=0n

n tnPn

Y el estimador es llamado “frecuencia de siniestralidad” y está dado por.

N

n

uestosriesgosdeNúmero

ocurridosniestrossideNúmerof ==

exp

2. ( )XV es una distribución de tipo continuo con media:

( )∫∞

=0

1 XXdVC

Que nos habla del costo medio por siniestro.

En la concepción clásica, dicha media viene estimada por:

n

S

ocurridosniestrossideNúmero

PagadosSiniestrosc ==

Page 39: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

25

3. A partir de la expresión:

( ) ( ) ( ) ( )XVtPtXF n

nn

*

0

*, ∑∞

=

=

La media de la distribución es:

( )[ ] ( ) ( ) ( ) ( ) ( ) ( ) ( )∫ ∫ ∑ ∫∑∞ ∞ ∞

=

∞∞

===

==

0 0 0 0

*

0

*,n

nn

n

nnt XdVXtPXVtPdXtXdFXXE

( ) ( )∑∑∞

=

=

==≈00 n

nn

n cntnPccntP

Y esta estimación coincide con la “Prima Pura” según la concepción

clásica, de acuerdo con la relación:

puestosexriesgoslosdeNúmero

ocurridosniestrossilospordadesembolsaCuantía

N

S

n

S

N

nP ===

Con ello resulta que la concepción clásica equivale a operar con la media

de la distribución total, lo cual no es suficiente cuando se da entrada a

problemas de estabilidad, para lo cual se utilizan los criterios del Caso 2

para la Distribución del total de siniestros.

3.4 TASA TÉCNICA

La tasa técnica es el resultado de aplicar la prima pura más los gastos

presupuestados y utilidades proyectadas.

Sea P’, la prima pura

α el porcentaje que representan los gastos administrativos respecto a la prima

cobrada.

β el porcentaje que representan las comisiones a los Asesores Productores de

Seguros respecto a la prima cobrada.

Page 40: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

26

u el porcentaje de representa la utilidad de la Compañía de Seguros respecto a la

prima cobrada.

La Prima Técnica P’’ es:

( )u

PP

++−=

βα1

´´´

La Tasa Técnica entonces es

���� ����� ����

���� �� �����

La Tasa Técnica permite a los Aseguradores conocer no solo la cuantía del riesgo

de un objeto asegurado, sino también, cuanto debería ser el cobro de Prima al

Asegurado. Las compañías de seguros intentan que la tasa técnica se encuentre

por debajo de la tasa cobrada efectivamente a los clientes, y así garantizar

utilidades. Sin embargo esto no siempre es posible, debido a las presiones de

mercado.

El Capítulo 5, tratará este tema a mayor profundidad.

TASA COBRADA

La Tasa cobrada es la tasa que las compañías de seguros cobran a sus clientes;

se espera que la tasa cobrada sea mayor que la tasa técnica. No obstante, por la

gran cantidad de oferta y presión para que los precios bajen, varias compañías

experimentan déficits en la tasa cobrada y tasa técnica.

El mantenimiento de la rentabilidad de la compañía lo hacen a través de

estrategias de crecimiento acelerado de corto plazo, mientras realizan otras

medidas de tipo administrativo de mediano plazo.

���� ������� ������ �������

���� �� �����

Page 41: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

27

CAPÍTULO 4

4 DESCRIPCIÓN TEÓRICA DE LOS MODELOS DE

REGRESIÓN Y REGRESIÓN SEMIPARAMÉTRICA

Para la descripción de los modelos de regresión semiparamétrica, es necesario

describir los modelos paramétricos como los no paramétricos; en el modelo

paramétrico se utilizará la regresión múltiple, y en el modelo no paramétrico, los

polinomios locales penalizados, los modelos mixtos se encargan de la

combinación de ambas.

La descripción de la Regresión Múltiple se encuentra en el Anexo 2. Y ciertos

conceptos teóricos de la regresión semiparamétrica adicionales al alcance del

presente trabajo, se encuentran en el Anexo 3.

4.1 REGRESIÓN CON POLINOMIOS LOCALES Y NUDOS

La suavización con polinomios locales, es una técnica de regresión no

paramétrica que utiliza el diagrama de dispersión como herramienta.

Polinomios locales

Los polinomios locales son funciones de regresión con restricciones que se juntan

por segmentos en puntos llamados “nudos”.

Un polinomio local, ajusta un segmento de datos separados binarios que se

agregan estratégicamente sobre puntos del eje X, donde se determina qué es

necesario cambiar de la función de regresión; esto guiado por el diagrama de

dispersión.

Nudos

Sea la función ( )+− kx la parte positiva de la diferencia ( )kx − , entonces:

( ) { }kxMaxkx ii −=− + ,0 . k se denomina “nudo”.

Page 42: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

28

La regresión con nudos se realiza para cambiar el modelo de regresión a través

del dominio de datos, cuando sea necesario para beneficio de la explicación del

modelo.

Por ejemplo, si en un problema

iii exy ++= 10 ββ donde ( )σ,0Nei →

El diagrama de dispersión presenta un comportamiento similar al siguiente:

Figura 5. Caso de fijación del valor 0.40 como un nudo

Se hace necesario obtener, dos curvas de regresión distintas. Para este caso, se

lo puede simplificar si al modelo de regresión tradicional, utilizando los “nudos”.

En este ejemplo se aplica un nudo en x = 0.4. Por lo que la matriz X de datos,

debe ser modificada de la siguiente manera:

( ) iiii exxy +−++= +4.01110 βββ donde ( )σ,0Nei →

( )

( )

−=

+

+

4.01

:::

4.01 11

nn xx

xx

X

Donde ( ) { }4.0,04.0 −=− + ii xMaxx

Un modelo de regresión con un número K de nudos para la variable x , es de la

forma

( )∑=

+−++=K

kkk kxxy

11 ββα , el cual se puede representar como

En este caso se necesita un nudo, en X ~ 0.4

0.00.20.40.60.81.01.21.41.61.82.0

0.00 0.20 0.40 0.60 0.80 1.00

Figura 6- Ejemplo de uso de nodos

Page 43: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

29

( )

( ) ( )

>−++−++

≤<−++≤+

=

KKK kxkxkxx

kxkkxx

kxx

y

βββα

ββαβα

...

......

110

21110

10

Los valores kk , se determinan a priori o se pueden escoger ciertos algoritmos

para su cálculo automático.

Ya que este tipo de modelos podrían llegar a ser sobre parametrizados

dependiendo del comportamiento de los datos, en la práctica es mejor utilizar

algún tipo de restricción; por ejemplo los modelos de regresión con polinomios

locales penalizados

4.2 REGRESIÓN CON POLINOMIOS LOCALES PENALIZADOS

El modelo de regresión lineal clásico, está basado en la búsqueda de mínimos

cuadrados ordinarios:

βˆ Xy = donde β minimiza 2βXy −

En los mínimos cuadrados penalizados, se minimiza 2βXy − sujeta a

CDT ≤ββ

D es simétrica y semidefinida positiva tal que 0≥ββ DT

=

KxKKx

xKx

ID

2

222

0

00

λβ minimiza ββλβ DXy T22 +−

La solución es

( ) yXDXX TT 12ˆ −+= λβ λ

ββλ DT2 es llamado una penalidad áspera

Los valores ajustados son:

( ) yXDXXXy TT 12ˆ−+= λ

Si el modelo es de grado p :

Page 44: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

30

( )∑=

+−++++=p

k

pkpk

pp kxxxy

110 ... ββββ

El estimador, utilizando polinomios locales penalizados es

( ) yXDXXXy TpT 12ˆ−+= λ

Donde

( )KpdiagD 1,0 1+=

4.2.1 FUNCIÓN DE BASE RADIAL

Un conjunto alternativo de funciones de base puede ser el compuesto por

ppp kxkxxx κ−− ,....,,,.....,,1 1 . Para valores de p impares. A estas funciones

base se denominan funciones de base radial.

Por ejemplo, una suavización cúbica con polinomios locales. Así, para un valor, el

0>λ el modelo de regresión será de la forma:

( ) ∑=

−++=n

jjj xxxxf

1

3

110ˆˆˆˆ βββ

Donde n11110ˆ,.....,ˆ,ˆ,ˆ ββββ minimizan

1132

1100 ββλββ KXXy T+−−

Sujeto a:

010 =βTX

Donde [ ]T100 ,βββ ≡ , [ ]Tn1111 ,....,βββ ≡ , [ ] niixX ≤≤= 10 ,1 , y

−≡=

≤≤

3

,11

njiji xxKX

La restricción 010 =βTX significa que el ajustador de polinomios locales usa n

funciones base antes que 2+n , implicada por la combinación del número de

columnas en 0X y 1X .

Aproximaciones para suavización por polinomios locales que requieren

considerablemente menos computación, son las que pueden obtenerse utilizando

una secuencia de nudos Kkk ,...,1 usando la funciòn base 33

1 ,....,,,1 Kkxkxx −− y

haciendo que

Page 45: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

31

niKk

ki kxX≤≤

≤≤

−=

1

3

11 y

−=

≤≤

3

,1 '

'

Kkkkk kkK

Esta familia de suavizadores puede ser extendida a otras de grados impares

arbitrarios reemplazando la potencia al cubo en la función de base radial por otro

valor ( ),...2,112 =− mm y adicionando términos polinomiales por encima del grado

1−m .

4.2.1 SUAVIZADORES LINEALES

En los mínimos cuadrados ordinarios

( ) HyyXXXXy TT == −1ˆ

( ) TT XXXXH1−= . A la matriz H se la llama matriz sombrero

En los mínimos cuadrados con polinomios locales penalizados

( ) ySyXDXXXy TpTλλ =+= −12ˆ

( ) TpT XDXXXS12 −+= λλ . A la matriz λS se la llama Matriz Suavizadora,

Más generalmente, un suavizador lineal L , es tal que

Lyy =ˆ .

Para alguna matriz L nxn que no depende de y

4.2.2 GRADOS DE LIBERTAD EN LOS POLINOMIOS LOCALES

PENALIZADOS

4.2.3.1 GRADOS DE LIBERTAD DE LA REGRESIÓN

En los mínimos cuadrados ordinarios, los grados de libertad de la regresión se

calculan por

( )Ltrdf fit ≡

En los mínimos cuadrados con polinomios locales penalizados, los grados de

libertad se calculan

Page 46: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

32

( )λStrdf fit ≡

Usando la propiedad ( ) ( )BAtrABtr =

( ){ }XXDXXtrdf TTfit

12 −+= λ

Kpdfp fit ++≤≤+ 11 . K es el número de nudos

4.2.3.2 GRADOS DE LIBERTAD DE LOS RESIDUOS

Para los grados de libertad de los residuos en los mínimos cuadrados ordinarios,

fitres dfndf −= que equivale a pn −

Revisando el modelo general con suavizador lineal

Lyyf == ˆˆ ,

ε+= fy

Donde

( ) ICov 2σε =

Sea ySf λ≡ˆ

El valor esperado de la suma de residuos al cuadrado en este caso es

( ) 2ˆ yfERSSE −= λ

( ) 2yISE −= λ

( ) ( ){ }yISISyE TT −−= λλ

( ) ( ) ( ) ( ){ }ISIStrfISISf TTT −−+−−= λλλλ σ 2

( ) ( ) ( ){ }nStrSStrfIS T +−+−= λλλλ σ 222

Por tanto, bajo regresión no paramétrica, los grados de libertad de los residuos

utilizando mínimos cuadrados con polinomios locales penalizados es

( ) ( )Tres SStrStrndf λλλ +−≡ 2

En regresión paramétrica, la diferencia es que λλλ SSS T = entonces ( )λStrndfres −≡ .

Si el término ( ) 2fIS −λ es muy pequeño, entonces

Page 47: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

33

resdf

RSS=2σ y es estimador insesgado.

Además, asumiendo que

( ) ( )Tres SStrStrndf λλλ +−= 2

( ) ( )Tres SStrStrdfn λλλ +=− 2

Es una alternativa para medir

( )λStrdf fit = ,

Para el número efectivo de parámetros ajustados por λf .

4.3 MODELOS MIXTOS

Charles Henderson (1911-1989), Ph.D. en Ganadería, fue estudiante de Jay Lush

(1896-1982), Ph.D en Genética, ambos norteamericanos.

Lush había introducido métodos estadísticos para reproducción animal basados

en medidas genéticas de los animales; posteriormente, esta técnica se denominó

“índice de selección” y utilizaba mínimos cuadrados para factores ambientales de

carácter fijo (efectos fijos), con datos no balanceados y con varias subclases que

no tenían datos.

Pero el índice de selección requería estimar los componentes de la varianza para

efectos ambientales no correlacionados o no observables (efectos aleatorios),

Henderson, trabajó en esta solución, mediante una ecuación que incorporaba

tanto a los factores fijos como aleatorios. Esta ecuación fue denominada Ecuación

de Henderson; actualmente es conocida como “Modelos Mixtos Lineales”.

4.3.1 DESCRIPCIÓN DEL MODELO

MODELOS MIXTOS LINEALES

La estimación de los coeficientes fijos del modelo de regresión

Page 48: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

34

∈+= βXy

β Es un vector de efectos fijos

X Es la matriz que asocia los efectos fijos con las observaciones en y

∈ Es el vector de efectos alaetorios.

Produce la solución en mínimos cuadrados generalizados de

( ) yVXXVX 11 'ˆ' −− =β

Donde se espera que la matriz de orden nxn

( ) ( ) VVyV =∈=

Cuando existen correlaciones entre los errores, la matriz V no es la Matriz

Identidad, y calcular su inversa es complicado y toma mucho tiempo de

computación, sobre todo en casos grandes. Adicionalmente, los estimadores para

los efectos fijos son, en este caso, los mejores estimadores lineales insesgados

BLUE.

Pero cierto tipos de problemas como los tratados por Henderson, para la cría

animal u otros problemas, requerían de una ecuación para los efectos aleatorios

con variables predictoras, por ejemplo los valores de crecimiento.

Esto llevó a crear un segundo problema a resolver, donde

ε+∈= Zu Donde u Es el vector de efectos aleatorios a ser determinados

Z Es la matriz que asocia los efectos aleatorios con y ε Es el vector de efectos aleatorios no correlacionados con u

Los predictores de u, tienen la propiedad de ser Mejores predictores lineales

insesgados BLUP. Una forma de obtener el estimador de u, es bajo el supuesto

[ ]yuE |

Sujeto a

[ ] [ ]uEuE =ˆ

Page 49: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

35

El predictor es por tanto

( )β'ˆ 1 XyVGZu −= −

Donde

( )',cov' yuGZ =

Los valores de u requerían de dos importantes entradas previas: La matriz V

invertida y los efectos fijos calculados previamente.

Henderson, trabajó en cómo calcular los estimadores de efectos fijos y los

predictores de efectos aleatorios sin tener que invertir V.

Esta solución requería tener conocimientos de “componentes de la varianza” en

V, y fue especializando sus resultados, siempre concentrado en cría animal.

Para la solución, Henderson primero unió ambas partes en una sola ecuación

suponiendo que ambos efectos eran fijos.

εβ ++= ZuXy

Los estimadores y predictores serían:

=

−−

−−

yRZ

yRX

uZRZXRZ

ZRXXRX1

1

11

11

'

'

ˆ

ˆ

''

'' β

( )εVarR =

R usualmente tiene una estructura simple, es diagonal y homogénea o diagonal

en bloques. Así la inversa de R puede obtenerse más fácil que V.

Ahora, para una formulación más general, lo que hizo fue agregar G-1 donde

G=V(u).

=

+ −

−−−

−−

yRZ

yRX

uGZRZXRZ

ZRXXRX1

1

111

11

'

'

ˆ

ˆ

''

'' β

( )εVarR =

( )uVarG =

Esto permitía resolver por medio de las dos matrices R y G, más sencillas de

invertir que V, y adicionalmente se pudo comprobar que la resolución coincide con

los estimadores BLUE y BLUP. Este resultado ha sido muy importante para todos

los desarrollos subsecuentes de los Modelos Mixtos Lineales.

Page 50: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

36

En detalle, las matrices son

=

npn

p

p

xx

xx

xx

X

......1

:.....::

.....1

.....1

1

221

111

, matriz de datos

=

×××

×××

×××

pnpnpn

pnpnpn

pnpnpn

Z

1......00

:.....::

0.....10

0.....01

, matriz de diseño.

=

0

0

εu

E

=

=

I

I

R

GuCov U

2

2

0

0

0

0

εσσ

ε

( )GNormalu ,0→

4.3.2 ESTIMACIÓN DE PARÁMETROS

Estimación por máxima verosimilitud de β

( ) yVXXVX TT 111ˆ −−−=β

donde

( ) RZGZyCovV T +==

Estimación por mejor predicción de u

( ) 2

)(minargˆ yguEuyg

−=

( )yuE=

( )βXyVGZT −= −1

Conexión con mínimos cuadrados penalizados

Page 51: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

37

Efectos aleatorios para u es equivalente a

( )22

,minarg

ˆ

ˆuZuXy

u uαββ

β+−−=

donde 2

2

uσσα ε≡

Predicción alternativa de la Mejor Predicción Linea l Insesgado (BLUP)

Para 1×n arbitrarios vectores sy t , los estimadores β~y u~ que minimizan la

varianza de la predicción ( ){ }iT ZuXyVar +− βl , son tales que

( ) ( ){ }2~~ZutXsuZtXsE TTTT +−+ ββ

Sujeto a la condición insesgada

( ) ( )ZutXsEuZtXsE TTTT +=+ ββ ~~

La solución para β~y u~son:

( ) ( ) yVXXVXBLUP TT 111~ −−−=≡ ββ

( ) ( )β~~ 1 XyVGZuuBLUP T −=≡ − .

4.3.3 ESTIMACIÓN DE LA MATRIZ DE COVARIANZAS

Estimación de Máxima Verosimilitud (ML)

La función log-verosimilitud es

( ) ( ){ }[ ] ( )π2log2

log2

1, 1111 n

yVXXVXXIVyVRG TTTP −−+−= −−−−

l

Donde ( ) RZGZyCovV T +==

Estimación de máxima verosimilitud de G y R

La función log-verosimilitud es

( ) ( ){ }[ ] ( )π2log2

log2

1, 1111 n

yVXXVXXIVyVRG TTTP −−+−= −−−−

l

Donde ( ) RZGZyCovV T +==

Page 52: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

38

Estimación de Máxima Verosimilitud restringida (REM L)

REML maximiza

( ) ( ) XVXRGRG TPR

1log2

1,, −−= ll

El criterio REML implica maximización de la verosimilitud de las combinaciones

lineales de los elementos de y que no dependen de β .

En el libro de (Searle, S.R., Casella, G. and McCulloch, C.E., 1992) se detalla el

procedimiento teórico y algunos programas de computación, como el lme(), que

contienen algoritmos para su estimación.

La principal ventaja de utilizar REML en vez de ML es que REML toma en cuenta

los grados de libertad de la parte de efectos fijos.

4.4 PARÁMETRO DE SUAVIZACIÓN

Utilizando el criterio REML para estimar la matriz de covarianza se tiene:

( ) ( ) ( ){ }[ ]yVXXVXXIVyXVXVnV TTTTR

11111loglog2log2

1 −−−−− −+++−= πl

Donde ( )yCovV = . Para el modelo con spline penalizado de p grados.

IZZV Tu

22εσσ +=

λ dada como expresión

p

u

2

1

2

2

=

σσλ ε

El parámetro suavizador es

p

REMLu

REMLREML

2

1

2,

2,

ˆ

ˆˆ

=

σσ

λ ε

4.5 ELECCIÓN DEL NÚMERO DE NUDOS

La elección del número de nudos es empírica mediante

Page 53: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

39

2

1

++=

K

kkκ ésima cuantil muestral de ix ’s (únicos)

Número de nudos

= 20,4

maxn

K

4.6 INFERENCIA ESTADÍSTICA

En un modelo semiparamétrico interesa conocer además de las preguntas naturales para un modelo

( ) iii xfy ε+= , donde ( ) 0=iE ε

• ¿Cuál es la desviación estándar de ( )ixf ?

• ¿Cuál es el intervalo con el 95% de confianza para ( )ixf ?

También resulta necesario contestar las siguientes preguntas

• ¿ f es lineal o no-lineal?

• ¿Dónde está el punto crítico de f ? • ¿Es f monótona creciente?

4.6.1 INFERENCIA PARA POLINOMIOS LOCALES PENALIZADOS SIN

REPRESENTACIÓN DE MODELO MIXTO

Este modelo es representado como:

( )∑=

+ +−++=K

kikikii kxxy

1110 εβββ

donde ninguno de los coeficientes K11110 ,...,,, ββββ son considerados aleatorios y

( )2,0 σε Ni → . En este caso

( ) yxf Txl=ˆ

donde ( ) Tx

Tx CDCCC

12 −+= λl

con ( ) ( )[ ]++ −−≡ kx kxkxxC ....1 1 , ( )1,....,1,0,0diagD ≡ y

[ ]nixi

CC≤≤

≡1

Page 54: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

40

En el caso de funciones con suavizador lineal, el intervalo de confianza es

( )

>

−±

30ˆ2

1

30ˆ;2

nz

ndftxf

x

xres

l

l

ε

ε

σα

σα

Y su intervalo de predicción es

( )

>+

≤+

−±

301ˆ2

1

301ˆ;2

2

2

nz

ndftxf

x

xres

l

l

ε

ε

σα

σα

Para el caso de los intervalos de confianza para polinomios locales penalizados

sin representación del modelo mixto, estos pueden ser construidos con la misma

notación pero con:

( ) ( ) Tx

TTTxx CDCCCCDCCC

1212 −−++= λλl

4.6.2 INFERENCIA PARA POLINOMIOS LOCALES PENALIZADOS CON

REPRESENTACIÓN DE MODELO MIXTO

El modelo mixto

( )∑=

+ +−++=K

kikikii kxuxy

110 εββ

Puede ser escrito como

εβ ++= ZuXy

=

I

IuCov u

2

2

0

0

εσσ

ε

donde [ ] niixX ≤≤= 11 ( )niKk

ki kxZ≤≤≤≤

+

−=11

Sea

[ ]xXx 1= ( )

−=≤≤

+Kkkx kxZ

1

y

( ) uZXxf xx~~~ +≡ β

Page 55: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

41

donde β~ y u~ son los BLUPs de β y u . Entonces ( )xf~ es el BLUP de

( ) uZXxf xx +≡ β

El estimador es

( ) uZXxf xx ˆˆˆ +≡ β

que denota el correspondiente EBLUP de ( )xf .

Note que dentro de esta estructura, la función objetivo ( )xf es aleatoria debido a

la aleatoriedad en u . La estimación de la variabilidad difiere dependiendo de cual

aleatoriedad es la que se toma en u . Un argumento, el cual pesa a la misma

estimación de variabilidad como la formulación de regresión, es que la

aleatoriedad de u es un elemento utilizado para la curvatura del modelo, mientras

ε cuenta para la variabilidad en la curva.

En concordancia con este argumento, el cálculo de la varianza debe hacerse con

respeto a la distribución condicional uy antes que con la distribución no-

condicional de y .

Las bandas de variabilidad pueden obtenerse desde

( ){ } [ ] [ ]Txxxx ZXuu

CovZXuxf

= ~

~~var

β

Txx Cu

uCovC

= ~

Entonces, tomando en cuenta que

( ) ( ) 11111 −−−−− ++=

BCRCCRCBCRCu

uCov TTTβ

1

2

21

2

22

−−

+

+=

DCCCCDCCu

uCov

u

TT

u

T

σσ

σσσ

β εεε

Por lo tanto

Page 56: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

42

( ){ } Tx

u

TT

u

Tx CDCCCCDCCCuxf

1

2

21

2

22

ˆ

ˆ

ˆ

ˆˆˆˆ

−−

+

+=

σσ

σσσσ εε

ε

Si se mantiene que

( ) ( ) Tx

TTTxx CDCCCCDCCC

1212 −−++= λλl , y que ( )IN 2,0 εσε → entonces

( ) ( ){ } ( ){ }[ ]uxfuxfENuxf ~var,~~ → , esto lleva a que

( ) ( ){ }( ){ } ( )1,0~

~~Nu

uxf

uxfExf→

σ

y un intervalo de confianza de aproximadamente ( )%1100 α− para ( ){ }uxfE ~ es

( ) ( ){ }uxfzxf ˆˆ2

1ˆ σα

−±

Y si no hay un sesgo apreciable, entonces ( ){ } ( )xfuxfE ≈~ , y este intervalo puede

ser interpretado como un intervalo de confianza para ( )xf . Este sesgo

condicional es

( ) ( ){ } ( ){ } ( ){ }uuuEZuEXuxfxfE xx −+−=− ~~~ ββ

+−=

uDCCC

u

Tx

u

01

2

2

2

2

σσ

σσ εε

el cual no es cero, pero dado ( ) 0=uE , el sesgo no condicional es

( ) ( ){ } 0~ =−= xfxfE

Así, en promedio, sobre la distribución u , ( )xf~ es insesgada para ( )xf . Para la

contabilización del sesgo en los intervalos de confianza, la varianza de la

regresión ( ){ }uxfvar debe ser reemplazada por la media cuadrática del error

condicional

( ) ( ){ }[ ] ( ){ } ( ) ( ){ }[ ]22 ~~var~ uxfxfEuxfuxfxfE −+=−

y entonces promediado sobre la distribución u , tomando en cuenta que

( ){ }uxf~var es constante (no depende de u )

Page 57: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

43

( ) ( ){ }[ ]( ) ( ){ } ( ) ( ){ }[ ]( )22 ~~var~ uxfxfEEuxfuxfxfEE −+=−

Pero el lado izquierdo es

( ) ( ){ }[ ] ( ) ( ){ }xfxfxfxfE −=− ~var~ 2

−−

=uu

Cx ~

~var

ββ

Txx C

uuCovC

−= ~

Por lo tanto la regresión y la estimación de variabilidad del sesgo ajustado difiere:

El primero usa:

−=

u

uuCovu

uCov ~

~

~

~ ββ

Mientras que los otros usan: 1

2

22

~

~

+=

−DCC

uuCov

u

T

σσσ

β εε

Y esto implica que

( ) ( ){ } Tx

u

Tx CDCCCxfxf

1

2

2

ˆˆˆ

+=−

σσσσ ε

ε

También, bajo ciertos supuestos

( ) ( )( ) ( ){ } ( )1,0~

ˆ

~N

xfxf

xfxf →−

−σ

y un intervalo de aproximadamente ( )%1100 α− de confianza para ( )xf es

( )( ) ( ){ }

( ) ( ){ }

>−

≤−

−±

30ˆ..ˆ2

1

30ˆ..ˆ;2

nxfxfestdevstz

nxfxfestdevstdftxf

res

ε

ε

σα

σα

Este intervalo será algo más grande que el intervalo ( ) ( ){ }uxfestdevstzxf ˆ..2

−± α

porque en la primera se utilizan los dos componentes del error: la varianza y el

Page 58: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

44

sesgo al cuadrado, mientras que la segunda esta en función de la varianza, y

cubre ( ){ }uxfE ~ , no ( )xf .

4.7 PRUEBAS DE SIGNIFICACIÓN

4.7.1 PRUEBA DE RAZÓN DE VEROSIMILITUD RESTRINGIDA

La hipótesis nula en un modelo paramétrico, será por ejemplo:

( ){ }densidaddensidaddurezaEH 100 log: ββ +=

( ) ( ){ }densidadfdensidaddurezaEH =log:1

Usando un modelo mixto

( ) ( )∑=

+−++=K

kkk kxuxxf

110 ββ ku es i.i.d ( )2,0 uN σ

La hipótesis de reduce a

0: 20 =uH σ

0: 21 >uH σ

Prueba estadística

El log de verosimilitud restringido es

( ) ( ) ( ) ( ) XVXXyVXyVny TTuR

1122 loglog2log;,2 −− +−−++=− ββπσσ εl

Entonces, el estadístico de verosimilitud restringida es

( ) ( ) ( ){ }( )yyyLR uRRR ;ˆ,ˆ;ˆ,02log2 2220, εε σσσ ll −−=−

donde 20,εσ minimiza

( )yR ;,02 2εσl−

y ( )22 ˆ,ˆ εσσ u minimiza

( )yuR ;,2 22εσσl−

Page 59: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

45

Así, la hipótesis nula de linealidad debería ser rechazada si el valor observado

( )yLRRlog2− está en la cola mayor de su distribución nula.

Distribución nula

La distribución nula asintótica para el caso de los modelos paramétricos generales

( )yLRRlog2− es

21

2

2

1

2

1++ ss χχ

Donde s es el número de coeficientes de la regresión a ser probados con la

hipótesis de que su valor es estadísticamente cero.

En esta prueba, el valor P es estimado por simulación.

Aunque para el caso de los modelos mixtos generales, es necesario estimar un

Valor P, mediante simulación, porque la distribución nula en ese caso no sigue

asintóticamente la forma 21

2

2

1

2

1++ ss χχ .

En (Ruppert, D., Wand, M.P. & Carroll, R.J., 2003), se mencionan fuentes de

trabajos donde existen algoritmos para modelos con solo un componente de

varianza.

4.7.2 PRUEBA F

4.7.2.1 PRUEBA F PARAMÉTRICA

La comparación entre modelos se hace evaluando el R2, el de mayor R2, será el

“mayor”, el de menor R2 será el menor.

( )( ) ( )mayormenormayormayor

menormayor

pnppR

RRF

−−−−

=/1 2

22

Page 60: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

46

donde, para cada modelo

2R = Cuadrado de la correlación entre y y y

P=Número de parámetros de cada modelo.

4.7.2.2. PRUEBA F NO PARAMÉTRICA

En la regresión no paramétrica, se determinan los grados de libertad de los

residuos por

( ) ( )Tres SStrStrndf λλλ +−≡ 2

( )( ) mayorresmayorresmenorreslmayor

menormayor

dfdfdfR

RRF

,,,2

22

/1 −−−

=

Bajo la hipótesis nula, F tendrá una aproximación a la distribución F con

mayorresmenorres dfdf ,, − y mayorresdf , grados de libertad

4.8 MODELOS SEMIPARAMÉTRICOS CON POLINOMIOS

LOCALES PENALIZADOS

El presente trabajo trata a la regresión semiparamétrica bajo la utilización de

polinomios locales penalizados con representación de modelos mixtos.

Se representa de la siguiente forma:

( ) ( ) iiii tgsfy εβ +++= 0

A este modelo se le pueden agregar polinomios locales, representándose por

medio de la siguiente expresión:

( ) ( )∑∑=

=

−+−++−++=

ts K

ki

mtki

tk

K

kit

mski

skisi ktutksusy

1

12

1

12

0 εβββ

Donde m=1,2,3,..

( )2,0~ εσNinduk , ( )2,0~ εσε Nindi

El ajuste al modelo se resuelve haciendo que:

Page 61: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

47

( ) yCCCCy TT 1ˆ

−Λ+=

Donde

( ) ( )

−−=

≤≤

≤≤

12

1

12

1

1m

Kk

tki

m

Kk

skiii

ts

ktkstsC ni ≤≤1

y

( )12

12 11000 xKtxKs ts

diag λλ=Λ

Y la formulación del modelo mixto se expresa como:

[ ]ts ββββ 0= [ ]TtK

tsK

s

tsuuuuu ,....,,....,,...., 11=

[ ]ii tsX 1= ni ≤≤1

( ) ( )

−−=

≤≤

≤≤

12

1

12

1

,m

Kk

tki

m

Kk

ski

ts

ktksZ ni ≤≤1

Resolver bajo el método de estimación por Mínimos cuadrados penalizados, en

este caso, es equivalente a utilizar un Modelo Mixto mediante BLUP

εβ ++= ZuXy

0=

εu

E

=

I

I

Iu

Cov t

s

2

2

2

00

00

00

εσσ

σ

ε

Pruebas de hipótesis

Para la prueba lineal de un componente

0: 2 =sHo σ

0: 21 >sH σ

Para la prueba de efecto nulo de un componente

0: 2 == ssHo σβ

0:1 ≠sH β ó 02 >sσ

Se puede usar la prueba de verosimilitud restringida LR y aproximación de la

prueba F

La prueba LR requiere simulación para el cálculo de los valores p

Page 62: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

48

CAPÍTULO 5 5 UNA APLICACIÒN DE REGRESIÓN SEMIPARAMÉTRICA

PARA LA TARIFACIÓN DE LOS SEGUROS DE VEHICULOS EN

UN SUBCONJUNTO DE ASEGURADOS DE UNA COMPAÑÍA DE

SEGUROS.

Una compañía de seguros en el Ecuador, que ha pedido no ser identificada, nos

proporcionó datos de las pólizas y siniestros desde 2006 a 2010, de vehículos

livianos (Menor a 3,5 Toneladas) de uso familiar, a nivel nacional.

Definimos utilizar los primeros cuatro (4) años para construir el modelo y el último

año para la predicción.

La Tarifa de la compañía de seguros es una tabla segmentada por celdas entre la

antigüedad del vehículo y el tipo de Categoría según una clasificación propia de la

compañía basada en sus propios análisis de riesgo por marcas y modelos; ella

contiene la tasa que se aplica a la suma asegurada. La tasa cobrada aplicada en

cada caso, también nos fue proporcionada. La base de datos también permite

calcular la tasa técnica actuarialmente, según la sección 3.4

Las celdas que resultan de la combinación de variables segmentadas, tienen el

inconveniente de datos incompletos o insuficientes según su combinación; por

ejemplo es poco probable tener suficientes estadísticas de personas aseguradas

de 19 años con vehículos mayores a USD 40,000 y de antigüedad superior a 5

años. Por ello la compañía de seguros hace unas tarifas que no dependen de esta

combinación, justamente por sus limitaciones.

Nuestro trabajo será elaborar un modelo semiparamétrico para el cálculo de la

tasa técnica en función de las celdas que contienen estadísticas, intentando que

Page 63: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

49

éstas combinaciones, y cualquier otra combinación nueva que aparezca pueda

ser determinada mediante aproximación de la función de regresión.

Los Campos disponibles fueron:

• Cantidad de vehículos asegurados

• Suma asegurada

• Prima neta cobrada

• Género del Asegurado

• Fecha de nacimiento del Asegurado

• Año de fabricación del vehículo

• Cantidad de eventos atendidos

• Cantidad de eventos pagados

• Siniestros netos totales pagados

Las variables predictoras para la tasa técnica son:

DEL VEHÍCULO

• Antigüedad del vehículo. • Suma asegurada.

DEL ASEGURADO

• Género del Asegurado. • Edad del Asegurado.

Las variables como antigüedad del vehículo y edad del vehículo fueron calculadas

a partir de la fecha de nacimiento y año de fabricación respectivamente, y

respetando el año de incidencia en el momento en que ocurrieron los eventos.

El modelo permitirá estimar la cuantía de la tasa técnica y su variabilidad; de esta

forma la Compañía de Seguros podrá aplicar una Tarifa más flexible y adaptada al

nivel de riesgo de una combinación de valores de variable. También será posible

estimar la tasa técnica para riesgos donde no existen suficientes estadísticas,

utilizando las curvas continuas de regresión.

Page 64: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

50

Los datos de los primeros cuatro años fueron agrupados en 491 filas.

Recibimos la información, por parte de la compañía de seguros donde, para

calcular la tasa técnica como en la sección 3.4 se utiliza un recargo de 40%. Así

40.0=++ uβα . Se conoce que 18.0=β

5.1 ESTADÍSTICAS DESCRIPTIVAS

Software: Durante todo el trabajo, se utiliza el software de libre disponibilidad “R”

versión 2.12.0, publicada el 15-Oct-2010 y muy eventualmente, el EXCEL 2010. R

es un paquete estadístico que utiliza comandos. Estos comandos y sus

resultados, se encuentran en el documento en un recuadro con líneas

segmentadas. La intención es que el lector pueda repetir todo el procedimiento

descrito, si lo prefiere.

Los datos se encuentran en el archivo datostesis.txt, se muestran estadísticas por

variable, y su relación con la tasa técnica.

> B <- as.data.frame(read.table("C:\\datostesis.txt ",header=TRUE))

> attach(B)

A continuación, se utiliza el comando “summary” en R, que calcula el mínimo, los

cuartiles, el promedio, y el máximo de cada variable

5.1.1 GÉNERO DEL ASEGURADO

La diferencia de valores de tasa técnica, según el género se muestra a

continuación.

> summary(ttecnica) (TASA TÉCNICA PARA T ODOS LOS PROPIETARIOS)

Min. 1st Qu. Median Mean 3rd Qu. Max.

0.020 1.815 3.500 4.022 5.555 20.360

> filtro1<-B[genero==1,] (FILTRO PARA ASEGURADOS HOMBRES)

> summary(filtro1$ttecnica)

Min. 1st Qu. Median Mean 3rd Qu. Max.

Page 65: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

51

0.020 2.055 3.550 4.202 5.785 20.360

> filtro1<-B[genero==0,] (FILTRO PARA ASEGURADOS MUJERES)

> summary(filtro1$ttecnica)

Min. 1st Qu. Median Mean 3rd Qu. Max.

0.060 1.585 3.470 3.827 5.245 16.080

Revisando los cuartiles y media, se observa que cuando el Asegurado es

Hombre, la tasa técnica es mayor comparado con las mujeres, no así la mediana;

esto quiere decir que en los hombres, ocurren casos más extremos, que con las

mujeres.

Figura 7- Diagrama de Caja de la Tasa Técnica por Género

5.1.2 EDAD DEL ASEGURADO

La edad mínima para ser propietario de un vehículo y acceder a un seguro es de

18 años según la Ley de Tránsito. Se puede notar que la edad más frecuente está

entre 32 y 38 años.

Page 66: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

52

Figura 8- Histograma de la Edad del Asegurado

Los más jóvenes tienen tasa técnica más alta que las personas adultas; esto se

debe a que el conductor va adquiriendo mayor experiencia y responsabilidad,

hasta llegar a una edad de 69 años, donde nuevamente empieza a crecer la tasa

técnica. Se sabe que el estado de salud, visión, reflejos de los Adultos Mayores

son de más bajo nivel que en años de juventud. Adicionalmente, los vehículos de

estos asegurados son conducidos principalmente por otra persona; la suma

asegurada más baja en edad avanzada del propietario también es común, esto

según la fórmula de la razón de pérdida, provoca un efecto contrario en la tasa

técnica haciéndola más alta.

Figura 9- Influencia de la edad del Asegurado en la Tasa Técnica

Page 67: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

53

5.1.3 ANTIGÜEDAD DEL VEHÍCULO

La antigüedad en el vehículo influye en varios aspectos del seguro. Si se trata de

vehículos nuevos, la suma asegurada será mayor que los vehículos usados del

mismo modelo.

También es importante anotar que los repuestos de los vehículos cuestan lo

mismo para un modelo nuevo que para uno usado. Por ejemplo, un modelo que

ha prevalecido desde hace varios años es el NISSAN SENTRA. Un repuesto

compatible de este vehículo costará lo mismo para una versión reciente que para

uno muy antiguo fabricado hace mas de 10 años; sin embargo, el antiguo ya ha

perdido valor, y por la fórmula de Tasa Técnica vista en la sección 3.4, mientras

menor es la Suma Asegurada, mayor será la tasa técnica.

Las Compañías de Seguros, saben que las casas de repuesto y concesionarios

no mantienen alta disponibilidad de repuestos en vehículos antiguos, lo que

dificulta, en caso de pérdida parcial, brindar una rápida atención al siniestro.

Además, las importaciones en estos casos se vuelven especiales y bajo pedido, lo

que hace que ese daño en particular resulte más caro que de otros vehículos de

versiones más recientes donde si hay inventario.

Sobre la distribución de esta variable, el 80% de los vehículos tiene hasta 4 años

de uso.

Analizando la Figura 11, existe una tendencia positiva hasta los 10 años de

antigüedad, y negativa en lo posterior. La antigüedad máxima observada es de 15

años.

Page 68: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

54

Figura 10- Histograma de la Antigüedad del Vehículo

Figura 11- Influencia de la antiguedad del vehículo en la Tasa Técnica

5.1.4 SUMA ASEGURADA

Los vehículos con suma asegurada menor a USD 20,000, pueden ser adquiridos

por el mayor grupo de familias del país. Cuando se trata del primer vehículo, se

tiene poca experiencia en el manejo y mantenimiento, lo que hace que la

frecuencia siniestral sea más alta y por ello la tasa técnica también será mayor.

Page 69: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

55

Los vehículos mayores a USD 20,000, lo adquieren familias con un poder

adquisitivo más alto y probablemente no es el primer carro de la familia, por lo

cual el propietario y conductores toman más precaución y cuidado al volante y en

mantenimiento. Estos vehículos también cuentan por un mayor número de

dispositivos de seguridad que ofrece el mercado, como películas de seguridad en

vidrios o sistemas de georeferencia para localizarlos, en caso de robo,

disminuyendo así la tasa técnica.

Figura 12- Histograma de la Suma Asegurada

Figura 13- Histograma del logaritmo natural de la Suma Asegurada

Page 70: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

56

En efecto, las compañías de seguros cobran tasas más bajas a los vehículos

cuya suma asegurada es mayor a USD 20,000. La figura 14 muestra que a mayor

suma asegurada, menor tasa técnica.

Figura 14- Influencia de la Suma Asegurada en la Tasa Técnica

5.1.5 TASA COBRADA

La Tasa Cobrada es la tasa que se aplica en el día a día de las pólizas que

contratan los asegurados con la Compañía de Seguros. Si bien es cierto, que las

tasas están publicadas en una tarifa, la presión del mercado con respecto a los

competidores, la influencia de los Asesores Productores de Seguros, políticas de

descuento, rangos de negociación de los Ejecutivos de Cuenta, hacen que la tasa

de Tarifa no sea de aplicación estricta y se produce que las tasas sean menores a

las indicadas a la tarifa.

En la Figura 15, la Tasa Cobrada está concentrada en un pequeño rango

(comparada con la tasa técnica de la figura 16). Es inusual observar tasas

cobradas mayores a 5%. O menores a 3.5%.

También hay que considerar que esta concentración se debe a que la Compañía

de Seguros conoce cuál es su tasa técnica promedio, y por tanto se entiende que,

Page 71: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

57

si la tasa cobrada tiene mayor o menor variación pero éste contiene a la tasa

técnica promedio, se minimizan las posibilidades de caer en déficit. Esta intuición

es correcta; sin embargo, es lo que hacen todas las compañías, haciendo que no

existan diferenciadores de precio más flexibles a la realidad de cada Asegurado.

Figura 15- Histograma de la Tasa Cobrada

5.1.6 TASA TÉCNICA

La tasa técnica es sesgada hacia la izquierda, por lo que se produce una cola

hacia la derecha. Se aplicará un modelo que permita mayor eficiencia en su

aproximación cuando se conoce cierta información del vehículo y del Asegurado.

Figura 16- Histograma de la Tasa Técnica

Page 72: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

58

5.2 MODELO DE REGRESIÓN PARA LA TASA TÉCNICA

El modelo de regresión semiparamétrica, está preparado para soportar variables

explicativas cuya relación con la variable dependiente puede no ser ajustada a los

modelos tradicionales, por ejemplo el caso de que la relación no sea lineal.

Además, existe el software libre “R”, y dentro de él, paquetes complementarios

llamados librerías como SEMIPAR, que pueden ser utilizados con potentes

algoritmos para tratar regresión semiparamétrica. Por ser software libre no todas

las bondades están programadas, y en esta tesis ha sido necesario hacer un poco

de programación para extraer o calcular indicadores de las tablas de resultados

de los algoritmos. También vale indicar que estas herramientas aún no han sido

comercializados en los paquetes estadísticos más populares. El mundo científico

y los estadísticos aplicados cada día adoptan más a R como su herramienta más

útil. Por estas razones se utilizará R durante todo este desarrollo, salvo contadas

excepciones.

De la base de datos recibida, la Tasa Técnica no sigue una distribución normal,

por lo que aplicar regresión bajo los mínimos cuadrados ordinarios no es posible

sin al menos realizar una transformación a la variable.

Se aplica el método de transformación de Box-Cox. (Box, G. E. P. and Cox, D. R.

(1964) An analysis of transformations (with discussion). Journal of the Royal

Statistical Society B, 26, 211–252). La transformación Box-Cox, busca transformar

a una variable en lo más parecido a una distribución normal. Este método ha

tenido un uso masivo en modelización y análisis.

5.2.1 TRANSFORMACIÓN BOX-COX PARA LA TASA TÉCNICA

Sea X una variable aleatoria positiva.

La transformación de Box Cox de parámetro λ está definida como:

Page 73: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

59

=

≠−

=0log

01

λ

λλ

λ

λ

X

X

X

El problema es determinar la constante lambda. Utilizando R, el procedimiento de

transformación Box-Cox se realiza bajo el siguiente comando.

> B <- as.data.frame(read.table("C:\\datostesis.txt ",header=TRUE))

> attach(B)

> a<-boxcox(lm(ttecnica~genero+promsuma+promedad+pr omedadveh))

> which.max(a$y)

[1] 60

> a$x[60]

[1] 0.3838384

> lambda<-a$x[60]

Según los datos de tasa técnica, el valor 3838384.0=λ es el mejor valor para

utilizarlo en la transformación hacia una normal, aplicar la transformación:

> B$cox <- (ttecnica^lambda-1)/lambda

Al vector transformado, se le realizó la prueba de Shapiro-Wilks cuya hipótesis

nula es que la variable transformada sigue una distribución normal.

El Valor p=0.08911 para la prueba de Kolmogorov-Smirnov es mayor que 0.05,

por lo cual, no permite que se rechace la Hipótesis Nula de que los datos

provienen de una distribución normal. Esto nos permitirá utilizar la regresión por

mínimos cuadrados ordinarios, y sus supuestos.

Page 74: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

60

Figura 17- Transformación de Box-Cox a la variable Tasa Técnica

5.2.2 MODELO 1: REGRESIÓN LINEAL MÚLTIPLE

Utilizando el paquete estadístico de libre disponibilidad “R”, en el paquete Base, la función “lm” que significa Modelos Lineales, aplica regresión múltiple bajo mínimos cuadrados ordinarios. La función “spm” que significa regresión semiparamétrica y descrita a profundidad en la sección 5.3.1, también lo hace. Poor conveniencia se utilizará la función spm, debido a que es mas sencillo comparar modelos utilizando la misma función. Utilizando el modelo de Regresión Múltiple en R, se obtienen los siguientes resultados, basados en las variables disponibles: Ttecnica: La Tasa Técnica es la tasa calculada bajo el método de la razón de pérdida. Los valores están x 100. Y se deben leer en %. Ej: 3.2 es en realidad 3.2%. Genero: Femenino o Masculino

Page 75: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

61

Promsuma: Suma asegurada Promedad: Edad del Asegurado Promedadveh: Antigüedad del vehículo > fitlm1<- spm(B$cox~genero+promsuma+promedad+prome dadveh) > summary(fitlm1) Summary for linear components: coef se ratio p-value intercept 3.796e+00 2.271e-01 16.720 0.0000 * ** genero 3.905e-01 9.970e-02 3.917 0.0001 * ** promsuma -7.776e-05 7.188e-06 -10.820 0.0000 * ** promedad -1.912e-02 3.074e-03 -6.219 0.0000 * ** promedadveh -5.700e-02 2.566e-02 -2.222 0.0264 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘. ’ 0.1 ‘ ’ 1

El modelo también es significativo frente al modelo nulo, según la Tabla ANOVA

Fuente

Suma de

cuadrados

Grados de

Libertad

Media

cuadrática F Pr (>F)

Regresión 323.89 4 80.9725 68.3485 <0.0002

Error 575.77 486 1.1847

Total 808.66 490

Esto permite indicar, que la hipótesis conjunta de que todos los coeficientes sean cero, es rechazada. Por tanto, es válido suponer que hay un modelo diferente a una constante media, que puede explicar a la variable Tasa Técnica. > (cor(B$cox,fitlm1$fit$fitted)^2) (Valor R 2) [1] 0.2917053

Mediante la prueba de Kolmogorv – Smirnov a los errores. > ks.test(fitlm1$fit$residuals,"pnorm",m=0,sd=sd(fi tlm1$fit$residuals)) One-sample Kolmogorov-Smirnov test data: fitlm1$fit$residuals D = 0.0406, p-value = 0.3918 alternative hypothesis: two-sided

5.2.3 MODELO 2: REGRESIÓN DE POLINOMIO DE GRADO 3

Se aplica un modelo de regresión polinomial donde el grado de cada variable (salvo género) sea hasta 3. > fitlm2 <- spm(B$cox ~ genero + promsuma + I(proms uma^2) + I(promsuma^3) + promedad + I(promedad^2) + I(promedad^3) + promed adveh + I(promedadveh^2) + I(promedadveh^3))

Page 76: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

62

> summary(fitlm2) Coefficients: Estimate Std. Error t value Pr(> |t|) (Intercept) 4.349e+00 1.547e+00 2.812 0.00 5127 ** genero 3.790e-01 9.918e-02 3.821 0.00 0150 *** promsuma -4.242e-04 1.350e-04 -3.142 0.00 1781 ** I(promsuma^2) 1.142e-08 5.439e-09 2.100 0.03 6250 * I(promsuma^3) -1.131e-13 6.882e-14 -1.643 0.10 0939 promedad 1.891e-01 8.259e-02 2.289 0.02 2506 * I(promedad^2) -4.287e-03 1.734e-03 -2.472 0.01 3769 * I(promedad^3) 2.838e-05 1.154e-05 2.460 0.01 4250 * promedadveh -5.661e-01 2.332e-01 -2.428 0.01 5566 * I(promedadveh^2) 5.526e-02 4.084e-02 1.353 0.17 6635 I(promedadveh^3) -2.737e-03 2.153e-03 -1.271 0.20 4302 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘. ’ 0.1 ‘ ’ 1

La salida indica que varios de estos coeficientes no son significativos, se empieza por descartar a la variable promedadveh^3, y se continua hasta que todas las variables seleccionadas sean significativas. El modelo final resultante de estas pruebas, es: > fitlm2 <- spm(B$cox ~ genero + promsuma + I(proms uma^2) + promedad + I(promedad^2) + I(promedad^3) + promedadveh) > summary(fitlm2) Coefficients: Estimate Std. Error t value Pr(>|t| ) (Intercept) 2.571e+00 1.254e+00 2.049 0.04098 6 * genero 3.896e-01 9.911e-02 3.931 9.69e-0 5 *** promsuma -1.953e-04 3.531e-05 -5.532 5.20e-0 8 *** I(promsuma^2) 2.306e-09 6.872e-10 3.356 0.00085 2 *** promedad 1.635e-01 8.122e-02 2.013 0.04466 0 * I(promedad^2) -3.834e-03 1.712e-03 -2.239 0.02560 3 * I(promedad^3) 2.536e-05 1.138e-05 2.228 0.02634 6 * promedadveh -1.636e-01 3.937e-02 -4.155 3.84e-0 5 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘. ’ 0.1 ‘ ’ 1

> (cor(B$cox,fitlm2$fitted)^2) (Valor R 2) [1] 0.3151486 La tabla ANOVA demuestra que el modelo es significativo

Fuente

Suma de

cuadrados

Grados de

Libertad

Media

cuadrática F Pr (>F)

Regresión 254.85 7 36.4071 31.75 <0.0002

Error 553.81 483 1.1466

Total 808.66 490

Page 77: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

63

5.2.4 MODELO 3: REGRESIÓN MÚLTIPLE CON LOGARITMO NATURAL

La función logaritmo natural ln, es muy útil en la modelización de regresión lineal, puede ser más parsimonioso que una regresión polinomial y en ocasiones más eficiente en la explicación del modelo. En R, la función logaritmo natural es log, y se aplicará a la variable “Suma Asegurada”. Se agrega a la base de datos una columna logpromsuma que es ln(promsuma). > fitlm3<-spm(B$cox ~ genero + logpromsuma + promed ad + promedadveh) > summary(fitlm3) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 20.535639 1.643425 12.496 < 2e-16 * ** genero 0.379236 0.098720 3.842 0.000138 * ** logpromsuma -1.852448 0.163993 -11.296 < 2e-16 * ** promedad -0.014300 0.003107 -4.603 5.33e-06 * ** promedadveh -0.226143 0.036554 -6.187 1.31e-09 * ** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘. ’ 0.1 ‘ ’ 1 > (cor(B$cox,fitlm3$fitted)^2) (Valor R 2) [1] 0.3039042 La tabla ANOVA demuestra que el modelo es significativo

Fuente

Suma de

cuadrados

Grados de

Libertad

Media

cuadrática F Pr (>F)

Regresión 245.76 4 61.44 53.04 <0.0002

Error 562.90 486 1.1582

Total 808.66 490

5.3 REGRESIÓN SEMIPARAMÉTRICA PARA LA TASA TÉCNICA

5.3.1 INTRODUCCIÓN A SEMIPAR, LIBRERÍA DE R

Antes de iniciar a hacer modelos semiparamétricos, es muy importante reconocer a priori cómo interactúa la función de regresión semiparamétrica en R, y cómo se modifica el modelo con el objetivo de encontrar mejores ajustes. En esta parte se utiliza un ejercicio de regresión no paramétrica simple entre la variable “B$cox” (Tasa Técnica bajo la transformación Box-Cox), y la variable “promsum” (Suma Asegurada del Vehículo).

Page 78: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

64

Lo primero que se debe hacer en R es llamar a la librería “semipar” que es la que contiene la función spm. Pero esta librería a su vez requiere de otras como “MASS”, “cluster”, “nlme”. library(MASS)

library(cluster)

library(nlme)

library(SemiPar)

Otras librerías son necesarias para otro tipo de funciones que serán utilizadas en el presente trabajo. library(mgcv)

library(lattice)

El modelo no paramétrico, f(promsuma), es de polinomios locales penalizados bajo modelos mixtos

( ) ixfy ε+= , ( )2,0~ εσε Ni Donde

( ) ∑=

−++=K

kkk xuxxf

1

3

10 κββ

La función spm se utiliza de la siguiente manera: > fit<-spm(B$cox~f(promsuma,df=3)) > summary(fit) (Resumen de la Re gresión) Summary for non-linear components: df spar knots f(promsuma) 3 91140 36 Note this includes 1 df for the intercept.

Los coeficientes ! y " se obtienen en ese orden mediante la siguiente función: > fit$fit$coef$fixed [1] 2.754741e+00 -6.988096e-05

Los coeficientes �# > fit$fit$coef$random [1] -2.11e-08 -5.67e-09 -4.96e-09 -4.47e-09 2.96e -09 3.17e-09 [7] 3.33e-09 3.54e-09 6.40e-09 6.64e-09 6.77e -09 6.64e-09 [13] 6.30e-09 6.21e-09 6.13e-09 5.78e-09 1.95e -09 1.94e-09 [19] 1.90e-09 -5.62e-10 -7.24e-10 -8.56e-10 -1.10e -09 -4.30e-09 [25] -4.43e-09 -4.55e-09 -5.00e-09 -4.55e-09 -4.26e -09 7.23e-11 [31] 4.63e-10 1.51e-09 5.92e-09 6.70e-09 1.57e -08 2.06e-08

Page 79: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

65

Aquí knots es 36, representa el valor de K, porque hay 36 nodos que se han calculado mediante la fórmula

2

1

++=

K

kkk ésima cuantil muestral de ix ’s (únicos)

> fit$info$pen$knots [[1]] [1] 3996.5 6310.5 6433.3 6519.7 8668.0 8785. 6 8863.1 8975.7 [9] 11030.8 11128.8 11202.3 13278.1 13533.2 13589. 3 13641.3 13817.1 [17] 16120.5 16189.7 16277.6 18505.8 18607.1 18694. 0 18838.4 21036.4 [25] 21133.5 21189.3 23380.7 23645.6 23786.2 25777. 8 25961.1 26466.4 [33] 28737.1 29046.4 37341.5 397787.0

Algunos indicadores importantes pueden ser obtenidos mediante las siguientes funciones: > fit$aux$df.fit (Grados de Liberta d de la regresión) [1] 3 > fit$aux$df.res (Grados de Liberta d de los residuos) [1] 487.5312 > cor(B$cox,fit$fit$fitted)^2 (R 2) [1] 0.2112830 > fit$aux$resid.var (Media cuadrática del error) [1] 1.295285

Para la comprobación de hipótesis del modelo sobre la independencia de los errores y la independencia de los efectos aleatorios, se utiliza la función de autocorrelación tanto en los coeficientes aleatorios como los coeficientes del error. > acf(fit$fit$coef$random,main="Autocorrelación de u") > acf(B$cox-fit$fit$fitted,main="Autocorrelación de l error")

Figura 18- Efecto de autocorrelación de los efectos aleatorios y del error

Page 80: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

66

El gráfico de autocorrelación en R muestra la autocorrelación de orden cero, es decir con la misma variable, esto siempre es 1 y evidente, por lo que no se interpreta este valor. Siguiendo con el análisis, se muestra que si existe autocorrelación, lo cual afecta a las inferencias del modelo. Es importante anotar que ambos vectores, el de los coeficientes aleatorios y el de los errores no tienen la misma dimensión, ya que el vector del error tiene dimensión n (datos), y el de coeficientes aleatorios tiene dimensión K (nodos). La variación de los grados de libertad de la regresión, hacen que cambie el parámetro suavizador, según la expresión y condiciones de la sección 4.6.2. En la Figura 19, los cambios en el valor de los grados de libertad de la regresión “df” provoca cambios en los otros indicadores, entre ellos el parámetro suavizador. Se observa que a medida que aumentan los grados de libertad de la regresión, disminuye el parámetro suavizador, logrando una apariencia más rugosa en la función. La sombra alrededor de la curva de ajuste, es la banda de error estándar. El primer modelo con 3 grados de libertad en los residuos, tiene una curva de ajuste sin rugosidad; esta curva, podría ser reemplazada con un modelo de regresión lineal, quizá con una ligera curva proporcionada por una variable elevada al cuadrado, o al cubo.

Page 81: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

67

Figura 19- Ejemplo de la relación entre los grados de libertad y el parámetro suavizador Precisamente, en (Ruppert, D., Wand, M.P. & Carroll, R.J., 2003) se encuentra la recomendación de que cuando ln(parámetro suavizador) sea mayor a 5, el tratamiento no lineal debe descartarse y omitir la función f(x) hacia una función lineal. A medida que aumenta esta rugosidad, aumenta también el valor R2, sin embargo, antes debería determinarse si estos cambios son significativos, aplicando la prueba F modificada de la sección 4.7.2.2. Por ejemplo, el modelo con 3 grados de libertad en la regresión cuyo R2 es 0.2112830 con respecto al modelo con 20 grados de libertad en la regresión cuyo R2 es 0.2707473.

Page 82: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

68

El estadístico F y el valor p se obtiene así: > fit1<-spm(B$cox~f(promsuma,df=3)) (MODELO DF=3) > (R2sma<-cor(B$cox,fit1$fit$fitted)^2) (R2) [1] 0.2112830 > (dffitsma<-fit1$aux$df.fit) ( G LIBERTAD REGRESSION) [1] 3 > (dfressma<-fit1$aux$df.res) ( G. LIBERTAD RESIDUOS) [1] 487.5312 > fit2<-spm(B$cox~f(promsuma,df=20)) (MODELO DF=20) > (R2lar<-cor(B$cox,fit2$fit$fitted)^2) (R2) [1] 0.2707473 > (dffitlar<-fit2$aux$df.fit) (G LIBERTAD REGRESION) [1] 20 > (dfreslar<-fit2$aux$df.res) (G LIBERTAD RESIDUOS) [1] 468.2576 > (F<-(R2lar-R2sma)/((1-R2lar)*(dfressma-dfreslar)/ dfreslar)) (VALOR F) [1] 1.981070 > (df(F,dfressma-dfreslar,dfreslar,0)) (VALOR P) [1] 0.04132972 >

5.3.2 MODELO 1: TRES VARIABLES NO LINEALES

Se sugiere que: Parte Paramétrica (Lineal): genero Para No Paramétrica (No lineal): Suma Asegurada (promsuma), Edad del Asegurado (promedadveh) y Antigüedad del Vehículo (promedadveh) Se utiliza el modelo basado en la sección 4.8, pero considerando una variable lineal y tres variables no lineales. El modelo modificado quedaría de la siguiente manera

( ) ( )∑∑=

=

−+−+++−+++=

sr K

k

mski

skis

K

kit

mrki

rkirgi ksustkrury

1

12

1

12

0 βββββ

( )∑=

−+−+

tK

ki

mtki

tkit ktut

1

12εβ

La salida se obtiene de los siguientes comandos:

Page 83: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

69

> fitspm1<-spm(B$cox~genero+f(promsuma)+f(promedad) +f(promedadveh)) > summary(fitspm1) Summary for linear components: coef se ratio p-value intercept 5.4320 2.05200 2.647 0.0084 genero 0.3895 0.09798 3.975 0.0001 Summary for non-linear components: df spar knots f(promsuma) 3.596 32510.00 36 f(promedad) 4.883 37.41 34 f(promedadveh) 1.000 3435.00 35 > fitspm1$aux$resid.var (Media cu adrática del error) [1] 1.113327 > cor(B$cox,fitspm1$fit$fitted)^2 (R 2) [1] 0.3400643

Es de destacar que esta media cuadrática del error (1.113327) es menor que las obtenidas en los 3 modelos paramétricos, lo que indica un mejor ajuste. La desviación estándar del error > fitspm1$fit$sigma Residual standard error: 1.055143

La parte paramétrica, muestra los coeficientes y los valores de significación calculados bajo el método de mínimos cuadrados generalizados, los cuales por tener p-value <0.05, no permiten que se rechace la hipótesis de que son estadísticamente significativos. La parte no paramétrica, registra entre 34 y 36 nodos en las variables. Los grados de libertad son: > (fitspm1$aux$df.fit) (Grados de libertad de l a regresión) [1] 11.47919 > (fitspm1$aux$df.res) (Grados de libertad de l os residuos) [1] 477.5864

Cabe anotar que en la salida estándar del comando summary(fitspm1), aparecen los grados de libertad utilizados en cada función no lineal, pero no se incluyen los de la parte lineal. Sumando los 2 grados de libertad que representan la constante y la variable genero, más los grados de libertad de la parte no lineal, el valor será igual a (fitspm1$aux$df.fit)=11.47919.

Page 84: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

70

Parámetro suavizador Debe llamar la atención, el valor muy alto spar, que se refiere al parámetro suavizador tanto para la variable promsuma como promedadveh. En la sección 5.3.1, las variables donde ln(spar)>5, deben ser tratadas como lineales. La primera variación al modelo, será cambiar de estado (de no lineal a lineal) a la variable promsuma, en el siguiente modelo. En este modelo la variable promsuma es ahora considerada como lineal. > fitspm1<-spm(B$cox~genero+promsuma+f(promedad)+f( promedadveh)) > summary(fitspm1) Summary for linear components: coef se ratio p-value intercept 5.023e+00 1.879e+00 2.673 0.0076 genero 3.960e-01 9.901e-02 3.999 0.0001 promsuma -7.517e-05 7.651e-06 -9.825 0.0000 Summary for non-linear components: df spar knots f(promedad) 4.820 38.22 34 f(promedadveh) 1.708 26.48 35 > cor(B$cox,fitspm1$fit$fitted)^2 (R 2) [1] 0.3198318 > fitspm1$aux$resid.var (Media cuadrát ica del error) [1] 1.142605 > fitspm1$fit$sigma (Desviación es tandar del error) [1] 1.068927 > (fitspm1$aux$df.fit) (Grados de Lib ertad de la regresión) [1] 9.527398 > (fitspm1$aux$df.res) (Grados de Lib ertad de los residuos) [1] 480.0442

5.3.3 MODELO 2: CON PARÁMETRO SUAVIZADOR

Utilizando la función logaritmo natural para la variable promsuma, el modelo resultante es: > fitspm2<-spm(B$cox~genero+logpromsuma+f(promedad) +f(promedadveh)) > summary(fitspm2) Summary for linear components: coef se ratio p-value intercept 21.9300 2.55700 8.576 0e+00 genero 0.3912 0.09786 3.997 1e-04 logpromsuma -1.8530 0.16480 -11.250 0e+00 Summary for non-linear components: df spar knots f(promedad) 4.925 36.99 34

Page 85: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

71

f(promedadveh) 1.000 1915.00 35 > cor(B$cox,fitspm2$fit$fitted)^2 [1] 0.3314195 > fitspm2$aux$resid.var [1] 1.121670 > fitspm2$fit$sigma [1] 1.059089 > (fitspm2$aux$df.fit) [1] 8.924675 > (fitspm2$aux$df.res) [1] 481.0156

Debido a que la variable promedadveh también tiene un parámetro suavizador muy alto lo excluimos de la parte no lineal; el modelo resultante es el que sigue: > fitspm3<-spm(B$cox~genero+logpromsuma+f(promedad) +promedadveh) > summary(fitspm3) Summary for linear components: coef se ratio p-value intercept 21.9300 2.55700 8.576 0e+00 genero 0.3912 0.09786 3.997 1e-04 logpromsuma -1.8530 0.16480 -11.250 0e+00 promedadveh -0.2313 0.03648 -6.340 0e+00 Summary for non-linear components: df spar knots f(promedad) 4.925 36.99 34 > cor(B$cox,fitspm3$fit$fitted)^2 [1] 0.3314195 > fitspm3$aux$resid.var [1] 1.121670 > fitspm3$fit$sigma [1] 1.059089 > (fitspm3$aux$df.fit) [1] 8.924672 > (fitspm3$aux$df.res) [1] 481.0156

Los coeficientes ! y " se obtienen en ese orden mediante la siguiente función: > fitspm3$fit$coef$fixed [1] 21.92640133 0.39116009 -1.85318370 -0.2312598 9 -0.03729708

Los coeficientes �# > fitspm3$fit$coef$random [1] -0.000865 -0.001586 -0.001420 0.000363 0.000 309 [6] -0.000296 -0.000370 -0.000396 -0.000507 -0.001 889 [11] -0.001920 -0.001906 -0.001793 -0.000732 -0.000 665 [16] -0.000571 0.001086 0.000352 0.000351 0.000 331 [21] 0.000602 0.000676 0.001310 0.001313 0.001 375

Page 86: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

72

[26] -0.000212 -0.000939 -0.002340 -0.002236 -0.002 090 [31] -0.002036 -0.001904 0.000511 0.005825

Gráfico del Modelo El siguiente es el gráfico del modelo de regresión resultante, acompañado de los ajustes en cada variable que interviene en el modelo. La parte sombrada corresponde a las bandas de error estándar.

Figura 20- Gráfico del ajuste de la regresión semiparamétrica por variable predictora A continuación se muestra un resumen de los datos ajustados, en sus valores menores “datosbajos” y mayores “datosaltos”.

Page 87: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

73

> B$ajuste <- fitspm3$fit$fitted > datosbajos<-B[B$ajuste<0.5,] > summary(datosbajos$nsexo) hombre mujer 25 22 > datosaltos<-B[B$ajuste>2.5,] > summary(datosaltos$nsexo) hombre mujer 41 5 > summary(datosbajos$promsuma) Min. 1st Qu. Median Mean 3rd Qu. Max. 21160 28760 37620 35050 39960 48880 > summary(datosaltos$promsuma) Min. 1st Qu. Median Mean 3rd Qu. Max. 3019 6559 8904 8889 11170 13590 > summary(datosbajos$promedad) Min. 1st Qu. Median Mean 3rd Qu. Max. 31.20 39.61 55.21 54.40 67.21 75.83 > summary(datosaltos$promedad) Min. 1st Qu. Median Mean 3rd Qu. Max. 19.76 23.97 31.45 33.13 35.61 83.27 > summary(datosbajos$promedadveh) Min. 1st Qu. Median Mean 3rd Qu. Max. 0.830 1.320 1.560 1.656 1.830 3.380 > summary(datosaltos$promedadveh) Min. 1st Qu. Median Mean 3rd Qu. Max. 0.920 2.290 3.280 4.282 6.167 11.480

La variable promsuma tiene claras diferencias en su valor respecto a la medida de la tasa técnica, asociándose los altos valores de suma asegurada, con bajos valores de tasa técnica, y los bajos valores de suma asegurada, generan altas tasa técnicas. La edad del Asegurado, también muestra relación con la tasa; los más jóvenes, con altas tasas técnicas, y los más maduros con bajas tasas técnicas. Cuando la antigüedad del vehículo es baja, las tasas técnicas también son bajas, y los vehículos de mayor antigüedad requieren de tasas técnicas altas. Estos resultados serán mencionados en las conclusiones.

5.4 SELECCIÓN DEL MODELO

Al modelo resultante de la regresión semiparámetrica, se realizaron cambios en la unidad del parámetro suavizador, fijando el número de nodos a 34. Bajo el criterio de mayor valor R2, se comparan los mejores modelos resultantes en la parte Regresión polinomial con respecto a la Regresión Semiparamétrica, mediante la Prueba F modificada

Page 88: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

74

( )( ) mayorresmayorresmenorresmayor

menormayor

dfdfdfR

RRF

,,,2

22

/1 −−−

=

Donde los grados de libertad de los residuos equivalen a:

( ) ( )Tres SStrStrndf λλλ +−≡ 2

A continuación el ejercicio entre fitlm3 con respecto al modelo semiparamétrico

fitspm3.

> fitlm3<-spm(B$cox ~ genero + logpromsuma + promed ad + promedadveh)

> (R2sma<-cor(B$cox,fitlm3$fit$fitted)^2)

[1] 0.3039042

> (dffitsma<-fitlm3$aux$df.fit)

[1] 5

> (dfressma<-fitlm3$aux$df.res)

[1] 486

> fitspm3<-spm(B$cox~genero+logpromsuma+f(promedad) +promedadveh)

> (R2lar<-cor(B$cox,fitspm3$fit$fitted)^2)

[1] 0.3314195

> (dffitlar<-fitspm3$aux$df.fit)

[1] 8.924672

> (dfreslar<-fitspm3$aux$df.res)

[1] 481.0156

> (F<-(R2lar-R2sma)/((1-R2lar)*(dfressma-dfreslar)/ dfreslar))

[1] 3.971621

> (df(F,dfressma-dfreslar,dfreslar,0))

[1] 0.003221142

El Valor p, de la prueba comparativa es 0.003221142, por lo cual se rechaza la

hipótesis nula de que ambos modelos tienen el mismo nivel de explicación, siendo

esto a favor del modelo semiparamétrico que tiene un nivel de explicación mayor.

Por tanto se escoge el modelo fitspm3 por demostrar mejores resultados que los

otros modelos disponibles.

Page 89: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

75

Error

Según el supuesto teórico, los errores deben ser independientes, normales, de

media cero y varianza constante. Además el error de la regresión debe ser

independiente del vector de coeficientes aleatorios del modelo mixto.

El error se obtiene del siguiente comando: fitspm3$fit$residuals

> summary(fitspm3$fit$residuals)

Min. 1st Qu. Median Mean 3rd Qu. Ma x.

-2.97600 -0.59730 -0.02616 0.00000 0.59110 3.677 00

> sqrt(var(fitspm3$fit$residuals)) DES VIACIÓN ESTANDAR

[1] 1.05049

La prueba de Kolmogorov – Smirnov no permite rechazar la hipótesis de que los

datos sean normales, con media cero y varianza constante.

> ks.test(fitspm3$fit$residuals,"pnorm",m=0,sd=sd(f itspm3$fit$residuals))

One-sample Kolmogorov-Smirnov test

data: fitspm3$fit$residuals

D = 0.043, p-value = 0.3254

alternative hypothesis: two-sided

La significación de la prueba, no permite que se rechace la hipótesis de que la

estimación es insesgada, es decir que el valor esperado del error es cero.

Evaluando las autocorrelaciones y autocorrelaciones parciales del error, se nota

que estos se encuentran dentro de las bandas de tolerancia.

Page 90: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

76

Figura 21- Autocorrelación del error

Los coeficientes $% De los coeficientes aleatorios del modelo, se aplica una prueba para comprobar su normalidad >ks.test(fitspm3$fit$coef$random,"pnorm",m=0,sd=sd( fitspm3$fit$coef$random)) One-sample Kolmogorov-Smirnov test data: fitspm3$fit$coef$random D = 0.1876, p-value = 0.1605 alternative hypothesis: two-sided

La función de autocorrelación

Figura 22- Autocorrelación de los u

Page 91: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

77

Las autocorrelaciones en los coeficientes aleatorios indican que no hay

independencia entre ellos, aunque éstos pasan la prueba de normalidad.

Los coeficientes aleatorios dependen del número de nodos. Haciendo variaciones

al número de nodos se obtienen diferentes resultados.

En la siguiente sección se ilustra dos tipos de variaciones que la regresión

semiparamétrica permite. La primera es la variación del parámetro suavizador, la

segunda es la variación del número de nodos.

Ambos coeficientes pueden ser variados incluso simultáneamente, el hacerlo

arbitrariamente es válido siempre que el modelo resultante sea comprobado es de

ajuste significativo según la prueba F modificada.

5.5 VARIACIONES AL MODELO EN EL NÚMERO DE NODOS

El método propuesto (Ruppert, D., Wand, M.P. & Carroll, R.J., 2003), utiliza una fórmula empírica para fijar los nodos de la función no paramétrica. Es posible variar los nodos hasta encontrar un modelo que sea mejor que el anterior o que cumpla con las hipótesis del modelo. La propuesta es que los nodos sean 34, por tanto existen 34 coeficientes aleatorios. Los coeficientes aleatorios están autocorrelacionados. Una variación tanto en la posición de los nodos como el número de ellos, cambia el resultado del ajuste y comprobación de hipótesis. Modificando la posición y el número de nodos: > nodos2<-c(23.81, 27.59, 27.76, 31.23, 31.89, 35.4 6, 35.61, 39.41, 39.58, 43.35, 43.50, 47.50, 51.28, 51.48, 51.68, 55 .32, 55.46, 59.29, 59.45, 59.71, 63.26, 64.28, 67.25)

El siguiente modelo de nodos modificados, es significativo con respecto al mejor modelo paramétrico fitlm3 y cumple con los supuestos de normalidad e independencia. >fitspm4<-spm(B$cox~genero+logpromsuma+f(promedad,k nots=nodos2)+ promedadveh) > summary(fitspm4) Summary for linear components:

Page 92: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

78

coef se ratio p-value intercept 21.6300 2.03100 10.650 0e+00 genero 0.3894 0.09833 3.960 1e-04 logpromsuma -1.8560 0.16550 -11.210 0e+00 promedadveh -0.2299 0.03664 -6.275 0e+00 Summary for non-linear components: df spar knots f(promedad) 4.129 45.5 23

> cor(B$cox,fitspm4$fit$fitted)^2 R 2 [1] 0.3233343 > fitspm4$aux$resid.var MEDIA CUADRÁ TICA DEL ERROR [1] 1.133310 > fitspm4$fit$sigma DESVIACION E STANDAR DEL ERROR [1] 1.064570 > (fitspm4$aux$df.fit) GRADOS DE LI BERTAD DE LA REGRESIÓN [1] 8.129239 > (fitspm4$aux$df.res) GRADOS DE LI BERTAD DE LOS RESIDUOS [1] 482.1514

> fitspm4$fit$coef$fixed EFECTOS FIJOS [1] 21.63120665 0.38937835 -1.85634646 -0.22991418 -0.03050773 > fitspm4$fit$coef$random EFECTOS ALEATORIOS [1] -1.8997e-04 -1.4644e-03 -8.9649e-04 -1.0910e-0 3 -1.2827e-03 [6] -1.9755e-03 -1.9857e-03 -1.8385e-03 -1.7698e-0 3 -9.7692e-04 [11] -9.2911e-04 2.5755e-04 -2.8755e-05 -2.8256e-0 5 -3.8563e-05 [16] -3.1062e-05 -6.5345e-06 -2.0097e-04 -2.1123e-0 4 -2.3970e-04 [21] -1.4703e-03 -3.0188e-03 2.0436e-03

Los nodos son: > fitspm4$info$pen$knots [1] 23.81 27.59 27.76 31.23 31.89 35.46 35.61 39.4 1 [9] 39.58 43.35 43.50 47.50 51.28 51.48 51.68 55.3 2 [17] 55.46 59.29 59.45 59.71 63.26 64.28 67.25

El error sigue una distribución normal e independiente. ks.test(fitspm4$fit$residuals,"pnorm",mean=0,sd=sd( fitspm3$fit$residuals)) One-sample Kolmogorov-Smirnov test data: fitspm4$fit$residuals D = 0.0436, p-value = 0.3079 alternative hypothesis: two-sided

Page 93: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

79

Figura 23- Autocorrelación del error Los efectos aleatorios se van a comprobar mediante la prueba de Shapiro Wilks, por ser esta la prueba apropiada para muestras pequeñas (<30 datos). Los coeficientes aleatorios son 23, ya que están en función al número de nodos. > shapiro.test(fitspm4$fit$coef$random) Shapiro-Wilk normality test data: fitspm4$fit$coef$random W = 0.9394, p-value = 0.1747

Figura 24- Autocorrelación de los efectos aleatorios u

Page 94: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

80

El gráfico de la regresión es el siguiente:

Figura 25- Gráfico del ajuste con nodos modificados En la figura 25 se puede observar las tendencias de las tres primeras variables lineales, y la curva de no lineal de la variable Edad del Asegurado. Evaluando la prueba F modificada con respecto al modelo fitlm3, > fitlm3<-spm(B$cox ~ genero + logpromsuma + promed ad + promedadveh) > (R2sma<-cor(B$cox,fitlm3$fit$fitted)^2) [1] 0.3039042 > (dffitsma<-fitlm3$aux$df.fit) [1] 5 > (dfressma<-fitlm3$aux$df.res) [1] 486

Page 95: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

81

> fitspm4<-spm(B$cox~genero+logpromsuma+f(promedad, knots=nodos2)+ promedadveh) > (R2lar<-cor(B$cox,fitspm4$fit$fitted)^2) [1] 0.3233343 > (dffitlar<-fitspm4$aux$df.fit) [1] 8.129239 > (dfreslar<-fitspm4$aux$df.res) [1] 482.1514 > (F<-(R2lar-R2sma)/((1-R2lar)*(dfressma-dfreslar)/ dfreslar)) [1] 3.597309 > (df(F,dfressma-dfreslar,dfreslar,0)) [1] 0.01224532

Se rechaza la hipótesis de que el mejor modelo paramétrico fitlm3, sea mejor predictor que el modelo semiparamétrico con nudos modificados, fitspm4. Este es el modelo finalmente propuesto para el ajuste de la tasa técnica, cuidando de recalcularla en función de la conversión por Box-Cox. Se utiliza fitspm4 para la predicción de los datos del quinto año disponible de la compañía de seguros, en el siguiente capítulo.

Page 96: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

82

CAPÍTULO 6

6 ANÁLISIS COMPARATIVO CONTABLE DE LOS

RESULTADOS REALES Y LOS OBTENIDOS DE

APLICAR EL MODELO PROPUESTO

Valores Ajustados del modelo semiparamétrico Se reservó un quinto año para la predicción, estos datos se encuentran en el archivo datosparaprediccion.txt. Estos datos serán extraídos y se utilizará el modelo fitspm4 para la predicción > B <- as.data.frame(read.table("C:\\datosparapredi ccion.txt", header=TRUE)) > preds<-predict(fitspm4,newdata=B,se=TRUE) > preds$tasanueva<-(preds$fit*lambda+1)^(1/lambda) > write.table(preds,"C:\\prediccion.txt",col.names= T,row.names=T)

El comando de predicción permite incluir la desviación estándar de la predicción. La Figura 26 se muestra la tasa técnica ya convertida y las bandas de predicción

Figura 26- Bandas de predicción para el quinto año con el modelo semiparamétrico seleccionado

Page 97: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

83

Por otro lado, al ser modelada la media en la regresión, la dispersión de la tasa técnica semiparamétrica es menor que la dispersión de la tasa técnica original, como se observa en la Figura 27.

Figura 27- Histograma de la Tasa Técnica y su ajuste semiparamétrico En la tasa técnica calculada actuarialmente, se observan tasas mayores a 10%, lo cual es inaplicable en la práctica. En la tasa técnica calculada con el modelo semiparamétrico fitspm3 (preds$tasanueva) las tasas no superan el 7%, lo cual si es posible en pocos casos.

Page 98: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

84

Los valores estadísticos para estas variables se obtienen a continuación: > summary(B$ttecnica) Min. 1st Qu. Median Mean 3rd Qu. Max. 0.090 1.985 3.235 3.788 4.393 19.920 > summary(preds$tasanueva) Min. 1st Qu. Median Mean 3rd Qu. Max. 0.5248 2.2530 3.1860 3.2480 4.2180 6.4670

La media de la tasa ajustada por el método semiparamétrico es menor que la media de la tasa técnica calculada originalmente, este es un efecto posiblemente provocado por la conversión Box-Cox. Realizando una prueba de hipótesis de igualdad de medias, siguiendo la distribución t de Student: > t.test(B$ttecnica,preds$tasanueva) Welch Two Sample t-test data: B$ttecnica and preds$tasanueva t = 1.7057, df = 160.887, p-value = 0.09 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.0851792 1.1649181 sample estimates: mean of x mean of y 3.787951 3.248081

El valor p es mayor a 0.05, y no permite que se rechace la hipótesis nula que indica que las dos muestras tienen la misma media. No obstante, se puede observar que tanto el valor mínimo como el primer cuartil, son mayores a la tasa técnica original, mientras que en los valores extremos superiores, hay leve diferencia en el tercer cuartil, si es menor el caso del máximo. En una prueba de hipótesis sobre igualdad de varianzas, mediante la distribución F de Fisher, se rechaza la hipótesis de varianzas iguales, siendo de menor varianza la predicción por regresión semiparamétrica. > var.test(B$ttecnica,preds$tasanueva) F test to compare two variances data: B$ttecnica and preds$tasanueva F = 5.8976, num df = 121, denom df = 121, p-value < 2.2e-16 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 4.122716 8.436734 sample estimates: ratio of variances 5.897648

Page 99: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

85

Elaborando una estadística de primas, se obtiene que: > sum(B$sumasegveh*B$ttecnica/100) [1] 7729431 > sum(B$sumasegveh*preds$tasanueva/100) [1] 7915748

La prima total obtenida por la regresión semiparámetrica es mayor que la prima de la tasa técnica actuarial. Este resultado es interesante porque la media de la tasa aplicada es menor a la que actualmente pueden obtener de los cálculos actuariales, sin embargo, aplicarla, le da mayores ingresos a la compañía de seguros. Esta ventaja debe ser muy apreciada por las compañías de seguros, ya que, de haber aplicado el modelo en el quinto año como política de suscripción, es que la suma de Primas netas originadas por el total de contratos suscritos en el año producen menor siniestralidad, y por ello mayores utilidades. Desde un punto de vista contable, es necesario considerar los componentes de un estado Financiero de la Compañía de seguros. Sin considerar temas que no son objeto de la tesis como Reservas Técnicas ni Reaseguro, se reproducirán los resultados de un estado de pérdidas y ganancias para el quinto año adoptando dos escenarios: El primero toma a la tasa técnica actuarial para el cálculo de las primas netas, y el segundo toma la tasa técnica calculada mediante la regresión semiparamétrica. La base de datos del quinto año contiene los datos:

• Edad del Asegurado • Género del asegurado • Antigüedad del Vehículo asegurado • Suma asegurada del Vehículo

Cuentas contables La contabilidad de Seguros es regulada por la Superintendencia de Bancos y Seguros. Las compañías de seguros, son auditadas por este organismo de control una vez al año, para dar resultados de sus estados financieros e indicadores. Las Primas Netas y los Siniestros Netos son cuentas de resultados, es decir, que se deben reflejar en el Estado de Pérdidas y Ganancias.

Page 100: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

86

Contablemente, para la compañía de seguros ingresa el valor de la prima neta anual, pero es necesario constituir una reserva de riesgo en curso. La prima neta anual menos la reserva de riesgo en curso se denomina Prima Neta Ganada. Los Siniestros Netos que pertenecen al mismo periodo de la Prima Neta Ganada se denominan Siniestros Netos Incurridos. La Siniestralidad Incurrida es igual a Siniestros Netos Incurridos divididos para Prima Neta Ganada. La Siniestralidad Incurrida, indica la porción de prima que se devuelve a los asegurados en las prestaciones a que tienen derecho, por los eventos cubiertos por las pólizas contratadas. Esa es la primera obligación de las compañías de seguros: El pago de los siniestros. Adicional a los gastos de siniestros, la compañía de seguros también debe pagar salarios a empleados, gastos de promoción, publicidad y propaganda, comisiones a los Asesores Productores de Seguros, constituye y libera reservas obligatorias, cumple con las normas de inversión establecida por la superintendencia de Bancos y seguros, paga impuestos, contribuciones, reaseguros y finalmente busca generar una utilidad razonable a su operación. El resultado del quinto año de ejercicio contable según los datos proporcionados por la compañía de seguros se encuentra en la Tabla 2: > sum(B$sumasegveh*B$ttecnica/100) [1] 7729431 > sum(B$sinnetousd) [1] 4021541 > sum(B$sinnetousd)/sum(B$sumasegveh*B$ttecnica/100 ) [1] 0.5202893

Tabla 2- Ejercicio Contable hasta Margen de Contribución, del 5to año del seguro de vehículos, con tasa técnica actuarial

Año 2010 Primas Netas Ganadas ( 1 ) 7,729,431

Siniestros Netos Incurridos ( 2 ) 4,021,541

Margen de Contribución = (1) - (2) 3,707,891

Siniestralidad Incurrida= (2) / (1) 52.03%

Según datos proporcionados por la compañía de seguros, el total de gastos administrativos más comisiones es de 40%.

Page 101: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

87

El resultado técnico sería entonces el Margen de Contribución menos el 40% de las Primas Netas Ganadas, como lo indica la Tabla 4. Tabla 3- Ejercicio Contable hasta Resultado Técnico, del 5to año del seguro de vehículos, con tasa técnica actuarial

Año 2010 Margen de Contribución = (1) - (2) 3,707,891

Total Gastos 3,091,772

Resultado Técnico 616,119

Resultado Técnico / Primas Netas Ganadas 7.97%

El ejercicio para la predicción del 5to año es > sum(B$sumasegveh*preds$tasanueva/100) [1] 7915748

Tabla 4- Ejercicio Contable hasta Margen de Contribución, del 5to año del seguro de vehículos, con tasa técnica bajo regresión semiparamétrica

Año 2010 Primas Netas Ganadas ( 1 ) 7,915,748

Siniestros Netos Incurridos ( 2 ) 4,021,541

Margen de Contribución = (1) - (2) 3,894,207

Siniestralidad Incurrida= (2) / (1) 50.80%

Esta siniestralidad es menor que la obtenida actuarialmente, esto implica una ventaja por la utilización del modelo semiparamétrico. Comparando la Tabla 4 con la Tabla 2, el ahorro en margen de contribución es de USD 186,316 (3,894,207- 3,707,891), superiores a cualquier esfuerzo de implementación de la nueva tarifa propuesta. En cuanto al resultado técnico, se tiene Tabla 5- Ejercicio Contable hasta resultado técnico, del 5to año del seguro de vehículos, con tasa técnica bajo regresión semiparamétrica.

Año 2010 Margen de Contribución = (1) - (2) 3,894,207

Total Gastos 3,125,310

Page 102: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

88

Resultado Técnico 768,897

Resultado Técnico / Primas Netas Ganadas 9.71%

Se mantienen los gastos del ejercicio anterior excepto las comisiones que son el 18% de las Primas Netas Ganadas, en este caso los Gastos se ajustan a USD 3,125,310 Se observa que el Resultado Técnico cuando se utiliza la regresión semiparamétrica para el cálculo de la tasa técnica, aumenta en USD 152,778 Este aumento de ingresos, junto a otras ventajas como una menor dispersión en la tasa técnica, contar con con tasas que si pueden aplicarse en el mercado y obtener un cálculo en casos donde no hay estadísticas previas usando una función de ajuste, es lo que hace al modelo propuesto, más atractivo que el método actuarial tradicional de razón de pérdida.

Page 103: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

89

CAPÍTULO 7

7 CONCLUSIONES Y RECOMENDACIONES

7.1 CONCLUSIONES

• La combinación de la regresión y el cálculo actuarial en aquellas celdas

donde hay suficiente cantidad de datos, puede crear un modelo que

cumpla con los supuestos básicos del error, facilitando el ajuste por

aproximación a cualquier tipo de combinación de variable, dentro de los

rangos mínimos y máximos para cada variable participante en el modelo.

• En el campo de los seguros de vehículo, la diferenciación de los riesgos,

crea ventajas competitivas entre compañías, debido a que la alta

competencia que hace disminuir las primas cobradas, obliga a las

compañías a crear medidas que aumenten sus utilidades en un ambiente

casi hostil.

• La identificación de bajos riesgos, entendiéndose como sujetos cuya

combinación de variables resultan menor tasa técnica, es muy importante

para las compañías de seguros, y esa identificación puede mejorar

mediante un modelo de regresión.

• Se utilizaron 4 de 5 años de datos para desarrollar el modelo de regresión

para el ajuste a la tasa técnica calculada actuarialmente bajo el método de

razón de pérdida.

• Debido a que la variable Tasa Técnica no es normal, y los errores de la

regresión por mínimos cuadrados no fueron normales, fue necesario utilizar

la transformación de Box-Cox con lambda= 0.3838384, para la variable a

ser regresada por las variables predictoras y acogerse a las propiedades

de normalidad del error en la regresión.

• La modelización de la tasa técnica actuarial por medio de la regresión bajo

mínimos cuadrados ordinarios, en el conjunto de datos disponible en esta

tesis, obtuvo un R2= 0.3039, correlación entre los datos y el ajuste del 55%,

Page 104: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

90

y los errores cumplieron el supuesto de normalidad con media cero y

varianza constantes.

• La aplicación de un modelo de regresión semiparamétrico que utiliza

polinomios locales penalizados mediante Modelos Mixtos, producen

significativamente, mejores resultados que la regresión mediante mínimos

cuadrados ordinarios. Se obtuvo un R2= 0.3233, correlación entre los datos

y el ajuste del 57%. Esta diferencia fue demostrada como significativa

mediante una prueba F modificada. Los errores de este ajuste también

cumplieron con los supuestos de normalidad e independencia, al igual que

los valores predictores de los efectos aleatorios, cuando se utilizaron 23

nodos entre los polinomios locales.

• Las variables: Género del Asegurado, Suma Asegurada del Vehículo,

Antigüedad del Vehículo fueron consideradas como lineales, y la variable

Edad del Asegurado es No lineal con relación a la Transformación Box-Cox

de la Tasa Técnica.

• El ajuste del modelo propuesto, es sensible al parámetro suavizador, ya

que éste modifica la rugosidad de la curva de ajuste, y los grados de

libertad de la regresión.

• El menor rango de valores de la tasa semiparamétrica hace que sea

totalmente práctico y aplicable al mercado actual, donde las tasas tienen un

bajo rango de diferencias.

• El quinto año fue utilizado para la predicción, obteniendo un ajuste de igual

media pero de menor varianza que la tasa técnica calculada bajo el método

de razón de pérdida.

• Existe una curva de aprendizaje en la variable Edad del Asegurado donde

a los 18 años, la tasa técnica empieza alta y va disminuyendo muy

levemente hasta los 55 años, luego hace una curva decreciente más

pronunciada hasta los setenta años, para luego crecer rápidamente hasta

los 85 años.

• Los Asegurados Hombres tienen una mayor tasa técnica que las mujeres.

• Las variables como Suma Asegurada y Antigüedad del Vehículo tienen

correlación negativa con la Tasa Técnica.

Page 105: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

91

• El modelo ofrece mayores ventajas económicas, debido a que las primas

son mayores en un 2.4%, la siniestralidad es menor bajo el modelo

propuesto, 50.80%, y con el modelo actuarial es de 52. 03%, el resultado

técnico es mayor en USD 152,778

7.2 RECOMENDACIONES

• La compañía de seguros también podría combinar el uso de su tarifa

habitual, y el modelo semiparamétrico para evaluar el riesgo en caso de

aplicar descuentos o extraprimas.

• Es posible detectar cual es el tipo de combinaciones de variables del

Asegurado y del Vehículo que hace que la tasa técnica tenga variables

altas o bajas, como lo anotado en la Sección 5.3.3, lo que podría permitir

establecer estrategias dirigidas a incentivar segmentos de clientes

rentables, y desincentivar segmentos de riesgo más alto, según el modelo.

• Las tendencias en el riesgo del seguro de vehículo pueden variar en el

tiempo, y aunque se requieren de grandes periodos para recaudar

suficientes estadísticas para los cálculos actuariales, no es recomendable

utilizar más de cinco años la base de datos. Al ser este mercado, de alta

competencia en precios, estos tienden a bajar, y un gran periodo de tiempo

puede hacer que las nuevas proyecciones no se encuentren con la

realidad.

• Sería recomendable buscar nuevas variables explicativas como por

ejemplo el kilometraje recorrido al momento de la suscripción, o la variable

que identifique la zona regional del domicilio del Asegurado, aunque el

incremento de variables aumenta el problema de las celdas, es posible que

este problema sea compensado con mejores indicadores de explicación.

• Los métodos y herramientas informáticas disponibles para regresión

semiparamétrica con uso de polinomios locales penalizados bajo modelos

mixtos son una opción que aún se encuentra en fase de investigación, por

lo que se sugiere una permanente actualización tanto de los conceptos

teóricos como aplicados, para el mantenimiento del modelo.

Page 106: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

92

REFERENCIAS

Asociación de Compañías de Seguros del Ecuador. (s.f.). Normatividad de Seguros.

Recuperado el 5 de Agosto de 2010, de

http://www.acose.org/normatividad/deseguros.html

Booth, P. et al. (2005). Modern Actuarial Theory and Practice 2nd. ed. USA: Chapman &

Hall/CRC.

Bowers et al. (1997). Actuarial Mathematics. USA: Society of Actuaries.

Crawley, M. (2007). The R Book. England: Wiley & Sons.

Fundación MAPFRE. (s.f.). Diccionario MAPFRE de Seguros. Recuperado el 5 de Agosto

de 2010, de http://www.mapfre.com/wdiccionario/general/diccionario-mapfre-

seguros.shtml

Keele, L. (2008). Semiparametric Regression for the Social Sciences. London: Wiley &

Sons.

McCulloch, C.E., Searle, S.R., and Neuhaus, J.M. (2008). Generalized, Linear, and Mixed

Models 2nd ed. New Jersey: Wiley & Sons.

Nieto de Alba, Vegas Asensio. (1993). Matemática Actuarial. España: Mapfre.

Pérez Caicer, Wehrli. (4 de Agosto de 2009). The Use of Semiparametric Regression in

Automobile Insurance Pricing. Poster presented at Joint Statistical Meetings.

Washington D.C., USA: The American Statistical Association.

http://www.amstat.org/meetings/jsm/2009/onlineprogram/index.cfm?fuseaction=ab

stract_details&abstractid=305477.

Pinheiro, J.C. and Bates, D.M. (2000). Mixed Effects Models in S and S-Plus. New York:

Springer.

Ruppert, D., Wand, M.P. & Carroll, R.J. (2003). Semiparametric Regression. New York:

Cambridge University Press.

Ruppert, David. Crainiceanu, Ciprian. (4 de Agosto de 2005). Course of Semiparametric

Regression. Joint Statistical Meetings. Minneapolis, Minnesota, USA: The

American Statistical Association.

http://www.amstat.org/meetings/jsm/2005/onlineprogram/index.cfm?fuseaction=ac

tivity_details&sessionid=200999.

Page 107: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

93

Searle, S.R., Casella, G. and McCulloch, C.E. (1992). Variance Components. New Jersey:

Wiley & Sons.

Straub, E. (1997). Non Life Insurance Mathematics. Association of Swiss Actuaries:

Springer-Verlang.

Texas A&M University, D. o. (s.f.). Semiparametric Regression. Recuperado el 15 de

Junio de 2011, de http://www.stat.tamu.edu/~carroll/semiregbook/

The National Academies Press. (s.f.). Charles Roy Henderson, A Biographical Memoir.

Recuperado el 11 de Diciembre de 2011, de

http://www.nap.edu/html/biomems/chenderson.pdf

Page 108: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

94

ANEXOS

Page 109: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

95

ANEXO 1: GLOSARIO DE SEGURO DE VEHÍCULOS

1.1. GLOSARIO DE SEGURO DE VEHÍCULOS

ASEGURADO

Según el Diccionario de la Real Academia Española: Dicho de una persona que

se encuentra expuesta al riesgo que asegura.

Según el Diccionario MAPFRE DE SEGUROS: En sentido estricto, es la persona

que en sí misma o en sus bienes o intereses económicos está expuesta al riesgo.

Según Decreto Supremo 1147 del Ecuador: Asegurado es la persona interesada

en la traslación de los riesgos.

AUTOMÓVIL

Según el Diccionario de la Real Academia Española: Que se mueve por sí mismo.

Se dice principalmente de los vehículos que pueden ser guiados para marchar por

una vía ordinaria sin necesidad de carriles y llevan un motor, generalmente de

explosión, que los pone en movimiento.

Según el Diccionario MAPFRE DE SEGUROS: Vehículo de motor que sirve,

normalmente, para el transporte de personas o cosas, o de ambas a la vez, o

para la tracción de otros vehículos con aquel fin. Se excluyen de esta definición

los vehículos especiales. La ley obliga a todos los propietarios de un automóvil a

contratar un seguro de Responsabilidad Civil.

Según Decreto Supremo 1147 del Ecuador: No existe definición.

COBERTURA

Según el Diccionario de la Real Academia Española: (Cubrirse) Prevenirse,

protegerse de cualquier responsabilidad, riesgo o perjuicio.

Según el Diccionario MAPFRE DE SEGUROS: Obligación principal del

asegurador en un contrato de seguro, consistente en hacerse cargo, hasta el

límite de la suma asegurada, de las consecuencias económicas que se deriven de

un siniestro.

Page 110: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

96

Según Decreto Supremo 1147 del Ecuador: (Objeto del Seguro) Con las

restricciones legales, el asegurador puede asumir todos o algunos de los riesgos

a que estén expuestos la cosa asegurada o el patrimonio o la persona del

asegurado, pero deben precisarse en tal forma que no quede duda respecto a los

riesgos cubiertos y a los excluidos.

COMPAÑÍA ASEGURADORA

Según el Diccionario de la Real Academia Española: Dicho de una empresa que

se dedica a la asunción de riesgos ajenos a cambio de la percepción de primas.

Según el Diccionario MAPFRE DE SEGUROS: Nombre con el que se designa, en

general, a la empresa o sociedad dedicada a la práctica del seguro.

Según Decreto Supremo 1147 del Ecuador: Se considera asegurador a la

persona jurídica legalmente autorizada para operar en el Ecuador, que asume los

riesgos especificados en el contrato de seguro.

DEDUCIBLE

Según el Diccionario de la Real Academia Española: (Franquicia) En el contrato

de seguro, cuantía mínima del daño a partir de la cual surge la obligación del

asegurador.

Según el Diccionario MAPFRE DE SEGUROS: Cantidad o porcentaje establecido

en una póliza cuyo importe ha de superarse para que se pague una reclamación.

(Franquicia) Cantidad por la que el asegurado es propio asegurador de sus

riesgos y en virtud de la cual, en caso de siniestro, soportará con su patrimonio la

parte de los daños que le corresponda.

Según Decreto Supremo 1147 del Ecuador: No existe definición.

EXCLUSIONES

Según el Diccionario de la Real Academia Española: Descartar, rechazar o negar

la posibilidad de algo.

Según el Diccionario MAPFRE DE SEGUROS: Decisión, que generalmente

corresponde a la entidad aseguradora, en virtud de la cual no quedan incluidos en

Page 111: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

97

las garantías de la póliza determinados riesgos o, quedando incluidos estos, las

garantías del contrato no surtirán efecto cuando concurran respecto a ellos

determinadas circunstancias o condiciones preestablecidas.

Según Decreto Supremo 1147 del Ecuador: La palabra si es citada en la

definición de Cobertura, pero no existe definición específica para la palabra

Exclusión.

INDEMNIZACIÓN

Según el Diccionario de la Real Academia Española: Resarcir de un daño o

perjuicio.

Según el Diccionario MAPFRE DE SEGUROS: En general, compensación o

resarcimiento económico por el menoscabo producido al perjudicado que se

realiza por el causante del daño o por quien deba corresponder en su lugar.

Según Decreto Supremo 1147 del Ecuador:

(Art. 32 al 34) Respecto del asegurado, los seguros de daños son contratos de

simple indemnización, y en ningún caso pueden constituir para él fuente de

enriquecimiento. La indemnización puede abarcar a la vez el daño emergente y el

lucro cesante, pero éste debe ser objeto de un acuerdo expreso.

La indemnización es pagadera en dinero, o mediante la reposición, reparación o

reconstrucción de la cosa asegurada, a opción del asegurador.

El monto asegurado se entiende reducido, desde el momento del siniestro, en una

cantidad igual a la indemnización pagada por el asegurador.

La indemnización no puede exceder del valor real del interés asegurado en el

momento del siniestro, ni del monto efectivo del prejuicio patrimonial sufrido por el

asegurado o beneficiario, ni puede sobrepasar el límite de la suma asegurada.

PÓLIZA

Según el Diccionario de la Real Academia Española: Documento justificativo del

contrato de seguros, fletamentos, operaciones de bolsa y otras negociaciones

comerciales.

Page 112: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

98

Según el Diccionario MAPFRE DE SEGUROS: Documento que instrumenta el

contrato de seguro, en el que se reflejan las normas que de forma general,

particular o especial regulan las relaciones contractuales convenidas entre el

asegurador y el asegurado.

Según Decreto Supremo 1147 del Ecuador:

El contrato de seguro se perfecciona y prueba por medio de documento privado

que se extenderá por duplicado y en el que se harán constar los elementos

esenciales. Dicho documento se llama Póliza; ésta debe redactarse en castellano

y ser firmada por los contratantes.

Las modificaciones del contrato o póliza, lo mismo que su renovación deben

también ser suscritas por los contratantes.

Toda póliza debe contener los siguientes datos:

a. El nombre y domicilio del asegurador;

b. Los nombres y domicilios del solicitante, asegurado y beneficiario;

c. La calidad en que actúa el solicitante del seguro;

d. La identificación precisa de la persona o cosa con respecto a la cual se contrata

el seguro;

e. La vigencia del contrato, con indicación de las fechas y horas de iniciación y

vencimiento, o el modelo de determinar unas y otras;

f. El monto asegurado o el modo de precisarlo;

g. La prima o el modo de calcularla;

h. La naturaleza de los riesgos tomados a su cargo por el asegurador;

i. La fecha en que se celebra el contrato y la firma de los contratantes;

j. Las demás cláusulas que deben figurar en la póliza de acuerdo con las

disposiciones legales.

Los anexos deben indicar la identidad precisa de la póliza a la cual corresponden;

y las renovaciones, además, el período de ampliación de la vigencia del contrato

original.

PRIMA

Según el Diccionario de la Real Academia Española: Precio que el asegurado

paga al asegurador, de cuantía unas veces fija y otras proporcional.

Page 113: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

99

Según el Diccionario MAPFRE DE SEGUROS: Aportación económica que ha de

satisfacer el contratante o asegurado a la entidad aseguradora en concepto de

contraprestación por la cobertura de riesgo que este le ofrece.

Según Decreto Supremo 1147 del Ecuador: La Prima o precio del seguro. El

solicitante del seguro está obligado al pago de la prima en el momento de la

suscripción del contrato.

RIESGO ASEGURABLE

Según el Diccionario de la Real Academia Española: Cada una de las

contingencias que pueden ser objeto de un contrato de seguro.

Según el Diccionario MAPFRE DE SEGUROS: Combinación de la probabilidad de

ocurrencia de un suceso y sus consecuencias.

Las características esenciales del riesgo son los siguientes:

- Incierto o aleatorio: Sobre el riesgo ha de haber una relativa incertidumbre,

pues el conocimiento de su existencia real haría desaparecer la aleatoriedad,

principio básico del seguro.

- Posible: Ha de existir posibilidad de riesgo; es decir, el siniestro cuyo

acae-cimiento se protege con la póliza debe «poder suceder».

- Concreto: El riesgo ha de ser analizado y valorado por la aseguradora en

dos aspectos, cualitativo y cuantitativo, antes de proceder a asumirlo. Sólo de esa

forma la entidad podrá decidir sobre la conveniencia o no de su aceptación y, en

caso afirmativo, fijar la prima adecuada. No puede garantizarse un riesgo cuya

valoración cuantitativa escape de todo criterio objetivo basado en la experiencia o

en unos cálculos actuariales que determinen, al menos con aproximación, la

prima que habría de establecerse.

- Lícito: El riesgo que se asegure no ha de ir, según se establece en la

legislación de todos los países, contra las reglas morales o de orden ni en

perjuicio de terceros, pues de ser así, la póliza que lo protegiese sería nula

automáticamente.

- Fortuito: El riesgo debe provenir de un acto o acontecimiento ajeno a la

voluntad humana de producirlo. No obstante, es indemnizable el siniestro

producido a consecuencia de actos realizados por un tercero, ajeno al vínculo

Page 114: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

100

contractual que une a la entidad y al asegurado, aunque en tal caso la

aseguradora se reserva el derecho de ejercitar las acciones pertinentes contra el

responsable de los daños (principio de subrogación), como también es

indemnizable el siniestro causado intencionadamente por cualquier persona,

incluido el propio contratante o asegurado, siempre que los daños se hayan

producido con ocasión de fuerza mayor o para evitar otros más graves.

- Contenido económico: La realización del riesgo ha de producir una

necesidad económica que se satisface con la indemnización correspondiente.

Según Decreto Supremo 1147 del Ecuador: Denominase riesgo el suceso incierto

que no depende exclusivamente de la voluntad del solicitante, asegurado o

beneficiario, ni de la del asegurador y cuyo acaecimiento hace exigible la

obligación del asegurador. Los hechos ciertos, salvo la muerte, y los físicamente

imposibles no constituyen riesgo y son, por tanto extraños al contrato de seguro.

SEGURO

Según el Diccionario de la Real Academia Española: Contrato por el que alguien

se obliga mediante el cobro de una prima a indemnizar el daño producido a otra

persona, o a satisfacerle un capital, una renta u otras prestaciones convenidas.

Según el Diccionario MAPFRE DE SEGUROS: Actividad económica-financiera

que presta el servicio de transformación de los riesgos de diversa naturaleza a

que están sometidos los patrimonios, en un gasto periódico presupuestable, que

puede ser soportado fácilmente por cada unidad patrimonial.

Según Decreto Supremo 1147 del Ecuador: El seguro es un contrato mediante el

cual una de las partes, el asegurador, se obliga, a cambio del pago de una prima,

a indemnizar a la otra parte, dentro de los limites convenidos, de una pérdida o un

daño producido por un acontecimiento incierto; o a pagar un capital o una renta, si

ocurre la eventualidad prevista en el contrato.

Page 115: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

101

SINIESTRO

Según el Diccionario de la Real Academia Española: En el contrato de seguro,

concreción del riesgo cubierto en dicho contrato y que determina el nacimiento de

la prestación del asegurador.

Según el Diccionario MAPFRE DE SEGUROS: Es la manifestación concreta del

riesgo asegurado, que produce unos daños garantizados en la póliza hasta

determinada cuantía.

Según Decreto Supremo 1147 del Ecuador: Se denomina siniestro la ocurrencia

del riesgo asegurado.

SUMA ASEGURADA

Según el Diccionario de la Real Academia Española: No existe definición.

Según el Diccionario MAPFRE DE SEGUROS: (Capital Asegurado) Valor

atribuido por el titular de un contrato de seguro a los bienes cubiertos por la póliza

y cuyo importe es la cantidad máxima que está obligado a pagar el asegurador,

en caso de siniestro.

Según Decreto Supremo 1147 del Ecuador: El monto asegurado o el límite de

responsabilidad del asegurador.

Page 116: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

102

ANEXO 2: REGRESIÓN MÚLTIPLE

2.1. REGRESIÓN MÚLTIPLE

El modelo de regresión lineal múltiple con k variables regresoras, es de la forma:

εββββ +++++= kkxxxy ...22110

Y los parámetros jβ , kj ,...,1,0= se denominan coeficientes de regresión.

Supóngase que se dispone de kn> observaciones y si se denota como ijx al

valor de la i -ésima observación de la variable jx , si yes la predicción de y , la

ecuación de regresión será

kkxbxbxbby ++++= ...ˆ 22110 ,

Donde kbbb ,...,, 10 son tales que la suma de los cuadrados de las diferencias entre

los valores observados de la variable respuesta y y su estimación y por la

ecuación de regresión sea mínima

Ahora, para cada una de las observaciones:

kk xbxbxbby 112211101 ...ˆ ++++=

kk xbxbxbby 222221102 ...ˆ ++++=

.

.

.

nkknnn xbxbxbby ++++= ...ˆ 22110

De forma matricial, los componentes del modelo de regresión son:

=

ny

y

y

Y.2

1

=

nknn

k

k

xxx

xxx

xxx

X

..1

......

......

..1

..1

21

22221

11211

Page 117: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

103

=

ββ

β.

.1

0

y

=

εε

ε.

.2

1

Y así la ecuación matricial del modelo será: εβ += XY

2.2 ESTIMACIÓN DE PARÁMETROS

Estimación para β

Si b es el vector de los estimadores de los parámetros de regresión

=

kb

b

b

b

.

.1

0

El sistema de estimación de los parámetros es XbY =ˆ

El vector de errores es XbYYY −=−= ˆε

El estimador de mínimos cuadrados de b se obtiene a partir de la minimización

de la suma cuadrática del error SCE:

( ) ( )XbYXbYSCE −−== ''εε

XbXbYXbYY ''''2' +−=

Derivando SCE respecto a b , e igualando a cero, el resultado es que

YXXbX '' =

Y si la matriz XX ' tiene inversa, entonces

( ) YXXXb '' 1−=

Propiedades de b por el método de mínimos cuadrados:

1. El estimador es insesgado, ( ) β=bE

2. La matriz de covarianza de b viene dada por ( ) ( ) 12 ' −= XXbCov σ

Page 118: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

104

2.3 Estimación para 2σ

Definimos los residuos al cuadrado “RSS” como

2

1

2 yyeRSSn

ii −==∑

=

Para la estimación de 2σ se utiliza el promedio de los residuos al cuadrado

“RSS”.

∑=

n

iie

n 1

21

En sentido matricial esto es:

( ) 22 1ˆ

1yHI

nyy

n−=− , donde ( ) TT XXXXH

1−= , y también Hyy =ˆ

( )( ) yHIHIyn

TT −−= 1

( )yHIyn

T −= 1

Definimos ( )Atr como la Traza de una matriz cuadrada A, y es la suma de los

elementos de la diagonal principal.

Adicionalmente,

( ){ } ( ){ }[ ]HIyytrEyHIyE TT −=−

( )( ){ }HIyyEtr T −=

( ) ( ) ( ){ }( )[ ]HIyEyEyCovtr T −+=

( ) ( ) ( ) ββσ XHIXHItr T −+−= 2

Ahora, reemplazando la definición H en ( )XHI − resulta que ( ) 0=− XHI .

Además, cada componente iiH de la matriz H (sombrero) es el factor

multiplicador para la contribución de iy a su correspondiente valor ajustado.

Y el total de esos factores es:

( ) ( ){ }TTn

iii XXXXtrHtrH

1

1

=

==∑

Y dado que ( ) ( )BAtrABtr = entonces

( ) ( ){ } ( ) pItrXXXXtrHtr pTT === −1

Page 119: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

105

Y este valor coincide con el número de parámetros que se quieren estimar.

Estos resultados, se aplican en la demostración y entonces

{ }HItrn

yyn

E n −=

− 22 1ˆ

1 σ

( ) ( ){ }pn ItrItrn

−= 21σ

2σn

pn −=

Esto muestra que la estimación de 2σ esta sesgada por el factor n

pn −.

Por lo tanto, es muy común usar como estimador insesgado de 2σ la expresión

22 ˆ1

ˆ yypn

−−

≡σ

Lo que equivale a que

( ) ( ) 2σpnRSSE −= , por lo tanto los “grados de libertad de los residuos” son

justamente pn − .

Para la varianza muestral se tiene que,

( ) YXbYYyySCEn

iii ''''ˆ

1

2 −==−=∑=

εε que tiene 1−− kn grados de libertad.

Así el error cuadrático medio, que es un estimador insesgado de 2σ , se calcula

por

12

−−==

kn

SCEsMCE

2.4 INTERVALOS DE CONFIANZA

2.4.1 Intervalos de confianza para β

Ya que los parámetros β , se considera como una variable aleatoria

multidimensional normalmente distribuida con media b y matriz de covarianza

( ) 12 ' −XXσ , por lo que cada uno de los estadísticos

jj

jj

Cs

b β− , kj ,...,1,0=

Page 120: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

106

Sigue una distribución t con ( )pn − grados de libertad y donde ijC es el j -ésimo

elemento de la diagonal de la matriz ( ) 1' −XX .

Así, un intervalo de confianza al ( )%1100 α− para el coeficiente de regresión jβ

es

( ) ( ) jjjjjjj CspntbCspntb −+≤≤−− 2/2/ αα β

2.4.2 Intervalos de confianza para la estimación ( )YE

Si se desea conocer el intervalo de confianza para la respuesta media de un

punto en particular pkpp xxx ,....,, 21 definimos el vector

=

pk

p

p

p

x

x

x

x

.

1

2

1

La respuesta en este punto es

bxy pp 'ˆ =

Este estimador es insesgado (es decir ( ) ( )βpp xYE 'ˆ = ) y su varianza es

( ) ( ) ppp xXXxYVar 12 ''ˆ −= σ

Un intervalo de confianza al ( )%1100 α− para la estimación en el punto px es

( ) ( ) ( ) ( ) ( ) ppppppp xXXxspntyYExXXxspnty 12/

12/ ''ˆ''ˆ

−− −+≤≤−− αα

2.4.3 Intervalo de confianza de ( )%1100 α− para la Predicción

Un modelo de regresión tiene su aplicación en realizar pronósticos

correspondientes a valores particulares de las variables independientes, px . La

respuesta en este punto es

bxy pp 'ˆ =

El intervalo de confianza de nivel ( )%1100 α− para la predicción es

( ) ( ) ( ) ( ) ppppppp xXXxspntyyxXXxspnty 12/

12/ ''1ˆ''1ˆ

−− +−+≤≤+−− αα

Page 121: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

107

2.5 PRUEBAS DE HIPÓTESIS

2.5.1 Pruebas de hipótesis para la significación del modelo.

Los valores residuales de una regresión ayudan a determinar que tan bueno ha

sido el ajuste de un modelo.

Se espera que el error iii YY ˆ−=ε , tenga media 0 y varianza conocida.

Ahora, para cada observación es posible realizar la siguiente identidad

( ) ( )YYYYYY iiii −+−=− ˆˆ

Si se aplica la sumatoria y se eleva al cuadrado, se tiene que

( ) ( ) ( ) ( )( )∑∑∑∑====

−−+−+−=−n

iiii

n

ii

n

iii

n

ii YYYYYYYYYY

11

2

1

2

1

2 ˆˆ2ˆˆ

El último término es igual a cero, como se demuestra a continuación.

Se puede demostrar que la parte ( ) ∑∑==

==−n

ii

n

iii eYY

11

0ˆˆ

( )( ) ( )∑∑==

−=−−n

iii

n

iiii YYeYYYY

11

ˆˆˆˆ

∑∑==

−=n

ii

n

iii eYYe

11

ˆˆˆ

( ) ∑∑==

−+=n

ii

n

iii eYXe

11

ˆˆˆˆ βα

0ˆˆˆˆˆ111

=−+= ∑∑∑===

n

ii

n

iii

n

ii eYXee βα

Entonces,

( ) ( ) ( )∑∑∑===

−+−=−n

ii

n

iii

n

ii YYYYYY

1

2

1

2

1

2 ˆˆ

( )∑=

−n

ii YY

1

2 es la suma de cuadrados totales “SCyy”

( )∑=

−n

iii YY

1

2ˆ es la suma de cuadrados del error “SCE”

Page 122: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

108

( )∑=

−n

ii YY

1

2ˆ es la suma de cuadrados de la regresión “SCR”

Para que un modelo de regresión sea significativo, sus coeficientes β (o al menos

uno) deben ser estadísticamente diferentes de cero. Por lo tanto nos interesa

comprobar la siguiente prueba de hipótesis:

1. 0...: 100 ==== kH βββ

2. 0:1 ≠kH β para al menos una k . 3. El estadístico de Prueba para esta hipótesis es:

( ) ( )

( )∑

=

=

−−−==

n

iii

n

ii

obs

yyk

yykn

MCE

MCRF

1

2

1

2

ˆ

ˆ1

MCR=Media cuadrática de regresión, se compone de la suma cuadrática

del error n

y

YXbSCR

n

ii

2

1''

−=∑

= con grados de libertad.

Asi, la Media Cuadratica del Error, es

k

MCRSCR=

4. Región de Rechazo: Se rechaza 0H a favor de H1 si ( )1; −−> knkFFobs α Distribución F de Fisher.

El rechazo de 0H significa que al menos una de las variables independientes jx

contribuye significativamente al modelo.

Para esta prueba es muy común encontrar la tabla 2.

Tabla 2.5 Análisis de Varianza

Fuente de

variación

Suma de

cuadrados

Grados de

libertad

Cuadrado

medio

F

Regresión SCR k MCR MCE

MCRFobs =

Error SCE 1−− kn MCEs =2

Total yySC 1−n

Page 123: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

109

2.5.2 Pruebas acerca de los parámetros β individuales

Si los componentes del error son variables aleatorios independientes

normalmente distribuidas con media cero y varianza 2σ , la distribución de

muestreo del estimador ib es normal con media iβ y desviación estándar

iibi SC

σσ = .

Lo que implica que ib es un estimador insesgado para iβ , y que la desviación

estándar de iβ puede estimarse por:

iibi SC

ss =

Ahora, la prueba de significación del modelo indica una prueba conjunta sobre los

parámetros, pero no indica información sobre cada uno de ellos. Que la prueba

conjunta determine significación, no implica que todos los parámetros sean

significativos. Para determinar cuáles son los parámetros significativos y cuáles

no, se requiere de la siguiente prueba:

1. 0:0 =iH β

2. 0:1 ≠iH β

3. El Estadístico de Prueba es ii

iobs Cs

bt =

4. Región de rechazo: Se rechaza 0H si ( )12/ −−−< knttobs α o

( )12/ −−> knttobs α

De esta forma es posible comprobar si cada uno de los iβ es significativo o no.

2.5.3 Coeficiente de Determinación Múltiple

El Coeficiente de determinación múltiple 2R es una medida de explicación del

modelo, que informa sobre la relación existente entre las variables y y y .

yyyy SC

SCE

SC

SCRR −== 12 . 10 2 ≤≤ R

Page 124: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

110

Un modelo que muestre un mejor ajuste, será también el que contenga una

correlación mas fuerte entre los datos y los valores ajustados, y esto corresponde

a un valor 2R más alto.

Ya que el estimador 2R tiende a ser más alto a medida que se incrementan mas

variables en el modelo, este se sobreestima, un método que considera este efecto

es el “coeficiente de determinación ajustado”,

( ) ( )( )1/

1/1

11 2

22

−−−−=

−−−−=

nSC

knSCE

kn

RkRR

yya 10 2 ≤≤ aR

Donde k es el número de variables independientes en el modelo de regresión. Y

la interpretación de sus valores es igual al de 2R .

Otra interpretación del valor 2R es que este es la proporción de la variación de la

variable de respuesta que puede ser explicada por las variables predictoras.

2.5.4 Prueba F

Esta prueba es utilizada para determinar si entre un modelo y otro existe

diferencia significativa en el ajuste, de manera de poder escoger el mejor entre

ambos.

Por ejemplo, dos modelos de regresión polinomial donde uno de ellos tiene un

grado exponente mayor para la variable x .

Modelo Mayor: ikik

kikiii exxxxy ++++++= −

− βββββ 11

2210 ..ˆ

Modelo Menor: ikikiii exxxy +++++= −

−1

12

210 ..ˆ ββββ

El problema de escoger entre un modelo y otro se puede resolver evaluando el

desempeño de la medida 2R y considerando el efecto de que el modelo que tiene

más variables resultará en un 2R más grande.

Se puede demostrar que el valor

( )( ) ( )mayormenormayormenor

menormayor

pnppR

RRF

−−−−

=/1 2

22

tiende a una distribución 2,1, mmFα donde

=α Error Tipo I.

Page 125: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

111

menormayor ppm −=1

mayorpnm −=2

2.6 ESTIMADOR DE MAXIMA VEROSIMILITUD RESTRINGIDA ( REML)

εβ +=1px

Xy ( )IN 2,0 εσε →

El ML (modelo lineal) estima la varianza del error como

n

XyML

2

2,

ˆˆ

βσ ε

−= sesgado para

2εσ

El REML estima la varianza del error como

pn

XyREML −

−=

2

2,

ˆˆ

βσ ε insesgado para

2εσ

Page 126: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

112

ANEXO C - Modelo de la orden de encuadernación

ESCUELA POLITÉCNICA NACIONAL

FACULTAD DE CIENCIAS ADMINISTRATIVAS

ORDEN DE ENCUADERNACIÓN

De acuerdo con lo estipulado en el Art. 17 del instructivo para la Aplicación del Reglamento del Sistema de Estudios, dictado por la Comisión de Docencia y Bienestar Estudiantil el 9 de agosto del 2000, y una vez comprobado que se han realizado las correcciones, modificaciones y más sugerencias realizadas por los miembros del Tribunal Examinador al informe del proyecto de titulación {ó tesis de grado} presentado por WEHRLI ENRIQUE PÉREZ CAICER. Se emite la presente orden de empastado, con fecha mes día del año. Para constancia firman los miembros del Tribunal Examinador:

NOMBRE FUNCIÓN FIRMA

DR. HOLGER CAPA SANTOS Director

M.SC. JAIME ANDRADE GONZALEZ Examinador

DR. JULIO MEDINA VALLEJO Examinador

_________________________

DR. EDUARDO ÁVALOS

DECANO

Page 127: ESCUELA POLITÉCNICA NACIONAL · 2019. 4. 7. · Pérdida para calcular la tasa técnica a priori, la cual va a ser estimada por el modelo de regresión semiparamétrica. Para la

113